بازشناسی گفتار: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز حذف از رده:تکنیکهای تأثیرپذیری متقابل ردهانبوه |
جز ←جایگزینی با [[وپ:اشتباه|اشتباهیاب]]: دستورات⟸دستورها، معیارشباهت⟸معیار شباهت، غیرتلفنی⟸غیر تلفنی، کارتحقیقاتی⟸کار تحقیقاتی |
||
خط ۲:
هدف از تشخیص گفتار که در متون علمی بیشتر با نام بازشناسی گفتار شناخته شدهاست، طراحی و پیادهسازی سیستمی است که اطلاعات گفتاری را دریافت و متن و فرمان گوینده را استخراج میکند.
فناوری '''بازشناسی گفتار''' به رایانهای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را میدهد که گفتار کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن یا به عنوان جایگزینی برای [[صفحه کلید]] یا [[ماوس]] برای وارد کردن
این سیستمها با بکارگیری روشهای مختلف [[طبقهبندی]] و شناسایی الگو قادرند به تشخیص واژگان هستند که البته برای افزایش دقت در شناسایی از یک [[فرهنگ لغات]] نیز در انتهای سیستم استفاده میشود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستمهای تشخیص گفتار مورد استفاده قرار میگیرند و در بخشهای انتهایی سیستم از [[هوش مصنوعی]] کمک گرفته میشود.
یک سیستم بازشناسی گفتار خودکار (Automatic Speech Recognition) که به اختصار ASR نامیده میشود با چالشهای فراوانی روبروست. از جمله مهمترین این چالشها میتوان به وجود نویز، انتخاب مجموعه ویژگیهای مناسب، انتخاب مدل آکوستیکی مناسب، تنوع زبان، تنوع جنسیت و [[مشکل لهجه در بازشناسی گفتار]] اشاره نمود. در مورد زبانهای رایج مانند انگلیسی کارهای زیادی در جهت مقابله با این چالشها انجام شدهاست اما در مورد [[زبان فارسی]] هنوز راه زیادی در پیش است.
امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکارگیری نرمافزار تشخیص گفتار میتوان
از آنجا که ارتباط کلامی راحتترین، سادهترین و سریعترین راه ارتباطی میباشد با کمک سیستمهای تشخیص گفتار عصر گویش پرداز میتوان با رایانهها از طریق صحبت ارتباط برقرار نمود، با آنها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستمهای خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول یا افرادی با آشنایی محدود با کامپیوتر و زبانهایخارجی نیز میتوانند تنها از طریق صحبتکردن با کامپیوتر ارتباط برقرار نمایند.
خط ۱۵:
تشخیص کلمات کلیدی گفتار
تشخیص کلمات کلیدی گفتار به معنای پیدا کردن یک کلمه یا عبارت خاص در گفتار میباشد که برای کاربردهای امنیتی، آرشیوهای صوتی و جستجوی صوتی قابل استفادهاست. نسخههای تلفنی و
کلمات خارج از دادگان و معیار اطمینان
خط ۲۴:
تشخیص گفتار از غیر گفتار (VAD)
برای بازشناسی گفتار پیوسته یا بازشناسی
بازشناسی با فاصله و آرایه میکروفنی
خط ۳۳:
تشخیص گفتار بومی از غیربومی
این
محاسبه سریع
یکی از بارهای محاسباتی در الگوریتمهای بازشناسی گفتار بدست آوردن مقدار شباهت است که یکی از گلوگاههای سیستمهای بازشناسی گفتار میباشد. روشهای بهینهای برای محاسبه مقدار شباهت پیادهسازی شده و به کار گرفته شدهاست.
|