بازشناسی گفتار: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Arash.pt (بحث | مشارکت‌ها)
جز ویرایش رها آسایش جو (بحث) به آخرین تغییری که LetsDoItBot انجام داده بود واگردانده شد
خط ۲:
 
هدف از تشخیص گفتار که در متون علمی بیشتر با نام بازشناسی گفتار شناخته شده‌است، طراحی و پیاده‌سازی سیستمی است که اطلاعات گفتاری را دریافت و متن و فرمان گوینده را استخراج می‌کند.
فناوری '''بازشناسی گفتار''' به رایانه‌ای که توانایی دریافت صدا را دارد (برای مثال به یک میکروفن مجهز است) این قابلیت را می‌دهد که گفتار کاربر را متوجه شود. این فناوری در تبدیل گفتار به متن و یا به عنوان جایگزینی برای [[صفحه کلید]] یا [[ماوس]] برای وارد کردن دستورات مورد استفاده قرار می‌گیرد. سیستم‌های واکافت کننده گفتار انواع مختلفی دارند، بعضی قادرند گفتار پیوسته را شناسایی نمایند، بعضی دیگر فقط می‌توانند گفتار گسسته (که بین کلمات سکوت وجود دارد) را شناسایی کنند. همچنین سیستم‌ها قادرند واژگان گفته شده توسط افراد مختلف و یا فقط توسط یک گوینده تشخیص دهند. بهر حال ایده‌آل‌ترین سیستم آن است که بتواند گفتار پیوسته غیر وابسته به گوینده را در محیط نویزی شناسایی نماید.
این سیستم‌ها با بکار گیری روش‌های مختلف [[طبقه‌بندی]] و شناسایی الگو قادرند به تشخیص واژگان هستند که البته برای افزایش دقت در شناسایی از یک [[فرهنگ لغات]] نیز در انتهای سیستم استفاده می‌شود. روشهایی مانند Hidden Markov Model یا Neural Network در بسیاری از سیستم‌های تشخیص گفتار مورد استفاده قرار می‌گیرند و در بخش‌های انتهایی سیستم از [[هوش مصنوعی]] کمک گرفته می‌شود.
 
خط ۸:
امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکار گیری نرم‌افزار تشخیص گفتار می‌توان دستورات یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشی‌های [[تلفن همراه]] از این سیستم‌ها جهت دریافت دستورات بصورت صوتی استفاده می‌شود.
 
از آنجا که ارتباط کلامی راحت‌ترین، ساده‌ترین و سریع‌ترین راه ارتباطی می‌باشد با کمک سیستمهای تشخیص گفتار عصر گویش پرداز می‌توان با رایانه‌ها از طریق صحبت ارتباط برقرار نمود، با آنها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستمهای خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول و یا افرادی با آشنایی محدود با کامپیوتر و زبان‌های‌خارجی نیز می‌توانند تنها از طریق صحبت‌کردن با کامپیوتر ارتباط برقرار نمایند.
بازشناسی گفتار تلفنی
یکی از کاربردهای بازشناسی گفتار، استفاده از آن در سیستم‌های تلفنی می‌باشد که کاربر بتواند در پشت تلفن تنها با بیان عنوان موردنظر به صورت گفتاری، کار خود را انجام دهد. این پروژه تحولی در سیستم‌های کامپیوتر- تلفنی به وجود آورده‌است. تشخیص گفتار تلفنی به دلیل شرایط خاص پشت تلفن مانند نویزهای کانال، محدودیت [[پهنای باند]]، تنوع نوع گوشی‌ها، تغییرات شدت صدا، تنوع گوینده و تنوع گویش دارای پیچیدگی‌های خاص خود است. نیوشا نرم‌افزار توسعه داده شده برای تشخیص گفتار تلفنی است که به روش‌های مختلف مقاوم‌سازی مجهز شده‌است تا قابل استفاده در کاربردهای واقعی باشد.
خط ۱۸:
 
کلمات خارج از دادگان و معیار اطمینان
برای آماده‌سازی یک سیستم واقعی، معیار اطمینان یکی از پارامترهای مهم می‌باشد. به کمک معیار اطمینان می‌توان دقت را در موارد خاص بررسی نمود و یا در هنگام آموزش از این ویژگی استفاده نمود. کاربرد دیگر معیار اطمینان در بدست آوردن کلمات خارج از دادگان است. کلمات خارج از دادگان یکی از پارامترهای اصلی سیستم‌های تشخیص فرامین صوتی می‌باشد.
 
بهبود کیفیت گفتار
خط ۴۴:
 
{{داده‌های کتابخانه‌ای}}
 
[[رده:تاریخ تعامل انسان و رایانه]]
[[رده:تشخیص گفتار]]