بازشناسی گفتار: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
LetsDoItBot (بحث | مشارکت‌ها)
←‏top: تمیزکاری، + ویرایش با ماژول ابرابزار با استفاده از AWB
معرفی سامانه بازشناسی گفتار شرکت گاتا
خط ۷:
یک سیستم بازشناسی گفتار خودکار (Automatic Speech Recognition) که به اختصار ASR نامیده می‌شود با چالشهای فراوانی روبروست. از جمله مهمترین این چالشها می‌توان به وجود نویز، انتخاب مجموعه ویژگی‌های مناسب، انتخاب مدل آکوستیکی مناسب، تنوع زبان، تنوع جنسیت و [[مشکل لهجه در بازشناسی گفتار]] اشاره نمود. در مورد زبان‌های رایج مانند انگلیسی کارهای زیادی در جهت مقابله با این چالش‌ها انجام شده‌است اما در مورد [[زبان فارسی]] هنوز راه زیادی در پیش است.
امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکار گیری نرم‌افزار تشخیص گفتار می‌توان دستورات یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشی‌های [[تلفن همراه]] از این سیستم‌ها جهت دریافت دستورات بصورت صوتی استفاده می‌شود.
 
هم اکنون شرکت دانش بنیان گاتا،ارایه دهنده ی راهکارهای فردی و سازمانی و تولید کننده نرم افزار در زمینه های پردازش متن ،گفتار و تصویر با استفاده از تکنیک های هوش مصنوعی برروی انواع پلت فرم ها سیستم های تشخیص گفتار را در زبان فارسی برروی پلت فرم های مختلف و قالب های گوناگون راه اندازی کرده است.'''این سامانه ، چه از طریق میکروفون رایانه و چه از طریق تلفن قادر است گفتار گوینده را تشخیص داده و از این طریق فرامین گفته شده را اجرا کند.''' سیستم بازشناسی گفتار گاتا، با استفاده از تکنیک های هوش مصنوعی ، برای استفاده در سیستم های رایانه و مخابراتی طراحی و پیاده سازی شده و قابلیت پشتیبانی از چند لاین همزمان را داراست. این سیستم دقت بالایی در تشخیص گفتار گوینده دارد.یکی از کاربردهای مهم آن، بویژه در ترکیب با سامانه تبدیل متن به گفتار رساتلکام، عدم نیاز به حضور اپراتورهای انسانی و تعامل کاراتر با مشتریان سازمان و کاهش هزینه ها و بازدهی اقتصادی بیشتر می باشد. ویژگی های این فناوری به اختصار در ذیل عنوان میشود:
 
- قابلیت دریافت درخواست کاربر از طریق گفتار و تشخیص آن
 
- پشتیبانی از زبان های انگلیسی و فارسی
 
-دقت و سرعت بسیار بالا در تشخیص گفتار گوینده
 
- امکان جستجو در گفتار خاص
 
سیستم بازشناسی گفتار گاتا در بسترهای زیر پیاده سازی شده است:
 
قابلیت استفاده بصورت SDK یا ماژول در سامانه های دیگر از جمله : سامانه تلفنبانک، سامانه تلفن گویا (IVR,VoIP)، سامانه ارتباط با مشتری و CRM، سامانه اطلاع رساني تلفني )اطلاعات سازماني، پزشکي، اخبار، هواشناسي، اعلام پرواز فرودگاه ها، پایانه های حمل و نقل)،سامانه آموزشي و آرشیوهای صوتی  (مدارس، دانشگاه ها و مؤسسات آموزشي )، رزرواسيون تلفني (بليت هواپيما و قطار، بليت سينما) ، بيمارستان و مؤسسات خدمات درمانی
 
از آنجا که ارتباط کلامی راحت‌ترین، ساده‌ترین و سریع‌ترین راه ارتباطی می‌باشد با کمک سیستمهای تشخیص گفتار عصر گویش پرداز می‌توان با رایانه‌ها از طریق صحبت ارتباط برقرار نمود، با آنها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستمهای خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول و یا افرادی با آشنایی محدود با کامپیوتر و زبان‌های‌خارجی نیز می‌توانند تنها از طریق صحبت‌کردن با کامپیوتر ارتباط برقرار نمایند.