بازشناسی گفتار: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
LetsDoItBot (بحث | مشارکتها) ←top: تمیزکاری، + ویرایش با ماژول ابرابزار با استفاده از AWB |
رها آسایش جو (بحث | مشارکتها) معرفی سامانه بازشناسی گفتار شرکت گاتا |
||
خط ۷:
یک سیستم بازشناسی گفتار خودکار (Automatic Speech Recognition) که به اختصار ASR نامیده میشود با چالشهای فراوانی روبروست. از جمله مهمترین این چالشها میتوان به وجود نویز، انتخاب مجموعه ویژگیهای مناسب، انتخاب مدل آکوستیکی مناسب، تنوع زبان، تنوع جنسیت و [[مشکل لهجه در بازشناسی گفتار]] اشاره نمود. در مورد زبانهای رایج مانند انگلیسی کارهای زیادی در جهت مقابله با این چالشها انجام شدهاست اما در مورد [[زبان فارسی]] هنوز راه زیادی در پیش است.
امروزه با داشتن میکروفن و کارت صوتی در کامپیوتر و بکار گیری نرمافزار تشخیص گفتار میتوان دستورات یا کلمات را به صورت صوتی به کامپیوتر وارد کرد. حتی در بعضی از گوشیهای [[تلفن همراه]] از این سیستمها جهت دریافت دستورات بصورت صوتی استفاده میشود.
هم اکنون شرکت دانش بنیان گاتا،ارایه دهنده ی راهکارهای فردی و سازمانی و تولید کننده نرم افزار در زمینه های پردازش متن ،گفتار و تصویر با استفاده از تکنیک های هوش مصنوعی برروی انواع پلت فرم ها سیستم های تشخیص گفتار را در زبان فارسی برروی پلت فرم های مختلف و قالب های گوناگون راه اندازی کرده است.'''این سامانه ، چه از طریق میکروفون رایانه و چه از طریق تلفن قادر است گفتار گوینده را تشخیص داده و از این طریق فرامین گفته شده را اجرا کند.''' سیستم بازشناسی گفتار گاتا، با استفاده از تکنیک های هوش مصنوعی ، برای استفاده در سیستم های رایانه و مخابراتی طراحی و پیاده سازی شده و قابلیت پشتیبانی از چند لاین همزمان را داراست. این سیستم دقت بالایی در تشخیص گفتار گوینده دارد.یکی از کاربردهای مهم آن، بویژه در ترکیب با سامانه تبدیل متن به گفتار رساتلکام، عدم نیاز به حضور اپراتورهای انسانی و تعامل کاراتر با مشتریان سازمان و کاهش هزینه ها و بازدهی اقتصادی بیشتر می باشد. ویژگی های این فناوری به اختصار در ذیل عنوان میشود:
- قابلیت دریافت درخواست کاربر از طریق گفتار و تشخیص آن
- پشتیبانی از زبان های انگلیسی و فارسی
-دقت و سرعت بسیار بالا در تشخیص گفتار گوینده
- امکان جستجو در گفتار خاص
سیستم بازشناسی گفتار گاتا در بسترهای زیر پیاده سازی شده است:
قابلیت استفاده بصورت SDK یا ماژول در سامانه های دیگر از جمله : سامانه تلفنبانک، سامانه تلفن گویا (IVR,VoIP)، سامانه ارتباط با مشتری و CRM، سامانه اطلاع رساني تلفني )اطلاعات سازماني، پزشکي، اخبار، هواشناسي، اعلام پرواز فرودگاه ها، پایانه های حمل و نقل)،سامانه آموزشي و آرشیوهای صوتی (مدارس، دانشگاه ها و مؤسسات آموزشي )، رزرواسيون تلفني (بليت هواپيما و قطار، بليت سينما) ، بيمارستان و مؤسسات خدمات درمانی
از آنجا که ارتباط کلامی راحتترین، سادهترین و سریعترین راه ارتباطی میباشد با کمک سیستمهای تشخیص گفتار عصر گویش پرداز میتوان با رایانهها از طریق صحبت ارتباط برقرار نمود، با آنها حرف زد، دستور داد یا از پشت تلفن و از راه دور بتوان سیستمهای خانگی را کنترل نمود. با کمک این محصولات، بسیاری از افراد معلول و یا افرادی با آشنایی محدود با کامپیوتر و زبانهایخارجی نیز میتوانند تنها از طریق صحبتکردن با کامپیوتر ارتباط برقرار نمایند.
|