فرآوری گفتار: تفاوت میان نسخهها
محتوای حذفشده محتوای افزودهشده
جز ابرابزار |
|||
خط ۲:
'''متن به [[گفتار]]''' {{انگلیسی|Text-to-Speech}} که [[سرواژه]] آن TTS است، برنامهای است که متن ورودی را به صدای انسان را میخواند.
این نوع برنامه برای تبدیل متن به [[پرونده (رایانه)|پرونده]] صوتی ([[کتاب گویا]])، تلفظ کلمات در نرمافزارهای واژهنامه، خواندن صفحه [[رایانه]] و نیز [[تلفن هوشمند]]
باید توجه کرد که اصطلاح «متن به گفتار» برای اشاره به دو مفهوم
الف) موتور متن به گفتار {{انگلیسی|Text-to-Speech engine}}
ب) پخشکننده متن به گفتار {{انگلیسی|Text-to-Speech player}}
که وظیفه تبدیل متن به گفتار در پسزمینه بر عهده موتور متن به گفتار است و پخشکننده متن به گفتار محیط کاربری برای وارد کردن متن و گرفتن خروجی صدا یا ذخیره در قالب پرونده صوتی را فراهم میکند. به منظور جلوگیری از ابهام
بطور کلی برای تبدیل متن به گفتار نیاز است تا پارامترهای مهم در تولید گفتار استخراج و استفاده شوند. استخراج بعضی از این پارامترها همچون رشته
▲بطور کلی برای تبدیل متن به گفتار نیاز است تا پارامترهای مهم در تولید گفتار استخراج و استفاده شوند. استخراج بعضی از این پارامترها همچون رشته آوایي نوشتار، کشش زمانی واجها و منحنی پیچ گفتار الزامی و بعضی دیگر همچون سرعت بیان، درنگ بین کلمات و تن صدا از جمله پارامترهای غیر ضروری می باشند که استفاده از آنها منجر به بهبود خروجی سیستم می گردد <ref>بهرنگ قاسمی زاده و مجید نم نبات، [http://pars.ie/publications/papers/pre-prints/farsi-text-to-speech.pdf ساختار یک سیستم تبدیل متن به گفتار برای زبان فارسیT] </ref>. پیمانه های لازم برای تبدیل متن به گفتار در یک سیستم تولید گفتار از متن عموما شامل دو بخش است: بخش پردازش زبان طبیعی اجزاء سازنده متن ورودی شامل کلمات، گروههای گرامری، جمالت و دیگر اطلاعات مرتبط با پردازش زبان که در بخش پردازش سیگنال دیجیتالی به عنوان ورودی مورد نیاز است تهیه می کند. بخش پردازش دیجیتالی سیگنال با استفاده از نتایج حاصل از بخش NLP، پارامترهای گفتار را شامل رشته آوایي متن و پارامترهای نوایي تعیین و در انتها گفتار خروجی با استفاده از یک موتور سنتز تولید می گردد.
== موتورهای متن به گفتار مشهور ==
در حال حاضر [[ئی اسپیک]] و
یکی از کاملترین پخشکننده متن به گفتار در [[مایکروسافت ویندوز]] بالابولکا {{انگلیسی|Balabolka}} نام دارد. ویژگی جالب این نرمافزار تشخیص متن فارسی از انگلیسی و استفاده از موتورهای متن به گفتار جداگانه (با رابط Windows SAPI 5) برای هر یک از زبانها است.
آریانا نرمافزار متن خوان فارسی شرکت دانش بنیان عصر گویش پرداز است. آریانا که نسخه قبلی آن همراه صفحه خوان جاوز (Jaws) برای خواندن صفحات و متون توسط نابینایان و کم بینایان طراحی شده بود، بعد از شش سال پوست انداخته و عصر گویش با تکنولوژی متفاوتی نسخه جدیدی را عرضه کرده است که صدای طبیعی و
در این
آریانا به صورت ماژول و سرویس تحت وب (Persian TTS Cloud) عرضه شده است که برنامهنویسها و سایر کسب و کارها را قادر به استفاده از قابلیت متن خوان فارسی در نرمافزارها و سختافزارهای رایانهای میکند. از قابلیت متن خوان میتوان در سامانههای تلفن گویا و VoIP برای خواندن اطلاعات متنی مختلف، در سامانههای انتقادات و پیشنهادهای تلفنی جهت خواندن نظریه کارشناسی برای کم کردن حجم حضور ارباب رجوع در ادارات و ... استفاده کرد و همچنین در وبسایتها (به ویژه در خبرگزاریها و برای ایجاد امکان خواندن توسط افراد کمبینا و مسن) و
یکی از کاملترین پخشکننده متن به گفتار در [[مایکروسافت ویندوز]] بالابولکا {{انگلیسی|Balabolka}} نام دارد. ویژگی جالب این نرمافزار تشخیص متن فارسی از انگلیسی و استفاده از موتورهای متن به گفتار جداگانه (با رابط Windows SAPI 5) برای هر یک از زبانها است.
خط ۲۷:
== مقالات مرتبط ==
[[ئی اسپیک]]
== پیوند به بیرون ==
* وبسایت ئی اسپیک: http://espeak.sourceforge.net/
▲* وبسایت گروه برنامه نویسی ئیاسپیک فارسی: http://espeak.ir/
* وبسایت پخشکننده متن به گفتار بالابولکا: http://www.cross-plus-a.com/balabolka.htm
سطر ۴۰ ⟵ ۳۸:
* https://en.wikipedia.org/wiki/ESpeak
* https://en.wikipedia.org/wiki/Microsoft_Speech_API
{{پانویس}}
|