فرآوری گفتار: تفاوت میان نسخه‌ها

محتوای حذف‌شده محتوای افزوده‌شده
Sasaniran (بحث | مشارکت‌ها)
جز ابرابزار
خط ۲:
'''متن به [[گفتار]]''' {{انگلیسی|Text-to-Speech}} که [[سرواژه]] آن TTS است، برنامه‌ای است که متن ورودی را به صدای انسان را می‌خواند.
 
این نوع برنامه برای تبدیل متن به [[پرونده (رایانه)|پرونده]] صوتی ([[کتاب گویا]])، تلفظ کلمات در نرم‌افزارهای واژه‌نامه، خواندن صفحه [[رایانه]] و نیز [[تلفن هوشمند]] مخصوصامخصوصاً برای کاربران نابینا توسط نرم‌افزارهای [[صفحه‌خوان]] کاربرد دارد. همچنین در سامانه‌های تلفن مخابرات و نیز دستگاه‌های [[خودپرداز]] جهت ارتباط گفتاری با کاربر بکار می‌رود.
 
باید توجه کرد که اصطلاح «متن به گفتار» برای اشاره به دو مفهوم متفاوت بکار می‌رود:
 
الف) موتور متن به گفتار {{انگلیسی|Text-to-Speech engine}}
 
ب) پخش‌کننده متن به گفتار {{انگلیسی|Text-to-Speech player}}
 
که وظیفه تبدیل متن به گفتار در پس‌زمینه بر عهده موتور متن به گفتار است و پخش‌کننده متن به گفتار محیط کاربری برای وارد کردن متن و گرفتن خروجی صدا یا ذخیره در قالب پرونده صوتی را فراهم می‌کند. به منظور جلوگیری از ابهام معمولامعمولاً موتور متن به گفتار اصطلاحااصطلاحاً {{انگلیسی|Speech-synthesizer}} نامیده می‌شود از طرف دیگر پخش‌کننده متن به گفتار مخصوصامخصوصاً در بین کاربران عام رایانه متن به گفتار نامیده می‌شود. لیکن باید توجه کرد زبانهای پشتیبانی شده گفتار و کیفیت صدا مربوط به موتور متن گفتار است و یک موتور متن به گفتار با رابط برنامه‌نویسی (API) به راحتی در نرم‌افزارهای گوناگون (پخش‌کننده‌های متن به گفتار) قابل فراخوانی و استفاده است.
 
بطور کلی برای تبدیل متن به گفتار نیاز است تا پارامترهای مهم در تولید گفتار استخراج و استفاده شوند. استخراج بعضی از این پارامترها همچون رشته آوایيآوایی نوشتار، کشش زمانی واجها و منحنی پیچ گفتار الزامی و بعضی دیگر همچون سرعت بیان، درنگ بین کلمات و تن صدا از جمله پارامترهای غیر ضروری می باشندمی‌باشند که استفاده از آنها منجر به بهبود خروجی سیستم می گردد می‌گردد.<ref>بهرنگ قاسمی زاده و مجید نم نبات، [http://pars.ie/publications/papers/pre-prints/farsi-text-to-speech.pdf ساختار یک سیستم تبدیل متن به گفتار برای زبان فارسیT] </ref>. پیمانه هایپیمانه‌های لازم برای تبدیل متن به گفتار در یک سیستم تولید گفتار از متن عموماعموماً شامل دو بخش است: بخش پردازش زبان طبیعی اجزاء سازنده متن ورودی شامل کلمات، گروههایگروه‌های گرامری، جمالت و دیگر اطلاعات مرتبط با پردازش زبان که در بخش پردازش سیگنال دیجیتالی به عنوان ورودی مورد نیاز است تهیه می کندمی‌کند. بخش پردازش دیجیتالی سیگنال با استفاده از نتایج حاصل از بخش NLP، پارامترهای گفتار را شامل رشته آوایيآوایی متن و پارامترهای نوایينوایی تعیین و در انتها گفتار خروجی با استفاده از یک موتور سنتز تولید می گرددمی‌گردد.
 
بطور کلی برای تبدیل متن به گفتار نیاز است تا پارامترهای مهم در تولید گفتار استخراج و استفاده شوند. استخراج بعضی از این پارامترها همچون رشته آوایي نوشتار، کشش زمانی واجها و منحنی پیچ گفتار الزامی و بعضی دیگر همچون سرعت بیان، درنگ بین کلمات و تن صدا از جمله پارامترهای غیر ضروری می باشند که استفاده از آنها منجر به بهبود خروجی سیستم می گردد <ref>بهرنگ قاسمی زاده و مجید نم نبات، [http://pars.ie/publications/papers/pre-prints/farsi-text-to-speech.pdf ساختار یک سیستم تبدیل متن به گفتار برای زبان فارسیT] </ref>. پیمانه های لازم برای تبدیل متن به گفتار در یک سیستم تولید گفتار از متن عموما شامل دو بخش است: بخش پردازش زبان طبیعی اجزاء سازنده متن ورودی شامل کلمات، گروههای گرامری، جمالت و دیگر اطلاعات مرتبط با پردازش زبان که در بخش پردازش سیگنال دیجیتالی به عنوان ورودی مورد نیاز است تهیه می کند. بخش پردازش دیجیتالی سیگنال با استفاده از نتایج حاصل از بخش NLP، پارامترهای گفتار را شامل رشته آوایي متن و پارامترهای نوایي تعیین و در انتها گفتار خروجی با استفاده از یک موتور سنتز تولید می گردد.
== موتورهای متن به گفتار مشهور ==
در حال حاضر [[ئی اسپیک]] و "«[[پارس خوان]]"» و "«[[آریانا]]"» موتورهای متن به گفتار مشهور هستند که از زبان فارسی پشتیبانی می‌کنند.
 
یکی از کامل‌ترین پخش‌کننده متن به گفتار در [[مایکروسافت ویندوز]] بالابولکا {{انگلیسی|Balabolka}} نام دارد. ویژگی جالب این نرم‌افزار تشخیص متن فارسی از انگلیسی و استفاده از موتورهای متن به گفتار جداگانه (با رابط Windows SAPI 5) برای هر یک از زبان‌ها است.
 
آریانا نرم‌افزار متن خوان فارسی شرکت دانش بنیان عصر گویش پرداز است. آریانا که نسخه قبلی آن همراه صفحه خوان جاوز (Jaws) برای خواندن صفحات و متون توسط نابینایان و کم بینایان طراحی شده بود، بعد از شش سال پوست انداخته و عصر گویش با تکنولوژی متفاوتی نسخه جدیدی را عرضه کرده است که صدای طبیعی و کاملاکاملاً قابل فهم تولید می‌کند. صدای تولیدی از آریانای 3۳ را می‌توان طبیعی‌ترین صدای تولید شده توسط کامپیوتر برای زبان فارسی دانست.
در این نرم افزار،نرم‌افزار، از روش‌های آماری برای تبدیل متن به صوت استفاده شده است و دارای صدای زن و مرد از صدای گوینده‌های حرفه‌ای سازمان صدا و سیما است. همچنین در آریانا ۳، قابلیت‌های هوشمند پردازش زبان طبیعی فارسی مانند تشخیص خودکار کلمات هم‌نگاره (مانند مَرد و مُرد)، تشخیص کسره اضافه برای خواندن روان متون، تلفظ کردن خودکار کلمات، خواندن کلمات انگلیسی و عربی با صدای یکسان با فارسی و تشخیص هوشمند انواع اعداد (تاریخ، ساعت، مبلغ و ...) است.
آریانا به صورت ماژول و سرویس تحت وب (Persian TTS Cloud) عرضه شده است که برنامه‌نویس‌ها و سایر کسب و کارها را قادر به استفاده از قابلیت متن خوان فارسی در نرم‌افزارها و سخت‌افزارهای رایانه‌ای می‌کند. از قابلیت متن خوان می‌توان در سامانه‌های تلفن گویا و VoIP برای خواندن اطلاعات متنی مختلف، در سامانه‌های انتقادات و پیشنهادهای تلفنی جهت خواندن نظریه کارشناسی برای کم کردن حجم حضور ارباب رجوع در ادارات و ... استفاده کرد و هم‌چنین در وب‌سایت‌ها (به ویژه در خبرگزاری‌ها و برای ایجاد امکان خواندن توسط افراد کم‌بینا و مسن) و نرم‌افزار‌هاینرم‌افزارهای تلفن همراه (مانند کتاب خوان، پیامک خوان و ...) به عنوان یک سرویس استفاده کرد. mohammad.hosseinian
 
یکی از کامل‌ترین پخش‌کننده متن به گفتار در [[مایکروسافت ویندوز]] بالابولکا {{انگلیسی|Balabolka}} نام دارد. ویژگی جالب این نرم‌افزار تشخیص متن فارسی از انگلیسی و استفاده از موتورهای متن به گفتار جداگانه (با رابط Windows SAPI 5) برای هر یک از زبان‌ها است.
خط ۲۷:
== مقالات مرتبط ==
[[ئی اسپیک]]
 
== پیوند به بیرون ==
* وب‌سایت ئی اسپیک: http://espeak.sourceforge.net/
* وب‌سایت گروه برنامه نویسیبرنامه‌نویسی ئی‌اسپیک فارسی: http://espeak.ir/
 
* وب‌سایت گروه برنامه نویسی ئی‌اسپیک فارسی: http://espeak.ir/
 
* وب‌سایت پخش‌کننده متن به گفتار بالابولکا: http://www.cross-plus-a.com/balabolka.htm
 
سطر ۴۰ ⟵ ۳۸:
* https://en.wikipedia.org/wiki/ESpeak
* https://en.wikipedia.org/wiki/Microsoft_Speech_API
 
 
{{پانویس}}