وکس‌فرج یک پیکرهٔ گفتار آزاد برای زبان‌های مختلف برای انجام تحقیقات یا تولید محصولات مبتنی بر تکنولوژی گفتار می‌باشد. این پروژه تحت پروانهٔ عمومی همگانی گنو منتشر می‌شود.

در وب سایت این پروژه ذکر شده‌است که اکثر مدل‌های صوتی که توسط نرم‌افزار متن‌باز تولید می‌شود دارای کد بسته می‌باشند و عموماً فایل‌های صوتی و متون مربوطه که برای تولید این مدل‌ها استفاده شده‌است، خارج از دسترس همگانی می‌باشد و هدف این پروژه جمع‌آوری گفتار و متون مربوطه برای استفاده در نرم‌افزارهای تشخیص گفتار آزاد و متن‌باز در لینوکس، ویندوز و مک می‌باشد. تمامی فایل‌های صوتی در این پروژه تحت پروانهٔ عمومی همگانی گنو منتشر می‌شود. سپس این فایل‌ها به مدل‌های صوتی برای استفاده در نرم‌افزارهای آزاد تشخیص گفتار (مانند CMU اسفینکس، ISIP، جولیوس، HTK و Kaldi) تبدیل شده و از طریق وب‌سایت پروژه منتشر می‌شود.

این پروژه در حال حاضر (اردیبهشت ۹۴) بیش از ۱۸ زبان را پشتیبانی می‌کند و زبان فارسی نیز یکی از آن‌ها می‌باشد. در صورت محقق شدن اهداف این پروژه، برای اولین بار برای زبان فارسی یک پیکره ۱۴۰ ساعتی با پروانهٔ عمومی همگانی گنو منتشر خواهد شد.

منابع

ویرایش