آذر ۲, ۱۴۰۳

عاشق وب

سایتی برای دوستداران وب. اخبار روز فناوری اطلاعات را در سایت عاشق وب دنبال کنید

در گفت وگو با عاشق وب مطرح شد نرم افزاری که امکان تشخیص کلمات کلیدی در فایل های صوتی را فراهم می آورد، تبدیل بلادرنگ صوت به متن

Rate this post

به گزارش عاشق وب محققان یکی از شرکت های دانش بنیان با ایجاد بزرگترین لغت نامه فارسی موفق به عرضه نرم افزار تبدیل متن به گفتار در زبان فارسی شدند و بنا بر گفته این پژوهشگران این محصول امکان پشتیبانی از گفتار و صوت در محیط های نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.
موسی مأموری، از محققان این طرح در گفتگو با ایسنا، تمرکز تحقیقاتی این شرکت دانش بنیان را توسعه سیستم های هوش مصنوعی دانست و اظهار داشت: تبدیل گفتار به متن فارسی با عنوان “فارس آوا” یکی از محصولات این شرکت است. صدا در هوش مصنوعی یکی از مهمترین و ارزشمندترین موضوعات است، بگونه ای که کشورهای پیشرفته بیشترین سرمایه گذاری را در این عرصه داشتند، چون راحت ترین راه ارتباطی کلامی میان انسان و کامپیوتر به حساب می آید.
وی ارتباط کلامی را راحت ترین، ساده ترین و سریع ترین راه ارتباطی توصیف کرد و اضافه کرد: دز نرم افزار “فارس آوا” از آخرین الگوریتم های یادگیری عمیق استفاده شده و بر خلاف محصولات مشابه نیازی به آموزش اولیه صدای کاربر ندارد و انواع صداها برایش قابل فهم است، ضمن آنکه امکان اضافه کردن فهم صوتی به انواع نرم افزارها وجود دارد.
مأموری با اشاره به اینکه هم اکنون این محصول ۱۵ درصد در زبان فارسی از گوگل بهتر عمل می کند، تصریح کرد: در گذشته شرکت های ایرانی از گوگل سرویس های لازم برای پردازش گفتار دریافت می کردند، ولی به علت تحریم شرکت های خارجی و افزایش قیمت ارز، مجبور به همکاری با شرکت های ایرانی در این زمینه هستند.
مأموری با اشاره به فعال شدن شرکت ها در زمینه پردازش گفتار، تصریح کرد: در این زمینه شرکت های گوناگونی فعال شدند، ولی یکی از مهمترین مزیت ما نسبت به رقبا، دارا بودن دیتا صدا است، بگونه ای که بیشتر از ۷ هزار ساعت به سیستم آموزش دادیم که در این زمینه رقیب دوم ما ۳ هزار ساعت است.
مجری طرح با تاکید بر اینکه اگر پردازش گفتار قوی باشد، می توان سامانه ها و محصولات مختلفی بر روی آن پیاده سازی کرد تا به صورت هوش مصنوعی کار کند، افزود: تبدیل گفتار فارسی به متن با دقت و سرعت بالا و به صورت بلادرنگ، توسعه و تولید به صورت کامل در داخل کشور، پشتیبانی از انواع فرمت های صوتی و ویدئویی با حجم بالا و امکان گرفتن صوت از میکروفن و تبدیل آن به متن به صورت آنلاین از قابلیت های این نرم افزار است.
این محقق، دارا بودن فرهنگ لغت بسیار بزرگ و وسیع را از دیگر مزایای نرم افزار تبدیل گفتار فارسی به متن عنوان نمود و خاطرنشان کرد: این نرم افزار همینطور امکان پشتیبانی از گفتار و صوت در محیط های نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.
وی دستیار هوشمند فارسی را از دیگر دستاورهای هوش مصنوعی این شرکت نام برد و خاطرنشان کرد: این نرم افزار که در آن از موتور “فارس آوا” استفاده شده است، همانند نرم افزارهایی چون سیری اپل و الکسا و گوگل اسیستنت کار می کند، بدین سان که دستور صوتی به کامپیوتر عرضه می شود و کامپیوتر صدا را تبدیل به متن می کند و بر مبنای بانک داده ای که در اختیار دارد، صوت را باردیگر به صورت گفتار تحویل می دهد.
مأموری دستیار هوشمند سازمانی را نوعی “چت بات” معرفی نمود که در کامل ترین حالت خود توانایی گفتگو کردن با انسان را دارد و افزود: این نرم افزار می تواند صحبت های انسان را متوجه شود، سوال های آنها را بفهمد و پاسخ متناسب با آنرا عرضه نماید و هیچگاه پاسخ های نادرست نمی دهد.
وی با اشاره به کاربردهای این نرم افزار توضیح داد: بعنوان مثال با استفاده از این نرم افزار می توان درباره آب و هوا، ترافیک شهری و دریافت خدمات اسنپ سوال کرد و یا زمانی که به کسی زنگ بزنید و یا می خواهید پیامک ارسال کنید، از آن پرسیده می شود و مبادرت به جست وجو می کند و در کسری از ثانیه پاسخ می دهد.
مأموری با اشاره به اینکه این خدمات به زبان فارسی است و تفاوت این نرم افزار با “سیری” در نوع انتخاب زبان است، خاطرنشان کرد: هم اکنون در ایران شرکتی به توانمندی “سیری” نداریم و ما جزو نخستین های این حوزه هستیم.
وی، مشاهده وضعیت آب و هوا، قیمت ارز و سکه، دیکشنری آنلاین، مشاهده نزدیکترین رستوران ها، پمپ بنزین ها، بیمارستان ها و غیره، برقراری تماس و ارسال پیامک و تنظیم آلارم، جست وجو و تحقیق، مکان یابی و ارتباط با تاکسی های آنلاین و امکان جستجوی کالاهای مورد نیاز از وب سایت ها را همچون کاربردهای این نرم افزار نام برد.
این محقق، دستیار هوشمند فوتبالی را از دیگر محصولات نرم افزاری فارس آوا دانست و اظهار داشت: این نرم افزار می تواند اطلاعات حوزه فوتبال را به کاربر عرضه نماید.