چند روز پيش بود که اين
سيستمهاي يادگيري بر اساس نمونهها کار مي کنن. بايد از چيزها نمونه هاي زيادي داشته باشيم تا بتونيم به ماشين ها بگيم «اينها رو نگاه کن، حالا سعي کن تکرارش کني». مثلا اگر قراره ماشين ياد بگيره گربه چيه بايد چند هزار عکس گربه ببينه يا اگر قراره صداي ما رو به متن تبديل کنه، بايد چند صد ساعت صدا و متن داشته باشه. حالا معلومه که چرا سيستم هاي مرتبط با صوت فارسي، عقب از بقيه هستن: چون نمونه هاشون کمه.
شرکت هاي مختلف براي حل اين مشکل راه حل هاي مختلف دارن. مثلا ممکنه يک شرکت ارائه دهنده نقشه، چند ده نفر رو بذاره که اسم همه خيابون ها رو چندين بار بخونن تا بعدا کامپيوتر بفهمه «يوسف آباد» چطوري تلفظ مي شه و اگر شما گفتين «يوسف آباد» بفهمه ماجرا چيه. اما همه که يه مرکز تماس ندارن و حتي اگر هم داشته باشن، در نهايت به چند صد ساعت صدا مي رسن. پس چيکار کنيم؟
پروژه بنياد موزيلا قراره با هممون کمک کنه. هم به همه توليد کننده هاي سيستم هاي مرتبط با صوت فارسي [و هر زبون ديگه] و هم به همه مصرف کننده هايي که لازم داريم کامپيوترها صدامون رو بفهمن. توي پروژه صداي مشترک موزيلا، شما صداتون رو اهدا مي کنين، ترسناک نيست! در واقع مي رين و چند تا جمله رو با صداي طبيعي خودتون مي خونين و ديتابيسي از متن و صدا رو کامل مي کنن. اگر هم ترجيح دادين، مي تونين به جاي خوندن جمله، جمله هاي بقيه رو گوش بدين و اعتبار سنجي کنين. ديتابيسي که درسته مي شه، آزاد است و در اختيار هر کسي که بعدا بخواد روش کار کنه.
پروژه صداي مشترک ابتکار موزيلا براي کمک به آموزش ابزارهاي يادگيري ماشين است تا بدانند مردم واقعي چگونه صحبت ميکنند.
توي اين پروژه شما حتي مي تونين سن و جنس خودتون رو هم بزنين و ديتايي غني تر براي هر کسي درست کنين که مي خواد به کامپيوترها «فهميدن» صدا رو آموزش بده. همونطور که گفتم اين ديتابيس کاملا آزاد و قابل استفاده توسط همه است و مشارکت توش باعث مي شه زندگي همه فارسي زبان ها آسونتر و با کيفيت تر بشه. پس به صفحه پروژه صداي مشترک موزيلا برين و چند تا جمله بخونين و حتي مثل من صفحه اش رو باز بذارين و گاه گداري براي رفع کسالت هم که شده، چند تا جمله از خودتون اهدا کنين يا به جمله هاي بقيه گوش بدين و بگين درست خوندنش يا نه. اينطوري همه با هم به پيشرفت زبان فارسي در دنياي کامپيوتر کمک کرديم و زودتر به دنيايي مي رسيم که توش اگر کسي دوست نداره، مجبور نباشه تايپ کنه.
من يک هفته است که در پروژ صداي مشترک موزيلا مشارکت ميکنم. هر روز 10 تا جمله ضبط ميکنم و به 10 تا جمله گوش ميکنم و همه اينها 10 دقيقه هم از وقت من را نميگيره، شما هم اگر علاقه داريد به پيشرفت زبان فارسي در دنياي کامپيوتر کمک کنيد از «اينجا» به پروژه صداي مشترک موزيلا بپيونديد.
مي ,رو ,هم ,صداي ,جمله ,پروژه ,صداي مشترک ,تا جمله ,پروژه صداي ,چند تا ,مشترک موزيلا ,صداي مشترک موزيلا