شاخص نوآوری ایران؛ آینهای از اقتصاد دانشبنیان کشور برای تعیین نقشه راه آینده
چشم انداز نوآوری ایران در سال ۲۰۲۴ کشوری را نشان می دهد که تلاش می…
۲۴ آذر ۱۴۰۳
۲۸ آذر ۱۴۰۳
زمان مطالعه : ۴ دقیقه
توسعه مدلهای زبانی هوش مصنوعی به زبان فارسی همواره با چالشهایی همراه است، از کمبود GPUها برای آموختن به مدل زبانی گرفته تا انعطافناپذیری کسبوکارها نسبت به مدلهای هوش مصنوعی، مدیرعامل «یوسیستنت»، به عنوان استارتآپ فعال در حوزه دستیار صوتی هوشمند معتقد است کمبود دادههای زبان فارسی در کنار تحریمها توسعه هوش مصنوعی یا دستیار صوتی هوشمند را پیچیدهتر کرده است.
زهرا رضوی، مدیرعامل یوسیستنت در توضیح نحوه فعالیت این استارتآپ در گفتوگو با پیوست گفت: فعالیت خود را در ابتدا در زمینه صوت به متن آغاز کردهاند و با مشاهده کمبود دستیارهای هوش مصنوعی فارسی زبان بوده که تصمیم گرفتهاند به طور جدی وارد حوزه تعاملی دستیارهای صوتی هوشمند شوند. او در باب دقت این ابزار گفت: ما حدود هزار ساعت داده برای آموزش این مدل جمعآوری کردهایم که توانسته آنرا به دقت بالایی برساند.
رضوی با اشاره به فعالیتهای پیشین یوسیستنت در حوزههای اقتصادی، شرکت پست و آنلاین شاپها یادآور میشود که هر یک از این حوزهها اصطلاحات و واژگانی دارند که در دایره کلمات معمول فارسی نیست. ما با جمعآوری حجم معقولی از دادهها توانستهایم مدل خود را با این واژهها و اصطلاحات آموزش دهیم.
یوسیستنت پلتفرمی است که فعالیت خود را از سال ۱۴۰۰ و با تمرکز بر دستیارهای صوتی هوشمند آغاز کرده. این شرکت تمرکز خود را معطوف آموزش( Train) دادن مدلهای زبانی بزرگ اوپن سورس مانند لاما ۳( Llama 3) و فاین تیون(Fine Tune) کردن آنها به زبان فارسی کرده است.
رضوی در مورد دو سرمایهگذار اصلی این دستیار صوتی هوشمند گفت: دیجینکست از زمان آغاز به کار ما در سوله نوآوری همراه و حامی ما بوده و شرکت آریو نیز در همان دور اول سرمایهگذاری با ما همراه شدن تا این دو به طور همزمان سرمایهگذاران اصلی ما باشند.
او در خصوص چالشهای توسعه هوش مصنوعی افزود: در زمینه توسعه هوش مصنوعیهای فارسی زبان بیشترین مشکل را میتوان دسترسی به منابع پردازش و GPUها دانست، به خصوص اگر مدلی مانند یوسیستنت برپایه پاسخ آنلاین و آنی باشد.
مدیرعامل این شرکت با اشاره به کمبود منابع و هزینههای بالا در اینباره اضافه کرد: حمایتهایی هم در این زمینه از سوی معاونت علمی بوده که ثبات و تداوم نداشته است
از نظر او بزرگترین محدودیت فعالان این حوزه همین مسئله وارد کردن GPUهاست که با توجه به تحریمها و فرآیند پیچیده و پرهزینه نصب و راهاندازی آنها، به معضل بزرگی بدل شده.
زهرا رضوی با گفتن این موضوع که هنوز در مراحل آزمون و خطا هستند، درصد دقت این مدل را در حوزههای مختلف را متفاوت عنوان کرد. طبق گفته او این دستیار هوش مصنوعی در حوزه آنلاین شاپ و ثبت سفارش به ۱۱ درصد خطا و در حوزه پستی هم به هفت درصد خطا رسیده است.
از آنجایی که زبان فارسی از لهجه و گویشهای متععددی تشکیل شده است، از مدیرعامل یوسیستنت پرسیدیم این گویشها و لهجهها تا چه اندازه در روند آموزش این دستیار صوتی هوشمند لحاظ شدهاند، او در پاسخ گفت: لهجههای ملایمتر را که شدت کمتری دارند در فرآیند آموزش این مدل وارد کردیم. مترصد پشتیبانی از لهجههای پیچیدهتر و گویشهایی که کلمات متفاوتی دارند هستیم؛ گلوگاه این امر هم داده است.
در حال حاضر یوسیستنت در واحد محتوایی دیجیکالا از قابلیت زیرنویسساز ویدئو خود استفاده میکند و انتظار میرود تا در آینده فرآیند سرچ صوتی را در این پلتفرم عملیاتی کنند.
هنوز مشخص نیست که قابلیت سرچ صوتی دیجی کالا قرار است در اختیار تمامی کاربران این پلتفرم قرار بگیرد یا فقط در اختیار کاربران سرویسهایی مثل دیجی پلاس.
رضوی با اشاره به حمایتی که معاونت علمی پیشین نهاد ریاست جمهوری در قالب ارائه منابع GPU با تخفیف به شرکتهای دانش بنیان از متوقف شدن این سرویس با آغاز به کار معاونت جدید و اهمیت این جنس حمایتها گفت.
زهرا رضوی به عنوان مدیرعامل و همبنیانگذار یوسیستنت، انتظار دارد زمینهای برای دسترسی آسانتر این قسم استارتآپها به GPUها و منابع اطلاعاتی فراهم شده و کسبوکارها نیز انعطاف بیشتری در زمینه بهرهوری از هوش مصنوعی به خرج دهند.