بنبست اوپنایآی در توسعه نسل بعدی مدلهای زبان: مسیری که به مدلهای استدلال محور رسید
گزارشی از والاستریت ژورنال میگوید بزرگترین استارتآپ هوش مصنوعی جهان در توسعه نسل بعدی مدلهای…
۲ دی ۱۴۰۳
۱۵ مرداد ۱۴۰۳
زمان مطالعه : ۵ دقیقه
تاریخ بهروزرسانی: ۱۶ مرداد ۱۴۰۳
رویداد رونمایی از دادماتولز برگزار شد. تشکیل جامعهای از مشارکتکنندگان جهت توسعه NLP زبان فارسی یکی از مهمترین اهداف و راهبردهای رویداد رونمایی از ابزار دادماتولز مطرح شد. دادماتولز، اولین ابزار جامع پردازش زبان فارسی است که به دنبال توسعه و پیشرفت پردازش زبان فارسی در هوش مصنوعی است.
به گزارش پیوست، رویداد رونمایی از دادماتولز، ابزار پردازش زبان فارسی با حضور اساتید دانشگاه، متخصصان حوزه هوش مصنوعی و فعلان این حوزه برگزار شد.
دادماتولز، ابزار کاربردی برای متخصصان هوش مصنوعی و برنامهنویسان است که موجب میشود توسعه نرمافزارهای کاربردی مبتنی بر NLP فارسی به سادگی انجام گیرد.
سید محمدباقر سجادی، مدیرعامل شرکت دادماتک تاریخ آغاز به کار ابزار دادماتولز را مهر ۱۴۰۰ اعلام کرد که ایده آن به دلیل نبود بستر مناسب جهت توسعه NLP شکل گرفت.
او در این باره گفت:« اواخر سال ۱۳۹۹ با افزایش کارهای تکراری تصمیم گرفتیم بستری را در دادماتک گسترش دهیم تا مجموعه از انجام کارهای تکراری پرهیز کنند. مهر ۱۴۰۰ این کار آغاز شد. اما برای اوپن سورس کردن آن با چالشهایی از منظر تعداد ماژول، بهبود ساختار، تمیز کردن کد و از این دست موارد مواجه بودیم. دی ماه ۱۴۰۰ اولین نسخه اوپن سورس دادماتولز توسعه پیدا کرد که در گیتهاب منتشر شد.
در سال ۱۴۰۱ با تمایل برخی از سازمانهای دولتی و متولی برای حمایت از این محصول روبه رو بودیم. اوایل سال ۱۴۰۲ با حمایت ستاد اقتصاد دیجیتال این پروژه را جلو بردیم و در آبان ۱۴۰۲ دادماتولز وارد فاز دوم شد.
سجادی در رابطه با اهداف طراحی این ابزار گفت:« از روز اول هدف اصلی ما توسعه NLP در زبان فارسی بود؛ زبانی که جزو زبانهای LowResource محسوب میشود و کمتر به آن پرداخته شده است. از دیگر اهداف ما، توسعه ابزار یکپارچه در زبان فارسی که در صنعت، دانشگاه و همه جا مورد استفاده قرار بگیرد بود که محقق شد. سهولت استفاده از NLP برای دیگران نیز از دیگر اهداف ماست.»
محمدباقر سجادی، مدیرعامل شرکت دادماتک راهبرد این مجموعه را ایجاد جامعهای از مشارکتکنندگان در NLP فارسی عنوان کرد و گفت:« هدف ما ایجاد جامعهای از مشارکتکنندگانی است که دادماتولز را یا دقیقتر بگویم NLP زبان فارسی را بهبود و توسعه دهند تا همیشه بهروز باشد.» او همچنین از درخواست دانشگاههای روسیه و کانادا برای ارتباط و کار در NLP زبان فارسی خبر داد.
راهبری پروژه، مدیریت ریپازیتوری، مشوقسازی، طراحی معماری، تعیین راهبردها و اولویتها، ارتباط با صنعت و دانشگاه و تجمیع حمایتها نقشهایی است که شرکت دادماتک در رابطه با دادماتولز عهدهدار آن است.
سجادی درباره نقشهای شرکت دادماتک گفت:« شرکت دادماتک که نقشهای گوناگونی را برعهده دارد از واگذاری نقشها به تیمهای صنعتی، دانشگاهی و دولتی استقبال میکند و خواهان ادامهدار شدن این مسیر است.»
در این رویداد نیاز اصلی دادماتولز بهبود مستمر آن عنوان و گفته شد در حال حاضر هیچ ادعایی مبنی بر کامل بودن این ابزار وجود ندارد و قطعا دارای اشکالاتی است که باید به صورت مستمر بهبود یابد. اما مهمتر از همه نیاز است که ماژولهای بیشتری به آن اضافه شود تا مرجعیت دادماتولز گسترده و دائمی باشد.
مدیرعامل دادماتک گفت: برای گسترش سرویسها و فراهم آوردن امکانی برای استفاده همگانی در صدد جذب حمایت از سوی سازمانهای دولتی و حاکمیتی هستیم.
محمد کرابی، مدیر محصول دادماتولز نسخه اول گفت:« معماری نسخه اول دادماتولز بر اساس معماری اسپیسی و خط پاپ لاینی است. از ویژگی های مثبت پاپ لاین بودن میتوان به استفاده از آنها به عنوان خوراک و ورودیهای ماژولهای بعدی اشاره کرد.»
بهروز مینایی، دبیرستاد هوش مصنوعی، آزادسازی محصول (اوپن سورس) و حمایت اولیه از آن خصوصا در لایههای پیکره زیرساختی را از اقدامات جلوبرندهای قلمداد کرد و گفت:« ابزارهای مورد استفاده در دادماتولز، مقدمهای است برای تسکهای سطح بالا مانند تحلیل احساسات و ترجمه ماشینی و تمام کارهای معنایی.» او ورود هوش مصنوعی مولد و کاربرد گسترده مدلها را تحولی در تسکهای صرفی، نحوی و معنایی دانست.
سجادی درباره انعقاد تفاهمنامه سازمان ملی هوش مصنوعی و دادماتک گفت:«این تفاهمنامه در راستای حمایت از پروژههای مقطع کارشناسی و ارشد است. دانشجویان موضوعی را پیشنهاد میدهند که در صورت کاربردی بودن در بستر دادماتولز قرار بگیرد و اوپن سورس شود و با ساختار دادماتولز برای همگان قابل استفاده شود. در صورت تائید پروپوزال دانشجو از سمت دادماتولز و سازمان تا سقف ۲۵ میلیون تومان از پایاننامه دانشجویان حمایت میشود. سجادی اشاره کرد که حمایت از پایاننامهها محدود به دانشجویان دانشگاهی نیست و از طرف افراد خارج از دانشگاه هم این کار شدنی است.
صادق جعفری، مدیر محصول دادماتولز درباره ویژگیهای نسخه دوم دادماتولز گفت:« این نسخه مبتنی بر adapters و به صورت پایپلاین است. یعنی ماژولها همراه با هم فراخوانده میشود تا سرعت زیادی در استفاده داشته باشد. دیتاستهای مختلفی هم در دادماتولز وجود دارد. embedingهای مختلف هم قابل استفاده در ماژولها است.»
او در ادامه درباره توسعه ابزارها گفت:« برای بهبود یک ابزار ابتدا نیاز است تا با ساختار آن آشنا شد. معماری و طراحی دادماتولز استاندارد و ساده است که آموزش و اضافهکردن مدلها در این ابزار کار سادهای باشد.»
سید مهدی شریعتزاده، دبیر ستاد اقتصاد دیجیتال گفت:« ابزار دادماتولز پیش از حمایت ستاد اقتصاد دیجیتال این پروژه به عنوان یک محصول دانش بنیان تائید شده بود. این پروژه در ادامه برای اسکیل کردن، افزایش دقت و کسب توانمندیهای جدید و توسعه کامیونتی تعاملاتی با معاونت علمی داشتند و از سمت اقتصاد دیجیتال و ستاد هوش مصنوعی. صحبت این بود که کمک کنیم پروژه در مقیاس بالاتر با توانمندیهای بهروزتر و با مشارکت بیشتر دانشگاهیها و بهرهگیری بیشتر صنعتیها راه خودش را طی کند. او به اهمیت ادامهدار بودن مسیر و تشکیل جامعهای از مشارکتکنندگان در این زمینه تاکید داشت.
سجادی از برگزاری مسابقه دادماتولز به صورت دو مرحلهای در پاییز سال جاری خبر داد. این مسابقه که در بحث مشوقسازی است تحت عنوان نامهها و اسناد اداری صورت خواهد گرفت تا کاربرد هوش مصنوعی زبان فارسی در آن نشان داده شود. او همچنین گفت که خروجی نهایی از این مسابقه کاملا اوپن سورس خواهد شد و در اختیار شرکتهای نرمافزاری و غیره قرار خواهد گرفت.