skip to Main Content
محتوای اختصاصی کاربران ویژهورود به سایت

فراموشی رمز عبور

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ عضو شوید

ثبت نام سایت

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ وارد شوید

فراموشی رمز عبور

وارد شوید یا عضو شوید

جشنواره نوروزی آنر

مدل‌های زبانی بزرگ فارسی؛ اهرم توسعه هوش مصنوعی ایرانی

ایمان ظهوریان مدیر نشریه دیده بان مرکز تحقیقات هوش مصنوعی پارت

۶ اردیبهشت ۱۴۰۴

زمان مطالعه : ۵ دقیقه

اگر به عمق تاروپود تاریخ ایران نگاهی بیندازیم، تعدادی گنج ارزشمند را به چشم می‌بینیم که از نیاکان ما به نسل امروزی منتقل شده‌اند. یکی از گران‌بهاترین آنها، زبان شیرین فارسی است که رد آن از اشعار کهن رودکی تا الگوریتم‌های پیچیده هوش مصنوعی قابل مشاهده است. اما آنچه که باعث شده این زبان در گذر زمان نه‌تنها خاموش نشود، بلکه پویاتر و بالنده‌تر به مسیر خود ادامه دهد، روح خلاق و فرهنگ‌ساز مردمی است که هر بار، ظرفی تازه برای شکوفایی زبان فارسی انتخاب کرده‌اند. روزگاری این خلاقیت در دیوان اشعار و کتاب‌های نثر نمود می‌یافت و امروز نوبت به ظرف جدیدی رسیده که آن را تحت عنوان «مدل‌های بزرگ زبانی» می‌شناسیم.

مدل‌های زبانی بزرگ یا همان LLMها، نه فقط یک نوآوری فنی، بلکه ادامه همان سنت دیرینه هستند. همان‌طور که وظیفه پاسداشت زبان، روزگاری بر عهده خطاطان، شاعران، نویسندگان و هنرمندان بود، اکنون نوبت پژوهشگران، مهندسان و توسعه‌دهندگان فناوری است که این راه را ادامه دهند و زبان فارسی را در دل فناوری‌های آینده تثبیت کنند. جهان امروز، جهان داده‌هاست و اگر زبان مادری ما نتواند با ابزارهای قدرتمند و قابل اتکا در این حوزه حضور پیدا کند، رفته‌رفته از میدان حذف خواهد شد. اینجاست که مدل‌های زبانی فارسی به‌عنوان اهرمی حیاتی برای بقا و تعالی زبان ما وارد صحنه می‌شوند. در حال حاضر، مدل‌های زبانی چندزبانه و غیرایرانی زیادی وجود دارند که از زبان فارسی هم پشتیبانی می‌کنند؛ اما تفاوتی اساسی میان «مجهز شدن به زبان فارسی» و «ساخته ‌شدن بر بستر زبان فارسی» وجود دارد.

مدل‌های زبانی غیرایرانی که به زبان فارسی تجهیز شده‌اند، شاید بتوانند متون فارسی را بخوانند، اما درکی از پشتوانه فرهنگی آن ندارند؛ شاید مهمانی باشند که بتوانند به زبان ما صحبت کنند، اما چهارگوشه خانه را مانند میزبان نمی‌شناسند. ما نیازمند مدل‌ زبانی هستیم که نه‌تنها فارسی را بفهمد، بلکه به فارسی «بیندیشد». هوشی که اگر واژه «یلدا» را شنید، آن را تنها به‌عنوان یک اسم خاص پردازش نکند، بلکه به کنکاش عمق آن در حافظه فرهنگی این سرزمین بپردازد. این همان اهرمی است که می‌تواند ما را از یک مصرف‌گرای صرف به سمت تولید ارزش بومی سوق دهد تا به‌جای لذت‌بردن لحظه‌ای از میوه‌های درخت، خود درختی ریشه‌دار و عظیم به بار بیاوریم.

لزوم توسعه مدل‌های بومی، تنها به این موارد خلاصه نمی‌شود. زمانی که ما استفاده از هوش مصنوعی را تنها به مدل‌های خارجی محدود کنیم، عملاً به شرکت‌های توسعه‌دهنده این مدل‌ها اجازه می‌دهیم بنا به تمایل خود، دسترسی کاربران و کسب‌وکارهای ما را محدود، سانسور و یا قطع کنند. ما در حال ساختن خانه بر روی زمین دیگران هستیم؛ شاید امروز به ما اجازه بدهند که از این خانه استفاده کنیم، اما آیا تضمینی هست که فردا هم نظر آنها چنین باشد؟ برای اینکه بتوانیم بر این ناامنی غلبه کنیم و آینده‌ای پایدار برای فناوری هوش مصنوعی بومی بسازیم، نیاز به یک «تنظیم‌گری حامیانه» داریم؛ تنظیم‌گری که نه سد راه نوآوران، بلکه مشوق و همراه آنها باشد.

تنظیم‌گری در حوزه مدل‌های زبانی را می‌توان به ستون فقرات مستحکم این سیستم زنده تشبیه کرد که در عین انعطاف‌پذیری، از فروپاشی و کج‌روی‌های احتمالی جلوگیری می‌کند. حتی پیشرفته‌ترین مدل‌های زبانی هم به طور مکرر در معرض تهدیداتی مانند نقض قانون کپی‌رایت، ارائه داده‌های مخاطره‌آمیز، تولید اطلاعات نادرست (Hallucination) و… قرار دارند و بدون تنظیم‌گری صحیح، معایب فعالیت آنها از مزایایشان پیشی می‌گیرد. تنظیم‌گری در اکوسیستم هوش مصنوعی ایران، می‌تواند در سه دسته‌بندی کلی انجام بگیرد: 1- حمایت از شرکت‌ها و تیم‌های توسعه‌دهنده مدل‌های بومی 2- حفاظت از حقوق کاربران، داده‌ها و حریم خصوصی افراد 3- تسهیل دسترسی پژوهشگران و توسعه‌دهندگان به زیرساخت‌ها و منابع لازم. این سه وظیفه می‌بایست به‌صورت هم‌زمان انجام شود و کوتاهی در تحقق هرکدام، پیشرفت مدل‌های زبانی بومی را متوقف نه، اما بسیار دشوار می‌کند.
در حال حاضر، زیست‌بوم نوپای هوش مصنوعی فارسی، دچار آفت «فعالیت جزیره‌ای» شده که فرصت هم‌افزایی و هم‌فکری را از فعالان این عرصه سلب کرده است. بسیاری از توسعه‌دهندگان، پژوهشگران و فعالان این عرصه، به دلیل نبود بستر اطلاع‌رسانی و نشست‌های مرتبط، از فعالیت دیگر هسته‌های فعال این اکوسیستم بی‌اطلاع هستند و همین باعث هم‌پوشانی و موازی‌کاری در حوزه توسعه مدل‌های زبانی بومی شده است. برای عبور از این چالش، راهکارهای عملی متعددی پیشنهاد شده که یکی از مؤثرترین آنها، برگزاری رویدادها و همایش‌های مرتبط با مدل‌های زبانی فارسی است. رویدادهایی از این دست، حکم حلقه‌های اتصال گمشده‌ای را دارند که می‌توانند جزایر پراکنده این زیست‌بوم را به یکدیگر متصل و آنها را به مجموعه‌ای واحد و منسجم تبدیل کنند.
در همین راستا، به‌زودی شاهد برگزاری رویدادی تحت عنوان «هوش مصنوعی و قند پارسی؛ بر مدار نوآوری‌های پارت» هستیم که پرداختن به جنبه‌های مختلف مدل‌های زبانی فارسی را در محوریت کار خود قرار داده است. این رویداد، نه‌تنها فرصتی برای بررسی چالش‌ها، موفقیت‌ها و مسیر رشد مدل‌های زبانی فارسی است، بلکه می‌تواند فضایی برای شبکه‌سازی، گفتگوهای تخصصی و هم‌افزایی بیشتر فعالان این عرصه باشد. این ارتباط مستقیم و بدون واسطه، تقویت‌کننده فضای همیاری و رشد جمعی است و زیست‌بوم هوش مصنوعی فارسی را یک گام به بلوغ نزدیک‌تر می‌کند. رویداد «هوش مصنوعی و قند پارسی؛ بر مدار نوآوری‌های پارت» در اوایل خردادماه امسال با حضور جمعی از متخصصین، اساتید و اندیشمندان حوزه مدل‌های زبانی برگزار می‌شود. از تمام پژوهشگران، متخصصان، علاقه‌مندان و مدیران کسب‌وکار که دغدغه پیشرفت هوش مصنوعی بومی و توسعه مدل‌های زبانی فارسی را دارند، دعوت می‌کنم با حضور در این رویداد، سهمی در ترسیم آینده هوش مصنوعی فارسی ایفا کنند.
امروز در بزنگاه سرنوشت‌سازی قرار داریم که لحظه‌ای تعلل و تکروی، آسیب‌های جبران‌ناپذیری به فناوری مدل‌های زبانی ما وارد می‌کند؛ آن هم در شرایطی که دیگر کشورها برای تثبیت جایگاه خود در عرصه فناوری هوش مصنوعی، با تمام قوا به میدان رقابت آمده‌اند و تلاش دارند تا سهم بیشتری از آینده این فناوری را به مدل مطلوب خود اختصاص بدهند. در چنین میدان پررقابتی، فرصت تأخیر نداریم؛ امروز فرصتی برای آینده‌سازی در اختیار ما است و امیدواریم که این فرصت طلایی به سربلندی زبان فارسی در دنیای مدل‌های زبانی ختم شود.

https://pvst.ir/kxl

0 نظر

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

برای بوکمارک این نوشته
Back To Top
جستجو