سناریوهای پسامذاکرات در آینده صنعت هوش مصنوعی ایران
هنوز دنیا از سردرگمی جنگ تعرفههای ترامپ خارج نشده که موضوع مذاکرات غیرمستقیم ایران و…
۳۱ فروردین ۱۴۰۴
۶ اردیبهشت ۱۴۰۴
زمان مطالعه : ۵ دقیقه
اگر به عمق تاروپود تاریخ ایران نگاهی بیندازیم، تعدادی گنج ارزشمند را به چشم میبینیم که از نیاکان ما به نسل امروزی منتقل شدهاند. یکی از گرانبهاترین آنها، زبان شیرین فارسی است که رد آن از اشعار کهن رودکی تا الگوریتمهای پیچیده هوش مصنوعی قابل مشاهده است. اما آنچه که باعث شده این زبان در گذر زمان نهتنها خاموش نشود، بلکه پویاتر و بالندهتر به مسیر خود ادامه دهد، روح خلاق و فرهنگساز مردمی است که هر بار، ظرفی تازه برای شکوفایی زبان فارسی انتخاب کردهاند. روزگاری این خلاقیت در دیوان اشعار و کتابهای نثر نمود مییافت و امروز نوبت به ظرف جدیدی رسیده که آن را تحت عنوان «مدلهای بزرگ زبانی» میشناسیم.
مدلهای زبانی بزرگ یا همان LLMها، نه فقط یک نوآوری فنی، بلکه ادامه همان سنت دیرینه هستند. همانطور که وظیفه پاسداشت زبان، روزگاری بر عهده خطاطان، شاعران، نویسندگان و هنرمندان بود، اکنون نوبت پژوهشگران، مهندسان و توسعهدهندگان فناوری است که این راه را ادامه دهند و زبان فارسی را در دل فناوریهای آینده تثبیت کنند. جهان امروز، جهان دادههاست و اگر زبان مادری ما نتواند با ابزارهای قدرتمند و قابل اتکا در این حوزه حضور پیدا کند، رفتهرفته از میدان حذف خواهد شد. اینجاست که مدلهای زبانی فارسی بهعنوان اهرمی حیاتی برای بقا و تعالی زبان ما وارد صحنه میشوند. در حال حاضر، مدلهای زبانی چندزبانه و غیرایرانی زیادی وجود دارند که از زبان فارسی هم پشتیبانی میکنند؛ اما تفاوتی اساسی میان «مجهز شدن به زبان فارسی» و «ساخته شدن بر بستر زبان فارسی» وجود دارد.
مدلهای زبانی غیرایرانی که به زبان فارسی تجهیز شدهاند، شاید بتوانند متون فارسی را بخوانند، اما درکی از پشتوانه فرهنگی آن ندارند؛ شاید مهمانی باشند که بتوانند به زبان ما صحبت کنند، اما چهارگوشه خانه را مانند میزبان نمیشناسند. ما نیازمند مدل زبانی هستیم که نهتنها فارسی را بفهمد، بلکه به فارسی «بیندیشد». هوشی که اگر واژه «یلدا» را شنید، آن را تنها بهعنوان یک اسم خاص پردازش نکند، بلکه به کنکاش عمق آن در حافظه فرهنگی این سرزمین بپردازد. این همان اهرمی است که میتواند ما را از یک مصرفگرای صرف به سمت تولید ارزش بومی سوق دهد تا بهجای لذتبردن لحظهای از میوههای درخت، خود درختی ریشهدار و عظیم به بار بیاوریم.
لزوم توسعه مدلهای بومی، تنها به این موارد خلاصه نمیشود. زمانی که ما استفاده از هوش مصنوعی را تنها به مدلهای خارجی محدود کنیم، عملاً به شرکتهای توسعهدهنده این مدلها اجازه میدهیم بنا به تمایل خود، دسترسی کاربران و کسبوکارهای ما را محدود، سانسور و یا قطع کنند. ما در حال ساختن خانه بر روی زمین دیگران هستیم؛ شاید امروز به ما اجازه بدهند که از این خانه استفاده کنیم، اما آیا تضمینی هست که فردا هم نظر آنها چنین باشد؟ برای اینکه بتوانیم بر این ناامنی غلبه کنیم و آیندهای پایدار برای فناوری هوش مصنوعی بومی بسازیم، نیاز به یک «تنظیمگری حامیانه» داریم؛ تنظیمگری که نه سد راه نوآوران، بلکه مشوق و همراه آنها باشد.
تنظیمگری در حوزه مدلهای زبانی را میتوان به ستون فقرات مستحکم این سیستم زنده تشبیه کرد که در عین انعطافپذیری، از فروپاشی و کجرویهای احتمالی جلوگیری میکند. حتی پیشرفتهترین مدلهای زبانی هم به طور مکرر در معرض تهدیداتی مانند نقض قانون کپیرایت، ارائه دادههای مخاطرهآمیز، تولید اطلاعات نادرست (Hallucination) و… قرار دارند و بدون تنظیمگری صحیح، معایب فعالیت آنها از مزایایشان پیشی میگیرد. تنظیمگری در اکوسیستم هوش مصنوعی ایران، میتواند در سه دستهبندی کلی انجام بگیرد: 1- حمایت از شرکتها و تیمهای توسعهدهنده مدلهای بومی 2- حفاظت از حقوق کاربران، دادهها و حریم خصوصی افراد 3- تسهیل دسترسی پژوهشگران و توسعهدهندگان به زیرساختها و منابع لازم. این سه وظیفه میبایست بهصورت همزمان انجام شود و کوتاهی در تحقق هرکدام، پیشرفت مدلهای زبانی بومی را متوقف نه، اما بسیار دشوار میکند.
در حال حاضر، زیستبوم نوپای هوش مصنوعی فارسی، دچار آفت «فعالیت جزیرهای» شده که فرصت همافزایی و همفکری را از فعالان این عرصه سلب کرده است. بسیاری از توسعهدهندگان، پژوهشگران و فعالان این عرصه، به دلیل نبود بستر اطلاعرسانی و نشستهای مرتبط، از فعالیت دیگر هستههای فعال این اکوسیستم بیاطلاع هستند و همین باعث همپوشانی و موازیکاری در حوزه توسعه مدلهای زبانی بومی شده است. برای عبور از این چالش، راهکارهای عملی متعددی پیشنهاد شده که یکی از مؤثرترین آنها، برگزاری رویدادها و همایشهای مرتبط با مدلهای زبانی فارسی است. رویدادهایی از این دست، حکم حلقههای اتصال گمشدهای را دارند که میتوانند جزایر پراکنده این زیستبوم را به یکدیگر متصل و آنها را به مجموعهای واحد و منسجم تبدیل کنند.
در همین راستا، بهزودی شاهد برگزاری رویدادی تحت عنوان «هوش مصنوعی و قند پارسی؛ بر مدار نوآوریهای پارت» هستیم که پرداختن به جنبههای مختلف مدلهای زبانی فارسی را در محوریت کار خود قرار داده است. این رویداد، نهتنها فرصتی برای بررسی چالشها، موفقیتها و مسیر رشد مدلهای زبانی فارسی است، بلکه میتواند فضایی برای شبکهسازی، گفتگوهای تخصصی و همافزایی بیشتر فعالان این عرصه باشد. این ارتباط مستقیم و بدون واسطه، تقویتکننده فضای همیاری و رشد جمعی است و زیستبوم هوش مصنوعی فارسی را یک گام به بلوغ نزدیکتر میکند. رویداد «هوش مصنوعی و قند پارسی؛ بر مدار نوآوریهای پارت» در اوایل خردادماه امسال با حضور جمعی از متخصصین، اساتید و اندیشمندان حوزه مدلهای زبانی برگزار میشود. از تمام پژوهشگران، متخصصان، علاقهمندان و مدیران کسبوکار که دغدغه پیشرفت هوش مصنوعی بومی و توسعه مدلهای زبانی فارسی را دارند، دعوت میکنم با حضور در این رویداد، سهمی در ترسیم آینده هوش مصنوعی فارسی ایفا کنند.
امروز در بزنگاه سرنوشتسازی قرار داریم که لحظهای تعلل و تکروی، آسیبهای جبرانناپذیری به فناوری مدلهای زبانی ما وارد میکند؛ آن هم در شرایطی که دیگر کشورها برای تثبیت جایگاه خود در عرصه فناوری هوش مصنوعی، با تمام قوا به میدان رقابت آمدهاند و تلاش دارند تا سهم بیشتری از آینده این فناوری را به مدل مطلوب خود اختصاص بدهند. در چنین میدان پررقابتی، فرصت تأخیر نداریم؛ امروز فرصتی برای آیندهسازی در اختیار ما است و امیدواریم که این فرصت طلایی به سربلندی زبان فارسی در دنیای مدلهای زبانی ختم شود.