راهکارهای صعود به جمع ۱۰ کشور برتر هوش مصنوعی
در یادداشت «تحلیل گزارشهای جهانی برای صعود ایران از رتبه ۷۰ در هوش مصنوعی به…
۱۸ فروردین ۱۴۰۴
۲۰ فروردین ۱۴۰۴
زمان مطالعه : ۶ دقیقه
سال ۱۴۰۳ در تقویم فعالان و علاقهمندان حوزه هوش مصنوعی (AI)، سالی سرشار از شگفتیها و ناامیدیها است. عدهای که چشمانداز آینده این فناوری را ترسیم میکردند، از رشد نمایی آن حیرتزده شدند و از طرف دیگر، گروهی که رویای روی کارآمدن زودهنگام ابزارهایی مانند هوش مصنوعی عمومی (AGI) و رباتهای هوشمند و چندمنظوره را در سر میپروراندند، سال را با کولهای از آرزوهای محقق نشده به انتها رساندند.
اما فارغ از تمامی انتظارات، سال ۱۴۰۳ نقطه عطفی در دنیای مدلهای بزرگ زبانی (LLMs)، چه در ایران و چه در دنیا به حساب میآید و پیشرفتهای چشمگیری که در این عرصه به دست آمد، آینده LLMها و در مقیاس بزرگتر، اکوسیستم هوش مصنوعی را دستخوش تغییر کرد. تنها زمانی میتوانیم به اهمیت دستاوردهای مدلهای زبانی در سال گذشته میلادی پی ببریم که تحولات رخ داده را از ابتدا مرور کنیم و نقاط کلیدی آن را زیر ذرهبین ببریم.
۸ روز بیشتر از آغاز سال ۲۰۲۴ میلادی نگذشته بود که مجموعه Mistral AI با انتشار مقالهای تأثیرگذار تحت عنوان Mixtral of Experts، به معرفی یک رویکرد جدید در عرصه LLMها پرداخت؛ رویکردی که اثرش تا همین امروز پابرجاست و باعث شد تا این استارتآپ کوچک، یکهتازی مجموعههای بزرگی مانند OpenAI و Google را به چالش بکشد. میسترال با دستاورد فنی خود، نشان داد که ارتقا عملکرد LLMها صرفاً محدود به افزایش تعداد پارامترها نیست و میتوان با کمی خلاقیت و نوآوری، مرزهای این صنعت را جا به جا کرد.
اگر ۱۴۰۳ را سال عرض اندام استارتآپهای کوچک در عرصه مدلهای زبانی بدانیم، پر بیراه نگفتهایم؛ چرا که در کنار میسترال ، مجموعههایی از جمله Anthropic و DeepSeek هم خوش درخشیدند و توانستند با عرضه مدلهای زبانی اختصاصی خود، بخشی از بازار را به تصاحب خود در آورند. در این میان، استارتآپ چینی DeepSeek موفق شد مسیر میسترال را با شایستگی تمام دنبال کند و با عرضه یک مدل سبک و در عین حال بهینهسازیشده، عملکردی مشابه برترین مدلهای OpenAI از خود به نمایش بگذارد. انقلاب DeepSeek در حوزه مدلهای زبانی متنباز، نیاز به سختافزارهای گرانقیمت برای آموزش و استفاده از مدلهای زبانی را کاهش داد و باعث شد تا سهام تراشهسازان آمریکایی مانند Nvidia، از آتش این اژدهای چینی درامان نماند.
پیشرفت LLMها در سال گذشته، محدود به بهینهسازی الگوریتم مدلها نماند و قابلیتهای جدید بسیاری به آنها افزوده شد. یکی از مهمترین این قابلیتها، توانایی «استنتاج» است که به لطف انتشارGPT-o1 و o1-mini به دست کاربران رسید. این نوآوری، ابعاد تازهای به فناوری مدلهای زبانی بخشید؛ چرا که پس از آن، LLMها این امکان را به دست آوردند که با اختصاص منابع بیشتر به مسائل پیچیده، موضوعات استنتاجی را حل کنند. قابلیت استنتاج، بهسرعت از انحصار OpenAI خارج شد و راه خود را به مدلهای زبانی دیگر باز کرد.
پیشرفت در قابلیتهای چندوجهی (Multimodal)، قابلیت دیگری است که دل علاقهمندان به هوش مصنوعی را در سال گذشته به دست آورد و باعث شد تا مدلهای زبانی، یک قدم بزرگ به سمت تحقق هوش مصنوعی عمومی بردارند. برای مثال، مجموعه Meta با معرفی مدل جدید خود تحت عنوان ImageBind، توجهات بسیاری را در زمینه مدلهای چندوجهی به خود جلب کرد. ImageBind میتواند دادههای متنی، تصویری، حرکتی، گرمایی، صوتی و سهبعدی را دریافت، تحلیل و ترکیب کند. این مدل، یکی از نخستین LLMهایی است که توانایی پردازش ۶ نوع داده ورودی بهصورت همزمان را داراست.
هرچند اغلب مدلهای چندوجهی، هنوز در مرحله تحقیق و توسعه قرار دارند، اما تعداد LLMهایی که در حال حاضر از بیش از یک نوع داده ورودی پشتیبانی میکنند، کم نیستند. در سال ۱۴۰۳، مدلهای GPT و Gemini، پشتیبانی از دادههای تصویری و صوتی را هم به مدل خود اضافه کردند و بهتبع آنها، LLMهای دیگر از جمله Grok، Claude ۳.۷ و… هم به این جریان پیوستند.
اما بد نیست نگاهی هم به اکوسیستم هوش مصنوعی ایران طی سال گذشته داشته باشیم. هر چند که در ۱۴۰۳ شاهد عرضه محصولات بومی و LLMهای فارسی متعددی در کشور بودیم؛ اما در مقام مقایسه، خصوصاً در برابر دیگر کشورهای منطقه و حوزه خلیج فارس، به جایگاهی که شایستگی آن را داریم دست پیدا نکردیم. مرتبه قابلقبولی هم که امروزه در اختیار داریم، به لطف مجموعههای خصوصی، استارتآپهای باانگیزه و توسعهدهندگان مستعدی است که با زیرساختها و امکانات محدود، موفق شدهاند دستاوردهای قابلتوجهی را رقم بزنند و اجازه ندهند شکاف میان ما و دیگر کشورها در زمینه هوش مصنوعی، از آنچه که هست عمیقتر شود.
یکی از مواردی که باعث میشود به آینده زیستبوم هوش مصنوعی در کشورامیدوار بمانیم، عرضه مدلهای زبانی پیشرفتهای است که طی ماههای گذشته بهصورت متنباز در دسترس توسعهدهندگان داخلی قرار گرفت. بهعنوان مثال، میتوانیم از گروه مدل زبانی «درنا» ساخته مرکز تحقیقات هوش مصنوعی پارت نام ببریم که با عرضه چندین LLM در اندازههای مختلف به صورت Open-source، در زمان خود توانست راه را برای ورود بسیاری از دانشجویان، محققان و کسبوکارها به دنیای هوش مصنوعی هموار کند. این مدلهای متنباز، علاوه بر افزایش دسترسیپذیری به فناوریهای جدید مدلهای زبانی، فرصتی استثنایی برای همافزایی میان فعالان این عرصه ایجاد کرد تا عرضه محصولات باکیفیت و پرمخاطب فارسی، تنها در مرحله تئوری باقی نماند. در کنار LLMهای عرضه شده توسط مجموعه پارت، شاهد ارائه چندین مدل زبانی فارسی توسط دیگر توسعهدهندگان داخلی بودیم که از جمله آنها میتوان به مدلهای «شیراز»، «تهران»، «PersianLLaMA»، «PersianMind»، «فابرت» و «آریابرت» اشاره کرد.
پیشرفت فناوری مدلهای زبانی کشور، تنها به عرضه LLMهای فارسی خلاصه نمیشود و از نمودهای دیگر آن میتوان به افزایش آگاهی جمعی پیرامون این فناوری در سطح کشور اشاره کرد. ما طی سال گذشته در مرکز تحقیقات هوش مصنوعی پارت، بخشی از توان و منابع خود را به توسعه مدلهای زبانی بزرگ و اپنسورس کردن LLMها اختصاص دادیم و تعهد به ادامه این مسیر را بخشی از وظایف خود میدانیم. در راستای همین هدف، تصمیم داریم در سال جدید، همراه با فعالیتهای بزرگ گذشته، بخشی از برنامههای خود را به آشنایی هرچه بیشتر اکوسیستم هوش مصنوعی کشور با فناوری مدلهای زبانی اختصاص دهیم. به عنوان مثال، میتوانم به رویدادی با نام هوش مصنوعی و قند پارسی، بر مدار نوآوریهای پارت اشاره کنم که در هفته آخر اردیبهشت ماه توسط مجموعه پارت برگزار میشود و انتظار میرود که به بزرگترین گردهمایی نخبگان، اساتید و فعالان حوزه مدلهای زبانی کشور تبدیل شود. رویدادهایی از این دست باعث میشود که به آینده LLMهای فارسیامیدوار بمانیم و با عزمی جدیتر در راستای پیشبرد اهداف مشخص شده در زمینه مدلهای زبانی فارسی گام برداریم.
در مجموع، ۱۴۰۳ را میتوان سال بهینهسازی، تخصصیسازی و ادغام مدلهای زبانی بزرگ نامید. سالی که تحولات در آن چنان عمیق و متنوع بود که به عنوان برههای سرنوشتساز در دنیای LLMها شناخته میشود و در آینده، بارها و بارها از دستاوردهای این سال یاد خواهیم کرد. آنچه که لذت بازنگری به سال گذشته را دوچندان میکند، قدرتنمایی مدلهای فارسی در میان سیل عرضه مدلهای جهانی است که اغلب به منابع و امکانات نامحدود متصلاند. استعداد و خلاقیت جوانان کشور توانست ما را از سال ۱۴۰۳ سربلند بیرون بیاورد؛ اما سؤال اصلی اینجاست؛ آیا اکوسیستم هوش مصنوعی کشور قادر است با حمایتهای حداقلی، همچنان شتاب پیشرفت خود را در سال ۱۴۰۴ حفظ کند؟ باید منتظر ماند و دید!