skip to Main Content
محتوای اختصاصی کاربران ویژهورود به سایت

فراموشی رمز عبور

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ عضو شوید

ثبت نام سایت

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ وارد شوید

فراموشی رمز عبور

وارد شوید یا عضو شوید

جشنواره نوروزی آنر

درباره سالی که گذشت؛ هوش مصنوعی و قند پارسی

حمیدرضا سلطانعلی‌زاده سرپرست فنی مرکز تحقیقات هوش مصنوعی پارت

۲۰ فروردین ۱۴۰۴

زمان مطالعه : ۶ دقیقه

سال ۱۴۰۳ در تقویم فعالان و علاقه‌مندان حوزه هوش مصنوعی (AI)، سالی سرشار از شگفتی‌ها و ناامیدی‌ها است. عده‌ای که چشم‌انداز آینده این فناوری را ترسیم می‌کردند، از رشد نمایی آن حیرت‌زده شدند و از طرف دیگر، گروهی که رویای روی کارآمدن زودهنگام ابزار‌هایی مانند هوش مصنوعی عمومی (AGI) و ربات‌های هوشمند و چندمنظوره را در سر می‌پروراندند، سال را با کوله‌ای از آرزو‌های محقق نشده به انتها رساندند.

اما فارغ از تمامی انتظارات، سال ۱۴۰۳ نقطه عطفی در دنیای مدل‌های بزرگ زبانی (LLMs)، چه در ایران و چه در دنیا به حساب می‌آید و پیشرفت‌های چشمگیری که در این عرصه به دست آمد، آینده LLM‌ها و در مقیاس بزرگتر، اکوسیستم هوش مصنوعی را دستخوش تغییر کرد. تنها زمانی می‌توانیم به اهمیت دستاورد‌های مدل‌های زبانی در سال گذشته میلادی پی ببریم که تحولات رخ داده را از ابتدا مرور کنیم و نقاط کلیدی آن را زیر ذره‌بین ببریم.

۸ روز بیشتر از آغاز سال ۲۰۲۴ میلادی نگذشته بود که مجموعه Mistral AI با انتشار مقاله‌ای تأثیرگذار تحت عنوان Mixtral of Experts، به معرفی یک رویکرد جدید در عرصه LLM‌ها پرداخت؛ رویکردی که اثرش تا همین امروز پابرجاست و باعث شد تا این استارت‌آپ کوچک، یکه‌تازی مجموعه‌های بزرگی مانند OpenAI و Google را به چالش بکشد. میسترال با دستاورد فنی خود، نشان داد که ارتقا عملکرد LLM‌ها صرفاً محدود به افزایش تعداد پارامتر‌ها نیست و می‌توان با کمی خلاقیت و نوآوری، مرز‌های این صنعت را جا به جا کرد.
اگر ۱۴۰۳ را سال عرض اندام استارت‌آپ‌های کوچک در عرصه مدل‌های زبانی بدانیم، پر بیراه نگفته‌ایم؛ چرا که در کنار میسترال ، مجموعه‌هایی از جمله Anthropic و DeepSeek هم خوش درخشیدند و توانستند با عرضه مدل‌های زبانی اختصاصی خود، بخشی از بازار را به تصاحب خود در آورند. در این میان، استارت‌آپ چینی DeepSeek موفق شد مسیر میسترال را با شایستگی تمام دنبال کند و با عرضه یک مدل سبک و در عین حال بهینه‌سازی‌شده، عملکردی مشابه برترین مدل‌های OpenAI از خود به نمایش بگذارد. انقلاب DeepSeek در حوزه مدل‌های زبانی متن‌باز، نیاز به سخت‌افزار‌های گران‌قیمت برای آموزش و استفاده از مدل‌های زبانی را کاهش داد و باعث شد تا سهام تراشه‌سازان آمریکایی مانند Nvidia، از آتش این اژد‌های چینی در‌امان نماند.

پیشرفت LLM‌ها در سال گذشته، محدود به بهینه‌سازی الگوریتم مدل‌ها نماند و قابلیت‌های جدید بسیاری به آن‌ها افزوده شد. یکی از مهم‌ترین این قابلیت‌ها، توانایی «استنتاج» است که به لطف انتشارGPT-o1 و o1-mini به دست کاربران رسید. این نوآوری، ابعاد تازه‌ای به فناوری مدل‌های زبانی بخشید؛ چرا که پس از آن، LLM‌ها این امکان را به دست آوردند که با اختصاص منابع بیشتر به مسائل پیچیده، موضوعات استنتاجی را حل کنند. قابلیت استنتاج، به‌سرعت از انحصار OpenAI خارج شد و راه خود را به مدل‌های زبانی دیگر باز کرد.
پیشرفت در قابلیت‌های چندوجهی (Multimodal)، قابلیت دیگری است که دل علاقه‌مندان به هوش مصنوعی را در سال گذشته به دست آورد و باعث شد تا مدل‌های زبانی، یک قدم بزرگ به سمت تحقق هوش مصنوعی عمومی بردارند. برای مثال، مجموعه Meta با معرفی مدل جدید خود تحت عنوان ImageBind، توجهات بسیاری را در زمینه مدل‌های چندوجهی به خود جلب کرد. ImageBind می‌تواند داده‌های متنی، تصویری، حرکتی، گرمایی، صوتی و سه‌بعدی را دریافت، تحلیل و ترکیب کند. این مدل، یکی از نخستین LLM‌هایی است که توانایی پردازش ۶ نوع داده ورودی به‌صورت هم‌زمان را داراست.

هرچند اغلب مدل‌های چندوجهی، هنوز در مرحله تحقیق و توسعه قرار دارند، اما تعداد LLM‌هایی که در حال حاضر از بیش از یک نوع داده ورودی پشتیبانی می‌کنند، کم نیستند. در سال ۱۴۰۳، مدل‌های GPT و Gemini، پشتیبانی از داده‌های تصویری و صوتی را هم به مدل خود اضافه کردند و به‌تبع آن‌ها، LLM‌های دیگر از جمله Grok، Claude ۳.۷ و… هم به این جریان پیوستند.

اما بد نیست نگاهی هم به اکوسیستم هوش مصنوعی ایران طی سال گذشته داشته باشیم. هر چند که در ۱۴۰۳ شاهد عرضه محصولات بومی و LLM‌های فارسی متعددی در کشور بودیم؛ اما در مقام مقایسه، خصوصاً در برابر دیگر کشور‌های منطقه و حوزه خلیج فارس، به جایگاهی که شایستگی آن را داریم دست پیدا نکردیم. مرتبه قابل‌قبولی هم که امروزه در اختیار داریم، به لطف مجموعه‌های خصوصی، استارت‌آپ‌های باانگیزه و توسعه‌دهندگان مستعدی است که با زیرساخت‌ها و امکانات محدود، موفق شده‌اند دستاورد‌های قابل‌توجهی را رقم بزنند و اجازه ندهند شکاف میان ما و دیگر کشور‌ها در زمینه هوش مصنوعی، از آنچه که هست عمیق‌تر شود.

یکی از مواردی که باعث می‌شود به آینده زیست‌بوم هوش مصنوعی در کشور‌امیدوار بمانیم، عرضه مدل‌های زبانی پیشرفته‌ای است که طی ماه‌های گذشته به‌صورت متن‌باز در دسترس توسعه‌دهندگان داخلی قرار گرفت. به‌عنوان مثال، می‌توانیم از گروه مدل زبانی «درنا» ساخته مرکز تحقیقات هوش مصنوعی پارت نام ببریم که با عرضه چندین LLM در اندازه‌های مختلف به صورت Open-source، در زمان خود توانست راه را برای ورود بسیاری از دانشجویان، محققان و کسب‌وکار‌ها به دنیای هوش مصنوعی هموار کند. این مدل‌های متن‌باز، علاوه بر افزایش دسترسی‌پذیری به فناوری‌های جدید مدل‌های زبانی، فرصتی استثنایی برای هم‌افزایی میان فعالان این عرصه ایجاد کرد تا عرضه محصولات باکیفیت و پرمخاطب فارسی، تنها در مرحله تئوری باقی نماند. در کنار LLM‌های عرضه شده توسط مجموعه پارت، شاهد ارائه چندین مدل زبانی فارسی توسط دیگر توسعه‌دهندگان داخلی بودیم که از جمله آن‌ها می‌توان به مدل‌های «شیراز»، «تهران»، «PersianLLaMA»، «PersianMind»، «فابرت» و «آریابرت» اشاره کرد.

پیشرفت فناوری مدل‌های زبانی کشور، تنها به عرضه LLM‌های فارسی خلاصه نمی‌شود و از نمود‌های دیگر آن می‌توان به افزایش آگاهی جمعی پیرامون این فناوری در سطح کشور اشاره کرد. ما طی سال گذشته در مرکز تحقیقات هوش مصنوعی پارت، بخشی از توان و منابع خود را به توسعه مدل‌های زبانی بزرگ و اپن‌سورس کردن LLM‌ها اختصاص دادیم و تعهد به ادامه این مسیر را بخشی از وظایف خود می‌دانیم. در راستای همین هدف، تصمیم داریم در سال جدید، همراه با فعالیت‌های بزرگ گذشته، بخشی از برنامه‌های خود را به آشنایی هرچه بیشتر اکوسیستم هوش مصنوعی کشور با فناوری مدل‌های زبانی اختصاص دهیم. به عنوان مثال، می‌توانم به رویدادی با نام هوش مصنوعی و قند پارسی، بر مدار نوآوری‌های پارت اشاره کنم که در هفته آخر اردیبهشت ماه توسط مجموعه پارت برگزار می‌شود و انتظار می‌رود که به بزرگ‌ترین گردهمایی نخبگان، اساتید و فعالان حوزه مدل‌های زبانی کشور تبدیل شود. رویداد‌هایی از این دست باعث می‌شود که به آینده LLM‌های فارسی‌امیدوار بمانیم و با عزمی جدی‌تر در راستای پیشبرد اهداف مشخص شده در زمینه مدل‌های زبانی فارسی گام برداریم.

در مجموع، ۱۴۰۳ را می‌توان سال بهینه‌سازی، تخصصی‌سازی و ادغام مدل‌های زبانی بزرگ نامید. سالی که تحولات در آن چنان عمیق و متنوع بود که به عنوان برهه‌ای سرنوشت‌ساز در دنیای LLM‌ها شناخته می‌شود و در آینده، بار‌ها و بار‌ها از دستاورد‌های این سال یاد خواهیم کرد. آنچه که لذت بازنگری به سال گذشته را دوچندان می‌کند، قدرت‌نمایی مدل‌های فارسی در میان سیل عرضه مدل‌های جهانی است که اغلب به منابع و امکانات نامحدود متصل‌اند. استعداد و خلاقیت جوانان کشور توانست ما را از سال ۱۴۰۳ سربلند بیرون بیاورد؛ اما سؤال اصلی اینجاست؛ آیا اکوسیستم هوش مصنوعی کشور قادر است با حمایت‌های حداقلی، همچنان شتاب پیشرفت خود را در سال ۱۴۰۴ حفظ کند؟ باید منتظر ماند و دید!

https://pvst.ir/ksr

0 نظر

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

برای بوکمارک این نوشته
Back To Top
جستجو