یسنا امان‌پور تحریریه

پیوست » پلاس » کوچک کردن مدل‌های زبانی متا؛ تغییر رویه این شرکت در خدمات مبتنی بر تلفن همراه

کوچک کردن مدل‌های زبانی متا؛ تغییر رویه این شرکت در خدمات مبتنی بر تلفن همراه

یسنا امان‌پور تحریریه

۱۵ شهریور ۱۴۰۳

زمان مطالعه : ۷ دقیقه

شرکت متا با اعمال تغییرات و کوچک کردن مدل‌های زبانی می‌خواهد آنها را برای اجرا در تلفن همراه آماده کند. متا با این اقدام، مجموعه کاملا جدیدی از برنامه‌های کاربردی برای هوش مصنوعی را ارائه می‌دهد که در عین حال روش‌های جدیدی برای تعامل با این فناوری در دنیای واقعی است. انتقال هوش مصنوعی به داخل دستگاه تلفن همراه می‌تواند ردپای کربنی که به خاطر انتقال و پردازش داده‌ها در مراکز داده عظیم و پرمصرف ایجاد می‌شود را تا حد بسیاری کاهش دهد.

به گزارش پیوست، نامتناسب بودن اندازه مدل‌های زبانی بزرگ و اجرا نشدن آنها بر تلفن‌های همراه، اهمیت استفاده از پارامترها را نشان می‌دهد.

اهمیت پارامترها در اجرای مدل‌های زبانی

مدل‌های زبانی بزرگ مانند ChatGPT، Gemini و Llama می‌توانند از میلیاردها و حتی تریلیون‌ها پارامتر برای به‌دست آوردن نتایج خود استفاده کنند. اندازه این مدل‌ها مانع اصلی اجرا نشدن آنها روی دستگاه‌های موبایلی است. به دنبال این موضوع دانشمندان متا در تحقیقات خود خاطرنشان کردند که نیاز روزافزونی به مدل‌های زبانی بزرگ و کارآمد در دستگاه‌های تلفن همراه وجود دارد.

در تحقیق خود، دانشمندان توضیح دادند که چگونه مدل‌های زبان بزرگ باکیفیت را با تعداد پارامتر کمتر از یک میلیارد ایجاد کرده‌اند، که به نظر آنها برای استقرار در دستگاه‌های تلفن همراه مناسب است.

برخلاف باور رایج که بر نقش محوری داده‌ها و کمیت پارامتر در تعیین کیفیت مدل تاکید می‌کند، دانشمندان با مدل زبان کوچک خود به نتایجی دست یافتند که در برخی زمینه ها با Llama LLM متا قابل مقایسه است.

نیک دجیاکومو، مدیرعامل Bucephalus، یک پلتفرم زنجیره تأمین تجارت الکترونیک مبتنی بر هوش مصنوعی در شهر نیویورک، می‌گوید:« برخلاف الگوی غالبی که به بزرگ بودن مدل زبانی تاکید دارد می‌بینیم که نتایج تحقیقات از الگوی دیگری رونمایی کرده و نشان داده می‌شود که واقعا نحوه استفاده از پارامترها اهمیت دارد.»

او همچنین افزود:« این موضوع، راه را برای پذیرش گسترده‌تر هوش مصنوعی روی دستگاه‌ تلفن همراه هموار می‌کند.»

گام اساسی

تحقیقات متا از این جهت قابل توجه است که طبق گفته داریان شیمی، مدیرعامل و بنیانگذار FutureFund، یک شرکت سرمایه‌گذاری خطرپذیر در سانفرانسیسکو، هنجار فعلی هوش مصنوعی وابسته به ابر را به چالش می‌کشد، که در آن داده‌ها اغلب در مراکز داده دوردست، پردازش می‌شوند.

شیمی در ارتباط با این موضوع گفت:« شرکت متا با انتقال پردازش هوش مصنوعی به داخل دستگاه تلفن همراه در حال ایجاد تغییرات مهمی است. این اقدام می‌تواند ردپای کربنی که به خاطر انتقال و پردازش داده‌ها در مراکز داده عظیم و پرمصرف ایجاد می‌شود را به‌طور قابل توجهی کم و هوش مصنوعی مبتنی بر دستگاه را به یک بازیگر کلیدی در دنیای فناوری تبدیل کند.»

یاشین مانراج، مدیرعامل Pvotal Technologies، توسعه‌دهنده نرم‌افزار امنیتی سرتاسر، در ایگل پوینت، اورگان گفت:« این تحقیق، اولین تلاش جامع و به اشتراک گذاشته ‌شده عمومی در این وسعت است.»

او در ادامه افزود:« این یک گام اساسی در دستیابی به رویکرد هماهنگ اSLM-LLM است که در آن توسعه‌دهندگان می‌توانند تعادل مناسبی بین پردازش داده ابری و روی دستگاه پیدا کنند. این تحقیق زیربنایی را ایجاد می‌کند که وعده‌های برنامه‌های کاربردی مبتنی بر هوش مصنوعی بتواند به سطح پشتیبانی، خودکارسازی و کمکی برسد که در سال‌های اخیر به بازار عرضه شده‌ اما فاقد ظرفیت مهندسی برای حمایت از آن چشم‌اندازها بوده است.»

دانشمندان متا همچنین در کاهش اندازه یک مدل زبان گام مهم دیگری برداشته‌اند. نیشانت نیکرا، مدیر ارشد بازاریابی موبایلی در Skyworks Solutions، یک شرکت نیمه‌رسانا در ایروین، کالیفرنیا، گفت:« آنها پیشنهاد می‌کنند یک مدل را به ترتیبی مشخص از بزرگی، کوچک کرده و آن را برای پوشیدنی‌ها، وسایل صوتی و تلفن‌های همراه قابل دسترس‌تر کنند.»

او در ادمه گفت:« آ‌نها در حال ارائه مجموعه کاملا جدیدی از برنامه‌های کاربردی برای هوش مصنوعی هستند و در عین حال روش‌های جدیدی برای تعامل هوش مصنوعی در دنیای واقعی ارائه می‌دهند. متا همچنین با کوچک کردن آنها در حال حل یک چالش بزرگ رشد، استقرار آنها در دستگاه لبه(edge devices) است که LLMها را آزار می‌دهد.»

تاثیر قابل توجه بر مراقبت‌های بهداشتی

یکی از حوزه‌هایی که مدل‌های زبانی کوچک می‌توانند تاثیر معناداری داشته باشد، پزشکی است. دانیل کلواس، مشاور پزشک در IT Medical، یک شرکت توسعه نرم‌افزار پزشکی جهانی، درباره تغییر و تحولات مدل‌های زبانی کوچک گفت:« این تحقیق نویدبخش این است که قابلیت هوش مصنوعی تولیدکننده را برای برنامه‌های کاربردی شامل دستگاه‌های تلفن همراه که در دنیای مراقبت‌های بهداشتی امروزی برای نظارت از راه دور و ارزیابی‌های بیومتریک فراگیر هستند، فراهم کند.»

او به این موضوع نیز اشاره کرد که با نشان دادن اینکه مدل‌های زبانی کوچک و کارآمد می‌تواند تعداد پارامترهایشان کمتر از یک میلیارد باشد و در عین حال در انجام برخی وظایف، عملکردی مشابه مدل‌های بزرگ‌تر داشته باشند، در واقع محققان دریچه‌ای به سوی استفاده‌ی فراگیر از هوش مصنوعی در پایش روزمره سلامت و مراقبت‌های شخصی بیمار گشوده‌اند.

کلواس توضیح داد که استفاده از SLMها همچنین می‌تواند تضمین کند که داده‌‌های حساس مربوط به سلامت می‌تواند به صورت امن در دستگاه پردازش شود که این مورد، موجب افزایش امنیت اطلاعات و حریم خصوصی بیمار می‌شود. آنها همچنین می‌توانند نظارت و مداخله در زمان واقعی سلامت را تسهیل کنند، که برای بیماران مبتلا به بیماری‌های مزمن یا کسانی که نیاز به مراقبت مداوم دارند بسیار مهم است.

او اضافه کرد که این مدل‌ها همچنین می‌تواند موانع تکنولوژیکی و مالی برای استقرار هوش مصنوعی در محیط‌های مراقبت‌های بهداشتی را کاهش دهد و به طور بالقوه فناوری‌های پیشرفته نظارت بر سلامت را برای جمعیت‌های گسترده‌تر دموکراتیک کند.

انعکاس روندهای صنعت

کاریداد مونوز، استاد فناوری رسانه‌ای جدید در کالج اجتماعی CUNY LaGuardia توضیح داد که تمرکز متا بر مدل‌های کوچک هوش مصنوعی برای دستگاه‌های تلفن همراه نشان‌دهنده گرایش گسترده‌تر صنعت به سمت بهینه‌سازی هوش مصنوعی برای کارایی و دسترسی است.

او همچنین گفت:« این تغییر نه تنها به چالش‌های عملی می‌پردازد، بلکه با نگرانی‌های فزاینده درباره تأثیرات زیست‌محیطی عملیات‌های هوش مصنوعی در مقیاس بزرگ همسو می‌شود. با حمایت از مدل‌های کوچک‌تر و کارآمدتر، متا در حال ایجاد سابقه‌ای برای توسعه هوش مصنوعی پایدار و فراگیر است.»

مدل‌های زبان کوچک همچنین با روند محاسبات لبه (edge computing) مطابقت دارند که تمرکز آن بر نزدیک‌تر کردن قابلیت‌های هوش مصنوعی به کاربران است.

نیک دجیاکومو درباره مزایای کوچک کردن مدل‌های زبانی گفت:« مدل‌های تخصصی و تنظیم شده می‌تواند برای کارهای خاص کارآمدتر و مقرون به صرفه‌تر باشد. بسیاری از برنامه‌های کاربردی موبایل به هوش مصنوعی پیشرفته نیاز ندارد. مثلا نیازی نیست که برای ارسال پیامک ابرکامپیوتر در اختیار داشت.»

وی در ادامه افزود:« این رویکرد به دستگاه اجازه می‌دهد تا روی مسیریابی بین مواردی که با استفاده از SLM پاسخ داده می‌شود و موارد استفاده تخصصی، مشابه رابطه بین پزشکان عمومی و متخصص تمرکز کند.»

تاثیر عمیق بر ارتباطات جهانی

شیمی اظهار داشت که پیامدهایی که SLMها می‌تواند بر اتصال جهانی داشته باشد بسیار عمیق است. او خاطرنشان کرد:« با افزایش توانایی هوش مصنوعی روی دستگاه، نیاز به اتصال مداوم به اینترنت کاهش می‌یابد که می‌تواند چشم‌انداز فناوری را در مناطقی که دسترسی به اینترنت به صورت نامنظم یا پرهزینه است، به طور چشمگیری تغییر دهد. این امر می‌تواند دسترسی به فناوری‌های پیشرفته را دموکراتیک کند و ابزارهای هوش مصنوعی پیشرفته را در بازارهای جهانی متنوع در دسترس قرار دهد.»

او، محقق شدن یک شبه و شدید این تغییرات را دور از انتظار خواند. علت این پیش‌بینی این است که پرس‌وجوهای پیچیده و چند زبانه همچنان به LLM‌های مبتنی بر ابر نیاز دارد تا ارزشی پیشرفته برای کاربران نهایی ارائه دهد. با این حال، این تغییر به سمت اجازه دادن به مدل «آخرین مایل» روی دستگاه می‌تواند به کاهش بار LLM برای انجام وظایف کوچک‌تر، کاهش حلقه‌های بازخورد و غنی‌سازی داده‌های محلی کمک کند.

شیمی درباره این روند گفت:« در نهایت این تغییرات، کاربر نهایی به وضوح برنده خواهد بود، زیرا این امر به ورود نسل جدیدی از قابلیت‌ها در دستگاه‌ها و شکل‌گیری بازنگری امیدوارکننده‌تر برنامه‌های کاربردی فرانت‌اند و نحوه تعامل مردم با جهان منجر می‌شود.»

او افزود:« در حالی که بازیگران همیشگی با قابلیت تاثیرگذار بر زندگی روزمره همه، نوآوری را در این بخش پیش می‌برند، مدل‌های زبانی کوچک همچنین می‌توانند اسب تروا (Trojan Horse) باشند که با داشتن مدل‌هایی قادر به جمع‌آوری داده‌ها و فراداده‌ها در سطحی بی‌سابقه، سطح جدیدی از پیچیدگی را در نفوذ به زندگی روزمره ما ارائه می‌دهند. امیدواریم با تدابیر حفاظتی مناسب، بتوانیم این تلاش‌ها را به سمت یک نتیجه‌ی سازنده هدایت کنیم.»

منبع: technewsworld

این مطالب را هم بخوانید: