مولد ویدیو سورا در اختیار مشترکان پولی ChatGPT قرار گرفت
مشترکان طرح ChatGPT Pro و Plus اوپنایآی از این پس به مولد ویدیو سورا (Sora)…
۲۰ آذر ۱۴۰۳
۲۲ آبان ۱۴۰۳
زمان مطالعه : ۵ دقیقه
شرکتهای هوش مصنوعی برای غلبه بر مشکلات و تاخیرهای غیرمنتظر در توسعه مدلهای زبانی بزرگتر به دنبال ترفندهای جدید آموزشی هستند که از روشهای انسانگونهای برای «تفکر» الگوریتمها استفاده میکند.
به گزارش پیوست به نقل از رویترز، دهها پژوهشگر، محقق و سرمایهگذار میگویند این ترفندها که یکی از بنیانهای توسعه مدل o1 هستند ممکن است شکل تازهای به رقابت هوش مصنوعی بدهند و تبعاتی برای انرژی و چیپهای خواهند داشت.
پس از عرضه چتبات محبوب ChatGPT در سال ۲۰۲۲، شرکتهای فناوری که در حال حاضر با رقمهای خیرهکننده ارزشگذاری میشوند به دنبال توسعه ابعاد این مدلها بودند و از داده بیشتر و افزایش قدرت رایانشی در این مسیر بهره گرفتهاند.
اما حالا پژوهشگران ارشد این حوزه رویکرد «بزرگتر بهتر است» را مورد تحت بازبینی دارند و ممکن است رویکرد تازهای را در مسیر توسعه این صنعت مشاهده کنیم.
ایلیا سوتسکور، همبنیانگذار شرکت هوش مصنوعی Safe Superintelligence (SSI) و یکی از بنیانگذاران اوپنایآی، میگوید در حال حاضر نتیجه حاصل از توسعه پیش آموزش (مرحلهای که یک مدل هوش مصنوعی با استفاده از مقدار زیادی داده آموزش دیده و الگوها و ساختارهای آن را درک میکند) به بنبست رسیده است.
سوتسکور به عنوان یکی از افراد تاثیرگذار در جهشهای هوش مصنوعی مولد و آموزش این مدلهای شناخته میشود که در نهایت به توسعه ChatGPT منتهی شد. او ابتدای سال جاری میلادی پس از جدایی از اوپنایآی شرکت SSI را بنیانگذاری کرد.
سوتسکور میگوید: «دهه ۲۰۱۰ عصر توسعه بود، حالا بار دیگر به عصر پرسش و کشف بازگشتهایم. همه به دنبال پدیده بزرگ بعدی هستند. در حال حاضر مهمترین چیز این است که یک عنصر درست را توسعه دهید.»
سوتسکور جزئیات بیشتری درمورد پیشرفت تیمش در این حوزه اشاره نکرد و تنها گفت SSI در حال کار روی رویکردی متفاوت نسبت به توسعه پیش از آموزش است.
افراد مطلع میگویند که پژوهشگران در پشت پرده بزرگترین آزمایشگاههای هوش مصنوعی با تاخیر و ناامیدی برای ساخت مدلی بهتر از GPT-4 مواجه شدهاند که حدود دو سالی از عمرش میگذرد.
روند آموزش مدلهای بزرگتر ممکن است دهها میلیون دلار هزینه داشته باشد و در عین حال به صدها چیپ تخصصی نیاز است. با توجه به پیچیدگی این سیستمها، احتمال ناتوانی سختافزار هم بیشتر میشود و پژوهشگران ممکن است از عملکرد نهایی یک مدل که شاید روند توسعه آن ماهها زمان ببرد اطلاعی نداشته باشند.
مساله دیگر این است که مدلهای بزرگ زبانی مقدار زیادی داده را میطلبند و مدلهای هوش مصنوعی در حال حاضر بیشتر دادههای عمومی را استفاده کردهاند. کمبود انرژی نیز یکی دیگر از موانع توسعه این سیستمها است.
پژوهشگران برای غلبه بر این موانع در حال بررسی ترفندی به نام «تخمین زمان آزمایش» هستند که مدلهای موجود را در مرحله «استنباط» یا همان زمان استفاده از آنها، تقویت میکند. برای مثال به جای انتخاب یک پاسخ واحد و فوری، مدل میتواند چندین احتمال را در لحظه تولید و ارزیابی کند و در نهایت بهترین مسیر را انتخاب کند.
این روش به مدلها اجازه میدهد تا توان رایانشی بیشتری را به وظایف پیچیده مثل ریاضی و کدنویسی یا عملیاتهای پیچیده که نیازمند استدلال انسانگونه و تصمیمگیری هستند، اختصاص دهند.
نوام براون، پژوهشگری از اوپنایآی که روی مدل o1 فعالیت داشته است ماه گذشته در کنفرانس هوش مصنوعی TED در سن فرانسیسکو، گفت: «متوجه شدیم که وادار کردن یک روبات به تنها ۲۰ ثانیه فکر کردن در یک دست پوکر باعث شد تا عملکرد مدل معادل با توسعه ۱۰۰ هزار برابری و آموزش ۱۰۰ هزار بار طولانیتر افزایش یابد.»
اوپنایآی در مدل جدید o1 از همین ترفند استفاده کرده است. این مدل میتواند به شکلی گام به گام روی مسائل فکر کند و فرایندی شبیه به استدلال انسانی را رقم بزند. همچنین در این مدل از دادهها و بازخورد ساخته متخصصان استفاده شده است. وجه تمایز اصلی این مدلها، آموزشهای اضافی روی مدلهای پایه از جمله GPT-4 است و شرکت میگوید سعی دارد از این ترفند برای مدلهای پایه بیشتری استفاده کند.
پژوهشگران دیگر آزمایشگاههای هوش مصنوعی از آنتروپیک گرفته تا xAI و گوگل دیپمایند نیز روی نسخههای خاص خود از این ترفند کار میکنند.
کوین ویل، مدیرمحصول اوپنایآی در یک کنفرانس فناوری در ماه اکتبر گفت: «ما میوههای رسیده زیادی را میبینیم که با چیدنشان خیلی سریع قرار است این مدلها تقویت شوند. ما سعی داریم تا وقتی که دیگران به ما برسند، سه قدم یا بیشتر از آنها جلو باشیم.»
این پیشرفتها میتوانند گسترده صحنه رقابت برای سختافزار هوش مصنوعی را به طور کامل دگرگون کند و در نتیجه تقاضای فزاینده برای پردازندههای انویدیا نیز کاهش یابد. فعالان بزرگ سرمایهگذاری جسولان از سکویا گرفته تا اندرسن هورویتز، که میلیاردها دلار روی توسعه مدلهای پیشرفته هوش مصنوعی در چندین آزمایشگاه سرمایهگذاری کردهآند میگویند در حال بررسی این روند و تاثیر آن بر سرمایهگذاریهای خود هستند.
به گفته سونیا هوانگ، یکی از شرکای شرکت سرمایهگذاری جسورانه سکویا کپیتال، میگوید: «این تحول ما را از جهان خوشههای بزرگ پیش آموزشی به سمت استنباط ابری حرکت میدهد که رویکردی توزیعی است و از سرورهای ابری برای استنباط استفاده میکند.»
تقاضا برای چیپهای پیشرفته انویدیا باعث شده تا این شرکت در ماه اکتبر با عبور از اپل به ارزشمندترین شرکت جهان تبدیل شود. در صورت تحول بازار و عبور از چیپهای آموزشی، ممکن است رقابت بیشتری را برای انویدیا شاهد باشیم.