مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » متا با زیرساختی بزرگتر از گذشته مشغول آموزش بعدی نسل بعدی هوش مصنوعی است

متا با زیرساختی بزرگتر از گذشته مشغول آموزش بعدی نسل بعدی هوش مصنوعی است

مهدی جعفری مترجم

۱۰ آبان ۱۴۰۳

زمان مطالعه : ۵ دقیقه

مارک زاکربرگ، مدیرعامل متا، روز چهارشنبه در تازه‌ترین صحبت‌های خود درمورد هوش مصنوعی گفت که نسل بعدی مدل زبانی این شرکت در حال طی کردن فرایند آموزشی با استفاده از یک زیرساخت گرافیکی «بزرگتر از هر چیز دیگری» است که تا به حال گزارش شده است. همچنین به گفته زاکربرگ، بیش از ۵۰۰ میلیون نفر در اپلیکیشن‌های مختلف این شرکت از چت‌بات Meta AI که مبتنی بر مدل زبانی Llama است استفاده می‌کنند.

به گزارش پیوست به نقل از وایرد، این مدل زبانی که Llama 4 نام خواهد داشت به گفته زاکربرگ در دست توسعه قرار دارد و باید در ابتدای سال آینده میلادی منتظر آن باشیم. زاکربرگ در تماس درآمدی خود با سرمایه‌گذاران گفت: «ما در حال آموزش مدل‌های Llama 4 روی دسته پردازنده‌ای بزرگتر از ۱۰۰ هزار H100 یا بزرگتر از هر چیز دیگری که من از دیگران دیدم، هستیم.»

توسعه زیرساخت آموزشی AI با قدرت رایانشی و داده به نظر مهمترین کلید توانمندسازی این ابزارها است. با اینکه امروز به نظر می‌رسد که متا پیشتازی این حوزه را در اختیار دارد، بیشتر بازیگران این عرصه به دنبال زیرساختی با بیش از ۱۰۰ هزار چیپ پیشرفته گرافیکی هستند. متا و انویدیا در ماه مارس جزئیات یک بسته گرافیکی با حدود ۲۵ هزار H100 را که برای آموزش Llama 3 استفاده شده بود به اشتراک گذاشتند و در عین حال ایلان ماسک نیز از همکاری ایکس با انویدیا برای تهیه زیرساختی با ۱۰۰ هزار H100 خبر داد. ماسک در شبکه اجتماعی ایکس نوشت: «این قدرتمندترین خوشه آموزش هوش مصنوعی در جهان است!»

زاکربرگ اما روز چهارشنبه از ارائه جزئیات احتمالی Llama 4 خودد داری کرد و با عبارت‌های مبهم به «ابزارهای جدید»، «استدلال قوی‌تر» و «بسیار سریع‌تر» اشاره داشت.

رویکرد متا برای سلطه بر هوش مصنوعی متفاوت از دیگر بازیگران بزرگ این عرصه است. مدل‌های Llama که به صورت رایگان و متن‌باز ارائه می‌شوند را برخلاف مدل‌های ساخته اوپن‌ای‌آی، گوگل و دیگر شرکت‌های بزرگ می‌توان دانلود به رایگان استفاده کرد. دیگر شرکت‌ها تنها از طریق API امکان استفاده را فراهم می‌کنند. هوش مصنوعی Llama از شهرت خاصی بین استارت‌آپ‌ها و پژوهشگران برخوردار است و امکان کنترل مدل‌ها، داده‌ها و هزینه رایانشی را برای آنها فراهم می‌کند.

با این حال ویژگی «متن‌باز» این مدل‌ها کمی جای بحث دارد و جواز این هوش مصنوعی محدودیت‌هایی را برای استفاده تجاری در نظر می‌گیرد. متا جزئیات آموزشی مدل‌های خود را نیز منتشر نکرده است و در نتیجه افراد خارج از شرکت به سختی می‌توانند نحوه کار آن را بررسی کنند. این شرکت در جولای ۲۰۲۳ اولین مدل Llama را روانه بازار کرد و آخرین نسخه آن (Llama 3.2) نیز سپتامبر ۲۰۲۴ در اختیار کاربران قرار گرفت.

مدیریت یک خوشه بسیار بزرگ از پردازنده‌های گرافیکی برای آموزش Llama 4 احتمالا با چالش‌های مهندسی بیشماری همراه است و به انرژی بالایی نیز نیاز خواهد داشت. مدیران متا روز چهارشنبه پاسخ روشنی به سوالات مطرح شده درمورد نحوه دسترسی به انرژی کافی در ایالات متحده ندادند.

براساس یک برآورد انجام گرفته، ۱۰۰ هزار پردازنده H100 به ۱۵۰ مگاوات انرژی نیاز دارد. بزرگترین ابر کامپیوتر موجود در ایالات متحده که El Capitan نام دارد اما تنها با ۳۰ مگاوات کار می‌کند. متا انتظار دارد که امسال تا ۴۰ میلیارد دلار برای توسعه دیتاسنتر‌ها و دیگر امکانات زیرساختی هزینه کند که یک رشد ۴۲ درصدی را نسبت به سال ۲۰۲۳ نشان می‌دهد. این شرکت همچنین یک رشد چشمگیر از مخارج را برای سال جاری پیش بینی می‌کند.

مجموع هزینه های عملیاتی متا در سال جاری ۹ درصد افزایش یافته است. با این حال مجموع فروش (که بیشتر آن تبلیغات است) یک جهش ۲۲ درصدی را تجربه کرد و از این رو حاشیه سود بزرگتری در اختیار شرکت برای سرمایه‌گذاری روی طرح‌های آینده قرار گرفته است.

در سمت دیگر این میدان نیز اوپن‌ای‌آی با وجود افزایش کاربران در مرحله زیان‌دهی باقی مانده است. این شرکت که همچنان یک ماهیت عام المنفعه دارد می‌گوید فرایند آموزش GPT-5 ادامه دارد. اوپن‌ای‌آی اعلام کرده است که GPT-5 بزرگتر از نسخه قبلی است اما اطلاعاتی در مورد زیرساخت آموزشی آن ارائه نکرده است. اوپن‌ای‌آی می‌گوید که علاوه بر مقیاس و ابعاد این مدل، نوآوری‌هایی را نیز می‌توان برای آن انتظار داشت.

سم آلتمن، مدیرعامل اوپن‌ای‌آی، می‌گوید GPT 5 «یک جهش بزرگ رو به جلو» در مقایسه با نسخه قبلی است. آلتمن هفته گذشته در پاسخ به گزارشی که عرضه این مدل را برای ماه دسامبر پیش‌بینی کرده بود در شبکه اجتماعی ایکس گفت «اخبار جعلی از کنترل خارج شده‌اند.»

روز سه شنبه، سوندار پیچای، مدیرعامل گوگل، نیز اعلام کرد که جدیدترین نسخه مدل‌های هوش مصنوعی جمنای در دست توسعه قرار دارند.

رویکرد نیمه‌متن‌بازی که متا نسبت به هوش مصنوعی در پیش گرفته است اما بحث‌هایی را به دنبال دارد. برخی از متخصصان هوش مصنوعی می‌گویند که دسترسی آزاد به مدل‌های قدرتمند هوش مصنوعی ممکن است از لحاظ سو استفاده مجرمان یا خودکارسازی فرایند ساخت سلاح‌های شیمیایی و بیولوژیکی خطرناک باشد. اگرچه Llama پیش از عرضه برای جلوگیری از رفتارهای نادرست آموزش می بیند اما عبور از این محدودیت‌ها به نظر کار دشواری نیست.

با این حال زاکربرگ در اشاره به مدل جدید Llama گفت که توانمند‌های تازه این مدل، قابلیت‌های بیشتری را به خدمات متا اضافه می‌کند. متا در حال حاضر چت‌بات‌های مختلفی با استفاده از هوش مصنوعی Llama را در خدمات خود از جمله فیسبوک، واتساپ، اینستاگرام و دیگر اپلیکیشن‌ها ادغام کرده است.

طبق گفته زاکربرگ بیش از ۵۰۰ میلیون نفر در ماه از چت‌بات این شرکت (Meta AI) در اپلیکیشن‌ها استفاده می‌کنند. متا انتظار دارد که در آینده از این بخش به درآمد تبلیغاتی برسد. سوزان لی، مدیر ارشد مالی متا، در تماس روز چهارشنبه گفت: «مردم می‌توانند به پرسش‌های بیشتری بپردازند. متا با پتانسیل درآمد تبلیغاتی می‌تواند یارانه Llama را برای دیگران تامین کند.»

این مطالب را هم بخوانید: