معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۱۰ آبان ۱۴۰۳
زمان مطالعه : ۵ دقیقه
مارک زاکربرگ، مدیرعامل متا، روز چهارشنبه در تازهترین صحبتهای خود درمورد هوش مصنوعی گفت که نسل بعدی مدل زبانی این شرکت در حال طی کردن فرایند آموزشی با استفاده از یک زیرساخت گرافیکی «بزرگتر از هر چیز دیگری» است که تا به حال گزارش شده است. همچنین به گفته زاکربرگ، بیش از ۵۰۰ میلیون نفر در اپلیکیشنهای مختلف این شرکت از چتبات Meta AI که مبتنی بر مدل زبانی Llama است استفاده میکنند.
به گزارش پیوست به نقل از وایرد، این مدل زبانی که Llama 4 نام خواهد داشت به گفته زاکربرگ در دست توسعه قرار دارد و باید در ابتدای سال آینده میلادی منتظر آن باشیم. زاکربرگ در تماس درآمدی خود با سرمایهگذاران گفت: «ما در حال آموزش مدلهای Llama 4 روی دسته پردازندهای بزرگتر از ۱۰۰ هزار H100 یا بزرگتر از هر چیز دیگری که من از دیگران دیدم، هستیم.»
توسعه زیرساخت آموزشی AI با قدرت رایانشی و داده به نظر مهمترین کلید توانمندسازی این ابزارها است. با اینکه امروز به نظر میرسد که متا پیشتازی این حوزه را در اختیار دارد، بیشتر بازیگران این عرصه به دنبال زیرساختی با بیش از ۱۰۰ هزار چیپ پیشرفته گرافیکی هستند. متا و انویدیا در ماه مارس جزئیات یک بسته گرافیکی با حدود ۲۵ هزار H100 را که برای آموزش Llama 3 استفاده شده بود به اشتراک گذاشتند و در عین حال ایلان ماسک نیز از همکاری ایکس با انویدیا برای تهیه زیرساختی با ۱۰۰ هزار H100 خبر داد. ماسک در شبکه اجتماعی ایکس نوشت: «این قدرتمندترین خوشه آموزش هوش مصنوعی در جهان است!»
زاکربرگ اما روز چهارشنبه از ارائه جزئیات احتمالی Llama 4 خودد داری کرد و با عبارتهای مبهم به «ابزارهای جدید»، «استدلال قویتر» و «بسیار سریعتر» اشاره داشت.
رویکرد متا برای سلطه بر هوش مصنوعی متفاوت از دیگر بازیگران بزرگ این عرصه است. مدلهای Llama که به صورت رایگان و متنباز ارائه میشوند را برخلاف مدلهای ساخته اوپنایآی، گوگل و دیگر شرکتهای بزرگ میتوان دانلود به رایگان استفاده کرد. دیگر شرکتها تنها از طریق API امکان استفاده را فراهم میکنند. هوش مصنوعی Llama از شهرت خاصی بین استارتآپها و پژوهشگران برخوردار است و امکان کنترل مدلها، دادهها و هزینه رایانشی را برای آنها فراهم میکند.
با این حال ویژگی «متنباز» این مدلها کمی جای بحث دارد و جواز این هوش مصنوعی محدودیتهایی را برای استفاده تجاری در نظر میگیرد. متا جزئیات آموزشی مدلهای خود را نیز منتشر نکرده است و در نتیجه افراد خارج از شرکت به سختی میتوانند نحوه کار آن را بررسی کنند. این شرکت در جولای ۲۰۲۳ اولین مدل Llama را روانه بازار کرد و آخرین نسخه آن (Llama 3.2) نیز سپتامبر ۲۰۲۴ در اختیار کاربران قرار گرفت.
مدیریت یک خوشه بسیار بزرگ از پردازندههای گرافیکی برای آموزش Llama 4 احتمالا با چالشهای مهندسی بیشماری همراه است و به انرژی بالایی نیز نیاز خواهد داشت. مدیران متا روز چهارشنبه پاسخ روشنی به سوالات مطرح شده درمورد نحوه دسترسی به انرژی کافی در ایالات متحده ندادند.
براساس یک برآورد انجام گرفته، ۱۰۰ هزار پردازنده H100 به ۱۵۰ مگاوات انرژی نیاز دارد. بزرگترین ابر کامپیوتر موجود در ایالات متحده که El Capitan نام دارد اما تنها با ۳۰ مگاوات کار میکند. متا انتظار دارد که امسال تا ۴۰ میلیارد دلار برای توسعه دیتاسنترها و دیگر امکانات زیرساختی هزینه کند که یک رشد ۴۲ درصدی را نسبت به سال ۲۰۲۳ نشان میدهد. این شرکت همچنین یک رشد چشمگیر از مخارج را برای سال جاری پیش بینی میکند.
مجموع هزینه های عملیاتی متا در سال جاری ۹ درصد افزایش یافته است. با این حال مجموع فروش (که بیشتر آن تبلیغات است) یک جهش ۲۲ درصدی را تجربه کرد و از این رو حاشیه سود بزرگتری در اختیار شرکت برای سرمایهگذاری روی طرحهای آینده قرار گرفته است.
در سمت دیگر این میدان نیز اوپنایآی با وجود افزایش کاربران در مرحله زیاندهی باقی مانده است. این شرکت که همچنان یک ماهیت عام المنفعه دارد میگوید فرایند آموزش GPT-5 ادامه دارد. اوپنایآی اعلام کرده است که GPT-5 بزرگتر از نسخه قبلی است اما اطلاعاتی در مورد زیرساخت آموزشی آن ارائه نکرده است. اوپنایآی میگوید که علاوه بر مقیاس و ابعاد این مدل، نوآوریهایی را نیز میتوان برای آن انتظار داشت.
سم آلتمن، مدیرعامل اوپنایآی، میگوید GPT 5 «یک جهش بزرگ رو به جلو» در مقایسه با نسخه قبلی است. آلتمن هفته گذشته در پاسخ به گزارشی که عرضه این مدل را برای ماه دسامبر پیشبینی کرده بود در شبکه اجتماعی ایکس گفت «اخبار جعلی از کنترل خارج شدهاند.»
روز سه شنبه، سوندار پیچای، مدیرعامل گوگل، نیز اعلام کرد که جدیدترین نسخه مدلهای هوش مصنوعی جمنای در دست توسعه قرار دارند.
رویکرد نیمهمتنبازی که متا نسبت به هوش مصنوعی در پیش گرفته است اما بحثهایی را به دنبال دارد. برخی از متخصصان هوش مصنوعی میگویند که دسترسی آزاد به مدلهای قدرتمند هوش مصنوعی ممکن است از لحاظ سو استفاده مجرمان یا خودکارسازی فرایند ساخت سلاحهای شیمیایی و بیولوژیکی خطرناک باشد. اگرچه Llama پیش از عرضه برای جلوگیری از رفتارهای نادرست آموزش می بیند اما عبور از این محدودیتها به نظر کار دشواری نیست.
با این حال زاکربرگ در اشاره به مدل جدید Llama گفت که توانمندهای تازه این مدل، قابلیتهای بیشتری را به خدمات متا اضافه میکند. متا در حال حاضر چتباتهای مختلفی با استفاده از هوش مصنوعی Llama را در خدمات خود از جمله فیسبوک، واتساپ، اینستاگرام و دیگر اپلیکیشنها ادغام کرده است.
طبق گفته زاکربرگ بیش از ۵۰۰ میلیون نفر در ماه از چتبات این شرکت (Meta AI) در اپلیکیشنها استفاده میکنند. متا انتظار دارد که در آینده از این بخش به درآمد تبلیغاتی برسد. سوزان لی، مدیر ارشد مالی متا، در تماس روز چهارشنبه گفت: «مردم میتوانند به پرسشهای بیشتری بپردازند. متا با پتانسیل درآمد تبلیغاتی میتواند یارانه Llama را برای دیگران تامین کند.»