هوش مصنوعی متا: لاما ۴ چیست و چرا اهمیت دارد؟
Llama (لاما) یک خانواده از مدلهای زبانی بزرگ باز (LLM) و مدلهای چندرسانهای بزرگ (LMM)…
۲۳ خرداد ۱۴۰۴
۲۲ خرداد ۱۴۰۴
زمان مطالعه : ۳ دقیقه
شرکت متا، مالک پلتفرمهای اجتماعی بزرگی همچون فیسبوک و اینستاگرام، روز چهارشنبه از مدل جدید و متنباز هوش مصنوعی خود با نام V-JEPA 2 رونمایی کرد؛ مدلی که توانایی درک بهتر محیط سهبعدی و حرکات اشیای فیزیکی را دارد.
به گزارش پیوست به نقل از CNBC، طبق اعلام متا V-JEPA 2 یک «مدل دنیامحور» (World Model) است که با الهام از منطق دنیای فیزیکی، شبیهسازی داخلی از واقعیت ایجاد میکند. این قابلیت به هوش مصنوعی کمک میکند تا همانند انسانها یاد بگیرد، تصمیمگیری و برای انجام وظایف مختلف برنامهریزی کند.
یان لیکان، دانشمند ارشد هوش مصنوعی شرکت متا، که پیش از این هم بر اهمیت درک جهان واقعی و اطلاعات بصری تاکید داشته است، طی یک سخنرانی در کنفرانس VivaTech پاریس در این باره گفت: «اینکه به ماشینها اجازه دهیم جهان فیزیکی را درک کنند بسیار متفاوت از این است که به آنها اجازه درک زبان طبیعی را بدهیم. یک مدل دنیامحور مانند یک دوقلوی کوچک دیجیتالی از واقعیت عمل میکند که هوش مصنوعی میتواند برای پیشبینی پیامدهای اعمال خود به آن رجوع کند.»
برای مثال، V-JEPA 2 میتواند تشخیص دهد که یک توپ پس از افتادن از روی میز به پایین سقوط میکند یا شیئی که از دید پنهان شده، از بین نرفته است. این تواناییها برای رباتهای تحویل کالا و خودروهای خودران که نیاز به درک لحظهای محیط اطراف خود دارند، اهمیت زیادی خواهد داشت.
برخلاف مدلهای سنتی که برای یادگیری به دادههای برچسبخورده و ویدئوهای متعدد وابسته هستند، V-JEPA 2 در یک فضای سادهسازی شده و نهفته استدلال میکند تا تعامل و حرکت اشیا را تحلیل و پیشبینی کند.
رونمایی از V-JEPA 2 را در حالی از شرکت متا شاهد هستیم که تمرکز این شرکت بر توسعه هوش مصنوعی در رقابت با شرکتهایی چون اوپنایآی، گوگل و مایکروسافت افزایش یافته است. پیش از این گزارشی از فایننشال تایمز خبر از سرمایهگذاری ۱۵ میلیارد دلاری این غول شبکه اجتماعی در شرکت Scale AI داده بود که براساس آن متا ۴۹ درصد از سهام این شرکت را در اختیار خواهد گرفت و مدیرعامل آن، الکساندر وانگ، را نیز به استخدام خود درآورد تا راهبردهای هوش مصنوعی خود را تقویت کند.
مدلهای دنیامحور در ماههای اخیر توجه بسیاری از پژوهشگران را به خود جلب کردهاند. بهویژه با حرکت جامعه علمی از مدلهای زبانی صرف به سوی سامانههایی که میتوانند دنیای فیزیکی را نیز شبیهسازی و درک کنند. برای مثال، در سال گذشته، فِی-فِی لی، از پژوهشگران برجسته این حوزه، استارتاپ World Labs را با هدف توسعه مدلهای عظیم دنیامحور تاسیس کرد. گوگل دیپمایند نیز در حال توسعه مدلی به نام Genie است که قابلیت شبیهسازی بازیها و محیطهای سهبعدی را به صورت آنی دارد.
متا امیدوار است V-JEPA 2 بتواند گامی بزرگ در جهت تحقق هوش مصنوعیهای واقعا مستقل و فیزیکی باشد؛ ماشینهایی که نهتنها زبان را میفهمند، بلکه میتوانند در جهان واقعی نیز تفکر، پیشبینی و عمل کنند.