یافتههای یک مطالعه جدید: ابزارهای هوش مصنوعی محتوای دارای حق نشر را حفظ کردهاند
مطالعه جدیدی درمورد هوش مصنوعی اوپنایآی شواهدی را ارائه کرده است که ادعای شاکیان نقض…
۱۷ فروردین ۱۴۰۴
۱۷ فروردین ۱۴۰۴
زمان مطالعه : ۶ دقیقه
شرکت متا با معرفی نسل جدید مدلهای زبان هوش مصنوعی خود با نام Llama 4، بار دیگر در مسیر توسعه مدلهای متنباز و چندرسانهای گام برداشت. این مجموعه شامل سه مدل جدید با نامهای Llama 4 Scout، Llama 4 Maverick و Llama 4 Behemoth است که هرکدام با ویژگیها و توانمندیهای منحصر به فرد، بخشی از جهان هوش مصنوعی را هدف میگیرند.
به گزارش پیوست، پست وبلاگی متا درمورد عرضه مدلهای جدید هوش مصنوعی نشان میدهد که غول شبکه اجتماعی به شکل قابل توجهی پنجره محتوای این مدلها را گسترش داده است. متا همچنین در مدل جدید خود از ترفند ترکیب متخصصان یا MoE کمک گرفته است، ترفندی که باعث افزایش بازدهی مدلهای شرکت دیپسیک شده بود.
مدلهای Llama 4 Scout و Llama 4 Maverick نخستین مدلهای متنباز شرکت متا هستند که از تعامل چندرسانهای (Multimodal) پشتیبانی میکنند و پنجره محتوایی (Context Length) بسیار گستردهای دارند. این دو مدل برای استفاده عمومی، تحقیقاتی و تجاری در وبسایت Llama.com و پلتفرم Hugging Face قابل دانلود هستند.
متا همچنین در کنار مدلهای جدید خود از Llama 4 Behemoth نیز رونمایی کرده است. این مدل در واقع معلمی مملو از اطلاعات برای مدلهای کوچک است. این مدل آموزشی با حدود دو تریلیون پارامتر و ۲۸۸ میلیارد پارامتر فعال به عنوان معلم اصلی برای مدلهای کوچکتر در نظر گرفته شده است.
به گفته متا، این غول دو هزار میلیارد پارامتری یکی از بهترین مدلهای غیراستدلالگر با عملکردی پیشرفته در حوزههای کدنویسی، ریاضیات و زبانهای چندگانه است که در تستهای استاندارد توانسته است برترین مدلها نظیر GPT-4.5، Claude 3.7 و Gemini 2.0 را پشت سر بگذارد.
مدل Behemoth از یک فرآیند آموزش مبتکرانه بهره میبرد که شامل آموزش تقویتی آنلاین پویا، پالایش سختگیرانه دادهها و طراحی زیرساختهای خاص برای مدیریت مدل در مقیاس بزرگ است.
متا میگوید در توسعه مدلهای نسل چهارمی خود تمرکز ویژهای بر بهبود امنیت دارد. طبق پست وبلاگی متا، این شرکت در هر لایه از روند توسعه مدل از پیش آموزش تا پسا آموزش، محافظتهایی را اعمال کرده است که از توسعه دهندگان نهایی در برابر سو استفاده کنندگان محافظت میکند.
متا در پیش آموزش، ترکیبی از فیلتر داده را در کنار دیگر محافظتها به کار برده است. در مرحله پسا آموزش نیز متا میگوید از چندین ترفند برای تضمین پیروی از سیاستها کمک گرفته است که برای توسعه دهنده و کاربر نهایی مفید است و همچنین امنیت داده را نیز افزایش میدهد.
متا در سطح سیستم از ابزارهایی همچون Llama Guard و Prompt Guard برای جلوگیری از تولید محتوای مضر و مقابله با حملات متنی و مهندسی اجتماعی کمک گرفته است. Llama Guard یک مدل زبانی بزرگ برای امنیت ورودی و خروجی است. توسعه دهندگان میتوانند از این ابزار برای نظارت بر نقض سیاستهای خود در ورودی و خروجی هوش مصنوعی استفاده کنند.
ابزار Prompt Guard نیز یک مدمل طبقهبندی کننده است که براساس طیف گستردهای از حملات آموزش دیده میتواند پرامپتهای آلوده با هدف جیلبریک و همچنین پرامپتهای آلوده با هدف تزریق ورودی را شناسایی کند.
خدمت دیگر متا در بخش امنیت نیز CyperSecEval است که به مدل هوش مصنوعی و توسعه دهندگان محصولی در درک و کاهش خطر امنیت سایبری هوش مصنوعی کمک میکند.
همچنین با معرفی روش ارزیابی GOAT، تیم متا موفق به شبیهسازی سناریوهای تهدیدآمیز در تعاملات چندمرحلهای شده تا آسیبپذیری مدلها را بهطور مؤثر بررسی کند.
متا همچنین در مدلهای جدید خود تمرکز ویژهای بر سوگیری داشته است. طبق پست وبلاگی شرکت، متا برای رفع این مشکل تلاش کرده تا مطمئن شود که مدلهای هوش مصنوعی جدید میتوانند از نقطهنظرهای مختلف به درخواستها پاسخ دهند و دیدگاه خاصی را نسبت به دیگران در اولویت قرار ندهند.
متا میگوید اقدامات جدید شرکت باعث کاهش سوگیری در مدلهای نسل چهارمی شده است. بر اساس ارزیابیها، نرخ پاسخهای همراه با سوگیری در Llama 4 نسبت به نسخههای قبلی بهشدت کاهش یافته است و میزان رد پاسخ به سوالات حساس از ۷ درصد در نسخه ۳.۳ به کمتر از ۲ درصد در نسخه جدید رسیده است.
متا که از ابتدای فعالیت خود در بخش هوش مصنوعی بر رویرکد رویکرد بازمتن یا Open Source تاکید کرده است، مدلهای جدید را نیز گام دیگری در خدمت جامعه متنباز میداند. متا میگوید، توسعهدهندگان، محققان و شرکتها اکنون میتوانند مدلهای Scout و Maverick را از طریق وبسایت رسمی متا و Hugging Face دریافت کرده و در پروژههای خود بهکار بگیرند. این مدلها همچنین در پیامرسانهایی نظیر واتساپ، مسنجر و اینستاگرام نیز برای کاربران قابل استفاده هستند.
متا همچنین اعلام کرده است که این مدلها ابتدای مسیر طولانی این شرکت در بخش هوش مصنوعی محسوب میشوند و جزئیات بیشتر درباره نقشه راه Llama 4 و پروژههای آتی، در رویداد اختصاصی LlamaCon که در تاریخ ۲۹ آوریل برگزار خواهد شد، ارائه میشود.