پیوست » فناوری » هوش مصنوعی » انتروپیک از مدل جدید Claude Opus 4.5 رونمایی کرد: قدرتمندترین مدل در کدنویسی، عامل‌ها و استفاده از رایانه

انتروپیک از مدل جدید Claude Opus 4.5 رونمایی کرد: قدرتمندترین مدل در کدنویسی، عامل‌ها و استفاده از رایانه

مهدی جعفری مترجم

۴ آذر ۱۴۰۴

زمان مطالعه : ۴ دقیقه

استارت‌آپ هوش مصنوعی انتروپیک از جدیدترین مدل هوش مصنوعی خود با نام Claude Opus 4.5 رونمایی کرد؛ مدلی که این شرکت آن را «بهترین مدل جهان» در حوزه‌هایی مانند کدنویسی، عامل‌های هوشمند یا ایجنت‌ها و استفاده مستقیم از کامپیوتر معرفی کرده است. این مدل از امروز از طریق اپلیکیشن‌های کلاود، API و سه پلتفرم ابری بزرگ در دسترس قرار می‌گیرد و قرار است نقطه عطفی در تحول کاری و دسترسی سازمان‌ها به قابلیت‌های پیشرفته هوش مصنوعی باشد.

به گزارش پیوست، انتروپیک در پست وبلاگی خود اعلام کرده است که Claude Opus 4.5 در تست‌های واقعی مهندسی نرم‌افزار، از جمله آزمون‌های سختگیرانه داخلی شرکت، عملکردی فراتر از تمام مدل‌های قبلی و حتی بهترین مهندسان انسانی داشته است.

شرکت‌ انتروپیک یکی از مهم‌ترین رقبای اوپن‌ای‌آی، بزرگترین استارت‌آپ هوش مصنوعی جهان، است که در زمینه رایانش ابری با آمازون و گوگل همکاری می‌کند. این شرکت برخلاف رقبایش بیشتر تمرکز خود را بر استفاده سازمانی و کاربرد‌های عملی و در عین حال کم‌هزینه هوش مصنوعی مولد گذاشته است و برای کاهش توان رایانشی مورد نیاز و افزایش بهره‌وری، به جای تصویر و ویدیو که در حال حاضر یکی از خبرساز‌ترین بخش‌های هوش مصنوعی هستند، بر بخش مهندسی نرم‌افزار و کدنویسی تمرکز دارد.

عملکرد مدل Opus 4.5 در حوزه‌های مختلف و مقایسه با مدل‌های گوگل و دیگر نسخه‌های هوش مصنوعی انتروپیک؛ این مدل تنها در سه حوزه پرسش و پاسخ چند‌زبانه، استدلال دیداری و استدلال سطح فارغ‌التحصیلان از پیشرفته‌ترین مدل‌های گوگل و اوپن‌ای‌آی عملکرد ضعیف‌تری دارد.

به گونه‌ای که حتی این مدل در یک آزمون دو ساعته که برای سنجش داوطلبان استخدام در حوزه مهندسی عملکرد طراحی شده، بالاترین امتیاز تاریخ را کسب کرده است.

تقویت چشمگیر توانایی استدلالی، دیداری و ریاضی

نسخه جدید، نه‌تنها در مهندسی نرم‌افزار، بلکه در حوزه‌های متنوعی مثل توانایی دیداری، استدلال پیچیده و حل مسائل ریاضی پیشرفت قابل توجهی داشته است. انتروپیک در پست وبلاگی خود می‌گوید بسیاری از بنچمارک‌های مرسوم دیگر توانایی اندازه‌گیری کامل قابلیت‌های این مدل را ندارند زیرا Opus 4.5 راه‌حل‌هایی ارائه می‌دهد که خارج از سناریوهای پیش‌بینی‌شده در تست‌ها هستند، اما از نظر فنی کاملا معتبر محسوب می‌شوند.

عملکرد Opus 4.5 در زمینه مهندسی نرم‌افزار؛ بهتر از جدیدترین مدل‌های گوگل، اوپن‌ای‌آی و نسخه‌های پیشین هوش مصنوعی انتروپیک

مدل Claude Opus 4.5 ایمن‌ترین مدل تاریخ این شرکت است و احتمالا در سطح کل صنعت نیز پیشتازی را در اختیار خواهد گرفت.

یکی از مهم‌ترین نقطه ضعف‌های امنیتی مدل‌های هوش مصنوعی به ویژه در زمانی که در نقش یک ایجنت یا عامل هوش مصنوعی وارد عمل می‌شوند تزریق پرامپت است. این مدل طبق اعلام انتروپیک نسبت به تمام مدل‌های پیشین، مقاوم‌‌ترین عملکرد را برابر چنین حملاتی دارد. مهاجمان در تزریق پرامپت یا Prompt Injection تلاش می‌کنند تا با ارائه دستورهای فریبنده در کد‌ها یا نوشته‌های وبسایت هدف، مدل را وادار به خروج از چارچوب‌های ایمنی کنند.

مصرف کمتر، خروجی بهتر: انتروپیک بهره‌وری توسعه‌دهندگان را افزایش می‌دهد

مدل Opus 4.5 نسبت به Sonnet 4.5، مدل پیشین این شرکت، برای دستیابی به نتایج مشابه توکن بسیار کمتری استفاده می‌کند. توسعه‌دهندگان اکنون می‌توانند با استفاده از پارامتر جدید تلاش (effort) مشخص کنند که مدل چقدر زمان و ظرفیت صرف حل یک مسئله کند (سطح تلاش را می‌توان به سه شکل پایین، متوسط و بالا تنظیم کرد.) براساس این سازوکار در حالت تلاش متوسط این مدل کیفیت بهترین خروجی Sonnet 4.5 با ۷۶ توکن کمتر ارائه می‌کند.

اما در صورتی که به عملکرد بهتری نیاز باشد، در حالت تلاش باال، عملکرد ۴.۳ درصد بهتر از Sonnet 4.5 با ۴۸ توکن کمتر ممکن می‌شود.

مدل جدید Opus 4.5 حتی در حالت تلاش پایین هم عملکردی قابل قیاس با Sonnet 4.5 به نمایش می‌گذارد

این ویژگی امکان ساخت عامل‌هایی را فراهم می‌کند که در طولانی مدت به کار بپردازند و همچنین سیستم‌های چندعاملی و فرایندهای پیچیده تحقیقاتی را امکان‌پذیر می‌سازد.

بروزرسانی محصولات انتروپیک

شرکت انتروپیک در کنار عرضه این مدل جدید مجموعه‌ای از قابلیت‌ها تازه را به محصولات خود اضافه کرده است. براساس این برزورسانی بخش کدنویسی کلاود یا Claude Code از این پس می‌تواند:

با حالت Plan Mode دقیق‌تر به برنامه‌ریزی پروژه‌ها بپردازد
اجرای خودکار طرح‌ها را پس از دریافت تایید کاربر برعهده بگیرد
و همچنین در نسخه دسکتاپ اجرای چندین سشن همزمان امکان‌پذیر شده است

اپلیکیشن‌های کلاود نیز از این پس در مکالمات طولانی دیگر به محدودیت حافظه نمی‌خورند و مدل به‌طور خودکار برای کاهش محدودیت به خلاصه‌سازی هوشمند می‌پردازد. علاوهبر این نسخه کروم اپلیکیشن کلاود از این پس برای کاربران اشتراک مکس به طور کامل دسترس قرار می‌گیرد.

نسخه اکسل کلاود نیز اکنون به صورت آزمایشی برای کاربران Max، Team و Enterprise در دسترس قرار گرفته است.

انتروپیک قیمت API مدل را ۵ دلار برای ورودی و ۲۵ دلار برای خروجی به ازای هر میلیون توکن اعلام کرده است که دسترسی به سطح «Opus» را برای توسعه‌دهندگان بیشتری ممکن می‌کند.

این مطالب را هم بخوانید: