دیپ‌سیک با مدل DeepseekMath-V2 به مدال طلای المپیاد ریاضی رسید

مهدی جعفری مترجم

۸ آذر ۱۴۰۴

زمان مطالعه : ۳ دقیقه

استارت‌آپ چینی دیپ‌سیک اعلام کرده است که مدل جدید ریاضی این شرکت به نام DeepseekMath-V2 موفق شده تا در آزمون‌های سطح بالای ریاضی از جمله المپیاد بین‌المللی ریاضی (IMO 2025) و المپیاد ریاضی چین (CMO 2024) به سطح مدال طلا دست پیدا کند. این مدل همچنین در آزمون مشهور پاتنام امتیاز خارق‌العاده ۱۱۸ از ۱۲۰ را کسب کرده و این در حالی است که بهترین عملکرد انسانی ۹۰ امتیاز گزارش شده است.

به گزارش پیوست به نقل از دی‌کودر، دیپ‌سیک در مقاله منتشر شده به هیچگونه ابزار ماشین حساب یا استفاده از کد خارجی اشاره نکرده که نشان می‌دهد این فرایند تنها از طریق زبان طبیعی صورت گرفته است. شرکت توضیح داده که مدل‌های هوش مصنوعی گذشته،‌ معمولا بدون اینکه کار و فرایند حل مساله را به درستی انجام دهند،‌ به پاسخ درست می‌رسیدند.

برای رفع این مشکل، DeepseekMath-V2 از یک فرآیند چندمرحله‌ای استفاده می‌کند که شامل دو بخش است. در بخش اول یک راست آزمایی توسط Verifier صورت می‌گیرد و اثبات اولیه مورد ارزیابی قرار می‌گیرد. در مرحله دوم اما Meta-verifier نقد‌های مرحله قبلی یعنی Verifier را مورد ارزیابی قرار می‌دهد تا ایرادهای واقعی مشخص شوند.

این ساختار به مدل اجازه می‌دهد راه‌حل خود را در زمان اجرا نقد و اصلاح کند، بدون اینکه نیازی به ابزارهای بیرونی مانند ماشین‌حساب یا محیط‌های برنامه‌نویسی باشد. در این حالت تمامی ارزیابی‌ها و راه‌حل‌ها در قالب زبان طبیعی انجام می‌شود.

برای مسائل دشوارتر، مدل با افزایش زمان محاسبه و تولید نسخه‌های متعدد از اثبات‌ها، بهترین پاسخ را با اطمینان بالا انتخاب می‌کند. گفتنی است که DeepseekMath-V2 بر پایه معماری Deepseek-V3.2-Exp-Base توسعه یافته است.

رقابت تنگاتنگ با اوپن‌ای‌آی و گوگل

دیپ‌سیک در حالی طی یک مقاله از موفقیت مدل خود در حوزه ریاضی خبر داده است که به‌تازگی گزارش‌هایی درباره دستاورد مشابه آزمایشگاه‌های آمریکایی مانند اوپن‌ای‌آی و گوگل دیپ‌مایند را نیز مشاهده کرده‌ایم؛ مدل‌هایی که به سطح مدال طلا در المپیاد ریاضی رسیده‌اند اما جزئیاتشان محرمانه مانده است.

این عملکرد‌ها نشان می‌دهد که مدل‌های زبانی نسل جدید در حال نزدیک شدن به توانایی حل مسائل پیچیده، انتزاعی و چندمرحله‌ای هستند؛ مهارت‌هایی که تا همین اواخر «در انحصار انسان‌ها» تلقی می‌شد.

با این حال گرچه شرکت‌های آمریکایی جزئیات معماری و روش‌های خود را منتشر نکرده‌اند، دیپ‌سیک استاندارد متن باز خود برای مدل‌ها را در حوزه تحقیقات نیز پیاده سازی کرده و تصمیم گرفته بخش زیادی از اطلاعات فنی مدل را در دسترس عموم قرار دهد. این حرکت نه‌تنها به نمایش قدرت فنی این شرکت کمک می‌کند، بلکه ضربه‌ای مستقیم به اقتصاد مدل‌های تجاری در غرب است.

مطابق گزارش اکونومیست، بسیاری از استارت‌آپ‌های آمریکایی برای کاهش هزینه‌ها، از مدل‌های چینی اوپن‌سورس استفاده می‌کنند و این امر فشار رقابتی را بر اوپن‌ای‌آی و دیگر شرکت‌های بزرگ هوش مصنوعی این کشور افزایش داده است.

در نگاه کلی نیز دو اقتصاد برتر جهان یعنی آمریکا و چین اکنون رقابت خود در بخش هوش مصنوعی را به فراتر از مدل‌های گسترش داده‌اند و نه تنها توسعه دهندگان هوش مصنوعی با یکدیگر در جدال هستند، بلکه بخش مهم دیگر زیرساخت آنها است که حالا ممکن است جنسی متفاوت از یکدیگر پیدا کند. هرچه دیپ‌سیک سریع‌تر مرزهای توانمندی مدل‌ها را جابه‌جا کند، به‌طور غیرمستقیم به شرکت‌های آمریکایی نیز کمک می‌کند تا ادامه مسیر توسعه‌های پرشتاب خود را توجیه کنند.

انتشار DeepseekMath-V2 بیانگر این است که شکاف میان شرق و غرب در هوش مصنوعی نه‌تنها کاهش یافته، بلکه ممکن است چین در برخی حوزه‌ها از جمله ریاضیات پیشرفته، در آستانه پیشی گرفتن از رقبای غربی قرار گیرد.

این مطالب را هم بخوانید: