مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » مدل جدید شرکت اوپن‌ای‌آی (GPT-5) چه تفاوتی با نسل قبلی دارد؛ متخصص PhD در جیب شما

مدل جدید شرکت اوپن‌ای‌آی (GPT-5) چه تفاوتی با نسل قبلی دارد؛ متخصص PhD در جیب شما

مهدی جعفری مترجم

۱۸ مرداد ۱۴۰۴

زمان مطالعه : ۱۰ دقیقه

شرکت اوپن‌ای‌آی دو روز پیش یعنی در تاریخ ۷ آگوست ۲۰۲۵ از جدید‌ترین و مورد انتظار‌ترین نسخه از مدل زبانی خود رونمایی کرد. در دو روز پس از عرضه این مدل واکنش‌های مختلفی رو نسبت به آن شاهد هستیم به طوری که بسیاری از کاربران شبکه اجتماعی ریدت در یک پرسش‌وپاسخ با حضور سم آلتمن، مدیرعامل اوپن‌ای‌آی، خواستار دسترسی به مدل پیشین یعنی GPT-4o شدند. با این حال مجله وایرد و هفته‌نامه بارونز از این مدل به عنوان گامی مهم به سمت هوش مصنوعی عمومی یا AGI یاد کرده‌اند.

به گزارش پیوست، مدل جدید شرکت اوپن‌ای‌آی که پس از مدت‌ها انتظار و گمانه‌زنی در دسترس عمومی قرار گرفت طبق گفته تحلیلگران به بارونز و فایننشال تایمز از لحاظ کدنویسی و کاهش خطا عملکرد خوبی را به نمایش گذاشته است.

اما در کنار بهبود عملکرد و حتی ارائه یک پنجره بزرگ ۴۰۰ هزار توکنی برای ورودی و خروجی این مدل، به نظر می‌رسد که نسل جدید و یکپارچه هوش مصنوعی اوپن‌ای‌آی تمرکز بیشتری بر کاربران پولی دارد و تفکیک فاحش‌‌تری را میان نسخه رایگان و پیشرفته شاهد هستیم.

برای مثال این پنجره ۴۰۰ هزار توکنی (که مختص کاربران رابط برنامه‌نویسی یا API است) برای کاربران رایگان که تنها به نسخه‌های نانو و مینی GPT-5 دسترسی دارند در ChatGPT به ۸ هزار توکن سقوط می‌کند. کاربران پلاس (و Team) و نسخه تجاری (و پرو) در ChatGPT به‌ترتیب پنجره محتوای ۳۲ هزار توکنی و ۱۲۸ هزار توکنی دارند. این تفاوت میان کاربران نسخه‌های مختلف با چشم‌انداز مدیرعامل شرکت که در پادکستی با تیئو وان به آن اشاره کرده بود و توکن‌ها را «ارز آینده» توصیف می‌کرد، هم‌خوانی دارد.

اما بیایید ابتدا نگاهی به تفاوت GPT-5 با نسخه پیشین و سپس تفاوت میان سطوح مختلفی دسترسی بیاندازیم.

GPT-5 چه تفاوتی با نسل قبلی خود دارد؟

همین ابتدای توضیحات بهتر است بگوییم که برخلاف گمانه‌زنی‌های یکی دو سال اخیر فعالان هوش مصنوعی که عرضه این مدل را در واقع تحقق AGI یا هوش مصنوعی عمومی با قابلیت‌هایی هم‌تراز یا فراتر از انسان برآورد می‌کردند،‌ نه تحلیلگران و نه خود شرکت ارائه دهنده این مدل را در چنین سطحی برآورد نمی‌کند و آن را تنها گامی بزرگ به سمت این هدف توصیف کرده‌اند (هدفی که شاید به طور کلی نیز یک اوجی دست نیافتنی از کمال باشد و شرکت‌ها تنها به مرور زمان فاصله خود را با آن کمتر کنند.)

با این حال GPT-5 که حالا از بیش از ۷۰۰ میلیون کاربر فعال هفتگی ChatGPT میزبانی می‌‌کند، تفاوت‌های روشنی با نسل قبلی خود دارد و بیشتر از یک جهش فنی، در واقع پیشرفتی در حوزه تجربه کاربری یا UX محسوب می‌شود.

اولین تفاوتی که هنگام استفاده GPT-5 احساس می‌کنید، حذف گزینه‌های انتخاب مدل یعنی همان GPT-4o، نسخه مینی GPT-4o و مدل استدلال‌گر o3 است. در واقع یکی از مهم‌ترین تغییرات نسخه جدید، یکپارچه‌سازی مدل‌های هوش مصنوعی اوپن‌ای‌آی در زیر یک چتر جدید است که به واسطه قابلیتی به نام مسیر‌دهنده لحظه‌ای ممکن شده و GPT-5 که در بردارنده نسخه‌های مختلف است تشخیص می‌دهد برای درخواست شما از مدمل استدلال‌گر یا زبانی استفاده کند (البته گفتنی است که کاربران نسخه پرو برای انتخاب نسخه GPT-5 Pro و GPT-5 Thinking حق انتخاب دارند.)

نسل پنجم مدل‌های اوپن‌ای‌آی نسخه‌ای جدید را جایگزین مدل‌های پیشین کرده است که در بنچمارک‌ها نیز عملکرد بهتری را به نمایش می‌گذارند: GPT-5-Main جایگزین GPT-4o شده است،‌ جای GPT-4o-mini را GPT-5-main-mini گرفته است. نسخه‌های استدلال‌گر o3، o4-mini،‌ o4 pro نیز به ترتیب با GPT-5-thinking، GPT-5-thinking-mini و GPT-5-Thinking-pro جایگزین شده‌اند و آخرین یا همان GPT-4.1-nano نیز با GPT-5-thinking-nano جایگزین شده است.

طبق اعلام اوپن‌ای‌آی، نسخه استاندارد GPT-5 (نسخه‌ای که تنها در اختیار کاربران پولی است) میزان خطاهای محتوایی را نسبت به GPT-4o به مقدار ۷۰ الی ۸۰ درصد کاهش داده است. نسخه مینی و نانو نیز که کاربران رایگان به آن دسترسی دارند، سریع‌تر از GPT-4o پاسخ می‌دهند.

بهبود عملکرد در کدنویسی

مدل GPT-5 در بنچمارک‌های معتبر نیز عملکرد بهتری را به ثبت رسانده است. این مدل در بنچمارک SWE-bench Verified که که به بررسی عملکرد مدل در وظایف کدنویسی واقعی با زبان پایتون می‌پردازد امتیاز ۷۴.۹ درصدی را ثبت کرده که جهشی چشمگیر نسبت به امتیاز ۶۹.۱ درصدی مدل o3 و ۵۴.۶ درصدی مدل GPT-4.1 محسوب می‌شود.

این بهبود عملکرد با توجه به اینکه GPT-5 برای ارائه نتایج مشابه از ۲۲ درصد توکن‌های خروجی کمتر و ۴۵ درصد استفاده از ابزار کمتری نسبت به o3 را به کار می‌گیرد و در واقع بهره‌وری را نیز افزایش داد، تحسین‌برانگیز است.

عملکرد مدل GPT-5 در بنچمارک دیگری به نام Aider Polyglot که به بررسی اصلاح کد چندزبانه می‌پردازد هم امتیاز ۸۸ درصدی را در مقایسه با امتیاز ۸۱ درصدی مدل o3 کسب کرده است و در عین حال حدود یک سوم نرخ خطا را دارد.

عملکرد ریاضیاتی و استدلال علمی

مدل GPT-5 در بخش ریاضیات پیشرفته نیز عملکرد بهترین سبت به نسخه‌های پیشین دارد و در سنجه AIME 2025 که یک رقابت ریاضیاتی بدون دسترسی به ابزار است این مدل امتیاز ۹۴.۶ درصدی را در مقایسه با امتیاز ۸۸.۹ درصدی o3 به‌ ثبت رسانده است. در تورنومنت ریاضی HMMT نیز بدون ابزار امتیاز ۹۳.۳ درصدی را مقایسه با امتیاز ۸۵ درصدی o3 به ثبت رسانده است. در سنجه دیگری به نام FrontierMath که به بررسی عملکرد ریاضیاتی پیشرفته با یک ابزار پایتون می‌پردازد، GPT-5 امتیاز ۲۶.۳ درصدی را در مقایسه با امتیاز ۱۵.۸ درصدی o3 به ثبت رسانده است.

در آزمون دیگری با سوالات علمی سطح PhD به نام GPQA Diamond نیز GPT-5 توانست با ابزارهای پایتون به امتیاز ۸۷.۳ درصدی و بدون این ابزارها به امتیاز ۸۵.۷ درصدی برسد که بهبود جزئی را نسبت به مدل o3 روایت می‌کند.

بهبود عملکرد به عنوان عامل هوش مصنوعی

اوپن‌ای‌آی می‌گوید این مدل در وظایف طولانی که هوش مصنوعی نقش عاملیتی را برعهده می‌گیرد عملکرد بسیار خوبی را به ثبت رسانده در بنچمارک τ2-bench telecom که یک سنجه جدید برای بررسی با دسترسی به ابزار است امتیاز ۹۶.۷ درصدی را کسب کرده است. این مدل در واقع با تکیه بر هوش بیشتر خود می‌تواند ده‌ها مورد استفاده از ابزار را به صورت زنجیره‌وار یا همزمان برنامه‌ریزی و اجرا کند و بهتر از مدل‌های پیشین در وظایف پیشرفته در مسیر خود بدون حواس‌پرتی و اشتباه به پیش برود.

علاوه بر این کاهش حدود ۸۰ درصدی خطاهای GPT-5 که در ابتدای متن به آن اشاره کردیم نیز عملکرد این مدل را در موضوعات حساس به شکل چشمگیری بهبود می‌بخشد.

قابلیت‌های جدید ChatGPT

اوپن‌ای‌آی در کنار عرضه مدل‌های جدید زبانی و استدلال‌گر خود که در قالب GPT-5 در اختیار کاربران قرار می‌گیرند،‌ قابلیت‌های تازه‌ای را نیز به ChatGPT اضافه کرده است.

کاربران حالا می‌توانند برای چت‌های مختلف خود رنگ خاص در نظر بگیرند که البته تنها یک ویژگی ظاهری است و تفاوت دیگری در گفتگو ایجاد نمی‌کند.

علاوه بر این شما می‌توانید شخصیت ChatGPT را به صورت دلخواه از میان ۵ گزینه مختلف انتخاب کنید. نسخه پیش‌فرض که برای تمام کاربران فعال است شاد و انطباق‌پذیر خواهد بود و چهار شخصیت دیگر نیز عبارتند از Cynic که رویکرد انتقادی و طعنه‌‌آمیز خواهد داشت، Robot که بهینه و رک است،‌ Listener که حامی و باملاحظه است و آخرین شخصیت هم Nerd نام دارد که کنجکاو و جستجوگر خواهد بود.

علاوه بر این مشترکان نسخه پلاس، پرو، تیم و اینترپرایز می‌توانند GPT-5 را مستقیما به جی‌میل و تقویم گوگل خود متص کنند تا هوش مصنوعی از این دسترسی برای برنامه‌ریزی زمانی، تنظیم پاسخ اولیه به ایمیل‌ها و کمک به زمان‌بندی بهتر روزانه استفاده کند.

تفاوت میان کاربران پولی و رایگان

با وجود اینکه کاربران رایگان و پولی پیش از این هم تفاوت روشنی با یکدیگر داشتند که از جمله آنها می‌توان محدودیت دسترسی به مدل‌های پیشرفته و مولد تصویر اشاره کرد، اما در نسل جدید کاربران علاوه بر محدودیت‌های پیشین، در نسخه جدید به مدل استنادارد GPT-5 هیچ دسترسی ندارند (این در حالی است که پیش از این مدل GPT-4o با محدودیت روزانه برای کاربران رایگان نیز قابل دسترسی بود.)

براساس ساختاربندی جدید اوپن‌ای‌آی، کاربران رایگان و پولی به شکل زیر در ChatGPT به مدل‌های شرکت دسترسی دارند:

۱. کاربران رایگان

کاربران رایگان که عمده کاربران ChatGPT را تشکیل می‌دهند تنها به دو نسخه سبک یعنی نانو و مینی دسترسی خواهند داشت که ویژگی‌های آن عبارتند از:

سرعت پاسخ‌گویی بالا برای مکالمات روزمره
پشتیبانی از متن و تصویر (ورودی تصویر محدود و کمتر دقیق از نسخه‌های پولی)
پنجره محتوایی یا تعداد توکن محدود نسبت به پولی (ورودی کوتاه‌تر و محدودیت در پردازش متن‌های طولانی)

به طور کلی به عنوان کاربر رایگان ChatGPT با محدودیت‌های زیر روبرو هستید:

به نسخه کامل یا GPT-5 Standard و نسخه‌های پیشرفته (Thinking/Pro) دسترسی نخواهید داشت
سرعت و ظرفیت پردازش در کارهای سنگین نیز کمتر است
و سقف درخواست روزانه با محدودیت بیشتری روبر خواهد شد

۲. کاربران پولی: نسخه پلاس و بالاتر

کاربران پولی ChatGPT به دو دسته کلی تقسیم می‌شوند: یکی مشترکان نسخه پلاس و تیم که در واقع ارزان‌ترین ورودی بخش کابران پولی هستند و دیگری مشترکان نسخه پرو و اینترپرایز یا سازمانی که سطح پیشرفته را شامل می‌شوند.

کاربران پولی به طول کلی از لحاظ دسترسی به مدل دست بازتری دارند و مدل‌های در دسترس آنها عبارت است از:

GPT-5 Standardدقت و توان بالا، مناسب تحلیل و کدنویسی پیشرفته
GPT-5-Mini وNano برای پاسخ سریع و کم‌هزینه
GPT-5-Thinking / High Reasoning برای استدلال عمیق و حل مسائل پیچیده (این دسته از مدل‌ها تنها در اختیار نسخه پرو و سازمانی قرار می‌گیرند)

به طور طبیعی، کاربران پولی با محدودیت‌های کمتری روبرو هستند و دست بازتری در تولید محتواهای مختلف همچون متن و تصویر دارند. اما پنجره محتوایی یا حداکثر توکن مجاز برای ورودی و خروجی بین پلن‌های کم‌هزینه و گران‌قیمت تفاوت آشکار دارد.

کاربران نسخه پلاس و تیم محدودی ۳۲ هزار توکنی دارند اما برای نسخه پرو و سازمانی این سرحد به ۱۲۸ هزار توکن افزایش می‌یابد. پنجره محتوایی برای مجموع ورودی و خروجی مدل برای مشترکان رابط برنامه‌نویسی یا API این شرکت تا ۴۰۰ هزار توکن افزایش می‌یابد.

سرعت پاسخ‌گویی و دقت تولید تصاویر نیز در مدل‌های پولی (و همچنین محدودیت تعداد درخواست‌های تولید تصویر) افزایش می‌یابد. علاوه بر این مدل‌های پولی دسترسی پایدار‌تری به هوش مصنوعی (به ویژه برای تولید تصویر) دارند، در حالی که برای مشترکان رایگان، در زمان اوج مصرف محدودیت‌هایی اعمال می‌شود.

یک متخصص PhD با تجربه کاربری متفاوت

به طور کلی گذار به GPT-5 را می‌توان تغییری مهم در تجربه کاربری چندپاره دانست که حالا در زیر یک چتر یکپارچه‌سازی شده‌اند و دیگر نیازی به انتخاب مدل‌های متفاوت نیست؛ در واقع این هوش مصنوعی است که خود با مسیردهی فوری بهترین مدل را برای شما انتخاب می‌کند.

با این حال عملکرد مدل نیز نسبت به نسل قبلی بهبود یافته، به طور کلی که مدیرعامل اوپن‌ای‌آی می‌گوید دسترسی به این مدل شبیه به داشتن یک «متخصص با مدرک PhD» در جیبتان است. با این حال آلتمن می‌گوید اگرچه این مدل یک گام مهم به سمت AGI است، اما هنوز نمی‌توان آن را هوش مصنوعی عمومی دانست چرا که بسیاری از قابلیت‌های کلیدی که برای چنین سیستم‌هایی در نظر گرفته می‌شود همچون «یادگیری مداوم» در آن به چشم نمی‌خورد.

باید دید اوپن‌ای‌آی که حالا برای فروش سهام با ارزش‌گذاری ۵۰۰ میلیارد دلاری خیز برداشته می‌تواند در ماه‌های آینده تفاوت محسوسی را برای کاربران رقم زده و همچنین باعث جذب مشترکان پولی بیشتری شود که بتوانند هزینه هنگفت زیرساخت هوش مصنوعی را توجیه کنند یا خیر.

این مطالب را هم بخوانید: