سم آلتمن در جلسه پرسشوپاسخی با کاربران ردیت،وعده اصلاح GPT-5 را داد
در جریان یک نشست پرسش و پاسخ (AMA) در شبکه اجتماعی ردیت، سم آلتمن، مدیرعامل…
۱۸ مرداد ۱۴۰۴
۱۸ مرداد ۱۴۰۴
زمان مطالعه : ۱۰ دقیقه
شرکت اوپنایآی دو روز پیش یعنی در تاریخ ۷ آگوست ۲۰۲۵ از جدیدترین و مورد انتظارترین نسخه از مدل زبانی خود رونمایی کرد. در دو روز پس از عرضه این مدل واکنشهای مختلفی رو نسبت به آن شاهد هستیم به طوری که بسیاری از کاربران شبکه اجتماعی ریدت در یک پرسشوپاسخ با حضور سم آلتمن، مدیرعامل اوپنایآی، خواستار دسترسی به مدل پیشین یعنی GPT-4o شدند. با این حال مجله وایرد و هفتهنامه بارونز از این مدل به عنوان گامی مهم به سمت هوش مصنوعی عمومی یا AGI یاد کردهاند.
به گزارش پیوست، مدل جدید شرکت اوپنایآی که پس از مدتها انتظار و گمانهزنی در دسترس عمومی قرار گرفت طبق گفته تحلیلگران به بارونز و فایننشال تایمز از لحاظ کدنویسی و کاهش خطا عملکرد خوبی را به نمایش گذاشته است.
اما در کنار بهبود عملکرد و حتی ارائه یک پنجره بزرگ ۴۰۰ هزار توکنی برای ورودی و خروجی این مدل، به نظر میرسد که نسل جدید و یکپارچه هوش مصنوعی اوپنایآی تمرکز بیشتری بر کاربران پولی دارد و تفکیک فاحشتری را میان نسخه رایگان و پیشرفته شاهد هستیم.
برای مثال این پنجره ۴۰۰ هزار توکنی (که مختص کاربران رابط برنامهنویسی یا API است) برای کاربران رایگان که تنها به نسخههای نانو و مینی GPT-5 دسترسی دارند در ChatGPT به ۸ هزار توکن سقوط میکند. کاربران پلاس (و Team) و نسخه تجاری (و پرو) در ChatGPT بهترتیب پنجره محتوای ۳۲ هزار توکنی و ۱۲۸ هزار توکنی دارند. این تفاوت میان کاربران نسخههای مختلف با چشمانداز مدیرعامل شرکت که در پادکستی با تیئو وان به آن اشاره کرده بود و توکنها را «ارز آینده» توصیف میکرد، همخوانی دارد.
اما بیایید ابتدا نگاهی به تفاوت GPT-5 با نسخه پیشین و سپس تفاوت میان سطوح مختلفی دسترسی بیاندازیم.
همین ابتدای توضیحات بهتر است بگوییم که برخلاف گمانهزنیهای یکی دو سال اخیر فعالان هوش مصنوعی که عرضه این مدل را در واقع تحقق AGI یا هوش مصنوعی عمومی با قابلیتهایی همتراز یا فراتر از انسان برآورد میکردند، نه تحلیلگران و نه خود شرکت ارائه دهنده این مدل را در چنین سطحی برآورد نمیکند و آن را تنها گامی بزرگ به سمت این هدف توصیف کردهاند (هدفی که شاید به طور کلی نیز یک اوجی دست نیافتنی از کمال باشد و شرکتها تنها به مرور زمان فاصله خود را با آن کمتر کنند.)
با این حال GPT-5 که حالا از بیش از ۷۰۰ میلیون کاربر فعال هفتگی ChatGPT میزبانی میکند، تفاوتهای روشنی با نسل قبلی خود دارد و بیشتر از یک جهش فنی، در واقع پیشرفتی در حوزه تجربه کاربری یا UX محسوب میشود.
اولین تفاوتی که هنگام استفاده GPT-5 احساس میکنید، حذف گزینههای انتخاب مدل یعنی همان GPT-4o، نسخه مینی GPT-4o و مدل استدلالگر o3 است. در واقع یکی از مهمترین تغییرات نسخه جدید، یکپارچهسازی مدلهای هوش مصنوعی اوپنایآی در زیر یک چتر جدید است که به واسطه قابلیتی به نام مسیردهنده لحظهای ممکن شده و GPT-5 که در بردارنده نسخههای مختلف است تشخیص میدهد برای درخواست شما از مدمل استدلالگر یا زبانی استفاده کند (البته گفتنی است که کاربران نسخه پرو برای انتخاب نسخه GPT-5 Pro و GPT-5 Thinking حق انتخاب دارند.)
نسل پنجم مدلهای اوپنایآی نسخهای جدید را جایگزین مدلهای پیشین کرده است که در بنچمارکها نیز عملکرد بهتری را به نمایش میگذارند: GPT-5-Main جایگزین GPT-4o شده است، جای GPT-4o-mini را GPT-5-main-mini گرفته است. نسخههای استدلالگر o3، o4-mini، o4 pro نیز به ترتیب با GPT-5-thinking، GPT-5-thinking-mini و GPT-5-Thinking-pro جایگزین شدهاند و آخرین یا همان GPT-4.1-nano نیز با GPT-5-thinking-nano جایگزین شده است.
طبق اعلام اوپنایآی، نسخه استاندارد GPT-5 (نسخهای که تنها در اختیار کاربران پولی است) میزان خطاهای محتوایی را نسبت به GPT-4o به مقدار ۷۰ الی ۸۰ درصد کاهش داده است. نسخه مینی و نانو نیز که کاربران رایگان به آن دسترسی دارند، سریعتر از GPT-4o پاسخ میدهند.
مدل GPT-5 در بنچمارکهای معتبر نیز عملکرد بهتری را به ثبت رسانده است. این مدل در بنچمارک SWE-bench Verified که که به بررسی عملکرد مدل در وظایف کدنویسی واقعی با زبان پایتون میپردازد امتیاز ۷۴.۹ درصدی را ثبت کرده که جهشی چشمگیر نسبت به امتیاز ۶۹.۱ درصدی مدل o3 و ۵۴.۶ درصدی مدل GPT-4.1 محسوب میشود.
این بهبود عملکرد با توجه به اینکه GPT-5 برای ارائه نتایج مشابه از ۲۲ درصد توکنهای خروجی کمتر و ۴۵ درصد استفاده از ابزار کمتری نسبت به o3 را به کار میگیرد و در واقع بهرهوری را نیز افزایش داد، تحسینبرانگیز است.
عملکرد مدل GPT-5 در بنچمارک دیگری به نام Aider Polyglot که به بررسی اصلاح کد چندزبانه میپردازد هم امتیاز ۸۸ درصدی را در مقایسه با امتیاز ۸۱ درصدی مدل o3 کسب کرده است و در عین حال حدود یک سوم نرخ خطا را دارد.
مدل GPT-5 در بخش ریاضیات پیشرفته نیز عملکرد بهترین سبت به نسخههای پیشین دارد و در سنجه AIME 2025 که یک رقابت ریاضیاتی بدون دسترسی به ابزار است این مدل امتیاز ۹۴.۶ درصدی را در مقایسه با امتیاز ۸۸.۹ درصدی o3 به ثبت رسانده است. در تورنومنت ریاضی HMMT نیز بدون ابزار امتیاز ۹۳.۳ درصدی را مقایسه با امتیاز ۸۵ درصدی o3 به ثبت رسانده است. در سنجه دیگری به نام FrontierMath که به بررسی عملکرد ریاضیاتی پیشرفته با یک ابزار پایتون میپردازد، GPT-5 امتیاز ۲۶.۳ درصدی را در مقایسه با امتیاز ۱۵.۸ درصدی o3 به ثبت رسانده است.
در آزمون دیگری با سوالات علمی سطح PhD به نام GPQA Diamond نیز GPT-5 توانست با ابزارهای پایتون به امتیاز ۸۷.۳ درصدی و بدون این ابزارها به امتیاز ۸۵.۷ درصدی برسد که بهبود جزئی را نسبت به مدل o3 روایت میکند.
اوپنایآی میگوید این مدل در وظایف طولانی که هوش مصنوعی نقش عاملیتی را برعهده میگیرد عملکرد بسیار خوبی را به ثبت رسانده در بنچمارک τ2-bench telecom که یک سنجه جدید برای بررسی با دسترسی به ابزار است امتیاز ۹۶.۷ درصدی را کسب کرده است. این مدل در واقع با تکیه بر هوش بیشتر خود میتواند دهها مورد استفاده از ابزار را به صورت زنجیرهوار یا همزمان برنامهریزی و اجرا کند و بهتر از مدلهای پیشین در وظایف پیشرفته در مسیر خود بدون حواسپرتی و اشتباه به پیش برود.
علاوه بر این کاهش حدود ۸۰ درصدی خطاهای GPT-5 که در ابتدای متن به آن اشاره کردیم نیز عملکرد این مدل را در موضوعات حساس به شکل چشمگیری بهبود میبخشد.
اوپنایآی در کنار عرضه مدلهای جدید زبانی و استدلالگر خود که در قالب GPT-5 در اختیار کاربران قرار میگیرند، قابلیتهای تازهای را نیز به ChatGPT اضافه کرده است.
کاربران حالا میتوانند برای چتهای مختلف خود رنگ خاص در نظر بگیرند که البته تنها یک ویژگی ظاهری است و تفاوت دیگری در گفتگو ایجاد نمیکند.
علاوه بر این شما میتوانید شخصیت ChatGPT را به صورت دلخواه از میان ۵ گزینه مختلف انتخاب کنید. نسخه پیشفرض که برای تمام کاربران فعال است شاد و انطباقپذیر خواهد بود و چهار شخصیت دیگر نیز عبارتند از Cynic که رویکرد انتقادی و طعنهآمیز خواهد داشت، Robot که بهینه و رک است، Listener که حامی و باملاحظه است و آخرین شخصیت هم Nerd نام دارد که کنجکاو و جستجوگر خواهد بود.
علاوه بر این مشترکان نسخه پلاس، پرو، تیم و اینترپرایز میتوانند GPT-5 را مستقیما به جیمیل و تقویم گوگل خود متص کنند تا هوش مصنوعی از این دسترسی برای برنامهریزی زمانی، تنظیم پاسخ اولیه به ایمیلها و کمک به زمانبندی بهتر روزانه استفاده کند.
با وجود اینکه کاربران رایگان و پولی پیش از این هم تفاوت روشنی با یکدیگر داشتند که از جمله آنها میتوان محدودیت دسترسی به مدلهای پیشرفته و مولد تصویر اشاره کرد، اما در نسل جدید کاربران علاوه بر محدودیتهای پیشین، در نسخه جدید به مدل استنادارد GPT-5 هیچ دسترسی ندارند (این در حالی است که پیش از این مدل GPT-4o با محدودیت روزانه برای کاربران رایگان نیز قابل دسترسی بود.)
براساس ساختاربندی جدید اوپنایآی، کاربران رایگان و پولی به شکل زیر در ChatGPT به مدلهای شرکت دسترسی دارند:
کاربران رایگان که عمده کاربران ChatGPT را تشکیل میدهند تنها به دو نسخه سبک یعنی نانو و مینی دسترسی خواهند داشت که ویژگیهای آن عبارتند از:
به طور کلی به عنوان کاربر رایگان ChatGPT با محدودیتهای زیر روبرو هستید:
کاربران پولی ChatGPT به دو دسته کلی تقسیم میشوند: یکی مشترکان نسخه پلاس و تیم که در واقع ارزانترین ورودی بخش کابران پولی هستند و دیگری مشترکان نسخه پرو و اینترپرایز یا سازمانی که سطح پیشرفته را شامل میشوند.
کاربران پولی به طول کلی از لحاظ دسترسی به مدل دست بازتری دارند و مدلهای در دسترس آنها عبارت است از:
به طور طبیعی، کاربران پولی با محدودیتهای کمتری روبرو هستند و دست بازتری در تولید محتواهای مختلف همچون متن و تصویر دارند. اما پنجره محتوایی یا حداکثر توکن مجاز برای ورودی و خروجی بین پلنهای کمهزینه و گرانقیمت تفاوت آشکار دارد.
کاربران نسخه پلاس و تیم محدودی ۳۲ هزار توکنی دارند اما برای نسخه پرو و سازمانی این سرحد به ۱۲۸ هزار توکن افزایش مییابد. پنجره محتوایی برای مجموع ورودی و خروجی مدل برای مشترکان رابط برنامهنویسی یا API این شرکت تا ۴۰۰ هزار توکن افزایش مییابد.
سرعت پاسخگویی و دقت تولید تصاویر نیز در مدلهای پولی (و همچنین محدودیت تعداد درخواستهای تولید تصویر) افزایش مییابد. علاوه بر این مدلهای پولی دسترسی پایدارتری به هوش مصنوعی (به ویژه برای تولید تصویر) دارند، در حالی که برای مشترکان رایگان، در زمان اوج مصرف محدودیتهایی اعمال میشود.
به طور کلی گذار به GPT-5 را میتوان تغییری مهم در تجربه کاربری چندپاره دانست که حالا در زیر یک چتر یکپارچهسازی شدهاند و دیگر نیازی به انتخاب مدلهای متفاوت نیست؛ در واقع این هوش مصنوعی است که خود با مسیردهی فوری بهترین مدل را برای شما انتخاب میکند.
با این حال عملکرد مدل نیز نسبت به نسل قبلی بهبود یافته، به طور کلی که مدیرعامل اوپنایآی میگوید دسترسی به این مدل شبیه به داشتن یک «متخصص با مدرک PhD» در جیبتان است. با این حال آلتمن میگوید اگرچه این مدل یک گام مهم به سمت AGI است، اما هنوز نمیتوان آن را هوش مصنوعی عمومی دانست چرا که بسیاری از قابلیتهای کلیدی که برای چنین سیستمهایی در نظر گرفته میشود همچون «یادگیری مداوم» در آن به چشم نمیخورد.
باید دید اوپنایآی که حالا برای فروش سهام با ارزشگذاری ۵۰۰ میلیارد دلاری خیز برداشته میتواند در ماههای آینده تفاوت محسوسی را برای کاربران رقم زده و همچنین باعث جذب مشترکان پولی بیشتری شود که بتوانند هزینه هنگفت زیرساخت هوش مصنوعی را توجیه کنند یا خیر.