skip to Main Content
محتوای اختصاصی کاربران ویژهورود به سایت

فراموشی رمز عبور

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ عضو شوید

ثبت نام سایت

با شبکه های اجتماعی وارد شوید

عضو نیستید؟ وارد شوید

فراموشی رمز عبور

وارد شوید یا عضو شوید

جشنواره نوروزی آنر

انقلابی که نیامد: چرا عامل‌های هوش مصنوعی در سال ۲۰۲۵ تحول‌آفرین نشدند؟

۶ دی ۱۴۰۴

زمان مطالعه : ۹ دقیقه

حدود یک سال پیش، سم آلتمن، مدیرعامل اوپن‌ای‌آی، پیش‌بینی‌ای بلند‌پروازانه‌ای را مطرح کرد که به‌سرعت به یکی از بحث‌برانگیزترین وعده‌های صنعت فناوری تبدیل شد. او گفت: «ما باور داریم که در سال ۲۰۲۵، نخستین عامل‌های هوش مصنوعی وارد نیروی کار می‌شوند و به‌طور معناداری خروجی شرکت‌ها را تغییر خواهند داد.»

به گزارش پیوست به نقل از نیویوکر، چند هفته بعد، کوین وایل، مدیر ارشد محصولات اوپن‌ای‌آی، در اجلاس مجمع جهانی اقتصاد در داووس، این پیش‌بینی را بسط داد و گفت که ChatGPT دیگر صرفا «ابزاری هوشمند برای گفتگو» نیست، بلکه قادر است در دنیای واقعی به نیابت از کاربران دست به اقدام بزند و کارهایی چون پر کردن فرم‌های آنلاین تا رزرو رستوران و وظایف پیچیده دیجیتال را به اجرا گذارد.

در آن مقطع، چنین اظهاراتی تنها یک اغراق تبلیغاتی به نظر نمی‌رسید. پیشرفت سریع مدل‌های زبانی بزرگ (LLMها)، به‌ویژه در حوزه برنامه‌نویسی، باعث باور بسیاری به این پیش‌بینی شده بود که هوش مصنوعی در آستانه یک جهش تاریخی قرار دارد؛ جهشی که تحول برآمده از آن می‌توانست ساختار بازار کار را دگرگون کند.

چشم‌انداز از نگاه فعالان بازار به حدی روشن بود که مارک بنیوف، مدیرعامل Salesforce که شرکتش از اولین شرکای صنعتی بزرگ برای پیشنهادات مختلف اوپن‌ای‌آی است و از عامل‌های هوش مصنوعی در فرایند‌های کاری خود استفاده می‌کند، پا را فراتر از این پیش‌بینی‌ها گذاشت و از انقلاب «چند هزار میلیارد دلاری» عامل‌های هوشمند سخن گفت.

اما اکنون که به پایان سال ۲۰۲۵ نزدیک می‌شویم، تصویر واقعی فاصله معناداری با این پیش‌بینی‌ها دارد و گرچه عامل‌های هوش مصنوعی به عنوان یک فناوری مهم و تاثیرگذار در آینده شناخته می‌شوند، اما هنوز تحولی که بزرگان فناوری از آن سخن می‌گفتند محقق نشده است.

عامل هوش مصنوعی چیست و چرا این‌قدر مهم تلقی می‌شد؟

برای اینکه بفهمیم چطور این انتظارات با شکست همراه شده است، ابتدا باید مفهوم عامل هوش مصنوعی را بررسی کنیم. برخلاف چت‌بات‌ها که به یک درخواست متنی پاسخ می‌دهند، عامل‌های هوش مصنوعی قرار است به‌طور مستقل در محیط دیجیتال دست به کار شده و به نیابت از ما عمل کنند.

به‌عبارت دیگر، یک عامل باید بتواند هدف کلی کاربر خود را در کند، همانند انسان آن را به چندین مرحله خرد تقسیم کرده و با استفاده از ابزارهای مختلف (مرورگر، نرم‌افزارها، APIها) دست به اقدام بزند و در این فرایند نتایج میانی را ارزیابی کرده و مسیر خود را براساس روند پیشرفت اصلاح کند تا در نهایت هدفی که کاربر خواستار آن است محقق شود.

مثالی که بیشتر برای این بخش استفاده می‌شود، فرایند رزرو یک هتل به نیابت از کاربر است که عامل هوش مصنوعی ابتدا به انتخاب تاریخ می‌پردازد، سپس گزینه‌ها را بررسی و فیلتر می‌کند، نظرات را می‌‌خواند ، قیمت‌های را در سایت‌های مختلف مقایسه می‌کند و در نهایت با توجه به دستور کاربر اقدام به رزرو هتل می‌کند. کاری که برای انسان ساده به نظر می‌رسد اما چندین تصمیم ریز را در درون خود دارد.

اگر عامل‌های هوش مصنوعی واقعا قادر به انجام چنین وظایفی باشند، پیامدهای عظیمی را شاهد خواهیم بود. از آنجایی که وظایف چند‌مرحله‌ای این چنینی در بسیاری از مشاغل به صورت روزمره انجام می‌‌گیرد، عامل‌ها می‌توانند به طور مستقیم جایگزین بخشی از نیروی انسانی در بسیاری از مشاغل اداری و خدماتی شوند.

حال گرچه گزارش‌ها از تعدیل گسترده به ویژه در بخش فناوری آمریکا در سال گذشته می‌گویند و آمار‌های جدید به حدود ۵۰ هزار تعدیل نیروی مستقیم در نتیجه هوش مصنوعی اشاره می‌کنند، اما آنچه رخ داده با پیش‌بینی و انتظارات فناوران متفاوت است.

چرا قرار شد که سال ۲۰۲۵ «سال عامل‌ها» باشد؟

دلیل اصلی خوش‌بینی، پیشرفت چشمگیر هوش مصنوعی در برنامه‌نویسی بود. تا پایان ۲۰۲۴، ابزارهایی مانند GitHub Copilot و مدل‌های پیشرفته اوپن‌ای‌آی نشان دادند که می‌توانند علاوه بر کدنویسی، حتی به اصلاح و تحلیل و پروژه‌های نرم‌افزاری نیز بپردازند.

دموی مشهور Codex Agent (عامل هوش مصنوعی اوپن‌ای‌آی که با تمرکز بر برنامه‌نویسی عرضه شده است) در ماه مه، نقطه عطفی برای این روایت بود. در این نمایش، کاربر از عامل هوش مصنوعی خواست تغییر کوچکی در وب‌سایت شخصی‌اش ایجاد کند و عامل هوش مصنوعی اوپن‌ای‌آی برای این کار ابتدا به بررسی ساختار فایل‌ها پرداخت. در مرحله بعدی فایل مناسب را شناسایی کرد و محل درست برای افزودن کد را یافت.

در نهایت کد را اصلاح کرد و صفحه جدیدی ایجاد که خواسته کاربر را پاسخ می‌داد و این همان کاری بود که فرد باید از یک طراح سایت انتظار می‌داشت.

برای بسیاری از مهندسان، این عملکرد به‌طرز نگران‌کننده‌ای شبیه تفکر انسانی بود. همین موفقیت باعث شد سیلیکون‌ولی به این نتیجه برسد که اگر هوش مصنوعی بتواند برنامه‌نویسی کند، به‌زودی از پس سایر کارها هم برمی‌آید.

اما موفقیت هوش مصنوعی در بخش برنامه‌نویسی آن چنان که باید در دیگر بخش‌ها ترجمه نشد و همین مساله باعث شد تا این ابزارها در حال حاضر نتوانند تفاوت معناداری در بخش‌های مختلف صنعتی و فناوری رقم بزنند.

خبری از عامل‌های عمومی نشد

با وجود این خوش‌بینی، در عمل عامل‌های هوش مصنوعی عمومی با شکست مواجه شدند. در پاییز، آندری کارپاتی، از بنیان‌گذاران اوپن‌ای‌آی، به‌صراحت اعلام کرد که عامل‌ها «از نظر شناختی دچار ضعف‌اند» و «عملا کار نمی‌کنند.»

گری مارکوس، منتقد قدیمی هیجان‌زدگی‌های صنعت فناوری، حتی صریح‌تر از این به انتقاد پرداخت و گفت: «عامل‌های هوش مصنوعی را تا این‌جا می‌توان عمدتا یک ناکامی توصیف کرد.»

این فاصله میان وعده و واقعیت، صرفا یک شکست فنی نیست؛ بلکه تهدیدی برای روایت کلان آینده هوش مصنوعی است که براساس آن شرکت‌ها و حتی دولت‌های مختلف به هزاران میلیارد دلار سرمایه‌گذاری متعهد شده‌اند.

اگر هوش مصنوعی نتواند از سطح چت‌بات فراتر برود، بسیاری از وعده‌های اتوماسیون گسترده زیر سوال خواهد رفت.

عامل‌ها واقعا چگونه کار می‌کنند؟

برخلاف تصور عمومی، عامل‌های هوش مصنوعی «مغزهای مستقل دیجیتال» نیستند. آن‌ها ترکیبی از  یک مدل زبانی بزرگ و یک برنامه کنترلی ساده هستند که وظیفه هماهنگ‌سازی بخش‌های مختلف را دارد که هرکدام از آن‌ها مدلی (گاه تخصصی و گاه عمومی) هستند.

این برنامه کنترلی درخواست کاربر را به پرسش‌هایی برای مدل تبدیل می‌کند: «هدف چیست؟ چه ابزارهایی در اختیار داری؟ گام بعدی چیست؟»

سپس مدل پیشنهاد یک اقدام را می‌دهد، سیستم آن را اجرا می‌کند، نتیجه را گزارش می‌دهد و دوباره از مدل می‌پرسد چه باید کرد. این چرخه تا زمانی ادامه پیدا می‌کند که مدل تصور کند کار تمام شده است.

با این حال چنین ساختاربندی در محیط‌های عملکرد عالی دارد، که کاملا مبتنی بر متن است.

به همین دلیل است که بخش نگارش و برنامه‌نویسی اولین حوزه شکوفایی عامل‌ها و به طور کلی هوش مصنوعی شناخته می‌شوند. محیط توسعه نرم‌افزار تقریبا ایده‌آل‌ترین سناریو برای LLMهاست چرا که  دستورات آن متنی‌اند، ساختارها منطقی و سلسله‌مراتبی دارد و بازخوردها سریع و شفاف‌اند.

به همین دلیل، عامل‌های کدنویسی عملکردی قابل‌قبول دارند اما مشکل زمانی آغاز می‌شود که عامل باید وارد دنیای گرافیکی و تعاملی انسان‌ها شود.

موس و کلیک یکی از چالش‌های اصلی عامل‌ها

بیشتر کارهای دیجیتال انسان‌ها با کلیک، اسکرول و انتخاب منوها انجام می‌شود. دلیل آن هم این است که جهان دیجیتال ما از جمله وبسایت‌ها و اپلیکشین‌ها با هدف ارائه خدمات به انسان‌ها طراحی شده‌اند و نه روبات‌ها؛ در واقع طراحی جهان دیجیتال به گونه‌ای است که تلاش کند از دسترسی روبات‌ها جلوگیری شود.

برای یک هوش مصنوعی یا عامل هوش مصنوعی، این محیط به‌شدت مبهم است. گزارش نیویورک‌تایمز نشان می‌دهد برخی استارت‌آپ‌ها حتی مجبور شده‌اند «سایت‌های سایه‌ای» با هدف تمرین دادن به هوش مصنوعی بسازند؛ نسخه‌های شبیه‌سازی‌شده از وب‌سایت‌هایی مانند جی‌میل یا United Airlines که هوش مصنوعی‌ بتواند رفتار موس را در آن تمرین کند.

نسخه اولیه ChatGPT Agent یا عامل هوش مصنوعی اوپن‌ای‌آی که در تابستان معرفی شد، گواهی بر این مشکل است. بررسی‌ها نشان داد حتی کارهای ساده، مانند انتخاب یک گزینه از منوی کشویی، ممکن است چندین دقیق به طول بیانجامد یا حتی به توقف کامل فرایند انجام کار منجر شود.

شاید همین مساله باعث شده تا شرکت‌های هوش مصنوعی همچنان بر نظارت انسانی تاکید داشته باشند و در واقع انسان را در کنار هوش مصنوعی در این حلقه کاری نگاه دارند. اما از آنجایی که هدف نهایی اقدام و فعالیت مستقل عامل‌ها است، برخی شرکت‌ها و توسعه‌دهندگان به فکر اینترنتی عامل پسند افتاده‌‌اند.

تغییر اینترنت به نفع عامل‌ها

برخی توسعه‌دهندگان معتقدند به‌جای آموزش هوش مصنوعی برای تقلید از انسان، باید ابزارها را برای هوش مصنوعی ساده‌تر کرد. از این رو پروژه‌هایی مانند Model Context Protocol و Agent2Agent گوگل را شاهد هستیم.

این پروژه‌ها به‌دنبال ایجاد جهانی هستند که در آن عامل‌ها مستقیما با یکدیگر و با نرم‌افزارها تعامل متنی داشته باشند و دیگر نیازی به تعامل با رابط گرافیکی نباشد. در واقع مرحله‌ای که در آن هوش مصنوعی به مشکل می‌خورد قرار است از مسیر انجام کار حذف شود.

اما این مسیر مستلزم بازطراحی بخش بزرگی از زیرساخت اینترنت است؛ کاری که سال‌ها زمان می‌برد و با مقاومت جدی مواجه خواهد شد.

اما حتی اگر مشکلات فنی حل شود، مانع بزرگ‌تری همچنان به قوت خود باقی است و آن ناتوانی LLMها در درک جهان واقعی است (جهانی که از متن و دستور‌های کامپیوتری فراتر می‌رود.)

نمونه‌ای که شرکت اوپن‌ای‌آی در دمو ارائه کرده بود نیز که حاوی نقشه سفر استادیوم‌های MLB بود و به‌اشتباه نقطه‌ای در خلیج مکزیک را در بر داشت، نمادی از این ضعف است.

مدل‌ها و در نتیجه عامل‌های هوش مصنوعی در بهترین حالت خود و در آنلاین‌ترین حالت در درک زمان درک مکان و استدلال سببی با مشکل مواجه‌اند و این ضعف‌ها در یک فرآیند چندمرحله‌ای می‌تواند فاجعه‌بار باشد.

اثر دومینویی خطاها

نرخ توهم (Hallucination) مدل‌های پیشرفته‌ای مانند GPT-5 حدود ۱۰ درصد گزارش شده است. برای یک چت‌بات، این عدد شاید قابل‌تحمل باشد؛ اما برای یک عامل که باید ۲۰ یا ۳۰ گام متوالی بردارد، یک خطا کافی است تا کل ماموریت با شکست مواجه شود و یا حتی نتیجه نهایی بسیار متفاوت از آنچه کاربرد انتظار داشت باشد.

شاید به همین دلیل باشد که سم آلتمن طی یک یادداشت داخلی اعلام کرد توسعه عامل‌های هوش مصنوعی در اولویت‌های اوپن‌ای‌آی کاهش می‌یابد و تمرکز اصلی دوباره به بهبود ChatGPT بازمی‌گردد (البته گفتنی است که این یادداشت درست پس از موفقیت مدل جمینای ۳ گوگل و جذب گسترده کاربران به اکوسیستم رقیب اوپن‌ای‌آی در اختیار کاربران قرار گرفت و بسیاری آن را تمرکز بر پاسخ رقابتی به گوگل تفسیر کرده‌اند.) با این حال این تصمیم نشانه‌ای آشکار از واقع‌گرایی پس از یک دوره هیجان‌زدگی است.

اما شاید بهترین توصیف وضعیت را خود آندری کارپاتی ارائه کرده باشد. او در پاسخ به این‌که چرا «سال عامل‌ها» محقق نشد، گفت: «این بیشتر دهه عامل‌هاست تا سال عامل‌ها.»

در نتیجه می‌توان گفت که گرچه هوش مصنوعی همچنان در حال پیشرفت است، اما سال ۲۰۲۵ نشان داد که گذار از ابزار هوشمند به عامل مستقل بسیار پیچیده‌تر از آن است که در هیاهوی اولیه و توسط بزرگان صنعتی پیش‌بینی می‌شد و آینده هوش مصنوعی نه با جهش‌های ناگهانی، بلکه با پیشرفت‌های تدریجی، پرخطا و زمان‌بر رقم خواهد خورد.

 

https://pvst.ir/n81

0 نظر

ارسال دیدگاه

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

*

برای بوکمارک این نوشته
Back To Top
جستجو