صندوقها پای کار استارتآپهای فرهنگی آمدند
استارتآپهای فعال در پارک ملی علوم و فناوریهای نرم و صنایع فرهنگی طی سالهای اخیر…
۶ دی ۱۴۰۴
۶ دی ۱۴۰۴
زمان مطالعه : ۹ دقیقه

حدود یک سال پیش، سم آلتمن، مدیرعامل اوپنایآی، پیشبینیای بلندپروازانهای را مطرح کرد که بهسرعت به یکی از بحثبرانگیزترین وعدههای صنعت فناوری تبدیل شد. او گفت: «ما باور داریم که در سال ۲۰۲۵، نخستین عاملهای هوش مصنوعی وارد نیروی کار میشوند و بهطور معناداری خروجی شرکتها را تغییر خواهند داد.»
به گزارش پیوست به نقل از نیویوکر، چند هفته بعد، کوین وایل، مدیر ارشد محصولات اوپنایآی، در اجلاس مجمع جهانی اقتصاد در داووس، این پیشبینی را بسط داد و گفت که ChatGPT دیگر صرفا «ابزاری هوشمند برای گفتگو» نیست، بلکه قادر است در دنیای واقعی به نیابت از کاربران دست به اقدام بزند و کارهایی چون پر کردن فرمهای آنلاین تا رزرو رستوران و وظایف پیچیده دیجیتال را به اجرا گذارد.
در آن مقطع، چنین اظهاراتی تنها یک اغراق تبلیغاتی به نظر نمیرسید. پیشرفت سریع مدلهای زبانی بزرگ (LLMها)، بهویژه در حوزه برنامهنویسی، باعث باور بسیاری به این پیشبینی شده بود که هوش مصنوعی در آستانه یک جهش تاریخی قرار دارد؛ جهشی که تحول برآمده از آن میتوانست ساختار بازار کار را دگرگون کند.
چشمانداز از نگاه فعالان بازار به حدی روشن بود که مارک بنیوف، مدیرعامل Salesforce که شرکتش از اولین شرکای صنعتی بزرگ برای پیشنهادات مختلف اوپنایآی است و از عاملهای هوش مصنوعی در فرایندهای کاری خود استفاده میکند، پا را فراتر از این پیشبینیها گذاشت و از انقلاب «چند هزار میلیارد دلاری» عاملهای هوشمند سخن گفت.
اما اکنون که به پایان سال ۲۰۲۵ نزدیک میشویم، تصویر واقعی فاصله معناداری با این پیشبینیها دارد و گرچه عاملهای هوش مصنوعی به عنوان یک فناوری مهم و تاثیرگذار در آینده شناخته میشوند، اما هنوز تحولی که بزرگان فناوری از آن سخن میگفتند محقق نشده است.
برای اینکه بفهمیم چطور این انتظارات با شکست همراه شده است، ابتدا باید مفهوم عامل هوش مصنوعی را بررسی کنیم. برخلاف چتباتها که به یک درخواست متنی پاسخ میدهند، عاملهای هوش مصنوعی قرار است بهطور مستقل در محیط دیجیتال دست به کار شده و به نیابت از ما عمل کنند.
بهعبارت دیگر، یک عامل باید بتواند هدف کلی کاربر خود را در کند، همانند انسان آن را به چندین مرحله خرد تقسیم کرده و با استفاده از ابزارهای مختلف (مرورگر، نرمافزارها، APIها) دست به اقدام بزند و در این فرایند نتایج میانی را ارزیابی کرده و مسیر خود را براساس روند پیشرفت اصلاح کند تا در نهایت هدفی که کاربر خواستار آن است محقق شود.
مثالی که بیشتر برای این بخش استفاده میشود، فرایند رزرو یک هتل به نیابت از کاربر است که عامل هوش مصنوعی ابتدا به انتخاب تاریخ میپردازد، سپس گزینهها را بررسی و فیلتر میکند، نظرات را میخواند ، قیمتهای را در سایتهای مختلف مقایسه میکند و در نهایت با توجه به دستور کاربر اقدام به رزرو هتل میکند. کاری که برای انسان ساده به نظر میرسد اما چندین تصمیم ریز را در درون خود دارد.
اگر عاملهای هوش مصنوعی واقعا قادر به انجام چنین وظایفی باشند، پیامدهای عظیمی را شاهد خواهیم بود. از آنجایی که وظایف چندمرحلهای این چنینی در بسیاری از مشاغل به صورت روزمره انجام میگیرد، عاملها میتوانند به طور مستقیم جایگزین بخشی از نیروی انسانی در بسیاری از مشاغل اداری و خدماتی شوند.
حال گرچه گزارشها از تعدیل گسترده به ویژه در بخش فناوری آمریکا در سال گذشته میگویند و آمارهای جدید به حدود ۵۰ هزار تعدیل نیروی مستقیم در نتیجه هوش مصنوعی اشاره میکنند، اما آنچه رخ داده با پیشبینی و انتظارات فناوران متفاوت است.
دلیل اصلی خوشبینی، پیشرفت چشمگیر هوش مصنوعی در برنامهنویسی بود. تا پایان ۲۰۲۴، ابزارهایی مانند GitHub Copilot و مدلهای پیشرفته اوپنایآی نشان دادند که میتوانند علاوه بر کدنویسی، حتی به اصلاح و تحلیل و پروژههای نرمافزاری نیز بپردازند.
دموی مشهور Codex Agent (عامل هوش مصنوعی اوپنایآی که با تمرکز بر برنامهنویسی عرضه شده است) در ماه مه، نقطه عطفی برای این روایت بود. در این نمایش، کاربر از عامل هوش مصنوعی خواست تغییر کوچکی در وبسایت شخصیاش ایجاد کند و عامل هوش مصنوعی اوپنایآی برای این کار ابتدا به بررسی ساختار فایلها پرداخت. در مرحله بعدی فایل مناسب را شناسایی کرد و محل درست برای افزودن کد را یافت.
در نهایت کد را اصلاح کرد و صفحه جدیدی ایجاد که خواسته کاربر را پاسخ میداد و این همان کاری بود که فرد باید از یک طراح سایت انتظار میداشت.
برای بسیاری از مهندسان، این عملکرد بهطرز نگرانکنندهای شبیه تفکر انسانی بود. همین موفقیت باعث شد سیلیکونولی به این نتیجه برسد که اگر هوش مصنوعی بتواند برنامهنویسی کند، بهزودی از پس سایر کارها هم برمیآید.
اما موفقیت هوش مصنوعی در بخش برنامهنویسی آن چنان که باید در دیگر بخشها ترجمه نشد و همین مساله باعث شد تا این ابزارها در حال حاضر نتوانند تفاوت معناداری در بخشهای مختلف صنعتی و فناوری رقم بزنند.
با وجود این خوشبینی، در عمل عاملهای هوش مصنوعی عمومی با شکست مواجه شدند. در پاییز، آندری کارپاتی، از بنیانگذاران اوپنایآی، بهصراحت اعلام کرد که عاملها «از نظر شناختی دچار ضعفاند» و «عملا کار نمیکنند.»
گری مارکوس، منتقد قدیمی هیجانزدگیهای صنعت فناوری، حتی صریحتر از این به انتقاد پرداخت و گفت: «عاملهای هوش مصنوعی را تا اینجا میتوان عمدتا یک ناکامی توصیف کرد.»
این فاصله میان وعده و واقعیت، صرفا یک شکست فنی نیست؛ بلکه تهدیدی برای روایت کلان آینده هوش مصنوعی است که براساس آن شرکتها و حتی دولتهای مختلف به هزاران میلیارد دلار سرمایهگذاری متعهد شدهاند.
اگر هوش مصنوعی نتواند از سطح چتبات فراتر برود، بسیاری از وعدههای اتوماسیون گسترده زیر سوال خواهد رفت.
برخلاف تصور عمومی، عاملهای هوش مصنوعی «مغزهای مستقل دیجیتال» نیستند. آنها ترکیبی از یک مدل زبانی بزرگ و یک برنامه کنترلی ساده هستند که وظیفه هماهنگسازی بخشهای مختلف را دارد که هرکدام از آنها مدلی (گاه تخصصی و گاه عمومی) هستند.
این برنامه کنترلی درخواست کاربر را به پرسشهایی برای مدل تبدیل میکند: «هدف چیست؟ چه ابزارهایی در اختیار داری؟ گام بعدی چیست؟»
سپس مدل پیشنهاد یک اقدام را میدهد، سیستم آن را اجرا میکند، نتیجه را گزارش میدهد و دوباره از مدل میپرسد چه باید کرد. این چرخه تا زمانی ادامه پیدا میکند که مدل تصور کند کار تمام شده است.
با این حال چنین ساختاربندی در محیطهای عملکرد عالی دارد، که کاملا مبتنی بر متن است.
به همین دلیل است که بخش نگارش و برنامهنویسی اولین حوزه شکوفایی عاملها و به طور کلی هوش مصنوعی شناخته میشوند. محیط توسعه نرمافزار تقریبا ایدهآلترین سناریو برای LLMهاست چرا که دستورات آن متنیاند، ساختارها منطقی و سلسلهمراتبی دارد و بازخوردها سریع و شفافاند.
به همین دلیل، عاملهای کدنویسی عملکردی قابلقبول دارند اما مشکل زمانی آغاز میشود که عامل باید وارد دنیای گرافیکی و تعاملی انسانها شود.
بیشتر کارهای دیجیتال انسانها با کلیک، اسکرول و انتخاب منوها انجام میشود. دلیل آن هم این است که جهان دیجیتال ما از جمله وبسایتها و اپلیکشینها با هدف ارائه خدمات به انسانها طراحی شدهاند و نه روباتها؛ در واقع طراحی جهان دیجیتال به گونهای است که تلاش کند از دسترسی روباتها جلوگیری شود.
برای یک هوش مصنوعی یا عامل هوش مصنوعی، این محیط بهشدت مبهم است. گزارش نیویورکتایمز نشان میدهد برخی استارتآپها حتی مجبور شدهاند «سایتهای سایهای» با هدف تمرین دادن به هوش مصنوعی بسازند؛ نسخههای شبیهسازیشده از وبسایتهایی مانند جیمیل یا United Airlines که هوش مصنوعی بتواند رفتار موس را در آن تمرین کند.
نسخه اولیه ChatGPT Agent یا عامل هوش مصنوعی اوپنایآی که در تابستان معرفی شد، گواهی بر این مشکل است. بررسیها نشان داد حتی کارهای ساده، مانند انتخاب یک گزینه از منوی کشویی، ممکن است چندین دقیق به طول بیانجامد یا حتی به توقف کامل فرایند انجام کار منجر شود.
شاید همین مساله باعث شده تا شرکتهای هوش مصنوعی همچنان بر نظارت انسانی تاکید داشته باشند و در واقع انسان را در کنار هوش مصنوعی در این حلقه کاری نگاه دارند. اما از آنجایی که هدف نهایی اقدام و فعالیت مستقل عاملها است، برخی شرکتها و توسعهدهندگان به فکر اینترنتی عامل پسند افتادهاند.
برخی توسعهدهندگان معتقدند بهجای آموزش هوش مصنوعی برای تقلید از انسان، باید ابزارها را برای هوش مصنوعی سادهتر کرد. از این رو پروژههایی مانند Model Context Protocol و Agent2Agent گوگل را شاهد هستیم.
این پروژهها بهدنبال ایجاد جهانی هستند که در آن عاملها مستقیما با یکدیگر و با نرمافزارها تعامل متنی داشته باشند و دیگر نیازی به تعامل با رابط گرافیکی نباشد. در واقع مرحلهای که در آن هوش مصنوعی به مشکل میخورد قرار است از مسیر انجام کار حذف شود.
اما این مسیر مستلزم بازطراحی بخش بزرگی از زیرساخت اینترنت است؛ کاری که سالها زمان میبرد و با مقاومت جدی مواجه خواهد شد.
اما حتی اگر مشکلات فنی حل شود، مانع بزرگتری همچنان به قوت خود باقی است و آن ناتوانی LLMها در درک جهان واقعی است (جهانی که از متن و دستورهای کامپیوتری فراتر میرود.)
نمونهای که شرکت اوپنایآی در دمو ارائه کرده بود نیز که حاوی نقشه سفر استادیومهای MLB بود و بهاشتباه نقطهای در خلیج مکزیک را در بر داشت، نمادی از این ضعف است.
مدلها و در نتیجه عاملهای هوش مصنوعی در بهترین حالت خود و در آنلاینترین حالت در درک زمان درک مکان و استدلال سببی با مشکل مواجهاند و این ضعفها در یک فرآیند چندمرحلهای میتواند فاجعهبار باشد.
نرخ توهم (Hallucination) مدلهای پیشرفتهای مانند GPT-5 حدود ۱۰ درصد گزارش شده است. برای یک چتبات، این عدد شاید قابلتحمل باشد؛ اما برای یک عامل که باید ۲۰ یا ۳۰ گام متوالی بردارد، یک خطا کافی است تا کل ماموریت با شکست مواجه شود و یا حتی نتیجه نهایی بسیار متفاوت از آنچه کاربرد انتظار داشت باشد.
شاید به همین دلیل باشد که سم آلتمن طی یک یادداشت داخلی اعلام کرد توسعه عاملهای هوش مصنوعی در اولویتهای اوپنایآی کاهش مییابد و تمرکز اصلی دوباره به بهبود ChatGPT بازمیگردد (البته گفتنی است که این یادداشت درست پس از موفقیت مدل جمینای ۳ گوگل و جذب گسترده کاربران به اکوسیستم رقیب اوپنایآی در اختیار کاربران قرار گرفت و بسیاری آن را تمرکز بر پاسخ رقابتی به گوگل تفسیر کردهاند.) با این حال این تصمیم نشانهای آشکار از واقعگرایی پس از یک دوره هیجانزدگی است.
اما شاید بهترین توصیف وضعیت را خود آندری کارپاتی ارائه کرده باشد. او در پاسخ به اینکه چرا «سال عاملها» محقق نشد، گفت: «این بیشتر دهه عاملهاست تا سال عاملها.»
در نتیجه میتوان گفت که گرچه هوش مصنوعی همچنان در حال پیشرفت است، اما سال ۲۰۲۵ نشان داد که گذار از ابزار هوشمند به عامل مستقل بسیار پیچیدهتر از آن است که در هیاهوی اولیه و توسط بزرگان صنعتی پیشبینی میشد و آینده هوش مصنوعی نه با جهشهای ناگهانی، بلکه با پیشرفتهای تدریجی، پرخطا و زمانبر رقم خواهد خورد.