معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۱۹ آبان ۱۴۰۳
زمان مطالعه : ۵ دقیقه
الویویر گادمنت، رئیس محصول پلتفرم اوپنایآی و رومین هیوت، رئیس تجربه توسعه دهنده این شرکت، در مسیر یک تور بینالمللی هستند. مجله فناوری امآیتی پیش از کنفرانس سالانه این شرکت در لندن (DevDay) در مصاحبهای با این دو گفتگو کرده است و پیش از اولین کنفرانس سالانه این شرکت در خارج از سن فرانسیسکو به تاثیر دو محصول جدیدی این شرکت از جمله ChatGPT Search بر عاملیتهای هوش مصنوعی پرداخته است.
به گزارش پیوست، اوپنایآی در لندن از پلتفرم جدید Realtime API رونمایی کرد که توسعه دهندگان میتوانند از طریق آن قابلیتهای صوتی این شرکت را در اپلیکیشنهای خود استفاده کنند. این شرکت در حال عرضه صداهای جدید و تابعی است که به توسعه دهندگان امکان تولید پرامپتهایی را برای ساخت اپلیکیشن و دستیارهای مفید صوتی و با سرعت بیشتر میدهد. در سمت مصرفکننده نیز این شرکت به تازگی از ChatGPT Search، قابلیتی برای جستجوی اینترنت با هوش مصنوعی رونمایی کرده است.
هردوی محصول راه را برای گام بزرگ بعدی هوش مصنوعی یا عاملیتهای هوش مصنوعی هموار میکنند. عاملیتهای هوش مصنوعی در واقع دستیارهایی هستند که زنجیره پیچیدهای از وظایف را به صورت خودمختار به اجرا میگذارند.
گادمنت میگوید: «اگر چند سال به جلو بروید، تمام انسانهای روی زمین، تمام کسبوکارها، یک عاملیت دارند. آن عاملیت شما را خیلی خوب میشناسد. علایق شما را میداند.» این عاملیت به ایمیلها، اپلیکیشنها و تقویم شما دسترسی دارد و به عنوان مسئول کارهای شما با هرکدام از این ابزارها ارتباط میگیرد و حتی روی مشکلات بلندمدت مثل نگارش یک مقاله درمورد یک موضوع خاص کار میکند.
گادمنت میگوید، استراتژی اوپنایآی این است که هم خودش عاملیت هوش مصنوعی بساز و هم به توسعه دهندگان اجازه دهد از نرمافزار این شرکت برای ساخت عاملیت استفاده کنند. صوت در شمایل و احساسی که این عاملیتها منتقل میکنند، نقش مهمی ایفا میکند.
او میگوید: «در حال حاضر بیشتر اپلیکیشنها مبتنی بر چت هستند… این خوب است اما برای تمام کاربردها مناسب نیست. در یک سری از کاربردها شما تایپ نمیکنید، حتی به صفحه نمایش هم نگاه نمیکنید و درنتیجه صوت رابط بسیار بهتری برای آنها است.»
گادمنت میگوید پیش از تحقق عاملیتها، دو مانع بزرگ باید برطرف شود.
اول از همه بحث استدلال است. هیوت میگوید ما برای ساخت عاملیتهای هوش مصنوعی باید مطمئن شویم که آنها میتوانند وظایف پیچیده را کامل کرده و کارها را به درستی انجام دهند. قابلیتهای «استدلال» اوپنایآی در همینجا به کار میآیند. اوپنایآی ماه گذشته از مدل o1 رونمایی کرد که با استفاده از یادگیری تقویت، به مدل آموزش میدهد که چطور اطلاعات را با استفاده از «زنجیره افکار» پردازش کند. گادمنت میگوید این روش زمان بیشتری برای تولید پاسخ در اختیار مدل میگذارد تا اشتباهات را شناسایی و اصلاح کند، مسائل را به مسائل کوچکتر تقسیم کند و رویکردهای مختلفی را برای پاسخ به سوالات امتحان کند.
چیراگ شاه، استاد علوم کامپیوتر در دانشگاه واشنگتن، میگوید اوپنایآی مدعی است که باید با یک نگاه نقادانه به بحث استدلال نگاه کرد. مدلهای بزرگ زبان در واقع استدلال واقعی ندارند. به احتمال زیاد این ابزارها چیزی شبیه به منطق را براساس دادههای آموزشی خود به کار گرفتهاند.
او میگوید: «این مدلها گاهی اوقات عملکرد بسیار فوقالعادهای در استدلال دارند، اما در واقع متظاهر خیلی خوبی هستند و تنها با کمی دقت میتوان این مساله را متوجه شد.»
گادمنت معترف است که هنوز راه درازی در پیش است. به عبارت ساده، مدلهایی مثل o1 باید مطمئنتر، سریعتر و ارزانتر شوند. این شرکت در بلندمدت باید ترفند زنجیره افکار خود را به بخشهای مختلف اعمال کند. به گفته او، اوپنایآی تا به اینجای کار روی علوم، کدنویسی و ریاضیات تمرکز کرده است اما حالا میخواهد به سراغ رشتههای دیگری مثل حقوق، حسابرسی و اقتصاد برود.
گادمنت میگوید اولویت دوم امکان اتصال ابزارهای مختلف است. تواناییهای یک مدل هوش مصنوعی در صورت محدود بودن آن به دادههای آموزشی خودش کاهش مییابد. این ابزارها باید بتوانند اینترنت را جستجو کرده و به دنبال اطلاعات به روز باشند. ChatGPT Search یکی از راهکارهای قدرتمند این کار برای ابزارهای اوپنایآی است.
این ابزارها علاوه بر دریافت اطلاعات، باید بتوانند اقداماتی را در جهان واقعی به اجرا بگذارند. برای مثال آنتروپیک، رقیب اوپنایآی، از قابلیت جدیدی رونمایی کرده است که چتبات Claude با استفاده از آن میتواند با رابط کاربری روی چیزهای کلیک کرده و از کامپیوتر «استفاده کند.» برای اینکه عاملیتها بتوانند کارهایی مثل خرید بلیط هواپیما را انجام دهند، این قابلیت ضرورت دارد. گادمنت میگوید o1 «تا حدی» میتوان از ابزارها استفاده کند که البته خیلی مطمئن نیست و تحقیق روی استفاده از ابزارها روند «توسعه امیدوارکننده» را طی میکند.
گادمنت میگوید انتظار دارد که سال آینده استفاده از هوش مصنوعی در بخش پشتیبانی و وظایف دستیارمحور بیشتر شود. با این حال به گفته او به سختی میتوان نحوه استفاده کاربران از فناوری اوپنایآی را پیشبینی کرد.
او میگوید: «صادقانه با نگاه به هر سالی که گذشت، کاربردهایی پدیدار شد که من را متعجب کرد و اصلا انتظار نداشتم. انتظار چند چیز عجیب را دارم که هیچکدام از ما قادر به پیشبینی آن نیستیم.»