استارتآپ جدید Dyna Robotics با ادغام هوش مصنوعی و روباتیک به دنبال خودکارسازی کارهای تکراری است
لیندون گائو، بنیانگذار استارتاپ موفق Caper AI که در سال ۲۰۲۱ در یک معامله ۳۵۰…
۱۰ فروردین ۱۴۰۴
۷ فروردین ۱۴۰۴
زمان مطالعه : ۳ دقیقه
شرکت اوپنایآی قابلیتهای جدید و پیشرفتهتری را برای تولید و اصلاح تصاویر به ChatGPT اضافه کرده است که کاربران با استفاده از آن میتوانند براساس متن طبیعی به تولید و اصلاح تصاویر بپردازند. با وجود اینکه امکان تولید تصویر پیش از این هم از طریق این چتبات امکان پذیر بود اما کیفیت نسخه جدید آن توجه بسیاری از کاربران را به خود جلب کرده است و تصاویر تولیدی این چتبات روز گذشته به یکی از ترندهای شبکه اجتماعی ایکس تبدیل شد.
به گزارش پیوست، این قابلیت که در رویداد زنده اوپنایآی در روز سهشنبه معرفی شد به کاربران اجازه میدهد تا از طریق مکالمه با چتبات بتوانند تصاویر مورد نظر خود را تولید یا ویرایش کنند. بازخورد مثبت کاربران نشان میدهد که کیفیت تصاویر تولید شده با این چتبات توجه بسیاری را به خود جلب کرده است و تقلیدی از سبک استودیو انیمیشن سازی Ghibli در روز گذشته به یکی از ترندهای ایکس (توییتر) تبدیل شد و کاربران بسیاری از صحنههای خاطرهانگیز و میمهای اینترنتی را به این سبک بازطراحی کردند.
علاوه بر این، ChatGPT اکنون در تولید تصاویری که شامل متنهای منسجم هستند، عملکرد بهتری دارد. این بروزرسانی به کاربران اجازه میدهد تا از این چتبات برای تولید نمودارها، اینفوگرافیکها و لوگوهای حرفهای نیز استفاده کنند. به عنوان مثال، میتوان از چتبات درخواست کرد تا تصویری فتورئالیستیک از یک منوی سفارشی یا یک نقشه تولید کند. همچنین، این هوش مصنوعی قادر است دستورالعملهای پیچیدهتر مربوط به ترکیببندی تصویر را اجرا کند.
این قابلیت که از مدل زبانی GPT-4o استفاده میکند، همچنین امکان بازطراحی تصاویر قدیمی به سبکی جدید را برای کاربران فراهم کرده است و همین بخش توجه بسیاری از کاربران شبکههای اجتماعی را به خود جلب کرد به طوری که روز گذشته شاهد سیلی از پستهای جدید در شبکه اجتماعی ایکس بودیم که تصاویر خاطرهانگیز را به سبک استودیو انیمه Ghibli بازطراحی کردند. استقبال به اندازهای بود که حتی سم آلتمن، مدیرعامل اوپنایآی نیز تصویر پروفایل خود را به عکسی از خودش که با همین سبک بازطراحی شده بود تغییر داد.
با این حال قابلیت جدید ChatGPT فراتر از یک تصویر ساز سبک انیمه برای کاربران ایکس است و اوپنایآی در تلاش است تا با این تغییر گام دیگری در مسیر تبدیل چتبات محبوب خود به یک پلتفرم همهکاره برداد. این چتبات در حال حاضر علاوه بر تصویرسازی در قالب موتور جستجو، دستیار صوتی و ابزار تولید ویدئو نیز برای کاربران ایفای نقش میکند.
اضافه شدن قابلیتهای پیشرفته تصویری، میتواند این چتبات را برای استفادههای شخصی و حرفهای جذابتر کند و مسیر رقابت با چتباتهای تصویری شرکتهای رقیب مانند xAI ایلان ماسک را هموار سازد.
با این حال، مانند سایر کاربردهای هوش مصنوعی، احتمال بروز خطا در تولید تصاویر وجود دار. به عنوان مثال، ممکن است هوش مصنوعی نامهای جعلی کشورها را در تصاویر قرار دهد یا در تولید متنهای کوچک و زبانهای غیرلاتین دچار مشکل شود. این شرکت در یک پست وبلاگی اعلام کرد که چنین خطاهایی معمولا نتیجه ارائه پرامپتهایی هستند که از جزئیات کافی برخوردار نمیباشند و در نتیجه برای رسیدن به نتیجه مطلوب بهتر است تا جزئیات بیشتری را به چتبات توضیح دهید.
یکی دیگر از محدودیتهای این ویژگی جدید سرعت پردازش آن است. طبق گفته آلتمن، تولید تصاویر دقیقتر زمان بیشتری میبرد و ممکن است تا یک دقیقه طول بکشد.
این قابلیتهای جدید از روز سهشنبه برای کاربران رایگان و پولی و از طریق مدل GPT-4o در دسترس قرار گرفتهاند و طبق اعلام اوپنایآی، این ویژگیها در چند هفته آینده از طریق رابط برنامهنویسی اپلیکیشن یا API در اختیار توسعهدهندگان نرمافزار قرار میگیرد.