معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۳۰ شهریور ۱۴۰۲
زمان مطالعه : ۳ دقیقه
اوپنایآی شب گذشته خبر عرضه سومین نسخه هوش مصنوعی مولد تصویر DALL-E را منتشر کرد و از ماه آینده میلادی، کاربران میتوانند از ChatGPT برای ساخت پرامپتها استفاده کنند. این نسخه جدید همچنین گزینههای امنیتی بیشتری داشته و قرار است از تولید یک سری تصاویر جلوگیری کند.
به گزارش پیوست، نسخه جدید مولد تصویر که فعلا در اختیار تعداد محدودی از کاربران و با هدف آزمایش قرار گرفته از ماه اکتبر، ابتدا برای کاربران ChatGPT Plus و ChatGPT Enterprise عرضه میشود و پس از آن هم باید در انتظار خدمت API آن باشیم.
وبسایت ورج میگوید نسخه جدید توجه بیشتری به گفتههای کاربران دارد و مفهوم متن را بهتر درک میکند. نسخه سوم مولد تصویر DALL-E با ChatGPT ادغام شده و با استفاده از این چتبات، دیگر نیازی به طراحی پرامپتهای پیچیده برای کار با DALL-E 3 نیست و کافی است از ChatGPT بخواهید پرامپتی ارائه کند و این چتبات پاراگرافی برای DALL-E3 مینویسد. با این حال اگر کاربران خاص DALL-E ایده مشخصی دارند همچنان میتوانند از پرامپتهای خود استفاده کنند.
ادیتیا رامش، محقق ارشد و رئیس تیم DALL-E، در دموی این نسخه گفت که از ChatGPT خواسته تا پرامپتی برای طراحی یک لوگو برای یک رستوران کوهستانی ایجاد کند.ChatGPT سپس پرامپتی طولانی نوشته و DALL-E نیز چهار گزینه ارائه کرد.
به گفته اوپنایآی، چنین ارتباطی با چتبات این شرکت باعث میشود تا مردم بیشتری امکان خلق آثار هنری با استفاده از هوش مصنوعی را داشته باشند.
DALL-E که اولین بار در ژانویه ۲۰۲۱ منتشر شد، سابقه بیشتری نسبت به Stability AI و میدجرنی دارد. پس از عرضه DALL-E 2، اوپنایآی پس از انتقادات درمورد تصاویر واقعگرایانه و سوگیری این مدلها، لیست انتظاری را برای استفاده از این ابزار ایجاد کرد. در ماه سپتامبر سال گذشته این لیست انتظار حذف شد و مدل در اختیار همه قرار گرفت.
اوپن ایآی میگوید زمان زیادی را صرف امنیت مدل جدید کرده تا از تولید تصاویر نامناسب یا نفرتپراکنی جلوگیری کند. به گفته این شرکت، DALL-E با تیمهای قرمز خارجی- گروهی که عمدا برای نفوذ به سیستم و عبور از محدودیتهای امنیتی تلاش میکند-و input classifiers، که راهکاری است برای اجتناب از پرامپتهای خاص یا خشونتآمیز، امنیت بیشتری دارد. DALL-E 3 همچنین در صورت اشاره مستقیم به نام چهرههای عمومی، امکان بازآفرینی تصویر آنها را نخواهد داشت.
سندهینی آگراوال، محقق سیاستهای این شرکت، میگوید «اعتماد زیادی» به تمهیدات امنیتی دارد اما باید در نظر داشت که این مدل همواره در حال بهبودی است و بینقص نیست. نمایندگان اوپنیایآی نیز در ایمیلی اعلام کردند که DALL-E 3 به گونهای آموزش دیده تا از تولید تصاویری به سبک هنرمندان زنده اجتناب کند. این در حالی است که نسخه پیشین (DALL-E 2) در صورت درخواست کاربر میتواند سبک هنری افراد را تقلید کند.
اوپنایآی همچنین برای جلوگیری از پیگرد قانونی به هنرمندان اجازه میدهد تا آثار خود را از مدلهای آینده متن به تصویر مستثنی کنند. هنرمندان میتوانند در یک فرم موجود در وبسایت اوپنایآی، با ارائه تصویر مربوط به اثری که حقوق آن را در اختیار دارند، حذف آن را از دادههای هوش مصنوعی درخواست دهند. درنتیجه نسخههای آینده DALL-E از ارائه تصاویری با ظاهر و سبک مشابه جلوگیری می کنند.