DALL-E 3 دقت و چارچوب‌های بیشتری دارد

مهدی جعفری مترجم

۳۰ شهریور ۱۴۰۲

زمان مطالعه : ۳ دقیقه

اوپن‌ای‌آی شب گذشته خبر عرضه سومین نسخه هوش مصنوعی مولد تصویر DALL-E را منتشر کرد و از ماه آینده میلادی،‌ کاربران می‌توانند از ChatGPT برای ساخت پرامپت‌ها استفاده کنند. این نسخه جدید همچنین گزینه‌های امنیتی بیشتری داشته و قرار است از تولید یک سری تصاویر جلوگیری کند.

به گزارش پیوست، نسخه جدید مولد تصویر که فعلا در اختیار تعداد محدودی از کاربران و با هدف آزمایش قرار گرفته از ماه اکتبر، ابتدا برای کاربران ChatGPT Plus و ChatGPT Enterprise عرضه می‌شود و پس از آن هم باید در انتظار خدمت API آن باشیم.

وبسایت ورج می‌گوید نسخه جدید توجه بیشتری به گفته‌های کاربران دارد و مفهوم متن را بهتر درک می‌کند. نسخه سوم مولد تصویر DALL-E با ChatGPT ادغام شده و با استفاده از این چت‌بات، دیگر نیازی به طراحی پرامپت‌های پیچیده برای کار با DALL-E 3 نیست و کافی است از ChatGPT بخواهید پرامپتی ارائه کند و این چت‌بات پاراگرافی برای DALL-E3 می‌نویسد. با این حال اگر کاربران خاص DALL-E ایده مشخصی دارند همچنان می‌توانند از پرامپت‌های خود استفاده کنند.

ادیتیا رامش، محقق ارشد و رئیس تیم DALL-E، در دموی این نسخه گفت که از ChatGPT خواسته تا پرامپتی برای طراحی یک لوگو برای یک رستوران کوهستانی ایجاد کند.ChatGPT سپس پرامپتی طولانی نوشته و DALL-E نیز چهار گزینه ارائه کرد.

به گفته اوپن‌ای‌آی، چنین ارتباطی با چت‌بات این شرکت باعث می‌شود تا مردم بیشتری امکان خلق آثار هنری با استفاده از هوش مصنوعی را داشته باشند.

DALL-E که اولین بار در ژانویه ۲۰۲۱ منتشر شد، سابقه بیشتری نسبت به Stability AI و میدجرنی دارد. پس از عرضه DALL-E 2، اوپن‌ای‌آی پس از انتقادات درمورد تصاویر واقع‌گرایانه و سوگیری این مدل‌ها، لیست انتظاری را برای استفاده از این ابزار ایجاد کرد. در ماه سپتامبر سال گذشته این لیست انتظار حذف شد و مدل در اختیار همه قرار گرفت.

اوپن ای‌آی می‌گوید زمان زیادی را صرف امنیت مدل جدید کرده تا از تولید تصاویر نامناسب یا نفرت‌پراکنی جلوگیری کند. به گفته این شرکت، DALL-E با تیم‌های قرمز خارجی- گروهی که عمدا برای نفوذ به سیستم و عبور از محدودیت‌های امنیتی تلاش می‌کند-و input classifiers، که راهکاری است برای اجتناب از پرامپت‌های خاص یا خشونت‌آمیز، امنیت بیشتری دارد. DALL-E 3 همچنین در صورت اشاره مستقیم به نام چهره‌های عمومی، امکان بازآفرینی تصویر آنها را نخواهد داشت.

سندهینی آگراوال، محقق سیاست‌های این شرکت، می‌گوید «اعتماد زیادی» به تمهیدات امنیتی دارد اما باید در نظر داشت که این مدل همواره در حال بهبودی است و بی‌نقص نیست. نمایندگان اوپنی‌ای‌آی نیز در ایمیلی اعلام کردند که DALL-E 3 به گونه‌ای آموزش دیده تا از تولید تصاویری به سبک هنرمندان زنده اجتناب کند. این در حالی است که نسخه پیشین (DALL-E 2) در صورت درخواست کاربر می‌تواند سبک هنری افراد را تقلید کند.

اوپن‌ای‌آی همچنین برای جلوگیری از پیگرد قانونی به هنرمندان اجازه می‌دهد تا آثار خود را از مدل‌های آینده متن به تصویر مستثنی کنند. هنرمندان می‌توانند در یک فرم موجود در وبسایت اوپن‌ای‌آی، با ارائه تصویر مربوط به اثری که حقوق آن را در اختیار دارند، حذف آن را از داده‌های هوش مصنوعی درخواست دهند. درنتیجه نسخه‌های آینده DALL-E از ارائه تصاویری با ظاهر و سبک مشابه جلوگیری می کنند.

این مطالب را هم بخوانید: