معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۲۶ بهمن ۱۴۰۲
زمان مطالعه : ۳ دقیقه
محققان اپل در یک مقاله تحقیقاتی از ابزار جدیدی به نام Keyframer پردهبرداری کردهاند که با استفاده از هوش مصنوعی مولد، تصاویر دوبعدی را براساس پرامپتهای کاربر متحرک میکند. انتظار میرود که این ابزار و چندین قابلیت هوش مصنوعی دیگر با iOS 18 در اختیار کاربران قرار گیرند.
به گزارش پیوست، اپل پیش از این در یک مقاله تحقیقاتی که ۸ فوریه منتشر شد گفته بود که قابلیت متحرکسازی یا انیمیشن تصاویر با وجود پتانسیل بالا، کمتر از موضوعاتی مثل نوشتار و تولید تصویر بررسی شدهاند.
ابزار Keyframer طبق گزارشها از آخرین مدل زبانی اوپنایآی، GPT-4، استفاده میکند و با تکیه بر قدرت این مدل بزرگ زبانی میتواند فایلهای وکتور گرافیکی توسعهپذیر (SVG؛ نوعی فرمت تصویر که با تغییر ابعاد کیفیت آن تغییری نمیکند) را گرفته و با تولید کد CSS آنها را براساس پرامپت متنی کاربر متحرک کند.
برای این کار کافی است تصویر خود را بارگذاری کرده و پرامپتی مثل «ستارهها را چشمکزن کن» ارائه کنید. مثالهایی که در مقاله تحقیقاتی ارائه شده نشان میدهد که میتوان رنگ پس زمینه را تغییر داده و نحوه محو و ظاهر شدن ستارهها را مشخص کرد.
کاربران میتوانند با یک بار امتحان چندین طراحی را تولید کنند و چیزهایی مثل کد رنگی و طول انیمیشن را در پنجرهای جداگانه تغییر دهند.
برای استفاده از این ابزار نیازی به مهارت کدنویسی ندارید و Keyframer به صورت خودکار تغییرات درخواستی را به CSS تبدیل میکند با این حال در مهارت کد نویسی میتوانید کد را دستکاری کنید. رویکرد اپل که بر توصیف به جای کد تمرکز دارد استفاده از این ابزار را به نسبت دیگر ابزارهای متحرک سازی تصویر سادهتر میکند. برای استفاده از دیگر ابزارها معمولا به چندین اپلیکیشن متفاوت و کمی تجربه کدنویسی نیاز است.
یکی از متخصصان طراحی گرافیک متحرک (موشن دیزاینر) که در تحقیقات اپل حضور داشته میگوید: «قسمتی از من نگران است که این ابزارها جاگیزین مشاغل شوند، زیرا پتانسیل بسیار زیادی را شاهد هستیم. اما به نظرم وقتی آنها را یاد گرفته و از آنها به عنوان یک انیمیتور استفاده میکنید، به ابزار دیگری در جعبه ابزار شما بدل میشوند. قرار است مهارتهای ما را تقویت کند. چیز واقعا هیجان انگیزی است.»
با این حال ابزار Keyframer هنوز در اختیار عمومی قرار نگرفته و براساس مقاله تحقیقاتی اپل تنها ۱۳ نفر با استفاده از یک تصویر SVG از پیش مشخص شده این ابزار را امتحان کردهاند.
اپل در مقاله تحقیقاتی خود همچنین به محدودیتهای این ابزار اشاره کرده میگوید Keyframer روی انیمیشنهای وب-محور مثل بارگذاری توالیها، تصویرسازی از داده و تغییر حالتها تصاویر تمرکز میکند و انیمیشنهایی که شما در فیلم و بازیهای ویدیویی مشاهده میکنید را نمیتوان (حداقل در حال حاضر) با استفاده از یک توصیف ساده تولید کرد.
اپل همچنین در حال طراحی ابزارهای متعددی با استفاده از هوش مصنوعی است و تحلیلگران انتظار دارند با عرضه iOS 18 بسیاری از آنها به آیفون و ایپدها ورود کنند. این شرکت در ماه دسامبر ابزاری به نام Human Gaussian Splats (HUGS) را معرفی کرد که میتواند آواتارهای متحرک انسانی روی کلیپهای ویدیویی بگذارد و ابزار دیگری به نام MGIE از این شرکت نیز یک مدل هوش مصنوعی است که میتواند با استفاده توصیفهای متنی تصاویر را اصلاح کند.