معرفی سیزده هوش مصنوعی تولید و پردازش تصویر: خلق از حروف ساده
امروزه و با توسعه هوش مصنوعی ابزار پردازش تصویر بسیاری برای تبدیل متن به تصویر…
۳۰ آبان ۱۴۰۳
۱۴ مهر ۱۴۰۳
زمان مطالعه : ۳ دقیقه
شرکت مادر فیسبوک و اینستاگرام با یک ابزار جدید هوش مصنوعی که براساس پرامپتهای متنی قادر به تولید و اصلاح ویدیو است به جنگ اوپنایآی و گوگل میرود. هر سه شرکت با رویکرد خاص خود برای سلطه بر عرصه پیشرفتهترین ابزارهای هوش مصنوعی تلاش میکنند و متا به پیشتاز عرصه متنباز و ادغام این ابزارها با اکوسیستم وسیع شبکههای اجتماعی تحت مالکیت خود مشهور است.
به گزارش پیوست به نقل از بلومبرگ، ابزار جدید متا که Movie Gen نام دارد میتواند ویدیوهایی تا سرحد ۱۶ ثانیه را براساس پرامپت متنی تولید کند. همچنین با این ابزار میتوان صوت خاصی برای ویدیو تولید کرد و یا به اصلاح آن پرداخت. کاربران حتی میتوانند از یک تصویر برای تولید ویدیو با حضور یک فرد واقعی استفاده کنند.
چنین قابلیتهایی نشان از تمرکز ابزار جدید متا بر حوزه تولید محتوا و فعالیتهای شبکه اجتماعی دارد و متا سال آینده Movie Gen را در اپلیکیشنهای شبکه اجتماعی خود ادغام میکند.
در حال حاضر اما تنها برخی از کارکنان و تعدادی از شرکای خارجی از جمله فیلمسازان به این ابزار دسترسی پیدا کردهاند. محدودیتهای شدید دسترسی برای ابزارهای مولد ویدیو که برای دیگر شرکتها نیز شاهد آن هستیم ناشی از حساسیت بالای تولید محتوا با این ابزارها و تقاضای شدید آنها برای قدرت رایانشی است که باعث شده دسترسی عموم به چنین ابزارهایی بسیار محدود باشد.
مدیران متا هنوز نحوه ادغام این ابزار را تحت بررسی دارند اما هدف نهایی متا به گفته کانر هیز، نایبرئیس بخش محصولات هوش مصنوعی این شرکت، تشویق افراد بیشتری به خلق یا اصلاح پستهای ویدیویی است. او میگوید استفاده از این ابزار «سرگرم کننده است، برای تولیدکنندگان محتوا مفید است و به طور کلی برای میزان تعامل در اپلیکیشنها خوب است اما ما در حال حاضر یک برنامه محصولی مشخص از شکل و شمایل آن در آینده نداریم.»
مووی جن گوشهای از تلاشهای گسترده متا برای سهمخواهی از صنعت هوش مصنوعی مولد است و تمامی این ابزارها مقدار زیادی داده را برای آموزش میطلبند. متا در سالهای اخیر میلیاردها دلار روی هوش مصنوعی سرمایهگذاری کرده است و چتباتی به نام Meta AI به تازگی در اپلیکیشنهای این شرکت ادغام شد. این چتبات میتواند به سوالات پاسخ دهد و یا با کاربران ارتباط بگیرد.
انتظار طولانی برای عرضه مولد ویدیو متا اما چندین دلیل دارد. یکی از آنها افزایش بهرهوری آن است. در حال حاضر «دهها دقیقه» برای تولید ویدیو براساس پرامپت متنی زمان میبرد که به گفته هیز برای کاربرانی که با گوشی به این کار مشغول میشوند بسیار طولانی است.
با این حال موضوعات ایمنی و مسئولیت پذیری هم از اهمیت ویژهای برخوردارند و برای مثال هیز میگوید نحوه برخورد با ویدیوهای شخصیسازی شده در مرکز توجه است تا کاربران نتوانند ویدیو نامناسبی تولید کنند یا بدون کسب رضایت درمورد شخص ثالثی محتوا بسازند.
چنین فناوری در گذشته برای تولید ویدیوهای جعلی یا همان دیپفیکها استفاده شده است و از جمله شاخصترین نمونههای دیپفیک میتوان به محتواهایی درمورد جو بایدن، رئیس جمهور آمریکا، و تیلور سوئیفت، خواننده محبوب، اشاره کرد.
مدیران متا میگویند برای جلوگیری از سو استفاده در حال کار روی راههای برای «نهاننگاری» یا «Watermark» هستند تا مخاطب از نقش هوش مصنوعی در محتوا مطلع شود.