مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » گزارش واشنگتن پست از ردپای نتفلیکس و هالیوود در داده‌های آموزشی هوش مصنوعی سورا

گزارش واشنگتن پست از ردپای نتفلیکس و هالیوود در داده‌های آموزشی هوش مصنوعی سورا

مهدی جعفری مترجم

۳۰ شهریور ۱۴۰۴

زمان مطالعه : ۷ دقیقه

زمانی که شرکت اوپن‌ای‌آی در دسامبر ۲۰۲۴ از ابزار مولد ویدیو خود با نام سورا (Sora) رونمایی کرد، بسیاری آن را نقطه عطفی در تاریخ فناوری دانستند و علاوه بر هیجان مخاطبان، نگرانی‌های بسیاری را درمورد این ابزار و تبعات احتمالی آن برای صنعت سرگرمی و حتی سو استفاده از این ابزار شاهد بودیم.

به گزارش پیوست، هوش مصنوعی سورا می‌تواند ویدئوهایی با کیفیت بالا تولید کند که به‌سادگی بخش‌هایی از فیلم‌های سینمایی، سریال‌های تلویزیونی و حتی لوگوی استودیوهای بزرگ را بازسازی می‌کند. چنین قابلیتی به‌سرعت توجه هنرمندان، استودیوهای فیلم‌سازی، شرکت‌های فناوری و سیاست‌گذاران را به خود جلب کرد. اما در دل این شگفتی، پرسشی جدی مطرح شد: سورا بر اساس چه داده‌هایی آموزش دیده است؟

اوپن‌ای‌آی مانند بسیاری از شرکت‌های دیگر اعلام کرده است که داده‌های مورد استفاده ترکیبی از «منابع عمومی و داده‌های دارای مجوز» هستند. اما همان‌طور که تجربه ChatGPT نشان داد، این عبارت می‌تواند طیف وسیعی از منابع اینترنتی را شامل شود؛ منابعی که در بسیاری از موارد بدون رضایت تولیدکنندگان محتوا جمع‌آوری شده است.

گزارش جدیدی از واشنگتن‌پست با بررسی این ابزار و ارائه پرامپت‌های متعدد، سعی کرده تا پرده از بخشی از این معما بردارد و نشان دهد که سورا احتمالا تا حدی از محتوای دارای حق نشر استفاده کرده است و این در حالی است که مولد‌های تصویر ممکن است در آینده الگوی درآمدی تولیدکنندگان داده‌های آموزشی خود را در معرض خطر قرار دهند.

آزمایش‌های واشنگتن‌پست: ردپای نتفلیکس و هالیوود در سورا

خبرنگاران روزنامه واشنگتن‌پست با تولید صدها ویدئو به وسیله هوش مصنوعی سورا، سعی کردند تا ببینند این مدل چه نوع محتوایی را بازتولید می‌کند. نتایج حیرت‌انگیز بود: سورا توانست صحنه‌هایی بسیار مشابه سریال‌های محبوب نتفلیکس از جمله «Wednesday»، بازی‌های ویدئویی پرطرفدار مانند Minecraft و حتی شخصیت‌های کارتونی و لوگوی استودیوهای بزرگ هالیوود همچون Warner Bros و DreamWorks را در محتوای نهایی خود بازتولید کند؛ مساله‌ای که نشانگر استفاده از محتوای ویدیویی این منابع در آموزش هوش مصنوعی سورا است.

بازتولید لوگوی استودیو‌های معروف با سورا طبق آزمایش‌های واشنگتن پست

در بسیاری موارد، خبرنگاران واشنگتن پست تنها کافی بود عباراتی ساده مانند «intro of Universal Studios» یا «trailer of a Wednesday TV show» را در پرامپت خود جای دهند تا سورا نسخه‌ای قابل‌قبول و مشابه محتوای اصلی بسازد. این میزان دقت در بازتولید محتوای استودیو‌های مشهور و اثر محبوب نتفلیکس باعث شد تا کارشناسان نتیجه بگیرند، احتمالا نسخه‌هایی از این آثار در داده‌های آموزشی سورا به کار رفته است.

بازتولید صحنه‌های مربوط به سریال‌های محبوب نتفلیکس با سورا در آزمایش‌های واشنگتن پست

یکی دیگر از منابع مهم آموزشی که شرکت‌های مولد ویدیو از آن استفاده می‌کنند نیز دیتاست‌هایی است که عمدتا شامل محتوای استخراج شده از پلتفرم یوتیوب است و این در حالی است که شرکت گوگل امکان چنین استفاده‌ای را برای رقبای خود فراهم نکرده است.

بازتولید لوگوی EA sports،‌صحنه‌های بازی ماینکرافت و حتی استریم‌ها با سورا

شرکت نتفلیکس نیز اعلام کرده است که هیچ‌گونه داده‌ای در اختیار اوپن‌ای‌آی قرار نداده است. همین‌طور، توییچ و تیک‌تاک که نیز اظهار کرده‌اند که شراکتی با اوپن‌ای‌آی ندارند. با این حال، آزمایش‌ها نشان می‌دهد سورا توانایی بازسازی دقیق واترمارک‌ها و لوگوهای این پلتفرم‌ها را دارد؛ موضوعی که بدون دسترسی به نمونه‌های واقعی، توضیح‌پذیر نیست.

یوتیوب که یکی از اصلی‌ترین منابع محتوای ویدئویی در اینترنت است، بارها تاکید کرده دانلود و استفاده از محتوای این پلتفرم بدون دریافت اجازه، به معنای نقض شرایط خدمات است. با این وجود، پژوهش‌ها نشان داده‌اند که بیش از ۷۰ درصد دیتاست‌های عمومی مورد استفاده در تحقیقات هوش مصنوعی از محتوای استخراج‌شده از یوتیوب تشکیل شده‌اند. این مسئله احتمال استفاده غیرمستقیم اوپن‌ای‌آی از چنین مجموعه‌هایی را تقویت می‌کند.

مطالعه‌ای که سال گذشته در این باره انجام گرفت و نشانگر سهم ۷۰ درصدی ویدیو‌های یوتیوب از دیتاست‌های عمومی برای هوش مصنوعی مولد ویدیو بود همچنین به ابزارهای آنلاینی اشاره دارد که می‌توانند میلیون‌ها ویدیو را به یک‌باره از یوتیوب یا تیک‌تاک دانلود کنند و محافظت‌های این پلتفرم نیز جلودار آنها نخواهند بود. گزارشی از آتلانتیک نیز به تازگی نشان داده است که دیتاست‌های مورد استفاده محققان و شرکت‌های هوش مصنوعی، شامل ویدیو‌های استخراج شده از یوتیوب است و گزارشی از 404 Media در سال گذشته نشان داد که شرکت انویدیا و استارت‌آپ Runway ML نیز هردو برای تولید ابزارهای خود از محتوای یوتیوب استفاده کرده‌اند.

ژوانا ماترژینسکا، پژوهشگر MIT، در این رابطه می‌گوید: «مدل تنها در حال تقلید داده‌های آموزشی است؛ هیچ جادویی در کار نیست.» به گفته او، وجود واترمارک‌ها و صحنه‌های بازسازی‌شده دلیلی بر این است که سورا نمونه‌هایی از این داده‌ها را در طول آموزش دیده است.

بازتولید شخصیت‌های محبوب با هوش مصنوعی سورا

از سوی دیگر، مارگارت میچل، دانشمند ارشد اخلاقی در شرکت Hugging Face، تاکید دارد که مسئله تنها به حق نشر محدود نمی‌شود: «آنچه اهمیت دارد رضایت افراد است، و هیچ چارچوب قانونی یا سیاسی کارآمدی برای آن وجود ندارد.»

از حق نشر تا حق رضایت

اوپن‌ای‌آی تاکنون با شکایت مستقیم در زمینه سورا مواجه نشده، اما پرونده‌های حقوقی متعددی علیه این شرکت در مورد استفاده از متن‌ها، کتاب‌ها و اخبار برای آموزش ChatGPT جریان دارد. همین‌طور، سایر شرکت‌های فعال در حوزه هوش مصنوعی مانند میدجرنی در حال حاضر با شکایت استودیوهای بزرگی همچون دیزنی و یونیورسال مواجه شده‌اند.

با اینکه قوانین فعلی اغلب بر حق نشر (Copyright) تمرکز دارند، بسیاری از منتقدان بر این عقیده‌اند که حق رضایت (Consent) باید مبنای نگاه به تنظیم‌گری این بخش قرار گیرد. در شرایطی که حجم عظیمی از داده‌ها در پلتفرم‌هایی مانند یوتیوب یا تیک‌تاک بارگذاری می‌شود، مرز میان محتوای عمومی و محتوای دارای حق نشر بیش از پیش مبهم شده است و اگرچه پلتفرم‌ها حق نشر را در بسیاری از موارد برای خود محفوظ می‌دانند، اما بسیاری معتقدند که حق رضایت نیز باید برای تولید کنندگان محتوا محفوظ باشد.

همین مساله باعث حساسیت استودیوهای فیلم‌سازی و صنوف هنری در آمریکا شده است. این دسته از فعالان صنعت سرگرمی معتقدند سورا با تقلید سبک‌های هنری به شدت حوزه کاری‌ آنها را در معرض خطر قرار می‌دهد. کمپین‌های عمومی همچون نامه سرگشاده ۴۰۰ کارگردان و بازیگر معروف علیه استفاده بدون مجوز از آثار هنری برای آموزش هوش مصنوعی نشان می‌دهد که بحران اعتماد میان هنرمندان و شرکت‌های فناوری در حال تشدید است.

در همین حال، شرکت اوپن‌ای‌آی اخیرا از پروژه جدیدی خبر داده است که براساس آن قرار است یک انیمیشن سینمایی را با کمک ابزارهای مولد تصویر خود تولید و به سینما ببرد. براساس گزارش منتشر شده،‌ این انیمیشن با کسری از هزینه نمونه‌های مشابه در هالیوود تولید می‌شود و با اینکه می‌تواند هزینه تولید آثار را تا حد زیادی کاهش دهد، اما موفقیت آن بدون شک تهدیدی برای رقبای سنتی محسوب می‌شود که شاید خودشان تولیدکنندگان بخشی از داده‌های آموزشی مدل‌های اوپن‌ای‌آی باشند.

برخی کارشناسان صنعتی معتقدند جذابیت هزینه‌های پایین و سرعت بالای تولید محتوای هوش مصنوعی باعث شده استودیوها نیز وسوسه شوند با شرکت‌های نوپای این حوزه همکاری کنند. اما نگرانی درباره حفاظت از مالکیت معنوی همچنان مانعی بزرگ در برابر این همکاری‌هاست.

چرا شرکت‌ها نسبت به داده‌های آموزشی خود شفاف نیستند؟

یکی از پیامدهای مستقیم شکایت‌های حقوقی و فشارهای عمومی، کاهش شفافیت شرکت‌های هوش مصنوعی است. پژوهشگران مستقل مانند استلا بیدرمن از موسسه EleutherAI می‌گویند: «نتیجه این وضعیت آن است که اساسا هیچ‌کس درباره محتوای دیتاست‌های آموزشی حرفی نمی‌زند.»

این پنهان‌کاری، علاوه بر افزایش نگرانی‌ها درباره نقض حقوق ناشران و هنرمندان، باعث می‌شود اعتماد عمومی به فناوری‌های نوین کاهش یابد. در غیاب شفافیت، هم مصرف‌کنندگان و هم تولیدکنندگان محتوا در فضایی پرابهام فعالیت می‌کنند.

ابزار سورا، همان‌طور که سخنگوی اوپن‌ای‌آی بیان کرده، می‌تواند «سطح خلاقیت استودیویی را در اختیار میلیون‌ها نفر قرار دهد.» اما پرسش این است که هزینه این خلاقیت بر دوش چه کسانی گذاشته می‌شود؟ اگر این خلاقیت حاصل استفاده از داده‌های حفاظت‌شده بدون رضایت و جبران مالی باشد، نه تنها آینده حقوقی اوپن‌ای‌آی بلکه کل صنعت هوش مصنوعی با بحرانی جدی مواجه است.

گرچه تبعات احتمالی برای شرکت‌های تولیدکننده ابزارهای هوش مصنوعی می‌تواند یکی از موضوعات مهم باشد، اما حفاظت از تولیدکنندگان محتوا و فعالان صنعت سرگرمی نیز در عصر هوش مصنوعی از اهمیت ویژه‌ای برخوردار است که رویکرد قانون‌گذاران در این باره و تفسیر قانونی قضات در پرونده‌های آتی تاثیر مستقیم بر آن خواهد داشت.

این مطالب را هم بخوانید: