انویدیا ۵۰۰ میلیون دلار در استارتآپ خودران بریتانیایی سرمایهگذاری میکند
انویدیا ۵۰۰ میلیون دلار در استارتآپ بریتانیایی Wayve که در زمینه فناوری خودران فعالیت دارد،…
۲۹ شهریور ۱۴۰۴
۳۰ شهریور ۱۴۰۴
زمان مطالعه : ۷ دقیقه
زمانی که شرکت اوپنایآی در دسامبر ۲۰۲۴ از ابزار مولد ویدیو خود با نام سورا (Sora) رونمایی کرد، بسیاری آن را نقطه عطفی در تاریخ فناوری دانستند و علاوه بر هیجان مخاطبان، نگرانیهای بسیاری را درمورد این ابزار و تبعات احتمالی آن برای صنعت سرگرمی و حتی سو استفاده از این ابزار شاهد بودیم.
به گزارش پیوست، هوش مصنوعی سورا میتواند ویدئوهایی با کیفیت بالا تولید کند که بهسادگی بخشهایی از فیلمهای سینمایی، سریالهای تلویزیونی و حتی لوگوی استودیوهای بزرگ را بازسازی میکند. چنین قابلیتی بهسرعت توجه هنرمندان، استودیوهای فیلمسازی، شرکتهای فناوری و سیاستگذاران را به خود جلب کرد. اما در دل این شگفتی، پرسشی جدی مطرح شد: سورا بر اساس چه دادههایی آموزش دیده است؟
اوپنایآی مانند بسیاری از شرکتهای دیگر اعلام کرده است که دادههای مورد استفاده ترکیبی از «منابع عمومی و دادههای دارای مجوز» هستند. اما همانطور که تجربه ChatGPT نشان داد، این عبارت میتواند طیف وسیعی از منابع اینترنتی را شامل شود؛ منابعی که در بسیاری از موارد بدون رضایت تولیدکنندگان محتوا جمعآوری شده است.
گزارش جدیدی از واشنگتنپست با بررسی این ابزار و ارائه پرامپتهای متعدد، سعی کرده تا پرده از بخشی از این معما بردارد و نشان دهد که سورا احتمالا تا حدی از محتوای دارای حق نشر استفاده کرده است و این در حالی است که مولدهای تصویر ممکن است در آینده الگوی درآمدی تولیدکنندگان دادههای آموزشی خود را در معرض خطر قرار دهند.
خبرنگاران روزنامه واشنگتنپست با تولید صدها ویدئو به وسیله هوش مصنوعی سورا، سعی کردند تا ببینند این مدل چه نوع محتوایی را بازتولید میکند. نتایج حیرتانگیز بود: سورا توانست صحنههایی بسیار مشابه سریالهای محبوب نتفلیکس از جمله «Wednesday»، بازیهای ویدئویی پرطرفدار مانند Minecraft و حتی شخصیتهای کارتونی و لوگوی استودیوهای بزرگ هالیوود همچون Warner Bros و DreamWorks را در محتوای نهایی خود بازتولید کند؛ مسالهای که نشانگر استفاده از محتوای ویدیویی این منابع در آموزش هوش مصنوعی سورا است.
در بسیاری موارد، خبرنگاران واشنگتن پست تنها کافی بود عباراتی ساده مانند «intro of Universal Studios» یا «trailer of a Wednesday TV show» را در پرامپت خود جای دهند تا سورا نسخهای قابلقبول و مشابه محتوای اصلی بسازد. این میزان دقت در بازتولید محتوای استودیوهای مشهور و اثر محبوب نتفلیکس باعث شد تا کارشناسان نتیجه بگیرند، احتمالا نسخههایی از این آثار در دادههای آموزشی سورا به کار رفته است.
یکی دیگر از منابع مهم آموزشی که شرکتهای مولد ویدیو از آن استفاده میکنند نیز دیتاستهایی است که عمدتا شامل محتوای استخراج شده از پلتفرم یوتیوب است و این در حالی است که شرکت گوگل امکان چنین استفادهای را برای رقبای خود فراهم نکرده است.
شرکت نتفلیکس نیز اعلام کرده است که هیچگونه دادهای در اختیار اوپنایآی قرار نداده است. همینطور، توییچ و تیکتاک که نیز اظهار کردهاند که شراکتی با اوپنایآی ندارند. با این حال، آزمایشها نشان میدهد سورا توانایی بازسازی دقیق واترمارکها و لوگوهای این پلتفرمها را دارد؛ موضوعی که بدون دسترسی به نمونههای واقعی، توضیحپذیر نیست.
یوتیوب که یکی از اصلیترین منابع محتوای ویدئویی در اینترنت است، بارها تاکید کرده دانلود و استفاده از محتوای این پلتفرم بدون دریافت اجازه، به معنای نقض شرایط خدمات است. با این وجود، پژوهشها نشان دادهاند که بیش از ۷۰ درصد دیتاستهای عمومی مورد استفاده در تحقیقات هوش مصنوعی از محتوای استخراجشده از یوتیوب تشکیل شدهاند. این مسئله احتمال استفاده غیرمستقیم اوپنایآی از چنین مجموعههایی را تقویت میکند.
مطالعهای که سال گذشته در این باره انجام گرفت و نشانگر سهم ۷۰ درصدی ویدیوهای یوتیوب از دیتاستهای عمومی برای هوش مصنوعی مولد ویدیو بود همچنین به ابزارهای آنلاینی اشاره دارد که میتوانند میلیونها ویدیو را به یکباره از یوتیوب یا تیکتاک دانلود کنند و محافظتهای این پلتفرم نیز جلودار آنها نخواهند بود. گزارشی از آتلانتیک نیز به تازگی نشان داده است که دیتاستهای مورد استفاده محققان و شرکتهای هوش مصنوعی، شامل ویدیوهای استخراج شده از یوتیوب است و گزارشی از 404 Media در سال گذشته نشان داد که شرکت انویدیا و استارتآپ Runway ML نیز هردو برای تولید ابزارهای خود از محتوای یوتیوب استفاده کردهاند.
ژوانا ماترژینسکا، پژوهشگر MIT، در این رابطه میگوید: «مدل تنها در حال تقلید دادههای آموزشی است؛ هیچ جادویی در کار نیست.» به گفته او، وجود واترمارکها و صحنههای بازسازیشده دلیلی بر این است که سورا نمونههایی از این دادهها را در طول آموزش دیده است.
از سوی دیگر، مارگارت میچل، دانشمند ارشد اخلاقی در شرکت Hugging Face، تاکید دارد که مسئله تنها به حق نشر محدود نمیشود: «آنچه اهمیت دارد رضایت افراد است، و هیچ چارچوب قانونی یا سیاسی کارآمدی برای آن وجود ندارد.»
اوپنایآی تاکنون با شکایت مستقیم در زمینه سورا مواجه نشده، اما پروندههای حقوقی متعددی علیه این شرکت در مورد استفاده از متنها، کتابها و اخبار برای آموزش ChatGPT جریان دارد. همینطور، سایر شرکتهای فعال در حوزه هوش مصنوعی مانند میدجرنی در حال حاضر با شکایت استودیوهای بزرگی همچون دیزنی و یونیورسال مواجه شدهاند.
با اینکه قوانین فعلی اغلب بر حق نشر (Copyright) تمرکز دارند، بسیاری از منتقدان بر این عقیدهاند که حق رضایت (Consent) باید مبنای نگاه به تنظیمگری این بخش قرار گیرد. در شرایطی که حجم عظیمی از دادهها در پلتفرمهایی مانند یوتیوب یا تیکتاک بارگذاری میشود، مرز میان محتوای عمومی و محتوای دارای حق نشر بیش از پیش مبهم شده است و اگرچه پلتفرمها حق نشر را در بسیاری از موارد برای خود محفوظ میدانند، اما بسیاری معتقدند که حق رضایت نیز باید برای تولید کنندگان محتوا محفوظ باشد.
همین مساله باعث حساسیت استودیوهای فیلمسازی و صنوف هنری در آمریکا شده است. این دسته از فعالان صنعت سرگرمی معتقدند سورا با تقلید سبکهای هنری به شدت حوزه کاری آنها را در معرض خطر قرار میدهد. کمپینهای عمومی همچون نامه سرگشاده ۴۰۰ کارگردان و بازیگر معروف علیه استفاده بدون مجوز از آثار هنری برای آموزش هوش مصنوعی نشان میدهد که بحران اعتماد میان هنرمندان و شرکتهای فناوری در حال تشدید است.
در همین حال، شرکت اوپنایآی اخیرا از پروژه جدیدی خبر داده است که براساس آن قرار است یک انیمیشن سینمایی را با کمک ابزارهای مولد تصویر خود تولید و به سینما ببرد. براساس گزارش منتشر شده، این انیمیشن با کسری از هزینه نمونههای مشابه در هالیوود تولید میشود و با اینکه میتواند هزینه تولید آثار را تا حد زیادی کاهش دهد، اما موفقیت آن بدون شک تهدیدی برای رقبای سنتی محسوب میشود که شاید خودشان تولیدکنندگان بخشی از دادههای آموزشی مدلهای اوپنایآی باشند.
برخی کارشناسان صنعتی معتقدند جذابیت هزینههای پایین و سرعت بالای تولید محتوای هوش مصنوعی باعث شده استودیوها نیز وسوسه شوند با شرکتهای نوپای این حوزه همکاری کنند. اما نگرانی درباره حفاظت از مالکیت معنوی همچنان مانعی بزرگ در برابر این همکاریهاست.
یکی از پیامدهای مستقیم شکایتهای حقوقی و فشارهای عمومی، کاهش شفافیت شرکتهای هوش مصنوعی است. پژوهشگران مستقل مانند استلا بیدرمن از موسسه EleutherAI میگویند: «نتیجه این وضعیت آن است که اساسا هیچکس درباره محتوای دیتاستهای آموزشی حرفی نمیزند.»
این پنهانکاری، علاوه بر افزایش نگرانیها درباره نقض حقوق ناشران و هنرمندان، باعث میشود اعتماد عمومی به فناوریهای نوین کاهش یابد. در غیاب شفافیت، هم مصرفکنندگان و هم تولیدکنندگان محتوا در فضایی پرابهام فعالیت میکنند.
ابزار سورا، همانطور که سخنگوی اوپنایآی بیان کرده، میتواند «سطح خلاقیت استودیویی را در اختیار میلیونها نفر قرار دهد.» اما پرسش این است که هزینه این خلاقیت بر دوش چه کسانی گذاشته میشود؟ اگر این خلاقیت حاصل استفاده از دادههای حفاظتشده بدون رضایت و جبران مالی باشد، نه تنها آینده حقوقی اوپنایآی بلکه کل صنعت هوش مصنوعی با بحرانی جدی مواجه است.
گرچه تبعات احتمالی برای شرکتهای تولیدکننده ابزارهای هوش مصنوعی میتواند یکی از موضوعات مهم باشد، اما حفاظت از تولیدکنندگان محتوا و فعالان صنعت سرگرمی نیز در عصر هوش مصنوعی از اهمیت ویژهای برخوردار است که رویکرد قانونگذاران در این باره و تفسیر قانونی قضات در پروندههای آتی تاثیر مستقیم بر آن خواهد داشت.