مهدی جعفری مترجم

پیوست » فناوری » هوش مصنوعی » متا در اولین آزمون جدی برای استفاده از محتوای دارای حق نشر به دادگاه می‌رود

متا در اولین آزمون جدی برای استفاده از محتوای دارای حق نشر به دادگاه می‌رود

مهدی جعفری مترجم

۱۱ اردیبهشت ۱۴۰۴

زمان مطالعه : ۵ دقیقه

شرکت متا قرار است امروز در یکی از نخستین آزمون‌های حقوقی مهم درباره استفاده از آثار دارای حق نشر در آموزش مدل‌های قدرتمند هوش مصنوعی، با گروهی از نویسندگان آمریکایی در دادگاه روبرو شود. این شکایت که از سوی حدود دوازده نویسنده مطرح شده، بر استفاده این غول شبکه اجتماعی ۱.۴ میلیارد دلاری از پایگاه داده‌ای به نام LibGen، تمرکز دارد. این پایگاه داده شامل کتاب‌ها، مقالات علمی و کمیک‌هایی است که بدون پرداخت حق نشر در آن نگهداری می‌شوند و متا از این پایگاه برای آموزش مدل‌های Llama استفاده کرده است.

به گزارش پیوست به نقل از فایننشال تایمز، نتیجه این دادگاه می‌تواند اثر مهمی بر نبرد داغ میان هنرمندان و شرکت‌های هوش مصنوعی در بحث حقوق نشر بگذارد و یکی از چندین شکایت مشابه در سراسر جهان است که شرکت‌های فناوری را به استفاده غیرمجاز از محتوا برای آموزش مدل‌های زبانی متهم می‌کند.

شرکت‌های مایکروسافت، اوپن‌ای‌آی و انتروپیک نیز با دعاوی مشابهی مواجه‌اند که ناشران به استفاده از داده‌های دارای حق نشر در روند آموزش چت‌بات‌های محبوبی مانند ChatGPT و Claude اعتراض دارند.

مری رزنبرگر، مدیرعامل انجمن نویسندگان آمریکا، با اشاره به نگرانی‌های موجودر پیرامون نقض حق نشر می‌گوید: «مدل‌های هوش مصنوعی با استفاده از صدها هزار یا حتی میلیون‌ها کتابی آموزش دیده‌اند که از سایت‌های معروف به دزدی ادبی دانلود شده‌اند. این مساله اتفاقی نیست. نویسندگان باید بابت این استفاده حق‌الزحمه دریافت می‌کردند.»

متا اما در دفاع از خود استدلال می‌کند که استفاده از آثار دارای حق نشر برای توسعه فناوری‌های تحول‌آفرین براساس چارچوب «استفاده منصفانه» مجاز محسوب می‌شود. حتی اگر منابع داده‌ای از پایگاه‌های غیرقانونی مانند LibGen استخراج شده باشند نیز شرکت‌های هوش مصنوعی طبق استدلال متا اجازه استفاده از آن برای توسعه یک محصول جدید را دارند. متا مدعی است که «صرف‌نظر از روش به‌دست آوردن داده‌ها، استفاده از آن‌ها منصفانه بوده است.»

بر اساس اسناد دادگاه، متا پیش‌تر مذاکراتی را با ناشران کتاب برای صدور مجوز استفاده از آثارشان آغاز کرده است، اما شاکیان ادعا دارند که این مذاکرات پس از دسترسی شرکت از طریق LibGen به آثار آنها متوقف شد. در نتیجه، نویسندگان از دریافت حقوق و کنترل بر آثارشان محروم شدند.

شرکت متا در روند اکتشاف این پرونده اعلام کرده است که: «اگر حتی برای یک کتاب مجوز بگیریم، دیگر نمی‌توانیم بر استراتژی استفاده منصفانه تکیه کنیم.» متا در دفاعیه خود تصریح می‌کند که هیچ بازاری برای دریافت مجوز این آثار برای چنین هدفی وجود نداشته است.

با این حال، ایمیل‌هایی که در فرآیند کشف اسناد دادگاه فاش شده‌اند نشان می‌دهد که برخی از کارکنان متا نسبت به ورود به حوزه خاکستری قانونی هشدار داده‌اند. به‌عنوان نمونه، در ایمیلی مربوط به ژانویه سال گذشته، «جوئل پینو»، رئیس سابق آزمایشگاه تحقیقاتی هوش مصنوعی FAIR در متا، پیشنهاد استفاده از پایگاه داده LibGen را مطرح کرده است. در ایمیلی دیگر، «سونی تیئاکانات»، مدیر تولید متا، می‌گوید: «تحت هیچ شرایطی نباید به‌طور عمومی اعلام کنیم که از LibGen برای آموزش استفاده کرده‌ایم.»

در همان ایمیل، زیرعنوانی به نام «ریسک‌های قانونی» آورده شده است که جزئیات آن مخفی باقی مانده است و بخش دیگری نیز با عنوان «ریسک‌های سیاستی» شامل موضوعاتی مانند «کپی‌رایت و مالکیت فکری» است که محتوای آن نیز منتشر نشده است. این ایمیل به نظر به پیشنهادات پیشگیرانه‌ای مانند «حذف داده‌هایی که به‌وضوح دزدی یا سرقت‌شده‌اند» اشاره می‌کند.

متا به عنوان یکی از مهمترین فعالان صنعت هوش مصنوعی، میلیاردها دلار برای تبدیل شدن به یک رهبر جهانی در این زمینه هزینه کرده است و مدل‌های Llama را برای رقابت با شرکت‌هایی مانند اوپن‌ای‌آی، مایکروسافت، گوگل و xAI متعلق به ایلان ماسک عرضه داشته است. این شرکت همچنین رویکرد متن‌باز را برای عرضه مدل‌های خود در پیش گرفته و بنابراین با توجه به نقش پررنگ این شرکت در بخش مدل‌های متن‌باز، این پرونده می‌تواند آینده توسعه مدل‌های متن‌باز را تحت تاثیر قرار دهد.

کریس مامِن، وکیل ارشد شرکت حقوقی Womble Bond Dickinson، ضمن تاکید بر اهمیت این دعاوی می‌گوید: «در حال حاضر ابهام بسیار زیادی وجود دارد.» به گفته او با اینکه ممکن است فرایند قضایی این پرونده و حصول نتیجه سال‌ها زمان ببرد اما «تعیین تکلیف این مسائل اهمیت بسیار زیادی دارد. اتفاقات این جهان با سرعت برق‌آسایی که فناوری و جهان اقتصادی ما در حال توسعه است، رخ می‌دهند.»

یکی دیگر از موارد اختلاف در این دعوی، روش متا برای دستیابی به پایگاه داده LibGen است که به گفته شاکیان از طریق تکنیکی به نام «تورنتینگ» صورت گرفته است. این روش معمولا هنگام دانلود، محتوای دریافت‌شده را در اختیار دیگر کاربران نیز قرار می‌دهد.

در اسناد دادگاهی آمده که متا این داده‌ها را از طریق تورنت دریافت کرده اما تلاش کرده تا انتشار آن‌ها را محدود کند. با این حال، هنوز تضمین قطعی درباره جلوگیری کامل از انتشار داده‌ها ارائه نشده و برخی اطلاعات مربوط به داده‌های خروجی نیز حذف شده‌اند.

متا در بیانیه رسمی خود اعلام کرده است: «متا مدل‌های هوش مصنوعی متن‌باز و تحول‌آفرینی را توسعه داده است که جرقه نوآوری، بهره‌وری و خلاقیت بی‌نظیری برای افراد و شرکت‌ها شده‌اند. استفاده منصفانه از آثار دارای حق نشر برای تحقق این اهداف حیاتی است.ما با اظهارات شاکیان مخالف هستیم و معتقدیم مستندات کامل، داستان متفاوتی را روایت می‌کنند. ما با تمام توان از خود دفاع خواهیم کرد و از توسعه هوش مصنوعی مولد به نفع همه حمایت می‌کنیم.»

این مطالب را هم بخوانید: