استارتآپ تحت حمایت سم آلتمن در آمریکا گویهای اسکن چشم مستقر کرد
استارتآپ Tools for Humanity، که مدیرعامل اوپنایآی، سم آلتمن، یکی از بنیانگذاران آن است، میگوید…
۱۱ اردیبهشت ۱۴۰۴
۱۱ اردیبهشت ۱۴۰۴
زمان مطالعه : ۵ دقیقه
شرکت متا قرار است امروز در یکی از نخستین آزمونهای حقوقی مهم درباره استفاده از آثار دارای حق نشر در آموزش مدلهای قدرتمند هوش مصنوعی، با گروهی از نویسندگان آمریکایی در دادگاه روبرو شود. این شکایت که از سوی حدود دوازده نویسنده مطرح شده، بر استفاده این غول شبکه اجتماعی ۱.۴ میلیارد دلاری از پایگاه دادهای به نام LibGen، تمرکز دارد. این پایگاه داده شامل کتابها، مقالات علمی و کمیکهایی است که بدون پرداخت حق نشر در آن نگهداری میشوند و متا از این پایگاه برای آموزش مدلهای Llama استفاده کرده است.
به گزارش پیوست به نقل از فایننشال تایمز، نتیجه این دادگاه میتواند اثر مهمی بر نبرد داغ میان هنرمندان و شرکتهای هوش مصنوعی در بحث حقوق نشر بگذارد و یکی از چندین شکایت مشابه در سراسر جهان است که شرکتهای فناوری را به استفاده غیرمجاز از محتوا برای آموزش مدلهای زبانی متهم میکند.
شرکتهای مایکروسافت، اوپنایآی و انتروپیک نیز با دعاوی مشابهی مواجهاند که ناشران به استفاده از دادههای دارای حق نشر در روند آموزش چتباتهای محبوبی مانند ChatGPT و Claude اعتراض دارند.
مری رزنبرگر، مدیرعامل انجمن نویسندگان آمریکا، با اشاره به نگرانیهای موجودر پیرامون نقض حق نشر میگوید: «مدلهای هوش مصنوعی با استفاده از صدها هزار یا حتی میلیونها کتابی آموزش دیدهاند که از سایتهای معروف به دزدی ادبی دانلود شدهاند. این مساله اتفاقی نیست. نویسندگان باید بابت این استفاده حقالزحمه دریافت میکردند.»
متا اما در دفاع از خود استدلال میکند که استفاده از آثار دارای حق نشر برای توسعه فناوریهای تحولآفرین براساس چارچوب «استفاده منصفانه» مجاز محسوب میشود. حتی اگر منابع دادهای از پایگاههای غیرقانونی مانند LibGen استخراج شده باشند نیز شرکتهای هوش مصنوعی طبق استدلال متا اجازه استفاده از آن برای توسعه یک محصول جدید را دارند. متا مدعی است که «صرفنظر از روش بهدست آوردن دادهها، استفاده از آنها منصفانه بوده است.»
بر اساس اسناد دادگاه، متا پیشتر مذاکراتی را با ناشران کتاب برای صدور مجوز استفاده از آثارشان آغاز کرده است، اما شاکیان ادعا دارند که این مذاکرات پس از دسترسی شرکت از طریق LibGen به آثار آنها متوقف شد. در نتیجه، نویسندگان از دریافت حقوق و کنترل بر آثارشان محروم شدند.
شرکت متا در روند اکتشاف این پرونده اعلام کرده است که: «اگر حتی برای یک کتاب مجوز بگیریم، دیگر نمیتوانیم بر استراتژی استفاده منصفانه تکیه کنیم.» متا در دفاعیه خود تصریح میکند که هیچ بازاری برای دریافت مجوز این آثار برای چنین هدفی وجود نداشته است.
با این حال، ایمیلهایی که در فرآیند کشف اسناد دادگاه فاش شدهاند نشان میدهد که برخی از کارکنان متا نسبت به ورود به حوزه خاکستری قانونی هشدار دادهاند. بهعنوان نمونه، در ایمیلی مربوط به ژانویه سال گذشته، «جوئل پینو»، رئیس سابق آزمایشگاه تحقیقاتی هوش مصنوعی FAIR در متا، پیشنهاد استفاده از پایگاه داده LibGen را مطرح کرده است. در ایمیلی دیگر، «سونی تیئاکانات»، مدیر تولید متا، میگوید: «تحت هیچ شرایطی نباید بهطور عمومی اعلام کنیم که از LibGen برای آموزش استفاده کردهایم.»
در همان ایمیل، زیرعنوانی به نام «ریسکهای قانونی» آورده شده است که جزئیات آن مخفی باقی مانده است و بخش دیگری نیز با عنوان «ریسکهای سیاستی» شامل موضوعاتی مانند «کپیرایت و مالکیت فکری» است که محتوای آن نیز منتشر نشده است. این ایمیل به نظر به پیشنهادات پیشگیرانهای مانند «حذف دادههایی که بهوضوح دزدی یا سرقتشدهاند» اشاره میکند.
متا به عنوان یکی از مهمترین فعالان صنعت هوش مصنوعی، میلیاردها دلار برای تبدیل شدن به یک رهبر جهانی در این زمینه هزینه کرده است و مدلهای Llama را برای رقابت با شرکتهایی مانند اوپنایآی، مایکروسافت، گوگل و xAI متعلق به ایلان ماسک عرضه داشته است. این شرکت همچنین رویکرد متنباز را برای عرضه مدلهای خود در پیش گرفته و بنابراین با توجه به نقش پررنگ این شرکت در بخش مدلهای متنباز، این پرونده میتواند آینده توسعه مدلهای متنباز را تحت تاثیر قرار دهد.
کریس مامِن، وکیل ارشد شرکت حقوقی Womble Bond Dickinson، ضمن تاکید بر اهمیت این دعاوی میگوید: «در حال حاضر ابهام بسیار زیادی وجود دارد.» به گفته او با اینکه ممکن است فرایند قضایی این پرونده و حصول نتیجه سالها زمان ببرد اما «تعیین تکلیف این مسائل اهمیت بسیار زیادی دارد. اتفاقات این جهان با سرعت برقآسایی که فناوری و جهان اقتصادی ما در حال توسعه است، رخ میدهند.»
یکی دیگر از موارد اختلاف در این دعوی، روش متا برای دستیابی به پایگاه داده LibGen است که به گفته شاکیان از طریق تکنیکی به نام «تورنتینگ» صورت گرفته است. این روش معمولا هنگام دانلود، محتوای دریافتشده را در اختیار دیگر کاربران نیز قرار میدهد.
در اسناد دادگاهی آمده که متا این دادهها را از طریق تورنت دریافت کرده اما تلاش کرده تا انتشار آنها را محدود کند. با این حال، هنوز تضمین قطعی درباره جلوگیری کامل از انتشار دادهها ارائه نشده و برخی اطلاعات مربوط به دادههای خروجی نیز حذف شدهاند.
متا در بیانیه رسمی خود اعلام کرده است: «متا مدلهای هوش مصنوعی متنباز و تحولآفرینی را توسعه داده است که جرقه نوآوری، بهرهوری و خلاقیت بینظیری برای افراد و شرکتها شدهاند. استفاده منصفانه از آثار دارای حق نشر برای تحقق این اهداف حیاتی است.ما با اظهارات شاکیان مخالف هستیم و معتقدیم مستندات کامل، داستان متفاوتی را روایت میکنند. ما با تمام توان از خود دفاع خواهیم کرد و از توسعه هوش مصنوعی مولد به نفع همه حمایت میکنیم.»