شکایت نویسندگان از ادوبی بابت آموزش هوش مصنوعی
تقریباً مانند اغلب شرکتهای فناوری دیگر، ادوبی در چند سال گذشته بهشدت روی هوش مصنوعی تمرکز کرده است. این شرکت نرمافزاری از سال ۲۰۲۳ مجموعهای از خدمات مبتنی بر هوش مصنوعی را عرضه کرده که از جمله آنها میتوان به Firefly، مجموعه تولید محتوای مبتنی بر AI، اشاره کرد. با این حال، به نظر میرسد این استقبال تمامقد از فناوری اکنون برای ادوبی دردسرساز شده، چرا که یک شکایت حقوقی جدید مدعی است این شرکت برای آموزش یکی از مدلهای هوش مصنوعی خود، کتابهای بدون مجوز قانونی را بهکار برده است.
این شکایت پیشنهادی بهصورت دعوای جمعی، از سوی الیزابت لیون، نویسندهای اهل ایالت اورگن، ثبت شده و ادعا میکند ادوبی از نسخههای غیرقانونی تعداد زیادی کتاب از جمله آثار خود او برای آموزش برنامه SlimLM استفاده کرده است.
ادوبی SlimLM را مجموعهای از مدلهای زبانی کوچک معرفی میکند که میتوان آنها را برای وظایف کمکرسانی به اسناد روی دستگاههای موبایل بهینهسازی کرد. به گفته این شرکت، SlimLM بهصورت اولیه با SlimPajama-627B آموزش دیده؛ مجموعهدادهای «حذفتکرارشده، چندمنبعی و متنباز» که توسط Cerebras در ژوئن ۲۰۲۳ منتشر شده است. لیون که چندین کتاب راهنما در حوزه نویسندگی غیرداستانی نوشته، میگوید برخی از آثارش در مجموعهداده پیشآموزشی که ادوبی استفاده کرده، وجود داشتهاند.
در شکایت لیون که نخستینبار توسط رویترز گزارش شد آمده است که نوشتههای او در یک زیرمجموعه پردازششده از یک دیتاست دستکاریشده قرار داشته که مبنای برنامه ادوبی بوده است. در متن شکایت آمده: «دیتاست SlimPajama با کپیبرداری و دستکاری دیتاست RedPajama (از جمله کپی Books3) ایجاد شده است. بنابراین، از آنجا که SlimPajama یک نسخه مشتقشده از RedPajama محسوب میشود، شامل دیتاست Books3 نیز هست؛ دیتاستی که آثار دارای حقکپیرایت شاکی و اعضای گروه را در بر میگیرد.»
«Books3» مجموعهای عظیم شامل ۱۹۱ هزار کتاب که برای آموزش سیستمهای هوش مصنوعی مولد استفاده شدهاند مدتهاست به منبعی از دردسرهای حقوقی برای جامعه فناوری تبدیل شده است. RedPajama نیز در چندین پرونده قضایی دیگر مورد اشاره قرار گرفته است. در ماه سپتامبر، شکایتی علیه اپل مطرح شد که این شرکت را متهم میکرد از آثار دارای حقکپیرایت برای آموزش مدل Apple Intelligence استفاده کرده است. در این پرونده به همان دیتاست اشاره شده و اپل به کپیبرداری از آثار محافظتشده «بدون رضایت و بدون ذکر منبع یا پرداخت غرامت» متهم شده بود. در ماه اکتبر نیز شکایتی مشابه علیه Salesforce مطرح شد که ادعا میکرد این شرکت هم از RedPajama برای آموزش استفاده کرده است.
متأسفانه برای صنعت فناوری، چنین شکایتهایی حالا تا حدی به امری رایج تبدیل شدهاند. الگوریتمهای هوش مصنوعی با دیتاستهای عظیم آموزش میبینند و در برخی موارد، گفته میشود این دیتاستها شامل محتوای دزدی بودهاند. در ماه سپتامبر، شرکت Anthropic موافقت کرد ۱.۵ میلیارد دلار به تعدادی از نویسندگانی بپردازد که این شرکت را به استفاده از نسخههای غیرقانونی آثارشان برای آموزش چتبات Claude متهم کرده بودند. این پرونده بهعنوان یک نقطه عطف احتمالی در نبردهای حقوقی جاری بر سر استفاده از محتوای دارای حقکپیرایت در دادههای آموزشی هوش مصنوعی تلقی شد؛ نبردهایی که شمار آنها کم نیست.