شکایت نویسندگان از ادوبی بابت آموزش هوش مصنوعی

ادوبی با شکایت جدیدی روبه‌رو شده که مدعی است این شرکت برای آموزش یکی از مدل‌های هوش مصنوعی خود از کتاب‌های دارای حق‌کپی‌رایت و نسخه‌های غیر قانونی استفاده کرده است.

نوشته شده توسط هدی کاظمی نسب

۲۷ آذر، ۱۴۰۴

شکایت نویسندگان از ادوبی بابت آموزش هوش مصنوعی

نوشته شده توسط هدی کاظمی نسب

۲۷ آذر، ۱۴۰۴

تقریباً مانند اغلب شرکت‌های فناوری دیگر، ادوبی در چند سال گذشته به‌شدت روی هوش مصنوعی تمرکز کرده است. این شرکت نرم‌افزاری از سال ۲۰۲۳ مجموعه‌ای از خدمات مبتنی بر هوش مصنوعی را عرضه کرده که از جمله آن‌ها می‌توان به Firefly، مجموعه تولید محتوای مبتنی بر AI، اشاره کرد. با این حال، به نظر می‌رسد این استقبال تمام‌قد از فناوری اکنون برای ادوبی دردسرساز شده، چرا که یک شکایت حقوقی جدید مدعی است این شرکت برای آموزش یکی از مدل‌های هوش مصنوعی خود، کتاب‌های بدون مجوز قانونی را به‌کار برده است.
این شکایت پیشنهادی به‌صورت دعوای جمعی، از سوی الیزابت لیون، نویسنده‌ای اهل ایالت اورگن، ثبت شده و ادعا می‌کند ادوبی از نسخه‌های غیرقانونی تعداد زیادی کتاب از جمله آثار خود او برای آموزش برنامه SlimLM استفاده کرده است.
ادوبی SlimLM را مجموعه‌ای از مدل‌های زبانی کوچک معرفی می‌کند که می‌توان آن‌ها را برای وظایف کمک‌رسانی به اسناد روی دستگاه‌های موبایل بهینه‌سازی کرد. به گفته این شرکت، SlimLM به‌صورت اولیه با SlimPajama-627B آموزش دیده؛ مجموعه‌داده‌ای «حذف‌تکرار‌شده، چندمنبعی و متن‌باز» که توسط Cerebras در ژوئن ۲۰۲۳ منتشر شده است. لیون که چندین کتاب راهنما در حوزه نویسندگی غیرداستانی نوشته، می‌گوید برخی از آثارش در مجموعه‌داده پیش‌آموزشی که ادوبی استفاده کرده، وجود داشته‌اند.
در شکایت لیون که نخستین‌بار توسط رویترز گزارش شد آمده است که نوشته‌های او در یک زیرمجموعه پردازش‌شده از یک دیتاست دست‌کاری‌شده قرار داشته که مبنای برنامه ادوبی بوده است. در متن شکایت آمده: «دیتاست SlimPajama با کپی‌برداری و دست‌کاری دیتاست RedPajama (از جمله کپی Books3) ایجاد شده است. بنابراین، از آنجا که SlimPajama یک نسخه مشتق‌شده از RedPajama محسوب می‌شود، شامل دیتاست Books3 نیز هست؛ دیتاستی که آثار دارای حق‌کپی‌رایت شاکی و اعضای گروه را در بر می‌گیرد.»
«Books3» مجموعه‌ای عظیم شامل ۱۹۱ هزار کتاب که برای آموزش سیستم‌های هوش مصنوعی مولد استفاده شده‌اند مدت‌هاست به منبعی از دردسرهای حقوقی برای جامعه فناوری تبدیل شده است. RedPajama نیز در چندین پرونده قضایی دیگر مورد اشاره قرار گرفته است. در ماه سپتامبر، شکایتی علیه اپل مطرح شد که این شرکت را متهم می‌کرد از آثار دارای حق‌کپی‌رایت برای آموزش مدل Apple Intelligence استفاده کرده است. در این پرونده به همان دیتاست اشاره شده و اپل به کپی‌برداری از آثار محافظت‌شده «بدون رضایت و بدون ذکر منبع یا پرداخت غرامت» متهم شده بود. در ماه اکتبر نیز شکایتی مشابه علیه Salesforce مطرح شد که ادعا می‌کرد این شرکت هم از RedPajama برای آموزش استفاده کرده است.
متأسفانه برای صنعت فناوری، چنین شکایت‌هایی حالا تا حدی به امری رایج تبدیل شده‌اند. الگوریتم‌های هوش مصنوعی با دیتاست‌های عظیم آموزش می‌بینند و در برخی موارد، گفته می‌شود این دیتاست‌ها شامل محتوای دزدی بوده‌اند. در ماه سپتامبر، شرکت Anthropic موافقت کرد ۱.۵ میلیارد دلار به تعدادی از نویسندگانی بپردازد که این شرکت را به استفاده از نسخه‌های غیرقانونی آثارشان برای آموزش چت‌بات Claude متهم کرده بودند. این پرونده به‌عنوان یک نقطه عطف احتمالی در نبردهای حقوقی جاری بر سر استفاده از محتوای دارای حق‌کپی‌رایت در داده‌های آموزشی هوش مصنوعی تلقی شد؛ نبردهایی که شمار آن‌ها کم نیست.