در گزارشی که اخیراً منتشر شده بود، ادعا شده بود که شرکتهای بزرگی مانند اپل بدون کسب مجوز از تولیدکنندگان محتوا، از ویدیوهای یوتیوب برای آموزش مدلهای هوش مصنوعی خود استفاده کردهاند. این خبر باعث نگرانیهایی در خصوص حقوق تولیدکنندگان محتوا و حریم خصوصی کاربران شد. اما اپل اکنون به طور رسمی اعلام کرده که هیچگاه از این مجموعه دادهها برای آموزش هوش مصنوعی خود، یعنی Apple Intelligence، استفاده نکرده است.
نقش EleutherAI و مجموعه دادههای Pile
گزارشهای قبلی نشان میداد که یک آزمایشگاه تحقیقاتی هوش مصنوعی به نام EleutherAI بدون اجازه تولیدکنندگان، زیرنویس ویدیوهای یوتیوب را استخراج کرده و از آنها در مجموعه دادهای به نام Pile استفاده کرده است. این مجموعه دادهها شامل اطلاعات دیگری از منابعی مانند ویکیپدیا، پارلمان بریتانیا و ایمیلهای شرکت Enron نیز میشد. هدف EleutherAI از ایجاد Pile کاهش موانع توسعه هوش مصنوعی برای شرکتهای کوچکتر اعلام شده بود.
با این حال، گزارشهای جدیدتر نشان میدهند که شرکتهای بزرگی نظیر اپل، انویدیا و سیلزفورس از مجموعه داده Pile برای آموزش پروژههای مختلف هوش مصنوعی خود بهره بردهاند. این ادعاها باعث بروز بحثهای زیادی در خصوص استفاده از دادههای بدون مجوز شده است.
واکنش اپل به این ادعاها
اپل در واکنش به این گزارشها، در مصاحبهای با AppleInsider تأکید کرده است که مجموعه داده Pile هرگز برای آموزش هوش مصنوعی Apple Intelligence استفاده نشده است. این شرکت توضیح داده که از Pile تنها برای آموزش مدلهای منبع باز OpenELM که در ماه آوریل منتشر شد، استفاده کرده است.
علاوه بر این، اپل تأیید کرده که مدلهای OpenELM هیچیک از ویژگیهای هوش مصنوعی یا یادگیری ماشینی Apple Intelligence را تأمین نمیکنند و هدف از ایجاد OpenELM کمک به جامعه تحقیقاتی بوده است. اپل همچنین اشاره کرده که هیچ برنامهای برای ساخت نسخه جدیدی از مدل OpenELM ندارد و تأکید کرده که این مدلها هرگز برای توسعه Apple Intelligence مورد استفاده قرار نگرفتهاند.
نتیجهگیری
این بیانیه اپل تلاش میکند تا نگرانیهای مرتبط با استفاده غیرمجاز از دادهها برای آموزش هوش مصنوعی را کاهش دهد. با وجود این، بحثهای پیرامون استفاده از دادههای بدون مجوز همچنان ادامه دارد و نشاندهنده نیاز به تدوین قوانین و مقررات شفافتر در این زمینه است. شرکتهای بزرگ فناوری باید با دقت بیشتری از دادههای کاربران استفاده کنند و از حقوق تولیدکنندگان محتوا و حریم خصوصی کاربران حفاظت کنند.