META обвинили в использовании пиратских книг для обучения ИИ
Марк Цукерберг вернулся на горячее место, на этот раз столкнувшись со взрывоопасными утверждениями о том, что Meta намеренно скачала миллионы книг с известных цифровых пиратских сайтов LibGen и Anna’s Archive, чтобы обучить свою передовую модель ИИ, Llama 3.
Согласно недавно поданным судебным документам, руководители Meta якобы открыто обсуждали свою отчаянную потребность в высококачественном контенте, признавая в проклятом электронном письме:Книги на самом деле важнее веб-данных" С этой целью, Предположительно, компания обратилась прямо к пиратским центрам, усыпанным украденными литературными сокровищами.s - без второй мысли или единого цента, выплаченного их законным владельцам. Forbes.
Мета-персонал обратился к LibGen является домом для более чем 7,5 миллионов пиратских книг и 81 миллиона украденных научных работ. Чтобы заполнить этот пробел. То же самое было и с архивом Анны.
...
В недавно поданных судебных документах Meta, возглавляемая основателем и генеральным директором Марком Цукербергом, Утверждается, что он намеренно и явно санкционировал рейд на LibGen.Anna’s Archive, еще одна огромная цифровая пиратская гавань, готовит свою последнюю модель искусственного интеллекта, Llama 3.
Последствия разозлили авторов по всему миру Работу своей жизни Цукерберг, возможно, незаметно подхватили и скормили последнему технологическому детищу Цукерберга без кредита, согласия или компенсации.
Как отмечается в статье, Финансовая отчетность Meta за 2024 год демонстрирует доходы, превышающие ошеломляющие 164 миллиарда долларов, а прибыль приближается к 62 миллиардам долларов.. Очевидно, У Meta были средства и силы, чтобы справедливо компенсировать создателей, издателей и исследователей.. Вместо этого они решили украсть этот контент для учебных целей.
Критики утверждают, что эта сага больше, чем просто корпоративная жадность.
Они, возможно, даже выступали в качестве лидера во вводных данных LLM и создавали лицензионные соглашения, которые уважали права автора. Представьте, если бы у компании была корпоративная культура, чтобы быть лидером по одному из последних и самых важных вопросов общества: Кому принадлежит контент в LLM?
По совпадению, основное значение «фокуса» Meta на долгосрочном воздействии гласит: Мы подчеркиваем долгосрочное мышление, которое побуждает нас расширять временные рамки для воздействия, которое мы имеем, а не оптимизировать для краткосрочных побед. "
Кажется очень ясным, что Meta действительно оптимизировала для краткосрочных побед в этом случае.Вместо изложения корпоративной культуры и лидерской позиции сотрудничества и подлинности.
Тем временем защита Meta опирается на аргумент «справедливого использования», предполагающий, что их ИИ превращает украденный контент во что-то достаточно новое. Но эксперты по правовым вопросам подчеркивают, что справедливое использование обычно применяется к педагогам, рецензентам и критикам, а не к технологическим гигантам, получающим прибыль от массового сбора коммерческих данных.
Автор этого Forbes Проверено АтлантическийИнструмент отслеживания LibGen Алекса Рейснера сделал тревожное открытие: все пять их собственных опубликованных книг были найдены пиратскими и включены в набор данных Meta.
Почему это уголовное нарушение авторских прав? https://t.co/hkZeYxlkJJ
— Cernovich (@Cernovich) 31 марта 2025 г.
Подан крупный групповой иск По словам автора, утверждения о нарушении авторских прав и недобросовестной конкуренции — в то время как другие фирмы «вероятно, виновны в подобных грехах».
В конечном счете, эта сага выходит за рамки одной только Меты. Ненасытная жажда данных всей индустрии ИИ срочно нуждается в четких этических ограждениях. Технологические гиганты должны формировать устойчивые, справедливые партнерские отношения с создателями контента или рисковать подавлением творчества, подрывом прав интеллектуальной собственности и подрывом общественного доверия.
Тайлер Дерден
Мон, 03/31/2025 - 15:20