Последним врагом ChatGPT стал лучший в мире словарь и энциклопедия.

Широко известно, что компании, занимающиеся разработкой искусственного интеллекта, используют статьи из интернета для обучения своих моделей, не выплачивая компенсацию авторам и не получая их разрешения. Такие издательства, как The New York Times, Chicago Tribune и Toronto Star, уже подали иски против этой практики. Теперь к судебному разбирательству присоединилась еще одна известная организация.

Издание Techcrunch сообщило , что Encyclopedia Britannica и ее дочерняя компания Merriam-Webster подали иск против OpenAI, утверждая, что гигант в области искусственного интеллекта совершил «масштабное нарушение авторских прав», скопировав и использовав почти 100 000 статей из ее онлайн-ресурсов для обучения своих магистерских программ без разрешения.

О чём этот судебный иск?

Britannica утверждает, что ChatGPT генерирует ответы , которые заменяют контент сайта, снижая трафик и потенциальную прибыль. Если пользователи могут задать вопрос ChatGPT и получить ответ, основанный на статьях Britannica, у них может снизиться мотивация посещать сайт напрямую.

В жалобе также утверждается, что OpenAI использует контент Britannica в рабочем процессе RAG ChatGPT, в рамках которого ИИ сканирует интернет на предмет актуальной информации при ответе на вопросы, и что ИИ воспроизводит этот контент, полностью или частично, при ответе на вопросы.

Кроме того, Britannica утверждает, что OpenAI нарушает закон о товарных знаках. Компания заявляет, что ChatGPT генерирует ложную информацию, а затем ошибочно приписывает её издателю. По мнению Britannica, ложная информация, генерируемая ChatGPT, ставит под угрозу «постоянный доступ общественности к высококачественной и заслуживающей доверия онлайн-информации».

Что произойдет дальше?

Вот в чём главный вопрос. Нет убедительных юридических прецедентов, устанавливающих, является ли обучение ИИ на контенте, защищённом авторским правом, нарушением авторских прав. Любой может сказать вам, что использовать чужую работу для обучения на ваших данных неправильно, но законодательство в этой области, мягко говоря, неясно.

В недавнем деле с участием компании Anthropic федеральный судья постановил, что использование защищенного авторским правом контента в качестве обучающих данных является достаточно трансформирующим, чтобы быть законным. Однако тот же судья установил, что Anthropic незаконно скачала миллионы книг, в результате чего пострадавшим авторам было выплачено компенсационное соглашение на сумму 1,5 миллиарда долларов.

Поскольку эта проблема продолжает развиваться, законодателям предстоит проделать значительную работу. Исход этих дел, вероятно, определит, как компании, занимающиеся искусственным интеллектом, смогут на законных основаниях использовать веб-контент в будущем.

Статья "Последний враг ChatGPT — лучший в мире словарь и энциклопедия" впервые появилась на сайте Digital Trends .