Загрузить еще

Битва за авторские права - самые известные словарь и энциклопедия подали иск против ChatGPT

Битва за авторские права - самые известные словарь и энциклопедия подали иск против ChatGPT
Фото: herbinisaac с сайта Pixabay

Самые известные в мире энциклопедия и словарь – Encyclopaedia Britannica и Merriam-Webster – обратились в суд с иском против OpenAI, заявив о несанкционированном использовании большого массива их материалов для тренировки моделей искусственного интеллекта, включая ChatGPT. Этот процесс может существенно изменить подходы к использованию цифрового контента во всей сфере ИИ. Об этом пишет Digital Trends.

Общепризнано, что компании в сфере искусственного интеллекта используют веб-статьи для обучения своих моделей без оплаты авторам и без получения разрешения. Такие издатели, как The New York Times, Chicago Tribune и Toronto Star, уже подали судебные иски против этой практики.

TechCrunch сообщает, что Encyclopaedia Britannica и ее дочерняя компания Merriam-Webster подали иск против OpenAI. Они утверждают, что AI-гигант совершил "масштабное нарушение авторских прав", собрав и использовав почти 100 000 онлайн-статей для обучения больших языковых моделей без разрешения.

Britannica заявляет, что ChatGPT генерирует ответы, фактически заменяющие ее контент, уменьшая трафик на сайт и потенциальные доходы. Если пользователи могут задать вопрос ChatGPT и получить ответ на основе статей Britannica, то у них пропадает стимул посещать сайт напрямую.

В иске также упоминается использование контента Britannica в процессе RAG (retrieval-augmented generation), когда ИИ во время ответа сканирует интернет для получения актуальной информации. Истцы утверждают, что в этом процессе система частично или полностью воспроизводит их контент.

Britannica также обвиняет OpenAI в нарушении законодательства о торговых марках. Компания утверждает, что ChatGPT иногда придумывает информацию, а затем ошибочно приписывает ее издателю. По словам Britannica, такие "галлюцинации" ставят под угрозу "дальнейший доступ общественности к качественной и достоверной онлайн-информации".

Пока нет четкой юридической практики, которая бы однозначно определила, является ли обучение ИИ на защищенном авторским правом контенте нарушением закона.

В недавнем деле против Anthropic федеральный судья постановил, что использование защищенного контента для обучения может считаться достаточно "трансформативным", чтобы быть законным. В то же время тот же судья признал, что компания незаконно загрузила миллионы книг, что привело к урегулированию дела на сумму 1,5 млрд долларов с пострадавшими авторами.

Поскольку эта тема продолжает развиваться, законодателям еще предстоит проделать значительную работу. Решения по этим делам, вероятно, определят, как именно AI-компании смогут легально использовать веб-контент в будущем.