Комментарий: Google «Новости» уже переполнены копиями реальных статей, созданными ИИ

Seth Weintraub | Вторник, 14 ноября, 2023, 22:56.

Если вы задавались вопросом, сможет ли Google перехитрить искусственный интеллект, то первые ответы, безусловно, не выглядят обнадеживающими. По имеющимся данным, бот-сайты, существующие задолго до появления генеративного ИИ, вероятно, воспользуются новой волной технологий, чтобы ускорить плагиат и, таким образом, более надежно обмануть Google, заставив его поверить, что это настоящие новостные сайты, что приведет к продвижению Google этих украденных статей через чрезвычайно популярный и широко используемый сервис Google Новости.

Любой, кто имел дело со службами Google Publisher, знает, что компания давно отказалась от своих «партнеров»-издателей, когда дело доходит до сообщения о ложных новостных сайтах, плагиате или контенте низкого качества. Google годами искусственно продвигает сайты «слишком маленькие, чтобы иметь собственный отдел рекламы».

Мы давно сообщали, когда видели, как новостные сайты копировали нашу работу. К сожалению, такие сайты часто остаются активными неделями, если не навсегда. Мы не только используем почти совершенно бесполезные инструменты, предоставляемые Google, но и обращаемся к руководителям.

Связанное: Google Discover сталкивается с серьезной проблемой: плагиат веб-историй

С появлением ИИ и больших языковых моделей (LLM) это стало намного сложнее, и Google, спустя годы позволив своему новостному продукту деградировать ради легких денег от AdSense, теперь открыт для эксплуатации даже легко идентифицируемыми скрейперами. По мере совершенствования LLM их будет труднее идентифицировать. Но какие шансы у Google, если он даже не может идентифицировать контент низкого качества, который он продвигает годами?

Реклама — прокрутите вниз для большего контента

Пример на сегодня:

Rivian, производитель электромобилей, вчера вечером выпустил обновление программного обеспечения, которое вывело из строя информационно-развлекательные системы многих своих пользователей. Я сообщил об этом сбое рано утром для сестринского сайта 9to5Google, Electrek. В течение нескольких минут два отдельных сайта с ИИ пропустили мою публикацию через генератор ИИ и выдали похожие статьи.

Google Новости продвигает эти статьи, иногда опережая оригинал:

Сайты выше используют ИИ для кражи легитимных новостных статей, и не только с Electrek. Сайты выше также используют рекламный движок Google для монетизации кликов по (моей) украденной работе.

«Автор» ИИ на сайте OPP за час после появления моей украденной статьи в Google Новостях создал множество пронумерованных страниц из украденных и обработанных ИИ историй. К каждому новостному материалу прилагается качественное, но легко идентифицируемое изображение, созданное ИИ. Это был бы очень низко висящий сигнал для Google, если бы он действительно хотел остановить поток контента, произведенного ИИ.

Если бы я не потратил много часов впустую, сообщая об этих сайтах, я бы сделал это снова.

Но на самом деле, Google просто сломан, и я не уверен, что он сможет исправить себя ценой потери рекламного дохода.