Google позволяет сайтам контролировать, используются ли они для обучения Bard и других генеративных ИИ

Google предоставляет веб-издателям новый способ контролировать данные для обучения ИИ и «использовать ли их сайты для улучшения Bard и генеративных API Vertex AI».

Большие языковые модели (LLM) обучаются на огромных объемах данных, включая веб-контент. В июле Google призвал к созданию современного robots.txt для ИИ. В отсутствие отраслевого стандарта Google обновляет свою платформу:

Используя Google-Extended для контроля доступа к контенту на сайте, администратор веб-сайта может выбирать, помогать ли этим моделям ИИ со временем становиться более точными и способными.

Google-Extended, являющийся частью robots.txt, конкретно применяется для обучения Bard и Vertex AI (которые доступны третьим сторонам как предложение Google Cloud), а также «будущим поколениям моделей, которые обеспечивают работу этих продуктов». Дополнительная информация для издателей доступна здесь.

Google заявляет, что услышал, как веб-издатели «хотят больше выбора и контроля над тем, как их контент используется для новых сценариев использования генеративного ИИ». Компания называет это «важным шагом в обеспечении прозрачности и контроля, которые, по нашему мнению, должны предоставлять все поставщики моделей ИИ».

…мы стремимся к взаимодействию с веб- и ИИ-сообществами для изучения дополнительных машиночитаемых подходов к выбору и контролю для веб-издателей. Мы с нетерпением ждем возможности поделиться новостями в ближайшее время.

Подробнее об ИИ от Google: