
Google предоставляет веб-издателям новый способ контролировать данные для обучения ИИ и «использовать ли их сайты для улучшения Bard и генеративных API Vertex AI».
Большие языковые модели (LLM) обучаются на огромных объемах данных, включая веб-контент. В июле Google призвал к созданию современного robots.txt для ИИ. В отсутствие отраслевого стандарта Google обновляет свою платформу:
Используя Google-Extended для контроля доступа к контенту на сайте, администратор веб-сайта может выбирать, помогать ли этим моделям ИИ со временем становиться более точными и способными.
Google-Extended, являющийся частью robots.txt, конкретно применяется для обучения Bard и Vertex AI (которые доступны третьим сторонам как предложение Google Cloud), а также «будущим поколениям моделей, которые обеспечивают работу этих продуктов». Дополнительная информация для издателей доступна здесь.
Google заявляет, что услышал, как веб-издатели «хотят больше выбора и контроля над тем, как их контент используется для новых сценариев использования генеративного ИИ». Компания называет это «важным шагом в обеспечении прозрачности и контроля, которые, по нашему мнению, должны предоставлять все поставщики моделей ИИ».
…мы стремимся к взаимодействию с веб- и ИИ-сообществами для изучения дополнительных машиночитаемых подходов к выбору и контролю для веб-издателей. Мы с нетерпением ждем возможности поделиться новостями в ближайшее время.
Подробнее об ИИ от Google:
- Google SGE теперь доступен для подростков, добавлена функция «Об этом результате»
- Расширения Bard позволяют Google получать доступ к вашей Gmail и Документам для выполнения задач
- Google Bard теперь доступен в Европе, поддерживает более 40 языков, закрепление чатов и многое другое
- Bard получил экспорт в Google Таблицы, улучшенные навыки логики и рассуждения