Google представила «Imagen Editor» для редактирования изображений с помощью текста

Google продолжает работу над генерацией изображений по текстовому описанию, представив инструмент «Imagen Editor», который позволяет редактировать изображения (или выполнять их частичное заполнение) с помощью текстовых подсказок. Об этом стало известно сегодня.

…редактирование изображений с помощью текста (TGIE) — это практическая задача, которая включает редактирование сгенерированных и сфотографированных визуальных материалов, а не их полную переработку.

В общих чертах, Imagen Editor позволяет загрузить изображение, выбрать область, которую вы хотите отредактировать/изменить, а затем ввести текстовую подсказку для этой конкретной области. Остальная часть изображения при этом не затрагивается.

Один из примеров демонстрирует выделение тела собаки с последующим запросом на «красный космический скафандр с белой звездой». Справа демо-версия добавляет «ракету из картона», а наиболее впечатляющим является добавление «синих игровых наушников».

Google опубликовала несколько других примеров и сопутствующую исследовательскую работу, но «не планирует выпускать Imagen Editor для широкой публики», ссылаясь на «озабоченность в отношении ответственного ИИ». Также была представлена EditBench — «метод для оценки качества моделей редактирования изображений».

Реклама — прокрутите дальше, чтобы увидеть больше контента

С точки зрения практического применения, Google отмечает, что TGIE может обеспечить «быстрое, автоматизированное и управляемое редактирование [как] удобное решение, когда воссоздание визуальных материалов было бы трудоемким или невозможным (например, изменение объектов на фотографиях из отпуска или совершенствование мелких деталей на милом щенке, сгенерированном с нуля)». Это происходит на фоне того, что Google Фото получает функцию Magic Editor, использующую элементы генеративного ИИ.

В потребительских продуктах Imagen и другие модели Google для генерации изображений по тексту должны сначала стать доступны пользователям в Google Презентациях. Тестирование в Workspace Labs началось недавно, также была анонсирована генерация изображений для пользовательских фонов Google Meet.

Подробнее об Imagen: