
После тестирования разработчиками в прошлом месяце, Google начинает развертывание собственного редактирования изображений с помощью ИИ в приложении Gemini.
Это позволяет редактировать изображения, которые вы загрузили вручную, а также те, которые сгенерировало приложение Gemini, с помощью текстовых подсказок на естественном языке. Вы можете продолжать просить Google вносить изменения, пока не будете удовлетворены, при этом контекст будет сохраняться. Это включает изменение фона, замену объектов и добавление элементов.
Вы также сможете изменять стили. В примере ниже вы увидите, как к собаке добавляется шляпа, а затем фон с травой меняется на пляж. Другой пример — как «вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос».
Как только базовая функциональность будет активна (будет встроенный запрос), вы сможете использовать любые из текущих моделей для начала редактирования изображений.

Еще одним преимуществом того, что Google называет «интуитивным многошаговым редактированием», являются «более богатые, контекстуальные ответы на ваши запросы с интегрированным текстом и изображениями». Один из примеров — запрос пошаговых инструкций, включающих изображения.
Например, вы можете попросить Gemini создать первый вариант сказки на ночь о драконах и предоставить изображения к истории.
Что касается безопасности, «изображения, созданные или отредактированные с помощью собственного генератора изображений, будут включать невидимый цифровой водяной знак SynthID». Google также «экспериментирует с добавлением видимого водяного знака на все изображения, сгенерированные Gemini». В примере выше это «ai» в контейнере в форме таблетки в правом нижнем углу.
В прошлом месяце в AI Studio Google продемонстрировал, как Flash 2.0 превосходно отображает изображения с текстом независимо от его длины, и как он «использует мировые знания и улучшенное логическое мышление для создания правильного изображения».
Собственное редактирование изображений постепенно внедряется в приложение Gemini начиная с сегодняшнего дня. В ближайшие недели оно будет «доступно большему количеству пользователей на более чем 45 языках и в большинстве стран».