Генеративные пользовательские интерфейсы Gemini — будущее принципа «для всего найдется свое приложение»

Самое важное, что Google анонсировал на прошлой неделе, — это генеративные пользовательские интерфейсы. Полностью интегрированные в Gemini 3, я считаю, что генеративный ИИ и интерфейсы приведут к появлению нового поколения приложений, но не в том смысле, в котором вы думаете.


У 9to5Google есть обновленная рассылка, которая освещает главные новости Google с дополнительными комментариями и другими интересными фактами. Подпишитесь здесь!


Генеративные пользовательские интерфейсы создают «визуальные впечатления и интерактивные интерфейсы — такие как веб-страницы, игры, инструменты и приложения — которые автоматически разрабатываются и полностью настраиваются в ответ на любой вопрос, инструкцию или запрос».

В gemini.google.com меню «Инструменты» с Gemini 3 Pro предлагает «Динамический вид» или «Визуальный вид». Первый использует возможности кодирования Gemini 3 для создания пользовательского интерфейса, а второй, по сути, предоставляет ползунки и фильтры для настройки «вида в стиле журнала». Режим ИИ использует генеративные пользовательские интерфейсы для добавления интерактивных инструментов и симуляций, а также таблиц, сеток и изображений, чтобы «конечный результат был не просто информативным, но и ясным и действенным».

В приложении Gemini вам нужно вручную включать динамический или визуальный вид, но очевидно, что в будущем оно будет автоматически определять, когда запрос лучше всего обработать с помощью генеративных пользовательских интерфейсов.

Генеративные интерфейсы решают проблему текстовой перегруженности чат-ботов, к которой я до сих пор (спустя несколько лет) с удивлением наблюдаю, что люди ее охотно приняли. Вместо того чтобы вводить текстовый запрос для уточнения, почему бы просто не показать графический интерфейс для этого?

Те, которыми я пользовался до сих пор (например, пользовательская карта мест), выглядели превосходно и представляли информацию лучше, чем источник, добавляя другую информацию из Интернета. Это было намного проще, чем посещать Google Карты, где была дополнительная информация, такая как номера телефонов и расчетное время прибытия.

Заглядывая дальше ответов на запросы, я думаю, что генеративные пользовательские интерфейсы окажут революционное влияние на мобильные приложения. Однако я не думаю, что самый большой вклад будет заключаться в том, чтобы позволить людям создавать пользовательские интерфейсы. По большей части, я думаю, большинство людей устраивают приложения «Часы» или «Календарь». Если нет, то магазин приложений всегда под рукой.

Скорее, генеративные пользовательские интерфейсы позволят вам создавать совершенно новые приложения, которые настроены и специально адаптированы для конкретной потребности, которой может не быть ни у кого другого.

Приведенный Google пример режима ИИ на прошлой неделе — создание пользовательского интерактивного кредитного калькулятора или физического симулятора.

Я чувствую, что будущее генеративного ИИ и пользовательских интерфейсов — это запрос помощи при покупке дома, а затем получение приложения, которое вам в этом поможет. Это сгенерированное руководство будет содержать пошаговые инструкции (в Интернете), охватывая функциональность нескольких приложений: от калькуляторов до электронных таблиц, а также календарей и напоминаний. Представьте, что соответствующие электронные письма появляются с возможностью полного чтения и ответа, или что RCS-чат с вашим брокером появляется встроенным для справки и быстрых вопросов. Ключевым моментом является то, что все по-прежнему синхронизируется с привычными приложениями, когда вы хотите получить обзор своего дня.

В случае с Android представьте, что вы можете добавить его на главный экран, как PWA (Progressive Web App), с иконками и уведомлениями.

В образовании вы переходите от ответа к полноценному обучающему приложению, которое предлагает структурированные уроки, напоминания, викторины и многое другое.

Со времен эпохи Google Now (к которой я постоянно возвращаюсь) меня одерживала идея того, как будет выглядеть разрушение парадигмы приложений. Я давно считал, что приложения — это, в конечном счете, информационные силосы, и что должен быть какой-то поток в стиле Now, который объединял бы все это. Вместо того чтобы переходить к конкретному приложению, чтобы получить доступ к вашей информации, данные должны появляться в централизованном потоке вместе со всем остальным, что принадлежит вам.

Я больше не думаю, что что-то заменит парадигму открытия приложения с главного экрана. Модель приложений слишком укоренилась, и именно так люди ожидают использовать свои основные вычислительные устройства.

Вместо этого, модель, которую я вижу с помощью генеративных пользовательских интерфейсов, заключается в том, что обычная функциональность приложений может быть вызвана и собрана для создания конкретного опыта по мере необходимости для пользователя. Вы переходите от выполнения задач, требующих нескольких посещений разных приложений, к тому, что все находится в одном месте. Это «для всего найдется свое приложение», но для эпохи персонализированного ИИ.