Какие функции Gemini и Google AI мы ждем

За последний год Google анонсировал ряд функций на базе Gemini и других ИИ-технологий для своих потребительских приложений. Вот все, что было объявлено, и когда это может появиться.

Pixel

На презентации Made by Google 2023 была анонсирована функция Zoom Enhance для Pixel 8 Pro, которая «интеллектуально заполняет пробелы между пикселями и предсказывает мелкие детали». Используя «специальную генеративную ИИ-модель изображения» на устройстве, Google позиционировал ее как полезную, когда вы забыли увеличить изображение.

Это невероятное применение генеративного ИИ, открывающее ряд возможностей для кадрирования и редактирования ваших изображений. Так что то увеличение масштаба, которое вы раньше видели в научной фантастике, теперь прямо в телефоне в вашей руке.

В октябре Google заявил, что функция «появится позже». После трех обновлений Pixel Feature Drops она так и не появилась. Неясно, относится ли модель, о которой говорит Google, к Gemini Nano с мультмодальностью. На данный момент она может быть представлена вместе с Pixel 9 Pro как главная фотофункция этого телефона.

Google Home

В приложении Google Home генеративный ИИ будет использоваться для суммирования событий в «упорядоченном представлении последних событий». Этот «быстрый и простой сводный отчет» будет использовать маркированные списки, а также вы сможете в разговорной форме «спрашивать о вашем доме», чтобы находить фрагменты видеоистории и получать автоматизации. «Экспериментальные функции» появятся у подписчиков Nest Aware в 2024 году.

Реклама — прокрутите дальше, чтобы увидеть контент

Fitbit

Fitbit Labs позволит пользователям Fitbit Premium тестировать экспериментальные ИИ-возможности и предоставлять обратную связь.

Одной из таких функций является чат-бот, который позволяет задавать вопросы о ваших данных Fitbit в естественной и разговорной манере. Эта «персонализированная тренировка», учитывающая фитнес-цели, направлена на создание «действенных сообщений и рекомендаций» с ответами, которые могут включать пользовательские диаграммы.

  • «Например, вы можете глубже изучить, сколько активных минут в зоне (AZM) вы получаете, и как это коррелирует с тем, насколько восстановительным является ваш сон».
  • «…эта модель может анализировать вариации в ваших моделях сна и качестве сна, а затем предлагать рекомендации о том, как изменить интенсивность тренировки на основе этих данных».

За кулисами это работает благодаря новой Personal Health LLM от Fitbit и Google Research, построенной на базе Gemini. По состоянию на март, она «появится позднее в этом году» для «ограниченного числа пользователей Android, зарегистрированных в программе Fitbit Labs в мобильном приложении Fitbit».

Google Photos

Ask Photos позволит вам задавать вопросы об изображениях и видео в вашей библиотеке. Помимо поиска фотографий, он может извлекать информацию и давать текстовый ответ. Работает на базе Gemini. Пример запросов: «Покажи мне лучшую фотографию из каждого национального парка, который я посетил» и «Какие темы были у праздников Лены в день рождения?» Его можно использовать для «предложения лучших фотографий» и создания подписей к ним. Ask Photos — это «экспериментальная функция», которая скоро появится, а Google уже намекает на больше возможностей в будущем.

Gmail + Google Workspace

В Gmail для Android и iOS вы найдете кнопку Gemini в правом верхнем углу, которая позволяет открыть мобильный аналог боковой панели для ввода полных запросов. Gmail также получит контекстные умные ответы, предлагающие более индивидуальные, подробные и тонкие предложения. Это будет внедряться в Workspace Labs в июле.

На конференции Cloud Next 2024 в апреле Google также представил функцию голосового ввода для «Помоги мне написать» в мобильном Gmail. Тем временем, функция «мгновенной полировки» «преобразует черновики в полное электронное письмо одним щелчком мыши».

На настольной версии в Gmail, Google Drive и Docs/Sheets/Slide доступна боковая панель. Gemini будет добавлен в Google Chat для суммирования разговоров и ответов на вопросы.

Google Maps

В феврале Google объявил, что Maps будет использовать LLM для работы чат-бота «Спроси о». Вы можете использовать его для поиска мест, соответствующих вашему запросу, с поддержкой последующих вопросов. Он работает на основе данных о 250 миллионах мест и загруженных пользователями фотографиях, видео и отзывах.

Chrome

Gemini Nano появится в настольном Chrome для обеспечения работы таких функций браузера, как «Помоги мне написать». Он должен быть доступен на большинстве современных ноутбуков и настольных компьютеров.

Помимо запуска AI Overviews, Google анонсировал ряд предстоящих функций, которые сначала появятся в Search Labs:

  • Вы сможете взять исходный AI Overview и сделать его «Проще» (всего несколько предложений) или «Разбить на части» (более длинный ответ).
  • Возможности многоэтапных рассуждений позволят вам задавать сложный вопрос за один раз, а не разбивать его на несколько запросов.
  • Планирование питания и поездок
  • Страница результатов поиска, организованная ИИ
  • Видеопоиск: Запишите видео и задайте вопрос о нем

Android 

Gemini Nano с мультмодальностью будет запущен на Pixel «позже в этом году» и будет обеспечивать работу таких функций, как описания TalkBack на устройстве/офлайн и оповещения о мошенничестве в реальном времени, которые слушают звонок на наличие характерных паттернов. Google поделится более подробной информацией позже в этом году.

На I/O 2024 Google также продемонстрировал, как Gemini на Android скоро станет наложением, а не полноэкранным интерфейсом для отображения результатов. Помимо сохранения контекста, это позволит вам перетаскивать сгенерированное изображение в беседу. Для подписчиков Gemini Advanced кнопки «Спросить это видео» и «Спросить этот PDF» позволят Gemini анализировать видео и документы соответственно. Это будет внедряться «в течение следующих нескольких месяцев». Кроме того, Dynamic Suggestions будет использовать Gemini Nano с мультмодальностью для понимания того, что находится на вашем экране:

Например, если вы активируете Gemini в разговоре о пиклболе, предложения могут включать «Найти клубы пиклбола рядом со мной» и «Правила пиклбола для начинающих».

  • Android Gemini app
  • Android Gemini app
  • Android Gemini app

Еще одним дополнением, которое будет особенно полезно на мобильных устройствах, являются расширения Gemini для Google Calendar, Tasks и Keep. Это позволит вам сфотографировать страницу с несколькими предстоящими датами, которые Gemini сможет преобразовать в события календаря. В ближайшие месяцы раздел «Утилиты» позволит мобильному Gemini получать доступ к приложению «Часы» на Android.

Мы также ожидаем появления мобильного Gemini на Pixel Tablet этим летом.

Gemini 

Live позволит вам вести двусторонний диалог с Gemini. Чтобы сделать взаимодействие более естественным, Gemini будет возвращать краткие ответы, которые вы сможете прервать, чтобы добавить новую информацию или запросить уточнение. Вы можете выбирать из 10 различных голосов, а Google представляет Gemini Live как полезный для подготовки к интервью или репетиции речи. Он будет доступен «в ближайшие месяцы» для подписчиков Gemini Advanced.

«Позже в этом году» Gemini Live позволит вам включить режим прямой камеры. Просто наведите на что-нибудь в реальном мире и задайте вопрос. Это работает благодаря Project Astra.

Gems — это индивидуальные версии Gemini, которые позволяют вам иметь «партнера по тренировкам, помощника шеф-повара, партнера по программированию или руководство по творческому письму». Подписчики Gemini Advanced смогут создавать свои собственные, в то время как все пользователи будут иметь доступ к готовым Gems, таким как Learning Coach.

Просто опишите, что вы хотите, чтобы ваш Gem делал и как он должен отвечать — например, «ты мой тренер по бегу, дай мне план ежедневных пробежек и будь позитивным, бодрым и мотивирующим». Gemini примет эти инструкции и одним щелчком мыши улучшит их, чтобы создать Gem, соответствующий вашим конкретным потребностям.

Пользователи Gemini Advanced также получат «иммерсивный планировщик», который выходит за рамки простого предложения мероприятий, а фактически учитывает время в пути и остановки, а также интересы людей, чтобы создать подробный маршрут. Gemini будет использовать данные о рейсах/путешествиях из Gmail, рекомендации Google Maps для еды и музеев рядом с вашим отелем, а также Поиск для других мероприятий.