Google анонсировала «Workspace Intelligence» и чипы TPU 8t + 8i

На конференции Cloud Next 2026 Google анонсировала «Workspace Intelligence» — систему, призванную предоставлять «высокоточный, персонализированный контекст для каждого приложения».

Эта система «понимает сложные семантические связи» между данными в Gmail, Docs и других приложениях Workspace, вашими активными проектами, коллегами и другой информацией, специфичной для компании. Workspace Intelligence использует возможности поиска Google и продвинутое моделирование Gemini для:


  • Сбор информации: Workspace Intelligence берет на себя основную работу по сбору нужной информации. Она преодолевает информационные барьеры, чтобы у вас было все необходимое в тот момент, когда вы хотите предпринять действие.
  • Осведомленность о ситуации: Используя продвинутое моделирование Gemini, Workspace Intelligence знает, что для вас наиболее важно прямо сейчас, гарантируя, что вы никогда не упустите пункт действий.
  • Настоящая персонализация: Понимая ваши прошлые рабочие и коммуникационные паттерны, Workspace Intelligence изучает ваш уникальный стиль работы, голос и предпочтения в форматировании, чтобы каждый результат звучал как ваш собственный.

Используя глубокий семантический контекст ваших цифровых рабочих процессов, охватывающих заметки о встречах, электронные письма, файлы и многое другое, он создает интеллектуальный уровень, основанный на вашем уникальном контексте, который может коренным образом изменить ваш подход к работе.

Этот фоновый слой обеспечивает работу таких функций, как AI Inbox и AI Overviews в Gmail. Workspace Intelligence также отвечает за новые возможности, такие как «Ask Gemini» в Google Chat. Этот выделенный диалог с Gemini позиционируется как «единая командная строка для всей вашей работы».

Просто изложите свою цель, и Gemini будет работать в фоновом режиме, чтобы доставить готовый результат непосредственно в ваш чат.

Ask Gemini в Chat может выполнять сложные задачи, такие как создание документов и слайдов, поиск файлов по описанию и нахождение подходящего времени для встреч с учетом расписаний всех участников. Он также может создавать ежедневные сводки и интегрироваться со сторонними инструментами, такими как Asana, Jira и Salesforce.

В Google Docs Gemini с помощью Workspace Intelligence может создавать инфографику «на основе ваших бизнес-данных». Он может редактировать несколько изображений одновременно «для создания визуальной согласованности в вашем документе». Другая функция может «обрабатывать комментарии в ваших документах и отвечать на них, а также редактировать ваш документ на основе отзывов по комментариям».

Gemini в Google Slides использует Workspace Intelligence для получения контекста и строгого соблюдения «шаблонов и визуальных стилей вашей компании» при создании презентаций за один проход. В Google Sheets он используется для разговорного создания и редактирования электронных таблиц.

Workspace Intelligence извлекает ваши релевантные электронные письма, чаты, файлы и информацию из Интернета, чтобы превратить идеи в профессионально оформленные черновики, имитирующие ваш точный голос, бренд, стиль и шаблоны компании.

Решение явно брендировать «Workspace Intelligence», а не просто позиционировать функциональность как расширение Gemini, интересно. Тем не менее, этот уровень будет работать в фоновом режиме, и конечные пользователи не должны об этом знать.


Google также анонсировала восьмое поколение Tensor Processing Units. В этом году стоит отметить внедрение «двух отдельных, специально разработанных архитектур для обучения и инференса».

TPU 8t (слева) предназначен для обучения с целью сокращения «цикла разработки передовых моделей с месяцев до недель». Он предлагает на 2,8x лучшую цену/производительность по сравнению с предыдущим поколением. Функции включают:


  • Масштаб: Один суперпод TPU 8t теперь масштабируется до 9600 чипов и двух петабайт общей высокоскоростной памяти, с удвоенной пропускной способностью между чипами по сравнению с предыдущим поколением. Эта архитектура обеспечивает 121 эксафлопс вычислений и позволяет использовать самую сложную память для самых сложных моделей.
  • Максимальная утилизация: Благодаря интеграции более быстрого доступа к хранилищу (в 10 раз быстрее) в сочетании с TPUDirect для прямого извлечения данных в TPU, TPU 8t помогает обеспечить максимальную утилизацию сквозной системы.
  • Почти линейное масштабирование: Наша новая сеть Virgo Network в сочетании с JAX и нашим программным обеспечением Pathways означает, что TPU 8t обеспечивает почти линейное масштабирование до миллиона чипов в одном логическом кластере.

Между тем, TPU 8i (справа) предназначен для инференса или запуска моделей. Он обеспечивает на 80% лучшую производительность на доллар по сравнению с предыдущими моделями, что, по словам Google, позволяет компаниям «обслуживать почти в два раза больший объем клиентов при той же стоимости».


  • Преодоление «проблемы памяти»: Чтобы процессоры не простаивали, TPU 8i сочетает 288 ГБ высокоскоростной памяти с 384 МБ встроенной SRAM — в 3 раза больше, чем у предыдущего поколения, — удерживая активный рабочий набор модели полностью на чипе.
  • Эффективность на базе Axion: Мы удвоили количество физических хостов ЦП на сервер, перейдя на наши пользовательские ЦП Axion на базе Arm. Используя неоднородную архитектуру памяти (NUMA) для изоляции, мы оптимизировали всю систему для превосходной производительности.
  • Масштабирование моделей MoE: Для современных моделей Mixture of Expert (MoE) мы удвоили пропускную способность Interconnect (ICI) до 19,2 Тбит/с. Наша новая архитектура Boardfly сокращает максимальный диаметр сети более чем на 50%, гарантируя, что система работает как единое целое с низкой задержкой.
  • Устранение задержек: Наш новый встроенный движок ускорения коллективных операций (CAE) разгружает глобальные операции, сокращая задержку на чипе до 5 раз и минимизируя лаги.

Примечание: Google Cloud спонсировал расходы на проживание, но не имел никакого влияния на редакционный контент.