Google I/O 2024: Главное событие в прямом эфире: Android 15, Gemini и ИИ

I/O 2024 начинается сегодня — это крупнейшее событие года для Google, где компания расскажет о новинках для пользователей и разработчиков. Gemini и ИИ будут в центре внимания, а также мы ожидаем узнать больше об Android 15.

Как смотреть Google I/O 2024

I/O 2024 в амфитеатре Shoreline в Маунтин-Вью, Калифорния, начнется с двухчасового выступления генерального директора Alphabet и Google Сундара Пичаи в 10:00 по тихоокеанскому времени / 13:00 по восточному времени / 17:00 по Гринвичу. На этой двухдневной конференции будет живая аудитория, и вы можете посмотреть трансляцию мероприятия в прямом эфире на YouTube.

Прямой репортаж (Обновления в обратном хронологическом порядке…)

  • «ИИ» упоминалось 121 раз во время основной презентации, по данным Gemini Advanced
  • LearnLM, основанный на Gemini, призван сделать «учебный процесс более персонализированным»
    • Обеспечивает работу «Тренера по обучению» в Gems
  • SynthID, технология водяных знаков, будет применяться для текста и станет с открытым исходным кодом
  • Что нового для разработчиков на Google I/O 2024
  • Gemini Nano на устройстве добавит мультимодальность в Android. Появится на Pixel позже в этом году
    • TalkBack на базе Gemini Nano появится позже в этом году
    • Предупреждения о «вероятном мошенничестве» в телефонных звонках.
    • Динамические предложения Gemini
  • Google находится на пути многолетней трансформации Android, делая ИИ его ядром
    • Функция «Кружок для поиска» появится на 200 миллионах устройств Android к концу года
    • Gemini становится основополагающей частью пользовательского опыта Android
    • Приложение Gemini теперь открывается как наложение, сохраняя контекст вместо полноэкранного интерфейса
    • Возможности «Спросить этот PDF» + «Спросить это видео»
  • Android Gemini app
  • Android Gemini app
  • Android Gemini app
  • Android Gemini Nano
  • Планирование поездок в Gemini Advanced
  • Gems — это пользовательские Gemini
  • Gemini Live: естественное общение с Gemini с возможностью прерывания
    • Добавление возможностей камеры из Project Astra позже в этом году
  • Gemini AI Teammate в Google Workspace
    • На 2025 год. Вы говорите ему, что делать.
    • Может иметь коллективную память
  • Автоматизация рабочих процессов с помощью ИИ появится в Workspace
  • Gmail на Android и iOS получит функции «Суммаризировать это письмо», вопросы и ответы (похоже на боковую панель на настольных компьютерах, но для мобильных устройств) и Контекстные быстрые ответы. Внедряется в этом месяце для Workspace Labs.
  • Задавайте вопросы к видео в Google Поиске. Используя Google Lens. Понимание вопроса, пофрагментный анализ видео, интеграция с окном длинного контекста Gemini
  • Результаты поиска, организованные с помощью ИИ, начиная с рекомендаций ресторанов и рецептов
  • Многошаговое рассуждение в Google Поиске для сценариев планирования
  • «Google делает работу за вас» — таков девиз компании для поисковых систем на базе генеративного ИИ. Упрощение запросов, требующих более 10 вопросов
  • Google Поиск: информация в реальном времени + системы ранжирования и качества + Gemini
  • Trillium — это TPU (Tensor Processing Unit) 6-го поколения от Google. Улучшение вычислительной мощности в 4,7 раза. Поступит клиентам облака в конце 2024 года
  • Veo: преобразование текста в видео с улучшенной согласованностью, качеством и разрешением вывода. Видео в разрешении HQ 1080p. Можно попробовать в VideoFX, список ожидания на labs.google.
  • Music AI Sandbox
  • Imagen 3: может включать мелкие детали в более длинный запрос. Лучшая модель для рендеринга текста на сегодняшний день
  • Демонстрация в прямом эфире на I/O для участников
  • Некоторые возможности появятся в приложении Gemini в этом году
  • «Новые захватывающие форм-факторы, такие как очки»
  • Astra работает на прототипе умных очков. Выглядит так же, как переводческие очки 2022 года
  • Ранний прототип Project Astra. Синхронная запись в реальном времени
  • Project Astra: цель — создать «универсального ИИ-агента, полезного в повседневной жизни»
    • Объединяет видео- и голосовой ввод в хронологию событий. Кэширование этой информации для эффективного извлечения.
  • Анонсирован Gemini 1.5 Flash: более легкая модель, чем 1.5 Pro. Для случаев использования, где важна низкая задержка и стоимость
  • Сэр Демис (Хассабис) из Google DeepMind выходит на сцену. Долгосрочная цель — создание AGI, человеческого уровня когнитивных способностей
  • Цель Google: «Сделать ИИ полезным для всех»
  • ИИ «Агенты»: интеллектуальные ассистенты, демонстрирующие рассуждение, планирование, память. Могут просчитывать несколько шагов вперед. Работают с программным обеспечением и системами. Под вашим присмотром.
  • Gemini 1.5 Pro появится в NotebookLM с функцией «Аудиообзоры». Сгенерированные аудиообсуждения, с возможностью пользователей присоединяться к беседе и управлять ею в впечатляющей мультимодальной демонстрации
  • Gemini 1.5 Pro теперь доступен в Gmail, боковой панели Workspace. Начинается с Workspace Labs
  • Расширение контекстного окна Gemini 1.5 Pro до 2 млн токенов для разработчиков в закрытом предварительном доступе
  • Gemini Advanced теперь использует Gemini 1.5 Pro с 1 млн токенов на 35 языках
  • Улучшения Gemini 1.5 Pro в переводе, кодировании, рассуждении. Обновленная версия доступна по всему миру сегодня
  • Google Фото получает функцию «Спросить Фото» с Gemini: спросите номер вашего водительского удостоверения + фотографии вашего ребенка, плавающего с течением времени. Разговорный поиск.
  • AI Overview (обзор с помощью ИИ) появляется в Google Поиске в США на этой неделе. Вскоре и в других странах
  • Более 1 миллиона регистраций в Gemini Advanced «всего за 3 месяца»
  • Все 2 миллиарда продуктов Google используют Gemini
  • Более 1,5 миллиона разработчиков используют Gemini
  • «Любой ввод для любого вывода»
  • «Мы находимся на очень ранних этапах сдвига платформы ИИ». — Пичаи
  • Сегодня в Shoreline присутствуют несколько тысяч разработчиков
  • На сцену вышел генеральный директор Сундар Пичаи
  • Видео освещает то, что Google анонсировала за последний год в области ИИ
  • Мы начинаем!
  • Предупреждение за 5 минут
  • Время пушки с футболками
  • Верните птицу, а пока у нас есть демо MusicFX:
  • На стриме сейчас воспроизводится музыка, созданная с помощью ИИ-моделей Google для генерации музыки из изображений
  • На экране в Shoreline: labs.google/gendino/
    • Игра/опыт генеративного ИИ будет доступен до 10:00 по тихоокеанскому времени
  • Трансляция на YouTube, ну, в прямом эфире. И мы уже на своих местах!