
I/O 2024 начинается сегодня — это крупнейшее событие года для Google, где компания расскажет о новинках для пользователей и разработчиков. Gemini и ИИ будут в центре внимания, а также мы ожидаем узнать больше об Android 15.
Как смотреть Google I/O 2024
I/O 2024 в амфитеатре Shoreline в Маунтин-Вью, Калифорния, начнется с двухчасового выступления генерального директора Alphabet и Google Сундара Пичаи в 10:00 по тихоокеанскому времени / 13:00 по восточному времени / 17:00 по Гринвичу. На этой двухдневной конференции будет живая аудитория, и вы можете посмотреть трансляцию мероприятия в прямом эфире на YouTube.
Прямой репортаж (Обновления в обратном хронологическом порядке…)
- «ИИ» упоминалось 121 раз во время основной презентации, по данным Gemini Advanced
- LearnLM, основанный на Gemini, призван сделать «учебный процесс более персонализированным»
- Обеспечивает работу «Тренера по обучению» в Gems
- SynthID, технология водяных знаков, будет применяться для текста и станет с открытым исходным кодом
- Что нового для разработчиков на Google I/O 2024
- Gemini Nano на устройстве добавит мультимодальность в Android. Появится на Pixel позже в этом году
- TalkBack на базе Gemini Nano появится позже в этом году
- Предупреждения о «вероятном мошенничестве» в телефонных звонках.
- Динамические предложения Gemini
- Google находится на пути многолетней трансформации Android, делая ИИ его ядром
- Функция «Кружок для поиска» появится на 200 миллионах устройств Android к концу года
- Gemini становится основополагающей частью пользовательского опыта Android
- Приложение Gemini теперь открывается как наложение, сохраняя контекст вместо полноэкранного интерфейса
- Возможности «Спросить этот PDF» + «Спросить это видео»
- Планирование поездок в Gemini Advanced
- Gems — это пользовательские Gemini
- Gemini Live: естественное общение с Gemini с возможностью прерывания
- Добавление возможностей камеры из Project Astra позже в этом году


- Gemini AI Teammate в Google Workspace
- На 2025 год. Вы говорите ему, что делать.
- Может иметь коллективную память
- Автоматизация рабочих процессов с помощью ИИ появится в Workspace
- Gmail на Android и iOS получит функции «Суммаризировать это письмо», вопросы и ответы (похоже на боковую панель на настольных компьютерах, но для мобильных устройств) и Контекстные быстрые ответы. Внедряется в этом месяце для Workspace Labs.
- Задавайте вопросы к видео в Google Поиске. Используя Google Lens. Понимание вопроса, пофрагментный анализ видео, интеграция с окном длинного контекста Gemini
- Результаты поиска, организованные с помощью ИИ, начиная с рекомендаций ресторанов и рецептов
- Многошаговое рассуждение в Google Поиске для сценариев планирования
- «Google делает работу за вас» — таков девиз компании для поисковых систем на базе генеративного ИИ. Упрощение запросов, требующих более 10 вопросов
- Google Поиск: информация в реальном времени + системы ранжирования и качества + Gemini
- Trillium — это TPU (Tensor Processing Unit) 6-го поколения от Google. Улучшение вычислительной мощности в 4,7 раза. Поступит клиентам облака в конце 2024 года
- Veo: преобразование текста в видео с улучшенной согласованностью, качеством и разрешением вывода. Видео в разрешении HQ 1080p. Можно попробовать в VideoFX, список ожидания на labs.google.
- Music AI Sandbox
- Imagen 3: может включать мелкие детали в более длинный запрос. Лучшая модель для рендеринга текста на сегодняшний день
- Демонстрация в прямом эфире на I/O для участников
- Некоторые возможности появятся в приложении Gemini в этом году
- «Новые захватывающие форм-факторы, такие как очки»
- Astra работает на прототипе умных очков. Выглядит так же, как переводческие очки 2022 года
- Ранний прототип Project Astra. Синхронная запись в реальном времени
- Project Astra: цель — создать «универсального ИИ-агента, полезного в повседневной жизни»
- Объединяет видео- и голосовой ввод в хронологию событий. Кэширование этой информации для эффективного извлечения.

- Анонсирован Gemini 1.5 Flash: более легкая модель, чем 1.5 Pro. Для случаев использования, где важна низкая задержка и стоимость
- Сэр Демис (Хассабис) из Google DeepMind выходит на сцену. Долгосрочная цель — создание AGI, человеческого уровня когнитивных способностей
- Цель Google: «Сделать ИИ полезным для всех»
- ИИ «Агенты»: интеллектуальные ассистенты, демонстрирующие рассуждение, планирование, память. Могут просчитывать несколько шагов вперед. Работают с программным обеспечением и системами. Под вашим присмотром.
- Gemini 1.5 Pro появится в NotebookLM с функцией «Аудиообзоры». Сгенерированные аудиообсуждения, с возможностью пользователей присоединяться к беседе и управлять ею в впечатляющей мультимодальной демонстрации

- Gemini 1.5 Pro теперь доступен в Gmail, боковой панели Workspace. Начинается с Workspace Labs
- Расширение контекстного окна Gemini 1.5 Pro до 2 млн токенов для разработчиков в закрытом предварительном доступе

- Gemini Advanced теперь использует Gemini 1.5 Pro с 1 млн токенов на 35 языках
- Улучшения Gemini 1.5 Pro в переводе, кодировании, рассуждении. Обновленная версия доступна по всему миру сегодня
- Google Фото получает функцию «Спросить Фото» с Gemini: спросите номер вашего водительского удостоверения + фотографии вашего ребенка, плавающего с течением времени. Разговорный поиск.

- AI Overview (обзор с помощью ИИ) появляется в Google Поиске в США на этой неделе. Вскоре и в других странах

- Более 1 миллиона регистраций в Gemini Advanced «всего за 3 месяца»
- Все 2 миллиарда продуктов Google используют Gemini
- Более 1,5 миллиона разработчиков используют Gemini
- «Любой ввод для любого вывода»
- «Мы находимся на очень ранних этапах сдвига платформы ИИ». — Пичаи
- Сегодня в Shoreline присутствуют несколько тысяч разработчиков

- На сцену вышел генеральный директор Сундар Пичаи
- Видео освещает то, что Google анонсировала за последний год в области ИИ
- Мы начинаем!
- Предупреждение за 5 минут
- Время пушки с футболками
- Верните птицу, а пока у нас есть демо MusicFX:
- На стриме сейчас воспроизводится музыка, созданная с помощью ИИ-моделей Google для генерации музыки из изображений
- На экране в Shoreline: labs.google/gendino/
- Игра/опыт генеративного ИИ будет доступен до 10:00 по тихоокеанскому времени
- Трансляция на YouTube, ну, в прямом эфире. И мы уже на своих местах!

