Google I/O 2024: Главное событие в прямом эфире: Android 15, Gemini и ИИ

Abner Li | Вторник, 14 мая, 2024, 06:47.

I/O 2024 начинается сегодня — это крупнейшее событие года для Google, где компания расскажет о новинках для пользователей и разработчиков. Gemini и ИИ будут в центре внимания, а также мы ожидаем узнать больше об Android 15.

Как смотреть Google I/O 2024

I/O 2024 в амфитеатре Shoreline в Маунтин-Вью, Калифорния, начнется с двухчасового выступления генерального директора Alphabet и Google Сундара Пичаи в 10:00 по тихоокеанскому времени / 13:00 по восточному времени / 17:00 по Гринвичу. На этой двухдневной конференции будет живая аудитория, и вы можете посмотреть трансляцию мероприятия в прямом эфире на YouTube.

Прямой репортаж (Обновления в обратном хронологическом порядке…)

«ИИ» упоминалось 121 раз во время основной презентации, по данным Gemini Advanced
LearnLM, основанный на Gemini, призван сделать «учебный процесс более персонализированным»
- Обеспечивает работу «Тренера по обучению» в Gems
SynthID, технология водяных знаков, будет применяться для текста и станет с открытым исходным кодом
Что нового для разработчиков на Google I/O 2024
Gemini Nano на устройстве добавит мультимодальность в Android. Появится на Pixel позже в этом году
- TalkBack на базе Gemini Nano появится позже в этом году
- Предупреждения о «вероятном мошенничестве» в телефонных звонках.
- Динамические предложения Gemini
Google находится на пути многолетней трансформации Android, делая ИИ его ядром
- Функция «Кружок для поиска» появится на 200 миллионах устройств Android к концу года
- Gemini становится основополагающей частью пользовательского опыта Android
- Приложение Gemini теперь открывается как наложение, сохраняя контекст вместо полноэкранного интерфейса
- Возможности «Спросить этот PDF» + «Спросить это видео»

Планирование поездок в Gemini Advanced
Gems — это пользовательские Gemini
Gemini Live: естественное общение с Gemini с возможностью прерывания
- Добавление возможностей камеры из Project Astra позже в этом году

Gemini AI Teammate в Google Workspace
- На 2025 год. Вы говорите ему, что делать.
- Может иметь коллективную память
Автоматизация рабочих процессов с помощью ИИ появится в Workspace
Gmail на Android и iOS получит функции «Суммаризировать это письмо», вопросы и ответы (похоже на боковую панель на настольных компьютерах, но для мобильных устройств) и Контекстные быстрые ответы. Внедряется в этом месяце для Workspace Labs.

Задавайте вопросы к видео в Google Поиске. Используя Google Lens. Понимание вопроса, пофрагментный анализ видео, интеграция с окном длинного контекста Gemini
Результаты поиска, организованные с помощью ИИ, начиная с рекомендаций ресторанов и рецептов
Многошаговое рассуждение в Google Поиске для сценариев планирования
«Google делает работу за вас» — таков девиз компании для поисковых систем на базе генеративного ИИ. Упрощение запросов, требующих более 10 вопросов
Google Поиск: информация в реальном времени + системы ранжирования и качества + Gemini
Trillium — это TPU (Tensor Processing Unit) 6-го поколения от Google. Улучшение вычислительной мощности в 4,7 раза. Поступит клиентам облака в конце 2024 года
Veo: преобразование текста в видео с улучшенной согласованностью, качеством и разрешением вывода. Видео в разрешении HQ 1080p. Можно попробовать в VideoFX, список ожидания на labs.google.
Music AI Sandbox
Imagen 3: может включать мелкие детали в более длинный запрос. Лучшая модель для рендеринга текста на сегодняшний день

Демонстрация в прямом эфире на I/O для участников
Некоторые возможности появятся в приложении Gemini в этом году
«Новые захватывающие форм-факторы, такие как очки»
Astra работает на прототипе умных очков. Выглядит так же, как переводческие очки 2022 года
Ранний прототип Project Astra. Синхронная запись в реальном времени
Project Astra: цель — создать «универсального ИИ-агента, полезного в повседневной жизни»
- Объединяет видео- и голосовой ввод в хронологию событий. Кэширование этой информации для эффективного извлечения.

Анонсирован Gemini 1.5 Flash: более легкая модель, чем 1.5 Pro. Для случаев использования, где важна низкая задержка и стоимость
Сэр Демис (Хассабис) из Google DeepMind выходит на сцену. Долгосрочная цель — создание AGI, человеческого уровня когнитивных способностей
Цель Google: «Сделать ИИ полезным для всех»
ИИ «Агенты»: интеллектуальные ассистенты, демонстрирующие рассуждение, планирование, память. Могут просчитывать несколько шагов вперед. Работают с программным обеспечением и системами. Под вашим присмотром.
Gemini 1.5 Pro появится в NotebookLM с функцией «Аудиообзоры». Сгенерированные аудиообсуждения, с возможностью пользователей присоединяться к беседе и управлять ею в впечатляющей мультимодальной демонстрации

Gemini 1.5 Pro теперь доступен в Gmail, боковой панели Workspace. Начинается с Workspace Labs
Расширение контекстного окна Gemini 1.5 Pro до 2 млн токенов для разработчиков в закрытом предварительном доступе

Gemini Advanced теперь использует Gemini 1.5 Pro с 1 млн токенов на 35 языках
Улучшения Gemini 1.5 Pro в переводе, кодировании, рассуждении. Обновленная версия доступна по всему миру сегодня
Google Фото получает функцию «Спросить Фото» с Gemini: спросите номер вашего водительского удостоверения + фотографии вашего ребенка, плавающего с течением времени. Разговорный поиск.

AI Overview (обзор с помощью ИИ) появляется в Google Поиске в США на этой неделе. Вскоре и в других странах

Более 1 миллиона регистраций в Gemini Advanced «всего за 3 месяца»
Все 2 миллиарда продуктов Google используют Gemini
Более 1,5 миллиона разработчиков используют Gemini
«Любой ввод для любого вывода»
«Мы находимся на очень ранних этапах сдвига платформы ИИ». — Пичаи
Сегодня в Shoreline присутствуют несколько тысяч разработчиков

На сцену вышел генеральный директор Сундар Пичаи
Видео освещает то, что Google анонсировала за последний год в области ИИ
Мы начинаем!
Предупреждение за 5 минут
Время пушки с футболками
Верните птицу, а пока у нас есть демо MusicFX:

Чертовски, это @marcrebillet! #GoogleIO pic.twitter.com/ZFLoMxdbhR

— Kyle Bradshaw (@SkylledDev) 14 мая 2024 г.

На стриме сейчас воспроизводится музыка, созданная с помощью ИИ-моделей Google для генерации музыки из изображений
На экране в Shoreline: labs.google/gendino/
- Игра/опыт генеративного ИИ будет доступен до 10:00 по тихоокеанскому времени
Трансляция на YouTube, ну, в прямом эфире. И мы уже на своих местах!