Подготовка к I/O 2024: Gemini как последнее «перезагрузка» Google

Abner Li | Пятница, 17 мая, 2024, 06:47.

Изначально меня привлекала Google тем, как она делает крутые и смелые вещи с технологиями доступным/бюджетным способом, чего не делает никто другой.

9to5Google запустил обновленную рассылку, освещающую главные новости Google с дополнительными комментариями и другими подробностями. Подпишитесь здесь!

Когда я стал пользователем экосистемы в 2012 году (первое поколение Nexus 7), у Google был Google Now и намеки на Glass. Первое представляло собой централизованную ленту, отображающую погоду, события календаря, информацию о поездках/путешествиях и многое другое. Это в основном основывалось на собственных данных Google, таких как Gmail, Calendar и Maps, которыми компания уже располагала по умолчанию.

Google Now был интегрирован и легко доступен на Android, прежде чем появился на iOS и Chrome/OS. Карточки использовались для отображения релевантной информации, что позволяло пользователям не открывать различные собственные и сторонние приложения, чтобы увидеть, по сути, ваши данные. Как я сказал в 2021 году, «Google Now разрушил разрозненность данных и представил их в едином и привычном интерфейсе».

Реклама – прокрутите для просмотра большего количества контента

Google Glass был запущен в 2013 году и сделал эти карточки Google Now центральной частью пользовательского интерфейса. Для меня это казалось невероятно футуристичным, и казалось, что Google имеет огромное преимущество. Примерно в то же время Google анонсировала Android Wear, полностью охватывая форм-факторы нового поколения.

Как пользователю продуктов Google, этот трехлетний период был очень захватывающим благодаря той последовательности, которую он принес. Казалось, что у компании было четкое видение того, как ваши данные будут свободны от привязки к приложениям и доступны через Google Now. Параллельная разработка Glass и Android Wear, казалось, указывала на то, что грядет что-то после смартфонов, ориентированных на приложения.

Я думал, что Google создает основу для будущего как в программном, так и в аппаратном обеспечении.

Затем произошло неизбежное. Google Now постепенно выводился из эксплуатации в течение 2016 года и в конечном итоге превратился в Discover и Assistant. Тем временем, то, что Google начала с Glass, никоим образом не является основой для какого-либо будущего оборудования умных очков, над которым она может работать сегодня.

Это стало символом того, как Google имеет привычку сворачивать проекты и заменять их чем-то совершенно иным — с точки зрения UI и UX — вместо того, чтобы развивать то, к чему конечные пользователи уже привыкли.

Последняя перезагрузка — это переход от Google Assistant к Gemini. До того, как мобильные обновления были анонсированы на I/O, я не думаю, что Gemini — это хороший голосовой помощник для телефона, который нужен пользователям Android. Например, невозможность воспроизводить музыку говорит о непонимании того, какой продукт нужен людям в их повседневной жизни.

Тем не менее, по итогам I/O 2024 я думаю, что Google, возможно, перерастает свои тенденции к перезагрузкам.

По сути, Google Now и Assistant зашли в технологический тупик. Я приравниваю оба к предоставлению вспомогательных функций через жестко закодированные правила, где было очень легко столкнуться с ограничениями возможного.

Сегодняшний ИИ выглядит как значительный шаг вперед, который действительно может выполнить обещание виртуального помощника. Google изложила свое видение ИИ-агентов: «Я думаю о них как об интеллектуальных системах, которые демонстрируют рассуждение, планирование и память. Они способны мыслить на несколько шагов вперед, работать с программным обеспечением и системами, чтобы сделать что-то от вашего имени, и, что самое важное, под вашим присмотром».

Сундар Пичаи привел пару «агентных» примеров, начиная с фотографирования обуви, которую вы купили и теперь хотите вернуть. Gemini найдет квитанцию в Gmail, заполнит форму возврата и назначит встречу для вывоза. Более сложный пример заключался в том, что Gemini и Chrome помогают вам переехать в новый город, находя химчистку, выгульщиков собак и другие услуги, а также обновляя ваш адрес в используемых приложениях/на сайтах.

Есть несколько сходств с Google Duplex, термином компании 2018 года для обучения ИИ выполнению задач и экономии вашего времени, которое включало телефонные звонки и заполнение форм в интернете. Этот онлайн-аспект с тех пор был отменен.

Тем временем Google DeepMind говорила о своей цели создать «универсального ИИ-агента, который может быть по-настоящему полезным в повседневной жизни». Для этого Project Astra должен:

«…понимать наш сложный и динамичный мир и реагировать на него так же, как это делаем мы».
«Ему нужно будет воспринимать и запоминать увиденное, чтобы понимать контекст и действовать».
«И он должен быть проактивным, обучаемым и персонализированным, чтобы вы могли общаться с ним естественно, без задержек».

Что Google могла бы сделать лучше с Gemini — и со всеми ее другими устаревшими продуктами — это обеспечить лучший переход от Assistant, начиная с паритета функций, прежде чем предлагать генеративные возможности, такие как создание изображений, о которых, я думаю, большинство людей не просит.

Тем временем, я по-прежнему не думаю, что Gemini — это лучшее название, чем Google Assistant. В широком смысле, стратегия именования компании — «Google» + назначение. Это не интересно, но это естественно информативно.

Есть два способа расти. Либо из собственного желания, либо потому, что вас заставляют внешние обстоятельства. В случае Google существует серьезная конкуренция.

Тем не менее, Google всегда хотела создать персонального помощника, как видно из заявления 2016 года о том, что Assistant — это шаг к созданию вашего собственного Google.

На этот раз кажется, что технологии не будут ограничивать амбиции Google. Скорее, камнем преткновения станет то, как она будет реализована.

Надеюсь, Gemini станет последней перезагрузкой.