Топ-8 ИИ-новинок, представленных Google на конференции I/O-2024

Несколько дней назад прошла ежегодная конференция разработчиков Google, на которой было представлено немало интересных разработок и новых функций. Особое внимание в этом году, разумеется, было уделено развитию продуктов на основе искусственного интеллекта – по подсчетам портала TechCrunch, слово “AI” («ИИ») произносилось на конференции более 120 раз. Давайте посмотрим, какие ИИ-функции и инструменты Google планирует развивать в ближайшее время.

  • Генеративный ИИ в поисковом браузере

Компания будет применять генеративный ИИ для упорядочивания и организации результатов при поисковых запросах. В зависимости от самого запроса, ИИ может генерировать сводки новостей, саммари обсуждений в социальных сетях или списки предложений. В первую очередь Google планирует улучшать с помощью ИИ результаты поиска и выдавать «умные подсказки» – например, если пользователь ищет места для отдыха, рестораны, книги, рецепты и т.д.

  • ИИ-помощник Gemini Live

Компания продолжает совершенствовать свой чат-бота Gemini – на конференции был анонсирован его новый интерфейс под названием Gemini Live. Обновленный чат-бот может более «осмысленно» реагировать на речь пользователей – например, он научился лучше адаптироваться к разной манере речи или прерывать разговор для поиска ответов на уточняющие вопросы, а также реагировать на окружение пользователей с помощью фотографий или видео, снятых на камеру смартфона (в частности, отвечать на вопросы о вещах или местности, находящихся в поле зрения камеры). Запуск Gemini Live запланирован на конец этого года.

Изображение: TechCrunch
Изображение: TechCrunch
  • Генератор видео Veo

Veo – новая ИИ-модель от Google, которая может преобразовывать текст в видеоклипы хорошего качества (1080p) продолжительностью чуть больше минуты. Инструмент может создавать ролики в различных стилях, включая эффект кино, пейзажную съемку и в замедленном режиме, а также вносить изменения и корректировки в уже созданные видео. Модель хорошо справляется с воплощением эффекта движения камеры и различных визуальных эффектов, что способствует реалистичности роликов.

Также генератор способен создать видео из статичного изображения.

  • Функция Ask Photos

Ask Photos – экспериментальная функция по внедрению помощника Gemini в Google Фото, которую планируют запустить этим летом. С её помощью пользователи смогут осуществлять широкий поиск по своей фото-коллекции, используя запросы на естественном языке – например, можно будет попросить найти «лучшую фотографию из отпуска». В таком случае Gemini будет определять лучшее фото с помощью анализа освещения, размытости и отсутствия искажений фона наряду с распознаванием информации о геолокации и датах съемки для выдачи подходящего результата.

Изображение: TechCrunch
Изображение: TechCrunch
  • Gemini в Gmail

Gemini также планируют внедрить и в Gmail – она поможет осуществлять более глубокий поиск, резюмировать стопку писем вместе с вложениями и генерировать имейлы по ключевым словам, а также выполнять более сложные действия – например, обрабатывать заявки о возврате товара по электронному письму.

Кроме того, Gemini сможет извлекать информацию из писем и вставлять её в электронные таблицы – например, даты мероприятий или стоимость товаров.

Изображение: TechCrunch
Изображение: TechCrunch
  • ИИ-защита от спам-звонков

Еще одна функция на базе ИИ будет предупреждать пользователей о потенциальных спам-звонках. Инструмент на основе Gemini Nano планируют внедрить в будущую версию Android. Конкретная дата запуска функции не объявлена, однако известно, что её можно будет отключить по желанию пользователя.

  • ИИ-модели для образования LearnLM

Компания разработала новый набор ИИ-моделей LearnLM, предназначенный для помощи в образовательном процессе. Модели обучены на данных из исследований в области образования; они помогают учителям придумывать интересные темы для уроков, генерировать обучающие викторины и искать материалы по запросу. Как и другие ИИ-инструменты Google, LearnLM построены на базе Gemini.

  • Обновленная ИИ-модель Gemma 2

В июне компания запустит Gemma 2 – новое поколение своей ИИ-модели Gemma. В ней будет 27 млрд параметров (у первых двух стандартных моделей было 2 млрд и 7 млрд параметров соответственно). Больше деталей об обновленном инструменте Google пока не раскрыла.

Топ-8 ИИ-новинок, представленных Google на конференции I/O-2024
Изображение: Google