Что Google показала на конференции I/O 2023
Cкладной Pixel Fold, планшет Pixel Tabet и новые возможности ИИ — Google представила фирменные гаджеты, а также продемонстрировала свои новые разработки.
Google в рамках конференции I/O 2023 анонсировала обновление линейки устройств Pixel и продемонстрировала свои достижения в области искусственного интеллекта. Если у вас не было возможности посмотреть презентацию в прямом эфире, мы собрали главные новости в материале.
В поиск Google добавили "снимки" ("snapshots")
Будущее поисковой системы Google будет тесно связано с возможностями искусственного интеллекта. Крупное обновление получило название "snapshots" или "снимки" — это инструмент, довольно экспериментальный, ведь его вид совсем отличается от привычной выдачи ответа в поисковике.
Теперь над результатами основного поиска появляется "снимок", где в кратком виде собран ответ ИИ. Компания продемонстрировала это на нескольких примерах. Так, если попросить Google найти лучшие Bluetooth-колонки для вечеринки, сначала отображаются стандартные результаты поиска, а затем в верхней части экрана отображается блок информации, сгенерированный нейросетью.
В ответе приводятся данные, на что обращать внимание при выборе колонки, несколько ссылок на руководства по выбору, а затем и ссылки на конкретные модели с кратким описанием. Если уточнить свой запрос, добавив "до $100", то резюме обновляется в соответствии с новым критериями.
Так, Google хочет, чтобы ИИ точно сообщал, в каких именно источниках он собрал информацию. И чтобы получить доступ к такой поисковой выдаче, надо присоединиться к программе Search Generative Experience (SGE), которая является частью Search Labs. Пока еще не все поисковые запросы будут приводить к появлению в выдаче ИИ-снимков. Например, на данном этапе вмешательство нейросетей полностью исключено из запросов на важные темы, такие как здоровье или финансы.
"Снимки" ИИ основаны на обновленной версии языковой модели Google (LLM) под названием PaLM 2.
Новое поколение языковой модели
Google представила новое поколение своей языковой модели — PaLM 2. Она была обучена на корпусе из более 100 языков и использует около 540 миллиардов параметров. В новой версии модели также улучшили поддержку языков программирования, написание и отладку кода.
PaLM 2 будет доступна в составе чат-бота Google Bard, а также станет базовой моделью для большинства новых ИИ-функций. Google отмечает, что новая модель лучше подходит для философских рассуждений, математики и логики.
Bard теперь доступен для всех
Google объявил, что чат-бот на базе искусственного интеллекта теперь доступен всем, независимо от того, были ли вы в списке ожидания. В ближайшее время Bard будет поддерживать до 40 самых популярных языков мира, включая украинский и русский.
Кроме того, чат-бот станет наглядным в своих ответах. При запросе достопримечательностей определенного региона или города Bard отправит не только текстовый ответ, но и изображения.
Усиливают цитирование первоисточников информации. Если Bard приводит блок программного кода или цитирует другой контент, можно будет просто нажать на аннотацию, и чат-бот подчеркнет заимствованные части ответа и даст ссылку.
Ц чат-бота появится кнопка "Экспорт", а также он станет мультимодальным, то есть кроме ответов в виде текста и картинок, будут появляться и таблицы. Для генерации изображений компания сотрудничает с Adobe, которая разрабатывает собственный ИИ для создания медиаконтента Firefly.
ИИ сможет отвечать на письма
Google интегрировал чат-бота Bard в Gmail. Например, Bard можно попросить написать приглашение с определенными условиями, ИИ составит письмо в черновиках Gmail, где пользователь уже может внести правки перед рассылкой.
Возможности Bard интегрируют в приложения и службы Google
Google представила Duet AI для Workspace. Это набор инструментов, куда также внедрят искусственный интеллект, среди которых Docs, Sheets, Slides, Meet и Gmail. Инструменты направлены на автоматизацию рабочего процесса. Это включает в себя помощь в написании документов в Docs и Gmail, создание изображений для Slides, автоматическую генерацию резюме для встреч в Meet и многое другое.
В настоящее время функции доступны только тем, кто был в листе ожидания. При этом разработчики отметили, что пользователи смогут контролировать свои настройки конфиденциальности, решая, как использовать эти инструменты и расширения.
"Универсальный переводчик"
Искусственный интеллект способен не только переводить речь человека, записанного на видео, но и адаптировать его артикуляцию к результату перевода на другой язык. "Универсальным переводчиком" Google назвали технологию перевода в видео.
Система распознает речь выступающего на видео человека "на слух" и переводит ее в текстовую форму. Текст уже переводится на нужный язык, из него тут же синтезируется речь с сохранением тембра и эмоциональной окраски. Затем под новую речь на другом языке синхронизируются не только движения губ и мимика, но и жестикуляция. Итоговое видео выглядит так, как будто спикер изначально произносил речь на другом языке.
Android получит обновления на основе ИИ
Новые функции на базе ИИ добавляют и в Android. Например, в приложении "Сообщения" появится Magic Compose, которая даст возможность отвечать на текстовые сообщения, используя предложенные ИИ ответы.
ИИ можно будет использовать для генерации собственных обоев. А в качестве эксклюзивной функции для Pixel — пользователям позволят настроить устройство с помощью новых "кинематических обоев", которые добавляют глубины в существующие фотографии.
В Google Фото добавляет "волшебный редактор"
В Google Photo появятся инструменты редактирования изображений на основе ИИ. С помощью Magic Editor можно перемещать или удалять объекты на фото, редактировать цвета и формы. Кроме редактирования, ИИ может по сути пересоздавать снимки, генерируя новый контент. Бета-версия Magic Editor станет доступна владельцам некоторых смартфонов Pixel в конце этого года.
Экспериментальный музыкальный инструмент ИИ
Компания показала MusicLM — модель для генерации музыки по текстовым запросам. Она доступен в тестовом режиме в приложении AI Test Kitchen для iOS и Android.
"Иммерсивные маршруты"
В Google Maps добавят "Иммерсивные маршруты". Функция позволит просматривать цифровые модели мест и маршрутов на карте. Она также визуализирует информацию о загруженности дорог и погоде в реальном времени.
Новые устройства — планшет Pixel Tablet, складной смартфон Pixel Fold и бюджетный Pixel 7a
Новый планшет Pixel Tablet оснащён процессором Tensor G2, 8 Гб оперативной памяти, 11-дюймовым дисплеем с разрешением 2560 x 1600 пикселей, а также двумя восьмимегапиксельными камерами на передней и задней панели. В кнопку питания встроен сканер отпечатков пальцев. Батарея обеспечивает 12 часов потоковой передачи видео. В комплекте с планшетом идет док-станция с динамиком. Устройство доступно только в конфигурации с Wi-FI (без LTE) по цене $500.
Компания представила и свой первый складной смартфон — Pixel Fold. Он оснащён процессором Tensor 2, 12 Гб оперативной памяти и аккумулятором ёмкостью 4800 мАч, а также 48-мегапиксельная основной камерой с оптической стабилизацией, широкоформатной камерой на 10,8 мегапиксилей и фронтальной на 8,3 мегапикселя. В сложенном виде размер OLED-экрана составляет 5,8 дюйма, в раскрытом — 7,6 дюйма. Дисплеи поддерживают частоту обновления в 120 Гц. Специальный шарнир изготовлен из нержавеющей стали и позволяет складывать устройство, не оставляя зазора между экранами. Смартфон доступен для заказа в США по цене $1799.
Также Google представила обновлённую версию своего бюджетного смартфона — Pixel 7a. Он оснащён процессором Tensor G2 и дисплеем в 6,1 дюйма, который поддерживает частоту кадров в 90 Гц. В базовой версии цена смартфона составляет $499.
Полную версию всей презентации вы можете посмотреть здесь: