Google меняет способ общения с ИИ: от команд к естественной речи

Более десяти лет назад Amazon и Google научили мир разговаривать с искусственным разумом. Через Amazon Alexa и Google Assistant люди освоили слова-активаторы и научились формулировать запросы на естественном языке, чтобы ставить будильники, включать музыку, управлять умным домом и искать сведения. В 2026 году правила игры поменялись. Если у нынешнего Google I/O и есть сквозная тема помимо ИИ-исполнителей, то это смена самого представления Google о том, как мы будем разговаривать с искусственным разумом. Десятки показанных нововведений используют голосовой ввод — но в нарочито неотшлифованном виде, где задача распознать намерение и действовать соответственно полностью ложится на Gemini. У этой перемены есть побочный эффект: Google хочет, чтобы пользователи свободно болтали с ИИ для решения задач, но попутно они могут начать меньше думать в принципе.

Источник изображения: Google

Rambler: клавиатура, которая редактирует за вас

Возьмём Rambler — обновлённую версию преобразования речи в текст для Gboard, которую Google продемонстрировал на The Android Show: Google I/O 2026 Edition 12 мая (в районе 19:00 МСК). «С Rambler не нужно подбирать точные слова перед началом, — пишет Google. — Вы можете говорить естественно, а функция сама вытащит важные части и соберёт их в краткое сообщение». Модель Rambler, входящая в новый пакет Gemini Intelligence, способна отсеивать слова-паразиты вроде «э-э» и «м-м» и улавливать суть, не транскрибируя ваш монолог дословно.

Принципиально новое — обработка поправок на лету. Если вы говорите «встретимся в нашей кофейне в среду в 15:00… нет, в 14:00», Rambler сам исправит время в итоговом тексте, не оставив следов от первой попытки. Не менее важна и поддержка переключения между языками внутри одной фразы — то, что билингвы делают постоянно в разговорах с близкими, и с чем традиционные диктофонные приложения справляются плохо. Google в качестве примера приводит чередование английского и хинди, но мультиязычная модель Gemini, на которой работает Rambler, поддерживает и другие комбинации.

У функции есть как минимум одно очевидное преимущество для людей с ограниченными возможностями: расшифровка и редактирование сообщения происходят одновременно, без необходимости касаться клавиатуры. Возможность отправить длинное сообщение, когда одна или обе руки заняты, теоретически полезна каждому. Что касается приватности — Google уточняет, что Gboard будет явно показывать, когда Rambler активен, голосовые записи нигде не сохраняются, а аудио используется только для расшифровки в реальном времени. Обработка комбинированная: часть запроса выполняется на устройстве, часть — в облаке.

Rambler запустится летом 2026 года сначала на смартфонах Pixel и Samsung Galaxy, а затем доедет до остальных устройств на Android 17. У владельцев iPhone уже несколько месяцев существует похожий по идее эксперимент Google — приложение Google AI Edge Eloquent, использующее модели на устройстве для очистки расшифровок речи.

Зачем Google вообще лезет в эту нишу

Приложение для управления задачами Todoist исследует схожие идеи в функции Ramble, позволяющей надиктовать список дел, а создание и сортировку задач оставить на ИИ. В Кремниевой долине, как сообщает The Wall Street Journal, уже наблюдается общий поворот к голосовой диктовке в корпоративных пространствах. Приложения вроде Wispr Flow, Typeless, Monologue и Superwhisper позволяют говорить или шептать в компьютер, преобразуя речь в текст и автоматически редактируя его под тон и стиль приложения. В здравоохранении многие врачи уже встроили ИИ-расшифровщиков в приём пациентов, чтобы не отвлекаться на заметки.

То, что предлагает Google, — это преимущества подобных инструментов без сторонней подписки и без дополнительного приложения. Использовать функцию можно на любом устройстве под управлением Android 17, а сам Gboard стоит по умолчанию на сотнях миллионов телефонов. Для стартапов вроде Wispr Flow и Typeless это серьёзный удар: их основное преимущество — качество расшифровки и удобство — теперь будет встроено в клавиатуру бесплатно.

Docs Live, Keep Live, Gmail Live: Gemini переезжает в Workspace

Docs Live, представленный на основном Google I/O 19–20 мая, — один из нескольких примеров интеграции опыта Gemini Live (живых голосовых чатов с Gemini) в другие сервисы компании. С Docs Live вы можете просто разговаривать с моделью, а она создаст готовый Google Doc на основе сказанного. «Просто говорите, а Docs Live возьмёт на себя всю тяжёлую работу — упорядочит ваши мысли, выстроит структуру документа и, с вашего разрешения, подтянет нужные детали из Gmail, Drive, Chat и интернета», — обещает Google.

В демоверсии Google показала инженера-программиста, которого позвали выступить в родном вузе и рассказать студентам о карьере. Пользователь надиктовывает Docs Live одним потоком: вытащить данные из резюме в Drive, добавить логистику мероприятия из переписки в Gmail, вкинуть пару забавных историй — всё единой неотрепетированной речью. Заявленная цель — сделать так, чтобы голосовые запросы могли быть длиннее и сложнее, чем кто-либо стал бы набирать руками, а модель достаточно сильна, чтобы не потерять нить, когда говорящий перескакивает с темы на тему.

Keep Live приносит ту же логику в приложение для заметок. В Keep появляется новая плавающая кнопка с иконкой Live над «Создать заметку»; нажатие открывает полноэкранный режим со звуковой волной по периметру. Говорите — Keep Live превратит поток сознания в аккуратные заметки или списки. Причём один разговор может породить несколько разных заметок: Google сама их разделит. Перед сохранением заметку можно поправить голосом или жестами.

Gmail Live превращает голосовые чаты с ИИ в более быстрый способ поиска по почте. Вместо того чтобы вводить поисковые запросы, вы можете спросить почтовый ящик голосом: какой выход у вашего рейса, код подтверждения с Airbnb, расписание ребёнка в школе — и получить ответы, собранные из ваших же писем. По сути, это исполнитель для почты, способный обрабатывать многошаговые запросы.

Что остаётся за кадром демонстраций

В сценариях использования этих нововведений упускается из виду то, что они устраняют. Тот самый инженер-программист в ролике про Docs Live — его пример показателен. Возвращение в альма-матер и рассказ студентам о карьерном пути — переживание, которое, по крайней мере гипотетически, было бы достаточно значимым, чтобы захотеть написать речь самому. Но вместо этого пользователь в демо перекладывает задачу на Docs Live. Не все рождаются писателями — кажется намеренным выбором Google указать, что это именно инженер, — но способность ясно мыслить и выражать собственные мысли и чувства выходит далеко за рамки карьерного пути.

То же касается и Rambler. Почти каждый в какой-то момент жизни ломает голову над значением или намерением чужого текстового сообщения, но Rambler позволяет переложить часть этой напряжённой (но ценной) работы на ИИ. С точки зрения Google, это упрощает доступ к технологии. С точки зрения долгосрочного навыка — это снимает с пользователя обязанность учиться формулировать.

Раньше: чтобы добиться от голосового исполнителя нужного результата, приходилось чётко продумывать команду — «включи свет в гостиной», «поставь будильник на 7 утра». Структура запроса заставляла думать.
Сейчас: Rambler и Live-функции принимают на вход поток сознания и отдают на выходе отшлифованный текст. Качество входа Google интересует всё меньше, если выход устраивает пользователя.
Что меняется: работа по уточнению намерения — формулировка мысли — переносится с человека на модель. Удобство в моменте, но без тренировки навыка в перспективе.

Кому это станет доступно и за какие деньги

Никто не обязан пользоваться этими инструментами, и в случае Docs Live, Keep Live и Gmail Live они на старте будут доступны только платным подписчикам Google AI Pro, Google AI Ultra и бизнес-версии Google Workspace, с раскаткой летом 2026 года. Rambler же остаётся бесплатным и привязан только к наличию Android 17 на устройстве — у Google здесь явная фора за счёт самого распространённого мобильного клавиатурного приложения в мире.

Обилие голосовых функций ИИ заставляет задуматься, чему они научат частых пользователей в отношении самого искусственного разума. Google Assistant и Amazon Alexa со временем стали лучше понимать причуды человеческой речи, но структура большинства диалогов с ними по-прежнему сводилась к роботизированному «запрос — ответ», потому что это был единственный надёжный способ получить желаемое. Нужно было сообразить, какую именно лампочку вы хотите включить через Google Assistant или какой «навык» вызвать в Alexa, и говорить соответственно. Сейчас Google куда меньше интересует качество и чёткость вашего ввода — главное, чтобы выход вас устроил, что в эпоху больших языковых моделей оказывается более лёгкой задачей, чем раньше.

Чем станет Google Docs, когда вам не нужно сильно думать о том, что вы хотите написать? Или Google Messages, когда формулирование сообщения отдано на откуп исполнителю? Новые функции Google вполне могут оказаться полезны миллионам — но, требуя меньше реальных размышлений, они способны полностью изменить то, как люди думают.

Google меняет способ общения с ИИ: от команд к естественной речи

Rambler: клавиатура, которая редактирует за вас

Зачем Google вообще лезет в эту нишу

Docs Live, Keep Live, Gmail Live: Gemini переезжает в Workspace

Что остаётся за кадром демонстраций

Кому это станет доступно и за какие деньги

Популярное

ЕС обвинил Instagram и Facebook в аддиктивном дизайне: Meta грозит штраф до $12 млрд

Meta вынуждена вернуть Китаю AI-стартап Manus: Tencent выкупает актив за $2 млрд

SK hynix привлекла $26,5 млрд на Nasdaq — крупнейшее IPO иностранной компании в истории США

Baldur's Gate 3: Одурманенная лягушка и тайник в Гнилостной трясине

Hunter x Hunter возвращается: долгожданное продолжение после полутора лет паузы

Лучшие материалы

Роман с Минтарой в Baldur's Gate 3: Ключевые требования и потенциальные последствия

Google меняет способ общения с ИИ: от команд к естественной речи

Rambler: клавиатура, которая редактирует за вас

Зачем Google вообще лезет в эту нишу

Docs Live, Keep Live, Gmail Live: Gemini переезжает в Workspace

Что остаётся за кадром демонстраций

Кому это станет доступно и за какие деньги

Intel Core Ultra 5 245K подешевел до $179: скидка 42% на 14-ядерный процессор Arrow Lake

Meta вынуждена вернуть Китаю AI-стартап Manus: Tencent выкупает актив за $2 млрд

J-пространство Claude: Anthropic нашла у ИИ подобие «рабочей памяти» сознания

SK hynix и TetraMem представили мемристорный SoC для ИИ на edge-устройствах

ЕС обвинил Instagram и Facebook в аддиктивном дизайне: Meta грозит штраф до $12 млрд

Meta вынуждена вернуть Китаю AI-стартап Manus: Tencent выкупает актив за $2 млрд

SK hynix привлекла $26,5 млрд на Nasdaq — крупнейшее IPO иностранной компании в истории США

Baldur's Gate 3: Одурманенная лягушка и тайник в Гнилостной трясине

Hunter x Hunter возвращается: долгожданное продолжение после полутора лет паузы

Роман с Минтарой в Baldur's Gate 3: Ключевые требования и потенциальные последствия