Приложения для голосового набора на основе искусственного разума прошли долгий путь за короткое время. Ещё недавно они работали медленно и с ошибками — если только вы не говорили с определённым произношением и не выговаривали каждое слово предельно чётко. Сегодня же надиктовать сообщение, письмо или целую заметку зачастую быстрее и удобнее, чем набирать их на клавиатуре.

Перелом наступил благодаря развитию больших языковых моделей и систем преобразования речи в текст: появились решения, которые точнее распознают сказанное и при этом удерживают достаточно смысла, чтобы правильно оформить готовый текст. Вдобавок разработчики научили программы автоматически убирать слова-паразиты, сглаживать запинки и расставлять знаки препинания — на выходе получается текст, который требует заметно меньше правок.

Поскольку на рынке сейчас десятки подобных программ, мы собрали подборку лучших и наиболее полезных приложений для голосового набора, доступных на сегодняшний день. Важная оговорка: большинство из них рассчитаны прежде всего на английскую речь, однако многие поддерживают и русский язык, а отдельные сервисы — десятки языков сразу. Цены ниже указаны в долларах и евро, так как разработчики в основном зарубежные; оплата из стран СНГ нередко требует зарубежной карты или посредника.

Wispr Flow — гибкая настройка стиля

Wispr Flow — это хорошо профинансированное приложение для диктовки, в котором можно добавлять собственные слова и указания для распознавания. У сервиса есть отдельные приложения для macOS, Windows и iOS; версия для Android пока в разработке.

Программа позволяет подстраивать расшифровку под задачу, выбирая один из стилей: «строгий», «разговорный» и «совсем свободный» — для личной переписки, рабочих заметок и писем. Если совместить её со средами для разработки вроде Cursor, можно включить распознавание названий переменных и упоминание файлов прямо в чате.

Интерфейс Wispr FlowИсточник изображения — Wispr Flow

Бесплатно сервис даёт расшифровать до 2 000 слов в неделю на компьютере и 1 000 слов в месяц на iOS. Платные подписки снимают ограничения и начинаются от $15 в месяц.

Willow — упор на бережное хранение данных

Willow подаёт себя как способ сэкономить время для тех, кто не любит печатать. Помимо привычных функций вроде автоматической правки и оформления, приложение задействует большие языковые модели, чтобы развернуть несколько продиктованных слов в законченный связный текст.

Willow делает ставку на бережное обращение с данными: все расшифровки хранятся прямо на устройстве, а от передачи сведений для обучения модели можно полностью отказаться. Ещё есть пользовательский словарь — он помогает приложению привыкнуть к профессиональным терминам вашей сферы или к особенностям местной речи.

Интерфейс WillowИсточник изображения — Willow

Бесплатно Willow позволяет надиктовать 2 000 слов в месяц в настольной версии. Отдельные тарифы начинаются от $15 в месяц и открывают безлимитную диктовку и запоминание вашего стиля письма.

Monologue — всё остаётся на устройстве

Если для вас на первом месте сохранность данных, Monologue позволяет загрузить модель искусственного разума прямо на устройство и расшифровывать речь, полностью обходясь без облака. Кроме того, приложение подстраивает тон текста под то, в какой программе вы сейчас работаете.

Бесплатно Monologue даёт расшифровать 1 000 слов в месяц; подписка стоит $10 в месяц или $100 в год. Самым активным пользователям разработчики высылают физическую кнопку быстрого запуска под названием Monokey для работы с приложением.

Superwhisper — выбор моделей и тонкая настройка

Superwhisper — в первую очередь приложение для диктовки, но оно справляется и с расшифровкой аудио- и видеофайлов. Здесь можно выбирать и загружать модели искусственного разума, в том числе несколько собственных — с разной скоростью и точностью, — а также модели распознавания речи Parakeet от Nvidia.

Программа разрешает писать собственные указания для управления результатом, а также просматривать обработанные и исходные расшифровки прямо из системной клавиатуры.

Базовое преобразование голоса в текст бесплатно, а на знакомство с Pro-возможностями (перевод и расшифровка файлов) даётся 15 минут. Платная версия позволяет подставлять собственные ключи доступа к моделям и подключать облачные и местные модели без ограничений.

Месячный тариф стоит $8,49, годовой — $84,99, либо можно один раз заплатить $249,99 за пожизненный доступ.

VoiceTypr — без интернета и без подписки

VoiceTypr работает по принципу «без интернета и без подписки», используя для расшифровки местные модели. Для тех, кто хочет развернуть открытую версию самостоятельно, есть репозиторий на GitHub. VoiceTypr поддерживает более 99 языков и работает на Mac и Windows.

Приложение можно бесплатно опробовать в течение трёх дней, после чего предлагается купить пожизненную лицензию. Стоимость: $35 за одно устройство, $56 за два и $98 за четыре.

Aqua — ставка на скорость

Aqua — приложение для голосового ввода для Windows и macOS, поддержанное акселератором Y Combinator; оно претендует на звание одного из самых быстрых в своём классе по задержке (времени между вашей речью и появлением текста на экране).

Помимо работы с грамматикой и пунктуацией, Aqua умеет подставлять текст по голосовым командам — например, можно сказать «мой адрес», и приложение впишет его целиком.

Кроме того, у Aqua есть собственный программный интерфейс для преобразования речи в текст, так что к её движку расшифровки могут подключаться другие приложения.

Бесплатный тариф даёт 1 000 слов в месяц. Платные планы начинаются от $8 в месяц при оплате за год и снимают ограничение на число слов, а также открывают 800 пользовательских записей в словаре.

Handy — простой и полностью бесплатный

Handy — это бесплатный инструмент расшифровки с открытым исходным кодом для Mac, Windows и Linux. Приложение довольно простое и не предлагает богатых настроек, но если вы хотите чаще пользоваться голосом и при этом ничего не платить — это хороший вариант.

В нём есть несложное меню настроек, где можно включить режим «зажми и говори» и сменить горячую клавишу для запуска расшифровки.

Typeless — щедрый бесплатный лимит

Typeless выделяется большим бесплатным запасом слов. Разработчики утверждают, что не сохраняют никаких данных и не используют их для обучения моделей. Ещё Typeless умеет переписывать неудачно построенные предложения.

На бесплатном тарифе можно надиктовать до 4 000 слов в неделю (около 16 000 слов в месяц). За $12 в месяц при годовой оплате открываются безлимитный набор и доступ к новым возможностям. Typeless доступен только для Windows и macOS.

VoiceInk — открытый код и работа с контекстом

VoiceInk — приложение для диктовки с открытым исходным кодом и бережным отношением к данным, выпущенное для Mac. Оно поддерживает глобальные сочетания клавиш для начала и остановки записи, а также режим «зажми и говори». Программа считывает то, что происходит на экране, и подстраивает результат под обстановку.

VoiceInk может сам распознавать определённые приложения и адреса страниц и применять к ним заданные правила оформления. Есть и режим помощника, способный отвечать на ваши вопросы. Стоимость: $25 за пожизненный доступ на одно устройство, $39 на два и $49 на три.

Dictato — мгновенный отклик на Mac

Dictato — приложение для диктовки для Mac стоимостью €9,99 (примерно $12), что даёт пожизненный доступ и два года обновлений. Оно работает с офлайн-моделями вроде Parakeet, Whisper и Apple Speech Analyzer, а для лёгкой правки текста и удаления слов-паразитов задействует Apple Intelligence. Благодаря местным моделям разработчики заявляют о сверхнизкой задержке в 80 мс — текст появляется почти мгновенно вслед за сказанным.

AudioPen — от голосовых заметок к расшифровке

AudioPen начинался как веб-сервис для голосовых заметок, но со временем разросся. Его версия для Mac теперь позволяет надиктовывать текст и переписывать его в нужном формате и стиле, переключаясь между ними в любой момент. Помимо прямой расшифровки, AudioPen умеет хранить голосовые заметки на разных платформах, объединять их в сводки, загружать аудиофайлы и переписывать готовые заметки с помощью искусственного разума. Стоимость: $33 за три месяца, $99 за год и $159 за два года.

Как выбрать приложение под себя

Если для вас важнее всего сохранность данных, обратите внимание на Monologue, VoiceTypr, Handy или VoiceInk — они умеют работать на устройстве без отправки записей в облако. Тем, кто часто переключается между перепиской, письмами и рабочими заметками, подойдут Wispr Flow и Willow с гибкой настройкой стиля. Если не хочется привязываться к подписке, присмотритесь к решениям с пожизненной лицензией — VoiceTypr, VoiceInk или Dictato. А когда нужен максимально щедрый бесплатный лимит, начните с Typeless.