Приложения для диктовки достигли высокой точности благодаря большим языковым моделям
Лучшие сервисы автоматически убирают слова-паразиты и исправляют оговорки
Wispr Flow и Willow позволяют настраивать стиль расшифровки — от строгого до разговорного
Superwhisper и VoiceTypr дают возможность выбирать модели искусственного разума для обработки прямо на устройстве, без подписки
Приложения для голосового набора на основе искусственного разума прошли долгий путь за короткое время. Ещё недавно они работали медленно и с ошибками — если только вы не говорили с определённым произношением и не выговаривали каждое слово предельно чётко. Сегодня же надиктовать сообщение, письмо или целую заметку зачастую быстрее и удобнее, чем набирать их на клавиатуре.
Перелом наступил благодаря развитию больших языковых моделей и систем преобразования речи в текст: появились решения, которые точнее распознают сказанное и при этом удерживают достаточно смысла, чтобы правильно оформить готовый текст. Вдобавок разработчики научили программы автоматически убирать слова-паразиты, сглаживать запинки и расставлять знаки препинания — на выходе получается текст, который требует заметно меньше правок.
Поскольку на рынке сейчас десятки подобных программ, мы собрали подборку лучших и наиболее полезных приложений для голосового набора, доступных на сегодняшний день. Важная оговорка: большинство из них рассчитаны прежде всего на английскую речь, однако многие поддерживают и русский язык, а отдельные сервисы — десятки языков сразу. Цены ниже указаны в долларах и евро, так как разработчики в основном зарубежные; оплата из стран СНГ нередко требует зарубежной карты или посредника.
Wispr Flow — гибкая настройка стиля
Wispr Flow — это хорошо профинансированное приложение для диктовки, в котором можно добавлять собственные слова и указания для распознавания. У сервиса есть отдельные приложения для macOS, Windows и iOS; версия для Android пока в разработке.
Программа позволяет подстраивать расшифровку под задачу, выбирая один из стилей: «строгий», «разговорный» и «совсем свободный» — для личной переписки, рабочих заметок и писем. Если совместить её со средами для разработки вроде Cursor, можно включить распознавание названий переменных и упоминание файлов прямо в чате.
Источник изображения — Wispr Flow
Бесплатно сервис даёт расшифровать до 2 000 слов в неделю на компьютере и 1 000 слов в месяц на iOS. Платные подписки снимают ограничения и начинаются от $15 в месяц.
Willow — упор на бережное хранение данных
Willow подаёт себя как способ сэкономить время для тех, кто не любит печатать. Помимо привычных функций вроде автоматической правки и оформления, приложение задействует большие языковые модели, чтобы развернуть несколько продиктованных слов в законченный связный текст.
Willow делает ставку на бережное обращение с данными: все расшифровки хранятся прямо на устройстве, а от передачи сведений для обучения модели можно полностью отказаться. Ещё есть пользовательский словарь — он помогает приложению привыкнуть к профессиональным терминам вашей сферы или к особенностям местной речи.
Бесплатно Willow позволяет надиктовать 2 000 слов в месяц в настольной версии. Отдельные тарифы начинаются от $15 в месяц и открывают безлимитную диктовку и запоминание вашего стиля письма.
Monologue — всё остаётся на устройстве
Если для вас на первом месте сохранность данных, Monologue позволяет загрузить модель искусственного разума прямо на устройство и расшифровывать речь, полностью обходясь без облака. Кроме того, приложение подстраивает тон текста под то, в какой программе вы сейчас работаете.
Бесплатно Monologue даёт расшифровать 1 000 слов в месяц; подписка стоит $10 в месяц или $100 в год. Самым активным пользователям разработчики высылают физическую кнопку быстрого запуска под названием Monokey для работы с приложением.
Superwhisper — выбор моделей и тонкая настройка
Superwhisper — в первую очередь приложение для диктовки, но оно справляется и с расшифровкой аудио- и видеофайлов. Здесь можно выбирать и загружать модели искусственного разума, в том числе несколько собственных — с разной скоростью и точностью, — а также модели распознавания речи Parakeet от Nvidia.
Программа разрешает писать собственные указания для управления результатом, а также просматривать обработанные и исходные расшифровки прямо из системной клавиатуры.
Базовое преобразование голоса в текст бесплатно, а на знакомство с Pro-возможностями (перевод и расшифровка файлов) даётся 15 минут. Платная версия позволяет подставлять собственные ключи доступа к моделям и подключать облачные и местные модели без ограничений.
Месячный тариф стоит $8,49, годовой — $84,99, либо можно один раз заплатить $249,99 за пожизненный доступ.
VoiceTypr — без интернета и без подписки
VoiceTypr работает по принципу «без интернета и без подписки», используя для расшифровки местные модели. Для тех, кто хочет развернуть открытую версию самостоятельно, есть репозиторий на GitHub. VoiceTypr поддерживает более 99 языков и работает на Mac и Windows.
Приложение можно бесплатно опробовать в течение трёх дней, после чего предлагается купить пожизненную лицензию. Стоимость: $35 за одно устройство, $56 за два и $98 за четыре.
Aqua — ставка на скорость
Aqua — приложение для голосового ввода для Windows и macOS, поддержанное акселератором Y Combinator; оно претендует на звание одного из самых быстрых в своём классе по задержке (времени между вашей речью и появлением текста на экране).
Помимо работы с грамматикой и пунктуацией, Aqua умеет подставлять текст по голосовым командам — например, можно сказать «мой адрес», и приложение впишет его целиком.
Кроме того, у Aqua есть собственный программный интерфейс для преобразования речи в текст, так что к её движку расшифровки могут подключаться другие приложения.
Бесплатный тариф даёт 1 000 слов в месяц. Платные планы начинаются от $8 в месяц при оплате за год и снимают ограничение на число слов, а также открывают 800 пользовательских записей в словаре.
Handy — простой и полностью бесплатный
Handy — это бесплатный инструмент расшифровки с открытым исходным кодом для Mac, Windows и Linux. Приложение довольно простое и не предлагает богатых настроек, но если вы хотите чаще пользоваться голосом и при этом ничего не платить — это хороший вариант.
В нём есть несложное меню настроек, где можно включить режим «зажми и говори» и сменить горячую клавишу для запуска расшифровки.
Typeless — щедрый бесплатный лимит
Typeless выделяется большим бесплатным запасом слов. Разработчики утверждают, что не сохраняют никаких данных и не используют их для обучения моделей. Ещё Typeless умеет переписывать неудачно построенные предложения.
На бесплатном тарифе можно надиктовать до 4 000 слов в неделю (около 16 000 слов в месяц). За $12 в месяц при годовой оплате открываются безлимитный набор и доступ к новым возможностям. Typeless доступен только для Windows и macOS.
VoiceInk — открытый код и работа с контекстом
VoiceInk — приложение для диктовки с открытым исходным кодом и бережным отношением к данным, выпущенное для Mac. Оно поддерживает глобальные сочетания клавиш для начала и остановки записи, а также режим «зажми и говори». Программа считывает то, что происходит на экране, и подстраивает результат под обстановку.
VoiceInk может сам распознавать определённые приложения и адреса страниц и применять к ним заданные правила оформления. Есть и режим помощника, способный отвечать на ваши вопросы. Стоимость: $25 за пожизненный доступ на одно устройство, $39 на два и $49 на три.
Dictato — мгновенный отклик на Mac
Dictato — приложение для диктовки для Mac стоимостью €9,99 (примерно $12), что даёт пожизненный доступ и два года обновлений. Оно работает с офлайн-моделями вроде Parakeet, Whisper и Apple Speech Analyzer, а для лёгкой правки текста и удаления слов-паразитов задействует Apple Intelligence. Благодаря местным моделям разработчики заявляют о сверхнизкой задержке в 80 мс — текст появляется почти мгновенно вслед за сказанным.
AudioPen — от голосовых заметок к расшифровке
AudioPen начинался как веб-сервис для голосовых заметок, но со временем разросся. Его версия для Mac теперь позволяет надиктовывать текст и переписывать его в нужном формате и стиле, переключаясь между ними в любой момент. Помимо прямой расшифровки, AudioPen умеет хранить голосовые заметки на разных платформах, объединять их в сводки, загружать аудиофайлы и переписывать готовые заметки с помощью искусственного разума. Стоимость: $33 за три месяца, $99 за год и $159 за два года.
Как выбрать приложение под себя
Если для вас важнее всего сохранность данных, обратите внимание на Monologue, VoiceTypr, Handy или VoiceInk — они умеют работать на устройстве без отправки записей в облако. Тем, кто часто переключается между перепиской, письмами и рабочими заметками, подойдут Wispr Flow и Willow с гибкой настройкой стиля. Если не хочется привязываться к подписке, присмотритесь к решениям с пожизненной лицензией — VoiceTypr, VoiceInk или Dictato. А когда нужен максимально щедрый бесплатный лимит, начните с Typeless.













