Приложения для диктовки достигли высокой точности благодаря большим языковым моделям
Лучшие сервисы автоматически удаляют слова-паразиты и исправляют оговорки
Wispr Flow и Willow позволяют настраивать стиль расшифровки — от формального до неформального
Superwhisper и VoiceTypr дают возможность выбирать модели ИИ для локальной обработки без подписки
Приложения для голосовой диктовки на основе AI прошли долгий путь за короткое время. Раньше они были медленными и неточными — если только вы не говорили с определённым акцентом и чётко произносили слова.
Image Credits:Carol Yepes / Getty Images
Прорыв в больших языковых моделях (LLM) и моделях преобразования речи в текст изменил ситуацию: появились системы, которые точнее распознают речь, сохраняя достаточно контекста для правильного форматирования текста. Разработчики также добавили функции для автоматического удаления слов-паразитов, исправления запинок и обработки пунктуации — получается текст, требующий значительно меньше правок.
Поскольку на рынке сейчас десятки подобных приложений, мы собрали подборку лучших и самых полезных программ для голосового набора текста, доступных на данный момент.
Wispr Flow — это хорошо финансируемое AI-приложение для диктовки, которое позволяет добавлять собственные слова и инструкции для распознавания. У него есть нативные приложения для macOS, Windows и iOS; версия для Android находится в разработке.
Приложение позволяет настраивать транскрипцию текста, выбирая стили: «формальный», «неформальный» и «очень неформальный» для разных типов письма — личных сообщений, работы и электронной почты. Если использовать его с инструментами для vibe-coding, такими как Cursor, можно включить функцию автоматического распознавания переменных или отмечать файлы в чате.
Бесплатно приложение позволяет транскрибировать до 2 000 слов в неделю на компьютере и 1 000 слов в месяц на iOS. Платные подписки снимают ограничения на количество транскрипций и начинаются от $15 в месяц.
Willow позиционирует себя как инструмент, экономящий время для тех, кто не любит печатать. Наряду с базовыми функциями, такими как автоматическое редактирование и форматирование, приложение использует большие языковые модели для генерации полноценного текста всего из нескольких продиктованных слов.
Willow также придерживается подхода, ориентированного на конфиденциальность: все транскрипты хранятся локально на устройстве, и можно полностью отказаться от использования данных для обучения модели. Приложение также позволяет добавлять пользовательский словарь, чтобы адаптироваться к терминологии в вашей сфере или местному диалекту.
Бесплатно Willow позволяет диктовать 2 000 слов в месяц в десктопной версии. Индивидуальные тарифные планы начинаются от $15 в месяц, открывая безлимитную диктовку и возможность запоминать ваш стиль письма.
Если приоритет — конфиденциальность, Monologue позволяет загрузить AI-модель прямо на устройство для транскрипции, полностью исключая хранение данных в облаке. Более того, приложение позволяет настраивать тон текста в зависимости от того, в каком приложении вы его используете.
Бесплатно Monologue позволяет транскрибировать 1 000 слов в месяц; подписка стоит $10 в месяц или $100 в год. Компания также отправляет своим самым активным пользователям физическое устройство быстрого запуска под названием Monokey для работы с приложением.
Superwhisper — в первую очередь приложение для диктовки, но оно также может транскрибировать аудио- и видеофайлы. Позволяет выбирать и загружать AI-модели, в том числе несколько собственных с разной скоростью и точностью, а также модели распознавания речи Parakeet от Nvidia.
Приложение также позволяет писать собственные промпты для управления выводом, а также просматривать обработанные и необработанные транскрипты прямо из системной клавиатуры.
Базовая функция преобразования голоса в текст бесплатна, и даётся 15 минут на тестирование Pro-функций, таких как перевод и транскрибация. Платная версия позволяет использовать собственные API-ключи AI и подключать облачные и локальные модели без каких-либо ограничений.
Ежемесячный план стоит $8.49 в месяц, годовой — $84.99 в год, либо можно оплатить $249.99 за пожизненную подписку.
VoiceTypr работает по принципу работы без интернета и без подписки, используя локальные модели для транскрипции. У него есть репозиторий на GitHub для тех, кто хочет разместить и запустить open-source версию самостоятельно. VoiceTypr поддерживает более 99 языков и работает на Mac и Windows.
Приложение доступно для трёхдневного бесплатного тестирования, после чего можно приобрести пожизненную лицензию. Стоимость: $35 за одно устройство, $56 за два и $98 за четыре устройства.
Aqua — это поддерживаемое Y Combinator приложение для голосового ввода для Windows и macOS, которое претендует на звание одного из самых быстрых инструментов в своей категории по задержке (времени между вашей речью и появлением текста на экране).
Помимо обработки грамматики и пунктуации, Aqua также позволяет автозаполнять текст с помощью голосовых команд — например, сказать «мой адрес», и Aqua введёт его.
Приложение также предлагает собственный API для преобразования речи в текст, позволяя другим приложениям подключаться к движку транскрипции Aqua.
Бесплатный тариф даёт 1 000 слов в месяц. Платные планы начинаются от $8 в месяц при годовой оплате и открывают безлимитное количество слов и 800 пользовательских значений словаря.
Handy — это бесплатный инструмент транскрипции с открытым исходным кодом, работающий на Mac, Windows и Linux. Приложение довольно базовое и не предлагает широких возможностей настройки, но если вы хотите начать больше использовать голос и не платить, это хороший вариант.
Приложение имеет простое меню настроек, позволяющее включить режим push-to-talk и изменить горячую клавишу для активации транскрипции.
Typeless выделяется большим бесплатным лимитом слов. Компания утверждает, что не сохраняет никакие данные и не использует их для обучения AI-моделей. Typeless также умеет переписывать неудачные предложения.
Приложение позволяет диктовать до 4 000 слов в неделю (примерно 16 000 слов в месяц) на бесплатном тарифе. Можно платить $12 в месяц (при годовой оплате), чтобы получить безлимитное количество слов и доступ к новым функциям. Typeless доступен только для Windows и macOS.
VoiceInk — это приватное приложение для диктовки с открытым исходным кодом для Mac. Приложение поддерживает глобальные сочетания клавиш для начала и остановки записи, а также режим push-to-talk. Оно считывает контекст на экране и соответствующим образом настраивает свой вывод.
Приложение может автоматически определять определённые приложения и URL-адреса и применять к ним пользовательское форматирование или правила. У него также есть режим ассистента, который может отвечать на ваши вопросы. Стоимость: $25 за пожизненный доступ на одно устройство, $39 на два устройства и $49 на три устройства.
Dictato — это приложение для диктовки для Mac, цена которого составляет €9.99 (примерно $12), что даёт пожизненный доступ и два года обновлений функций. Приложение работает с офлайн-моделями, такими как Parakeet, Whisper и Apple Speech Analyzer, и использует Apple Intelligence для лёгкой обработки текста и удаления слов-паразитов. Благодаря локальным моделям приложение заявляет о сверхбыстрой задержке в 80 мс, то есть текст появляется почти мгновенно после произнесения.
AudioPen начинался как веб-приложение для голосовых заметок, но со временем эволюционировал. Его версия для Mac теперь позволяет диктовать текст и переписывать его в предпочитаемом формате и стиле, переключаясь между разными стилями в любое время. Помимо прямой транскрипции, AudioPen позволяет хранить голосовые заметки на разных платформах, объединять заметки для создания сводок, загружать аудиофайлы и переписывать существующие заметки с помощью AI. Стоимость: $33 за три месяца, $99 за год и $159 за два года.


