Компьютерное программное обеспечение для голосового управления

Обновлено: 02.07.2024

Когда дело доходит до максимальной эффективности, нельзя полагаться только на технологии. Вы должны использовать все природные вещи, которые у вас есть. Просто напечатать и щелкнуть мышью недостаточно.

Лучшее программное обеспечение для распознавания речи делает ваш голос таким же продуктивным, как ваши руки. Он позволяет вам управлять своими устройствами или браузерами, а также управлять своим повседневным окружением.

Программное обеспечение для распознавания голоса для диктовки

Одной из лучших функций программного обеспечения для распознавания голоса является диктовка. Используя технологию преобразования речи в текст, он расшифровывает то, что вы говорите, так, как вы это говорите, с небольшим количеством ошибок. Вы можете говорить себе заметки на ходу и отправлять их текстом или электронной почтой. Более длинные тексты также не проблема для лучших приложений для распознавания голоса.

В этой статье мы дадим определение технологии распознавания речи и рассмотрим различные типы приложений для распознавания голоса, уделяя особое внимание диктовке. Затем мы рассмотрим 14 лучших приложений для распознавания голоса, преобразования речи в текст и транскрипции.

Сравнительная таблица программного обеспечения для распознавания голоса (10 лучших по рейтингу)

Продукт

Подходит для

Цены

Ссылка

Лучшее приложение преобразования речи в текст в целом

Лучшее приложение для распознавания голоса для стартапов

Лучшее приложение для преобразования речи в текст

Хороший инструмент для диктовки писателей

Распознавание речи Windows

Лучший инструмент распознавания речи для Windows

49 долларов США в год для Pro

0,006 долл. США за 00:15 аудио

Что такое программное обеспечение для распознавания голоса?

Программы для распознавания голоса — это приложения, в которых вы используете свой голос и говорите на естественном языке. Лучшее программное обеспечение для распознавания голоса превращает речь в текст и понимает голосовые команды.

Большинство людей знакомы с личными помощниками. К ним относятся Apple Siri, которая впервые появилась в 2011 году. Затем были Microsoft Cortana и Amazon Alexa, которые вышли в 2014 году. В 2016 году появился Google Assistant.

Взаимодействие с технологиями посредством речи становится все более важным. Не так давно исследование Gartner показало, что около 30 % наших взаимодействий с нашими устройствами происходит с помощью какого-либо программного обеспечения для распознавания голоса.

А теперь, когда на всех наших устройствах установлено больше и лучше микрофонов, нам больше не нужны гарнитуры, чтобы использовать лучшее программное обеспечение для распознавания речи.

Какие существуют типы программного обеспечения для распознавания голоса?

В зависимости от говорящего

Между динамиком и программным обеспечением для распознавания голоса существует две взаимосвязи. Во-первых, когда приложение изучает речь одного говорящего. Это называется зависимым от говорящего. Он отлично подходит для устройств iOS и Android.

Тогда есть независимое от говорящего программное обеспечение. Это не обучено на одном пользователе. Его можно использовать для любого динамика в равной степени. Это распространено в автоматизированных телефонных службах. Это также отлично подходит для встреч. Некоторые из лучших программ для диктовки могут даже распознавать разные голоса и разделять разговор.

Использование программного обеспечения для распознавания голоса

Одним из основных способов распознавания голоса является диктовка. Приложение расшифровывает ваш текст, когда вы говорите, в режиме реального времени.

Транскрипцию часто можно отредактировать и отправить в текстовых сообщениях или электронных письмах. Отличное программное обеспечение для транскрипции также понимает контекст. Он не спутает «мои голые руки» с «моими медвежьими руками». Некоторые из лучших программ для распознавания голоса для диктовки выполняют перевод.

Голосовые команды — еще один полезный инструмент. Они позволяют управлять компьютером без использования клавиатуры или мыши. Это может быть полезно для отдыха рук. Это также полезно для людей с ограниченными возможностями.

Программное обеспечение для распознавания голоса также может быть личным помощником. В качестве виртуального помощника он может устанавливать напоминания, отправлять текстовые сообщения, планировать события календаря и многое другое с помощью голосовых команд. Их также можно использовать лично для устройств Интернета вещей, таких как музыка или комнатная температура.

Кто использует программное обеспечение для распознавания голоса

Приложения для распознавания голоса могут оказаться полезными почти для всех. Распознавание голоса отлично помогает вам в повседневной жизни. От установки напоминаний и размещения онлайн-заказов до управления электричеством или отоплением.

Они также являются отличными рабочими инструментами. Программное обеспечение для расшифровки очень полезно на встрече или на конференции. Это также хорошо, когда у вас есть много идей, и они появляются быстрее, чем вы можете напечатать. Некоторые из лучших программ для транскрибирования позволяют командам совместно работать над транскрипциями, что является большим стимулом для стартапа или любой компании.

Писатели также получают большую пользу от преобразования речи в текст. Будь то запись длинных заметок в дороге или диктовка страница за страницей во время домашней работы. Журналисты также могут использовать приложения для диктовки во время интервью.

Скоро технология голосового управления войдет во многие сферы нашей жизни. Как вождение, где наши руки должны оставаться на руле.Гораздо лучше использовать свой голос для управления некоторыми вещами, для которых не следует использовать руки, например, радио или регулятором сиденья. То же самое относится и к профессионалам, таким как хирурги или автомеханики, которым громкая связь чище и безопаснее.

Какое программное обеспечение для распознавания голоса лучше всего? Вот наш список из 14 лучших:

Что касается лучшего программного обеспечения для распознавания речи, у вас есть несколько вариантов. Ниже представлены 14 лучших приложений для распознавания голоса для диктовки. Многие из этих приложений имеют и другие функции, такие как голосовое управление и виртуальные помощники. Мы сравниваем функции и выясняем, какое программное обеспечение для распознавания голоса является лучшим в целом, для диктовки, для Windows и других категорий.

Dragon (лучшее приложение для преобразования речи в текст)

Dragon Naturallyspeaking – это набор приложений для распознавания речи от Nuance. Это компания, занимающаяся разговорным искусственным интеллектом, которая фокусируется на слушании и анализе.

Программное обеспечение для распознавания речи Dragon использует технологию глубокого обучения. Он может похвастаться точностью 99%. Это один из самых высоких показателей. Помимо диктовки, Dragon использует распознавание голоса для голосовых команд. Вы можете просматривать веб-страницы, отправлять электронные письма или публиковать отчеты. Dragon интегрируется с Microsoft Office. Он работает на устройствах macOS, Windows, Android и iOS.

Дракон бывает нескольких уровней. Некоторые из наиболее популярных: Dragon Anywhere для мобильных устройств, Dragon Home (150 долларов США) и Dragon Professional Individual (300 долларов США).

Если диктовать компьютеру кажется привлекательной идеей, попробуйте Dragon NaturallySpeaking Premium. является стандартом де-факто для Windows.

Dragon долгое время безраздельно правил распознаванием речи, но не более того. Более простые или менее дорогие (если не такие мощные) варианты создают небольшие вотчины. Чем больше вариантов, тем лучше, учитывая, что использование голосовых команд может предотвратить или уменьшить повторяющиеся травмы от перенапряжения. Устное слово также подходит для некоторых проектов лучше, чем печатать.

Мы нашли пять вариантов на базе Windows, которые стоит протестировать. Они тоже были проверены в довольно суровых условиях: мой родной шотландский акцент и мой немецкий акцент, отточенный 13 годами, проведенными в Вюрцбурге. Хотя ни одному из них не удалось победить могущественного Дракона, они все же могли быть полезны для многих задач.

Распознавание речи Windows

Хотя Microsoft не афиширует этот факт, новые версии Windows поставляются с предустановленным собственным программным обеспечением для распознавания речи Windows. Я думал, что возненавижу его, но был впечатлен, особенно если учесть, что он бесплатный и уже установлен на ПК с Vista, Windows 7 или Windows 8.

Чтобы включить распознавание речи Windows, перейдите в меню "Пуск" и в поле поиска внизу введите распознавание речи . Нажмите на всплывающую опцию, и откроется окно, в котором вы можете включить эту функцию, а также прочитать короткий текст, чтобы дать Windows представление о том, на что похож ваш голос. Вы также можете получить доступ к этой функции через панель управления. После того, как все настроено, появится небольшое окно состояния. Вы будете использовать его для включения и выключения распознавания речи.

Для начала просто скажите в микрофон "начинайте слушать". Затем приложение издает звуковой сигнал и начинает действовать, ожидая вашей следующей команды. Вы можете сказать Windows Speech Recognition сделать что угодно на вашем ПК. Он может открывать браузеры (включая новые вкладки), приложения, а также документы Microsoft Office. Открыв документ, вы можете надиктовать текст, и он тут же появится там.

Вы также можете указать компьютеру выключить или перезагрузить компьютер, а также вызвать меню «Пуск» или окно командной строки. Когда вы закончите, просто скажите «перестань слушать», и он заснет, ожидая, пока вы его снова не разбудите.

Он прост в использовании и имеет приемлемую цену, но производительность распознавания речи Windows могла бы быть улучшена. Я обнаружил, что уровень точности снизился, когда я диктовал длинные тексты в документ MS Office. Он также не очень хорошо реагировал на мой немецкий акцент, поэтому другие акценты также могут его заблокировать.

Голосовой поиск Google

Пользователи Chrome могли заметить маленький микрофон в правой части строки поиска в Google. Это голосовой поиск Google.

Google Voice Скриншот поиска

Голосовой поиск Google делает Chrome еще более привлекательным.

Усилия Google по распознаванию голоса в настоящее время включают поисковую систему и службу перевода, но последняя предназначена только для iOS. Голосовой поиск Google доступен только в браузере Google Chrome, который работает на нескольких платформах.

В Chrome перейдите на главную веб-страницу Google. Предполагая, что на вашем ПК настроен микрофон (возможно, в гарнитуре или веб-камере), щелкните значок микрофона. В первый раз вам будет предложено предоставить Google разрешение на доступ к вашему микрофону.Когда вы это сделаете, он предложит вам произнести условия поиска. Он почти мгновенно распознает речь, и то, что, по мнению компьютера, вы сказали, всплывает на экране. Результаты поиска также отображаются быстро, без необходимости щелкать мышью.

Алгоритм распознавания голоса Google довольно хорошо распознает ваши слова. Я дал ему 10 поисковых запросов и произнес их со своим обычным (шотландским) акцентом, а также на английском с немецким акцентом. Он спотыкался всего несколько раз, и это было тогда, когда я произносил их со своим родным акцентом.

Дракон Естественно говорящий Премиум

Dragon занимается распознаванием речи достаточно долго, чтобы довести свой алгоритм до уровня изобразительного искусства. Однако за это искусство приходится платить высокую цену: домашняя версия Dragon NaturallySpeaking стоит 75 долларов США, а Premium — 150 долларов США.

Если у вас последний ультрабук на базе процессора Intel или моноблок, у вас может быть предустановлен Dragon Assistant. (Вы также найдете предустановленную версию на каждом iPhone и iPad, а Nuance ранее в этом году подтвердила, что компания производит Siri для Apple.) В противном случае самый дешевый предварительный просмотр — это Dragon Notes за 20 долларов, который позволяет вам протестировать голос. -возможности распознавания в урезанной программе.

Скриншот Dragon Naturally Speaking Pro

Dragon NaturallySpeaking проведет вас через обучение.

При первом открытии Dragon NaturallySpeaking вам необходимо выполнить обычные текстовые диктовки, чтобы настроить профиль пользователя. Затем приложение загружает панель в верхней части экрана. На этой панели находится оранжевый логотип микрофона, который указывает, что Dragon в настоящее время не слушает. Чтобы запустить приложение, просто скажите «проснуться», и оранжевый логотип станет зеленым. Здесь вы увидите, на что способен Дракон.

Одной из замечательных функций является интеграция с веб-приложениями и вашей электронной почтой, включая Gmail. Везде, где вы найдете текстовое поле, Dragon введет любой текст, который вы ему скажете. Он может писать для вас электронные письма, выполнять поиск в Google, публиковать сообщения в Facebook и Twitter и запускать веб-браузеры. Вы даже можете сказать ему, куда поместить курсор.

Скриншот Dragon Naturally Speaking Pro

Дракон достаточно умен, чтобы учиться у вас.

Точность диктовки — это то, чем действительно хорош Dragon. Вы можете открыть обычные приложения для обработки текста, такие как Microsoft Word и Блокнот, и начать диктовать свой текст. Если он неправильно понимает ваши слова или пишет с ошибками, вы можете попросить Dragon вернуться и исправить это. Он дает вам меню возможных других слов и позволяет вам выбрать то, которое вы хотите. Если нужного вам слова нет, вы можете ввести его, чтобы Dragon знал его на будущее.

Вы также можете указать, какие части текста вы хотите выделить, выделить курсивом, подчеркнуть, превратить в новый абзац и т. д. Когда вы закончите, прикажите Дракону закрыть файл, распечатать его, сохранить или открыть другой документ.

Несмотря на то, что он явно превосходит другие инструменты, меня беспокоили некоторые мелочи в этом программном обеспечении. Например, панель профиля пользователя плохо помещается в верхней части браузера, поэтому выглядит беспорядочно и неуместно. Он также не может запускать веб-сайты, открывать новые вкладки браузера (как это делает распознавание речи Windows) или закрывать приложения.

Скриншот Dragon Naturally Speaking Pro

Интеграция Dragon с другими приложениями делает его полезным как на ПК, так и в Интернете.

Но больше всего меня беспокоит то, что он устанавливает два дополнительных программного обеспечения, которые некоторые люди могут счесть неприятными. По словам представителя Nuance, надстройка браузера Rich Internet Application Support «позволяет вам контролировать большую часть вашего просмотра Интернета с помощью речи». Звучит неплохо, но, по моему опыту, он часто давал сбои и замедлял работу моего браузера. Вы можете удалить его, как и любой другой плагин, поэтому, если ваш браузер начнет ползать, как черепаха, страдающая артритом, вы знаете, что делать.

Прилагаемое программное обеспечение под названием Common Software Manager заполнило интернет-форумы недовольными пользователями, которые бросаются словами, например, «вредоносное ПО». Все, что делает CSM, — это регулярно проверяет наличие обновлений Dragon, но это действие может вызывать тревогу, если вы не знаете, какая программа это делает и почему. Представитель Dragon заверил меня, что CSM можно удалить без каких-либо побочных эффектов для самого Dragon, но, конечно, вы не получите обновления программного обеспечения, если сделаете это.

TalkTyper

В Dragon много функций, а онлайн-приложение TalkTyper — полная противоположность. Это дает вам возможность продиктовать свой текст, а затем дает вам несколько основных вариантов того, что делать с этим текстом. Для тех, кто предпочитает минимализм, этого может быть достаточно.

Ширина скриншота TalkTyper

Для веб-инструмента диктовки TalkTyper требуется Google Chrome.

TalkTyper использует голосовой алгоритм Google, поэтому вы получаете все преимущества эффективного инструмента. Конечно, для этого также требуется Google Chrome. Просто нажмите на зеленый значок микрофона справа и надиктуйте текст. Когда вы будете удовлетворены текстом на экране, нажмите кнопку со стрелкой вниз, чтобы переместить его в нижнее поле, где находятся параметры.

Эти варианты включают копирование текста в буфер обмена, отправку текста по электронной почте, печать текста, отправку его в твиттер и перевод на другой язык. Если вы хотите, чтобы текст был переведен, просто нажмите кнопку и выберите язык перевода. TalkTyper автоматически открывает новую вкладку браузера с вашим текстом, вставленным в Google Translate.

Я ожидал, что TalkTyper будет распознавать слова так же умело, как Google, но у него возникли проблемы с пониманием моего глубокого шотландского акцента. Даже когда я говорил четко, некоторые слова сбивались с пути, и я не совсем диктовал ракетостроение.

TalkTyper следует использовать только для более простых вещей, более короткого разговорного контента — например, электронной почты или твитов тут и там. Если вы хотите продиктовать свой великий опус, Dragon — лучший выбор.

Тазти

Тазти, произносимый как «вкусный», отличается от других двумя отличительными чертами. Во-первых, вы можете использовать приложение для управления компьютерными командами и играми с помощью голоса. А если у Tazti нет нужной вам команды, вы можете ее создать (и еще 299, пока вы это делаете).

Снимок экрана Tazti

Вместо того, чтобы диктовать, Тазти отдает приказы. Он помогает вам управлять играми, открывать приложения и даже использовать командную строку.

Будь то открытие установленного приложения, запуск веб-сайта, открытие каталога или использование командной строки, вы можете настроить Tazti по своему усмотрению. Если вам не нужна команда, вы можете отредактировать ее или полностью удалить. Вы даже можете использовать команды «щелчок» и «двойной щелчок», чтобы избавиться от необходимости использовать мышь.

Однако у Tazti есть один большой недостаток: он не позволяет диктовать текст в документ. Это не такое распознавание голоса. Разработчик Voice Tech Group признает, что другие продукты, описанные здесь, намного лучше справляются с диктовкой, поэтому компания решила сосредоточить свои усилия на другом.

Вместо этого Tazti больше ориентирован на геймеров, которые хотят использовать свой голос, чтобы отправить своих персонажей в бой, или на пользователей с ограниченными возможностями, которые предпочитают запускать программы, запускать медиаплеер и просматривать веб-страницы без использования клавиатуры. . Тот факт, что вы можете управлять важными частями Windows с помощью Tazti, делает его достойным включения сюда, даже если он не поддерживает диктовку.

Вы можете бесплатно протестировать Tazti в течение 15 дней. После этого он стоит 40 долларов США.

Никто не победил Дракона

После тестирования всех пяти приложений стало очевидно, что Dragon NaturallySpeaking значительно превосходит конкурентов. Windows представляет собой очень сильного конкурента с дополнительным бонусом в виде бесплатности, но ее распознавание речи было не таким сильным, и она не может найти папки, которые находятся прямо у нее под носом. Если вы собираетесь часто использовать распознавание речи, стоит инвестировать 75 долларов США для дома (150 долларов США для бизнеса) и перейти на Dragon.

Попробуйте распознавание речи прямо сейчас с помощью встроенного приложения Windows или Google в браузере Chrome. Вы будете поражены тем, насколько вам нравится обходиться без клавиатуры.

Простое программное решение, позволяющее вам управлять своим компьютером, диктовать электронные письма и письма, а также заставлять компьютер читать вам документы.

10 причин попробовать
программное обеспечение e-Speaking


Теперь вы можете сказать своему компьютеру, что вы от него хотите.

Насколько это дорого?

Это условно-бесплатное ПО. Это означает: вы можете загрузить его и попробовать в течение 30 дней, чтобы понять, понравится ли он вам. 30-дневный пробный период предоставляется бесплатно! Вот так. Вы можете загрузить его с более чем 100 встроенными командами и начать использовать его сегодня бесплатно. Если вам действительно нравится программа и вы хотите использовать ее в течение первых 30 дней, стоимость составит 14 долларов США.

Что это?

Управляйте компьютером Windows и управляйте им с помощью голоса. Управляйте своим компьютером, используя минимум нажатий клавиш или щелчков мыши. Если вы хотите переместить курсор на одну строку вниз, просто скажите: Down One . Хотите проверить почту? Просто скажите: Откройте электронную почту.Добавьте команды для открытия и управления любым документом или программой Windows.

Командование и управление

У вашего компьютера есть мозг. С гарнитурой и микрофоном теперь вы можете позволить компьютеру слышать вас, отвечать на ваши команды и даже говорить с вами, чтобы сообщить вам, что он сделал.

Майкрософт

Microsoft разработала программу (называемую SAPI), чтобы связать ваш голос с определенными действиями и распознаванием компьютером. Продукт e-Speaking использует эту новую технологию для создания небольшой и эффективной программы, которая принимает ваш голосовой ввод и преобразует его в события клавиатуры, мыши, системы и программы.

Грамматический языковой интерфейс

Интерфейс SAPI предоставляет вам возможность менять местами существительные и глаголы в ваших речевых командах. Например, вы можете создать команду, которая отвечает на команды «Открыть этот файл», «Открыть мой файл» и «Открыть новый файл». Или вы можете создать команду, которая отвечает на: «Закрыть документ» или «Документ, закрыть».

Как это работает?

Диктовку тоже?

Голосовая диктовка интегрирована в приложение e-Speaking и включает 26 различных голосовых команд для диктовки.

Почему электронная речь?

Наша цель при разработке этого продукта состояла в том, чтобы расширить вашу способность управлять компьютером с помощью голоса. Чтобы у вас был доступ к программному обеспечению для диктовки с использованием речевого движка Microsoft SAPI. И разрешить компьютеру читать вам документы и электронные письма.

Руководство пользователя?

Что такое распознавание речи?


Распознавание речи – это технология, позволяющая компьютеру распознавать и понимать слова, произнесенные человеком с помощью микрофона или телефона. Конечной целью технологии является создание системы, способной распознавать со 100 % точностью все слова, произносимые любым человеком.

Даже после многих лет исследований в этой области лучшие приложения для распознавания речи по-прежнему не могут распознавать речь со 100% точностью. Некоторые приложения способны распознавать более 90 % слов при произнесении с определенными ограничениями в отношении содержания и предшествующего обучения распознаванию характеристик речи говорящего.

Компьютерное программное обеспечение, которое понимает вашу речь, позволяет вам разговаривать с компьютером. Эти разговоры будут включать вас и компьютер, говорящий как команды или в ответ на события, ввод или другую обратную связь.

Говорить проще и понятнее, чем нажимать кнопки и пункты меню. Человеческая речь развивалась на протяжении многих тысяч лет и превратилась в эффективный способ обмена информацией и инструкций.

Полезно при доступе к системам через телефоны-автоматы, к которым не подключены клавиатуры.

Преимущества взаимодействия с компьютером с помощью речи

<ПР> Hands Speech не требует использования физических устройств, таких как клавиатуры или указывающие устройства. Вычислительные устройства могут стать более компактными, поскольку клавиатура и мышь играют менее заметную роль. Люди с физическими проблемами также могут извлечь выгоду из использования речевых приложений.

Что такое распознавание речи?


Распознавание речи – это технология, позволяющая компьютеру распознавать и понимать слова, произнесенные человеком с помощью микрофона или телефона. Конечной целью технологии является создание системы, способной распознавать со 100 % точностью все слова, произносимые любым человеком.

Даже после многих лет исследований в этой области лучшие приложения для распознавания речи по-прежнему не могут распознавать речь со 100% точностью. Некоторые приложения способны распознавать более 90 % слов при произнесении с определенными ограничениями в отношении содержания и предшествующего обучения распознаванию характеристик речи говорящего.

Компьютерное программное обеспечение, которое понимает вашу речь, позволяет вам разговаривать с компьютером. Эти разговоры будут включать вас и компьютер, говорящий как команды или в ответ на события, ввод или другую обратную связь.

Говорить проще и понятнее, чем нажимать кнопки и пункты меню. Человеческая речь развивалась на протяжении многих тысяч лет и превратилась в эффективный способ обмена информацией и инструкций.

Полезно при доступе к системам через телефоны-автоматы, к которым не подключены клавиатуры.

В первые дни распознавания голоса вам повезет, если вы сможете распознавать половину своих слов, даже если вы говорите медленно, как робот. В наши дни в каждом смартфоне есть своего рода голосовой помощник, который может быстро делать заметки или выполнять такие задачи, как открытие приложений.

Однако, если у вас есть компьютер с Windows 10, вы также можете управлять Windows 10 с помощью голоса. Это больше, чем просто классная функция. Это может стать настоящим стимулятором продуктивности, а для людей с ограниченными возможностями — эффективным способом взять под контроль свой компьютер.


Контроль против Диктовки

Вы хотите управлять Windows 10 с помощью голоса или просто хотите, чтобы она записывала ваши слова? Голосовое управление — это функция, отличная от диктовки, и некоторые пользователи часто путают эти два понятия. Если все, что вам нужно, это просто говорить, а компьютер записывает то, что вы говорите, вам не нужно прилагать все усилия для настройки распознавания речи.

Например, в Документах Google есть отличная функция голосовой диктовки, которая использует мощь облака для преобразования вашей речи в текст. Если вы являетесь пользователем macOS, вы даже можете использовать встроенную систему Apple.

Эта статья посвящена голосовому управлению, а не голосовой диктовке. Другими словами, мы хотим использовать Windows и выполнять общие задачи без использования клавиатуры или мыши.

Выбор правильного микрофона

Если вы хотите управлять Windows 10 с помощью голоса, вам нужно дать компьютеру возможность услышать вас. Если вы используете ноутбук или настольную веб-камеру, у вас уже есть обычный микрофон, но он не всегда подходит для распознавания голоса.


Поскольку у вас уже есть эти микрофоны, не помешает попробовать с ними голосовое управление, но микрофон лучшего класса, несомненно, улучшит ситуацию. Здесь мы используем микрофон Samson Go.

Указание Windows, какой микрофон использовать

Прежде чем вы сможете отдавать команды компьютеру, вам нужно указать, какой микрофон он должен использовать. Поскольку Windows поддерживает несколько микрофонов одновременно, иногда по умолчанию может быть выбран один из них, который не подходит для голосового управления.

Подключив микрофон (при условии, что это внешний микрофон), довольно легко выбрать его в качестве активного записывающего устройства. Просто щелкните правой кнопкой мыши значок динамика на панели задач.


Затем нажмите «Открыть настройки звука».

< бр />

В появившемся окне в разделе «ввод» выберите микрофон, который вы хотите, чтобы система использовала, из раскрывающегося списка.

Настройка распознавания речи

Чтобы начать процесс активации распознавания речи на компьютере с Windows 10, откройте меню "Пуск" и введите "Распознавание речи". Затем откройте его.

В появившемся новом окне нажмите «Начать распознавание речи». Вы можете получить всплывающее предупреждение о том, что распознавание речи оптимизировано для носителей английского языка в США. Просто нажмите OK, чтобы закрыть это.


Далее вы увидите этот мастер, который проведет вас через процесс установки.


Затем вам нужно выбрать тип используемого микрофона. Мы используем микрофон Samson Go, который стоит на рабочем столе (или прикрепляется к экрану), поэтому мы выберем настольный микрофон.


На следующем экране вы узнаете, как настроить микрофон. Он отличается для каждого типа микрофона, поэтому мы не будем его здесь показывать.

Теперь прочитайте образец текста, чтобы помочь Windows откалибровать микрофон.


Если компьютер вас достаточно хорошо понимает, вы можете нажать "Далее".

< бр />

Теперь вы увидите опцию, позволяющую Windows читать ваши документы, чтобы получить представление о вашем словарном запасе и формулировках. Вам решать, хотите ли вы это сделать. Если у вас есть документы с нерелевантным содержанием или у вас есть проблемы с конфиденциальностью, отключите эту функцию.


Хорошо, мы почти закончили. Теперь все, что вам нужно сделать, это выбрать режим активации.


< /p>

В основном вам нужно решить, хотите ли вы, чтобы распознавание речи включалось произнесением ключевого слова, что означает, что оно всегда слушает, или с помощью сочетания клавиш.

Теперь у вас есть возможность распечатать справочную карту с распространенными командами.


Честно говоря, большинству людей это не понадобится, так как вы всегда можете найти команды, когда вам это нужно, но если вы готовите компьютер для пользователя с ограниченными возможностями или менее технически подкованного, это удобно распечатать и поставить рядом с компьютером для справки.

Наконец, после того, как вы выбрали, запускать ли распознавание речи при запуске, вам предоставляется возможность пройти обучение. Если вы этого не сделали, вы должны! Для тех, кто прошел это руководство, просто пропустите его.

Когда распознавание речи запущено, вы увидите это на своем экране.


Активируйте распознавание речи, используя выбранный вами метод активации, хотя клавиша Windows + Ctrl будет работать как переключатель в любом случае. В качестве теста просто скажите «Пуск» с включенным индикатором «прослушивание». Меню «Пуск» должно появиться сразу. Дополнительные команды см. в официальном справочнике.

Что теперь?

После базовой настройки вы практически готовы управлять своим компьютером, используя только голос. Однако вы можете дополнительно обучить Windows, чтобы распознавание голоса стало более точным. Вы найдете обучающее приложение в настройках распознавания речи, которые вы впервые использовали для настройки распознавания голоса.

Чем больше образцов голоса есть в WIndows, тем лучше будет работать система. При этом, если вы получаете много пропущенных или неправильно расслышанных команд, потратьте несколько минут, чтобы обучить свою систему распознавания голоса.

Кортана и сторонние параметры

Хорошо, что в Windows 10 есть встроенное приложение для распознавания речи, позволяющее управлять Windows 10 с помощью голоса, но есть ли лучшая альтернатива? Правда в том, что управление речью на рабочем столе — довольно нишевая область. Это часто называют функцией доступности. Так что сторонних вариантов не так много.

< бр />

Интересно, что в Windows 10 есть полностью отдельная система голосового управления в виде Cortana. В качестве голосового помощника Cortana не предназначена для голосовой замены клавиатуры и мыши, но между этими двумя системами есть много общего. Посмотрите, на что способна Кортана. Возможно, она лучше подходит для ваших конкретных нужд, чем универсальная система распознавания речи.

Что касается стороннего голосового управления, то его немного. Самое известное на данный момент имя — Dragon Speech Recognition от Nuance. Они были пионерами компьютерного распознавания речи и, вероятно, имеют самый большой опыт в этой области. Этот вариант стоит изучить, если у вас есть сложные или критически важные потребности в распознавании речи.

Сидни Батлер — социолог и фанатик технологий, пытающийся понять, как сосуществуют люди и технологии. Он имеет двадцатилетний опыт работы внештатным специалистом по компьютерам и более десяти лет в качестве исследователя технологий и преподавателя. Сидни уже более пяти лет является профессиональным писателем по технологиям и освещает такие темы, как виртуальная реальность, игры, кибербезопасность и трансгуманизм. Прочитать полную биографию Сидни

Понравился ли вам этот совет? Если это так, загляните на наш собственный канал на YouTube, где мы рассказываем о Windows, Mac, программном обеспечении и приложениях, а также предлагаем множество советов по устранению неполадок и видео с практическими рекомендациями. Нажмите кнопку ниже, чтобы подписаться!

Читайте также: