Как разговаривать с компьютером

Обновлено: 02.07.2024

Конечно, вы разговариваете со своим смартфоном. Siri или Cortana (или Google Now) ищет вас в Интернете, отправляет текстовые сообщения или напоминает вам что-то сделать. Но вы разговариваете со своим компьютером? Вы просите его открывать приложения и находить файлы? Удалить это и использовать это с большой буквы?

Самый быстрый способ заставить компьютер что-то сделать — попросить его! Скоро один только ваш голос сделает все, что вы можете сделать с клавиатурой. Вот как начать прямо сейчас:

Первое, что нужно сделать, это понять, как ваш компьютер интерпретирует голосовые команды. Онлайн-инструкции могут показаться немного скучными, поэтому ожидайте проб и ошибок в процессе работы — поскольку вы не используете клавиатуру или мышь, это новый набор навыков.

Существует два основных способа управления компьютером с помощью голоса. Во-первых, вы можете диктовать текст вместо того, чтобы печатать его. Во-вторых, вы можете давать компьютеру команды. Когда вы диктуете, произносимые вами слова появляются в документе по мере их произнесения. Вы также произносите знаки препинания — запятую, точку, открывающую скобку и т. д.

Когда вы даете компьютеру команды, вы должны использовать определенные слова, которые компьютерное программное обеспечение для распознавания голоса идентифицирует как команды. Команды могут быть предназначены для действий внутри документа, над которым вы работаете, например «прокрутить вниз» или «удалить», или для действий в ОС, например «свернуть это» или «открыть».

  • Microsoft: если вы пользовались предыдущими версиями голосового управления Windows, не беспокойтесь. Он прошел долгий путь. Распознавание речи Windows 10 довольно хорошо справляется с пониманием того, что вы говорите, и переводом его в действие. Обязательно пройдите онлайн-учебник и следуйте процессу обучения, чтобы повысить точность диктовки. Вот полный список команд распознавания как для диктовки, так и для операционной системы.
  • Apple:Dictation встроен в операционную систему Mac, и если у вас OS X Mavericks или более поздняя версия, вы также можете использовать расширенные команды для диктовки. Чтобы создать свои собственные команды, просто соедините любое выбранное вами слово с любым доступным действием, и ваш Mac будет подчиняться вам, пока включена расширенная диктовка. Вы также можете включать и выключать диктовку своим голосом, что очень удобно. Ходят слухи, что Siri для настольных компьютеров будет выпущена в сентябре, но пока вы можете заставить Spotlight работать как Siri.
  • Google: вы можете использовать голосовой ввод в Документах Google (в разделе "Инструменты") для диктовки, используя те же типы команд, что и в Windows и OS X. Если у вас есть Chromebook, работающий на Android, вы можете использовать голосовое управление. поиск и команды, включив OK Google. Вот список команд Google для Android от CNet. Google Now, личный помощник для Android, лучше осведомлен о контексте, чем Siri и Cortana, но для некоторых людей он слишком навязчив.

Привыкание к использованию распознавания голоса для управления компьютером может занять некоторое время. И окружающим вас людям (и вашим питомцам) тоже может понадобиться время, чтобы приспособиться! Но как только вы освоите это, вы будете поражены тем, как быстро вы можете масштабировать — вы удивитесь, почему вы не разговаривали со своим компьютером целую вечность. Вы можете даже представить себе день, когда вообще не будете пользоваться клавиатурой.

Этот день приближается.

На самом деле, вскоре мы перейдем от того, чтобы просить наши компьютеры выполнять задачи, к тому, чтобы просить их решать проблемы. Поэтому вместо того, чтобы просить компьютер открыть приложение, вы спросите его примерно так: «На каких трех рынках США мой новый продукт, скорее всего, будет успешным?» или «Если у моего пациента есть симптомы, какие тесты следует выполнить в первую очередь и почему?» Благодаря возможностям когнитивных вычислений, подобным тем, что есть в IBM Watson, компьютере, который выиграл Jeopardy, общение с вашим устройством станет больше похоже на общение с разумным человеком. Связанные технологии включают искусственный интеллект, обработку естественного языка, машинное обучение, распознавание и синтез речи.

И все начинается с программного обеспечения для распознавания речи и диктовки, которое уже установлено на вашем компьютере. Чего же ты ждешь? Запрыгивай!

Прослушивание разговоров с ПК

Существует множество способов заставить компьютер читать текст вслух или читать текст на экране. Выберите ссылку ниже, чтобы получить информацию о конкретных программах или службах, доступных для озвучивания текста с вашего компьютера.

Слепые или слабовидящие пользователи ищут решения для специальных возможностей

Ниже приведены программы, которые помогают пользователям с нарушениями зрения или слепых просматривать графическую среду, такую ​​как Microsoft Windows, Интернет или другие части компьютера.

Рассказчик Microsoft Windows и экранная лупа. Хотя эти программы не такие сложные, как некоторые другие решения, они бесплатны и входят в состав Microsoft Windows.Доступ к обеим этим программам можно получить, нажав «Пуск», «Программы», «Стандартные», «Специальные возможности», а затем «Лупа» или «Экранный диктор». Ниже приводится краткое описание каждой из этих программ.

Лупа. Отличная программа, позволяющая пользователям с нарушениями зрения увеличивать части экрана, что упрощает чтение и навигацию по компьютеру.

Рассказчик - Эта программа больше предназначена для слепых. Он читает кнопки, ссылки и части окна вслух пользователю, позволяя ему или ей перемещаться. К сожалению, эта программа довольно ограничена, но может помочь некоторым пользователям в навигации.

JAWS — одна из самых сложных и рекомендуемых программ. JAWS — это программа для чтения с экрана, способная читать почти все, что происходит на экране. Он также способен выводить информацию на шрифт Брайля. К сожалению, из-за всех своих возможностей и сложностей эта программа является одним из самых дорогих решений.

Dolphin - Программное обеспечение Dolphin Pocket Hal - отличная программа для слабовидящих и слепых пользователей, которая способна читать все, что происходит на экране, практически в любой программе. Dolphin также предлагает другие решения, помогающие пользователям получать аудиозапись своих документов.

Пользователи, которые ищут программы для чтения текста вслух на своем компьютере

Если вы ищете программу для установки и запуска на своем компьютере, которая читает текст вслух, рассмотрите одну из следующих бесплатных программ.

Ultra Hal Text-to-Speech Reader — еще одна замечательная бесплатная программа для Windows, которая позволяет пользователям копировать текст в программу и читать текст вслух разными голосами.

Пользователи, которые ищут синтезатор речи в Интернете

Ниже приведены ссылки на веб-страницы, которые позволяют пользователям печатать и прослушивать синтез речи через Интернет. Для работы большинства этих страниц требуется только веб-браузер и динамики (или наушники).

Демонстрационная версия AT&T TTS (Text-To-Speech) — одна из лучших свободно доступных и хорошо звучащих онлайн-программ для синтеза речи. Он может преобразовывать печатный текст в аудиоформат и воспроизводить все онлайн без необходимости загружать какое-либо программное обеспечение.

Я пишу этот выпуск технических советов, сидя в аэропорту в ожидании рейса. Мужчина, сидящий рядом со мной, говорит: «В аэропорту сегодня многолюдно». Я соглашаюсь с ним, а потом понимаю, что он разговаривает не со мной: он разговаривает по мобильному телефону. Когда я оглядываюсь на своих попутчиков у ворот, я замечаю, что более половины из них разговаривают, но никто из них не с людьми рядом с ними. Беспроводные телефоны многое сделали для того, чтобы люди не стеснялись открыто говорить на публике. Это заставляет меня задаться вопросом, будут ли когда-нибудь люди одинаково комфортно управлять своими компьютерами с помощью голоса и устно составлять документы с использованием технологии распознавания речи.

Изображение двух DO - IT-ученые, использующие компьютер». ширина=

Технология распознавания речи существует уже несколько десятилетий. Исследователи из Bell Labs компании AT&T начали попытки заставить компьютеры расшифровывать человеческую речь в 1936 году. Первой компанией, выпустившей коммерческий продукт для распознавания речи, была Covox в 1982 году. В том же году двумя бывшими исследователями IBM Джеймсом и Джанет Бейкер была основана компания Dragon Systems. который работал над распознаванием речи в IBM. В 1990 году они выпустили Dragon Dictate™, первую систему преобразования речи в текст с большим словарным запасом для универсальной диктовки. Их основным рынком сбыта Dragon Dictate™ были люди с ограниченными возможностями, особенно люди с нарушениями опорно-двигательного аппарата, которым иначе было бы трудно набирать текст на компьютере. С тех пор распознавание речи завоевало популярность на основных рынках, и люди с ограниченными возможностями редко даже упоминаются в маркетинговых материалах. Тем не менее, технология распознавания речи может принести пользу людям с ограниченным использованием рук или ограниченной ловкостью, людям с повторяющимися стрессовыми травмами, такими как синдром запястного канала, и людям с ограниченными возможностями обучения, которые испытывают трудности с письмом. Он позволяет людям говорить естественно и транскрибирует то, что они говорят, или, по крайней мере, то, что, по его мнению, они говорят.

Точность и простота использования — главные препятствия на пути к тому, чтобы распознавание речи стало идеальным решением для всех. Продукты распознавания речи допускают ошибки — вы говорите «Нам это подходит», а на экране появляется «его артрит». К счастью, продукты для распознавания речи можно научить понимать произношение своих пользователей. Я лично знал людей с серьезно нарушенной речью, которые успешно научили свои компьютеры понимать их, но это требовало чрезвычайного терпения и времени.

Чтобы быть успешным пользователем распознавания речи, вы должны уметь определять, когда компьютер допустил ошибку, и вы должны ее исправить.В противном случае его ошибка закрепляется, и он учится неправильно. Думайте о распознавании речи как о младенце — он запрограммирован на понимание языка, но ничего не понимает пока и ничего не поймет, пока его родитель (вы) не поработает с ним, не научит и не исправит. его ошибки.

С каждой новой версией продукты для распознавания речи становятся точнее. Учитывая потенциальный потребительский рынок для распознавания речи и потенциальное повышение производительности (мы произносим 150 слов в минуту — очень немногие люди могут печатать так быстро), федеральное правительство и многие частные компании посвящают много времени и денег постоянным исследованиям и разработкам. . Когда-нибудь все будут говорить со своими компьютерами, и их компьютеры поймут их или будут достаточно умны, чтобы попросить разъяснений.

До тех пор нам все равно придется потратить много времени и усилий, чтобы продукты для распознавания речи работали на нас, но в конечном итоге это может значительно сэкономить время и позволить многим людям с ограниченными возможностями создавать документы намного быстрее, чем в противном случае они могли бы.

Распознавание речи также доступно в Microsoft Office 2002 и более поздних версиях. Он не такой многофункциональный, как Dragon Naturally Speaking, но позволяет вам диктовать текст в любую программу Office, а также выбирать меню и другие функции программы Office. По умолчанию он не установлен, но чтобы попробовать его, выберите «Инструменты» > «Речь» в меню Microsoft Word. Вам будет предложено установить речь и обучить Microsoft Speech распознавать ваш голос.

Известно, что в своих программных выступлениях Билл Гейтс рекламирует диалоговый пользовательский интерфейс (CUI), который произносится как "cooey". Как и многие технологические провидцы, он верит, что когда-нибудь мы все будем взаимодействовать с нашими компьютерами, как если бы они были людьми. Современные продукты для распознавания речи не особенно хороши в общении. Но это полезные инструменты, которые, если потратить время и терпение, могут значительно улучшить способность многих людей использовать компьютер и эффективно составлять документы.

Печать на ноутбуке

Печать может вызвать серьезную проблему со здоровьем: от повторяющихся растяжений, или RSI, страдают сотни тысяч людей каждый год. Если вы беспокоитесь о повреждении или просто хотите дать своим пальцам передышку, вам может помочь голосовая диктовка. Благодаря постоянному совершенствованию инструментов распознавания голоса, интерпретация вашего устного текста компьютером больше не вызывает разочарования, как это было раньше. На самом деле, в зависимости от вашей скорости печати, вам может быть быстрее произнести текст, чем набрать его. Кроме того, вам даже не нужно дополнительное оборудование — встроенный микрофон вашего компьютера должен быть более чем способен улавливать ваши слова.

Какую бы операционную систему и программное обеспечение вы ни использовали, вы можете найти множество бесплатных инструментов и коммерческих пакетов для преобразования вашего голоса в печать. В этом руководстве мы сосредоточимся на трех самых популярных текстовых процессорах: Microsoft Word, Apple Pages и Google Docs.

В Windows: Microsoft Word

Если вы используете текстовый процессор Microsoft на компьютере с Windows, у вас есть несколько вариантов распознавания голоса. В этом разделе будут рассмотрены три из них, основное внимание будет уделено программе распознавания речи Windows, встроенной в эту операционную систему.

Встроенная служба распознавания голоса будет работать в любом приложении Windows, включая Microsoft Word. Чтобы запустить его, введите «Распознавание речи Windows» в поле поиска на панели задач, затем щелкните приложение, когда оно появится. При первом запуске этого программного обеспечения вам необходимо научить утилиту распознавать ваш голос. В Windows есть краткий пошаговый мастер, который шаг за шагом проведет вас через весь процесс. Со временем система должна лучше распознавать ваш голос, и вы также можете обучить ее, щелкнув правой кнопкой мыши на консоли распознавания речи, выбрав Конфигурация и нажав Улучшить распознавание речи.

После того как вы завершите первоначальную настройку распознавания голоса, вы всегда сможете запустить утилиту с панели задач (как описано выше). С помощью распознавания речи вы можете управлять всеми видами действий на компьютере, включая запуск программ и поиск на компьютере, используя только свой голос. Если вам это нравится, вы можете настроить автоматический запуск программы при каждом запуске Windows: просто щелкните приложение правой кнопкой мыши, выберите «Параметры» и нажмите «Запуск при запуске».

Чтобы использовать службу с Microsoft Word, вытащите консоль распознавания речи на экран, откройте Word и переместите курсор на ту часть документа, которую вы сейчас редактируете. Затем нажмите кнопку микрофона и начните говорить. Нажмите на микрофон еще раз, чтобы отключить голосовую диктовку.Вы можете перемещаться с помощью произносимых фраз: например, скажите «исправить это», чтобы внести изменения, и «перейти к концу предложения», чтобы перемещаться по тексту. Полный список всех поддерживаемых команд, включая команды для пунктуации и форматирования, см. в документе службы поддержки Microsoft.

Несмотря на то, что распознавание речи Windows существует уже много лет, Microsoft недавно представила бесплатный экспериментальный подключаемый модуль для диктовки для Microsoft Word, Outlook и PowerPoint под названием Dictate. Перейдите по этой ссылке, чтобы загрузить его, а затем перезапустите Microsoft Word. Теперь вы должны увидеть новую вкладку «Диктовка» в меню ленты. Чтобы начать произносить слова на странице, откройте эту вкладку и нажмите кнопку «Старт». По нашему опыту, Dictate не так точен, как распознавание речи Windows, но приложение находится на ранней стадии развития и со временем может улучшиться. И у него есть то преимущество, что оно встроено прямо в Word.

Если вам недостаточно этих двух инструментов, попробуйте стороннюю программу. Прямо сейчас явным лидером рынка является Dragon для ПК. Благодаря многолетней разработке он может похвастаться фантастическим уровнем точности распознавания голоса и идеально подходит для всех ваших приложений Windows, включая Word. Если вы хотите получить полный контроль над своим компьютером с помощью голоса, а собственные инструменты Microsoft просто не работают так, как вы хотите, попробуйте один из пакетов Dragon: вы можете получить домашнюю версию за 75 долларов или заплатить за премиум версия, в которой добавлены такие возможности, как разговор через гарнитуру Bluetooth, за 175 долл. США.

В macOS: Microsoft Word и Apple Pages

Как и в Windows, macOS включает встроенную систему голосовой диктовки, которая работает с любой программой, включая Microsoft Word и проприетарный текстовый процессор Apple Pages.

Чтобы настроить его, нажмите меню Apple, выберите «Системные настройки», затем выберите «Клавиатура и диктовка». Включите диктовку, а также установите флажок «Расширенная диктовка», чтобы использовать эту функцию в автономном режиме. Затем откройте документ в Microsoft Word или Apple Pages. Либо выберите «Начать диктовку» в меню «Правка», либо нажмите кнопку быстрого доступа. По умолчанию для этого ярлыка установлено два касания функциональной клавиши, но вы можете изменить его на панели «Диктовка» в Системных настройках.

Затем просто скажите, что вы хотите ввести. Чтобы добавить знаки препинания, произнесите имя символа, который хотите использовать. Во время диктовки вы также можете использовать такие команды, как «новая строка» и «заглавные буквы». Полный список см. на странице поддержки Apple. Чтобы прекратить диктовку, нажмите "Готово" или один раз нажмите функциональную клавишу.

Если вас не устраивает это интегрированное решение, вы можете переключиться на стороннее альтернативное решение. Хотя нам по-прежнему нравится упомянутое ранее программное обеспечение Dragon, Dragon для Mac доступен только в профессиональной версии за 300 долларов. Каким бы мощным он ни был — он включает в себя возможности глубокого обучения, которые со временем позволяют ему становиться более точным — это большие деньги. Тем не менее, вы получаете большую отдачу от затраченных средств, в том числе возможность транскрибировать текст из аудиозаписей и настраивать собственные слова в словаре программного обеспечения.

В любой операционной системе: Документы Google

Для компьютеров с Windows или macOS вы можете настроить голосовую диктовку в Документах Google с помощью одного и того же простого процесса. Поскольку Документы — это веб-приложение, вам не нужно устанавливать какое-либо дополнительное программное обеспечение. Просто используйте любой удобный для вас браузер.

Для начала откройте документ Google Docs на экране, выберите меню "Инструменты" и выберите "Голосовой ввод". Вы также можете нажать сочетание клавиш: Ctrl+Shift+S в Windows и Cmd+Shift+S на Mac. На экране появится новая кнопка микрофона. Нажмите здесь, чтобы начать говорить и диктовать, хотя сначала вам может потребоваться предоставить браузеру разрешение на использование микрофона компьютера.

Система распознавания голоса Google очень точна, поэтому вам не придется исправлять слишком много слов или символов. Если система не уверена в том, что вы сказали, она подчеркнет соответствующую фразу, и вы можете щелкнуть правой кнопкой мыши по этим словам, чтобы увидеть список альтернативных предложений. Чтобы вставить знаки препинания, такие как точки, запятые, восклицательные или вопросительные знаки, или добавить новые строки или абзацы, просто скажите об этом. Кроме того, Google Docs поддерживает множество голосовых команд для выбора и форматирования текста, добавления и редактирования таблиц, перемещения по документу и многого другого. Полный список команд можно найти на странице поддержки Google Docs. Когда вы закончите диктовать, снова нажмите кнопку микрофона или скажите "Хватит слушать".

Дэвид Нилд (David Nield) — независимый участник Popular Science. Он создает руководства и разъяснения для раздела "Сделай сам" по всем вопросам: от улучшения фотографий на смартфоне до повышения безопасности ноутбука. У него не так много свободного времени, но если оно есть, то он смотрит малоизвестные фильмы и совершает длительные прогулки по сельской местности.

Читайте также: