Что такое компьютерная лингвистика

Обновлено: 21.11.2024

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

компьютерная лингвистика, языковой анализ с использованием компьютеров. Вычислительный анализ часто применяется для обработки основных языковых данных, например, для согласования и подсчета частот звуков, слов и словесных элементов, хотя компьютеры могут выполнять множество других типов лингвистического анализа.

Интерес к компьютерной лингвистике возник с появлением электронных цифровых компьютеров после окончания Второй мировой войны, и примерно с 1955 по 1965 год исследователи в США и Великобритании предприняли проекты, которые привели к компьютеризированному или механическому переводу, в частности Русский язык, предполагающий грамматический и семантический анализ предложений. Поддержка исследований в области механического перевода уменьшилась после того, как стало очевидно, что проблема создания высококачественных автоматических переводов гораздо сложнее, чем предполагалось.

Под вычислительной лингвистикой понимается не более чем использование электронных цифровых компьютеров в лингвистических исследованиях. В.

Начиная с конца 1960-х годов, исследования в области компьютерной лингвистики опирались на подходы из работ по искусственному интеллекту, в частности, на создание программ, способных понимать язык. По мере того, как компьютеры становились все более мощными, а количество письменных материалов в Интернете росло с развитием Всемирной паутины, компьютерная лингвистика разработала статистические подходы к изучению языка, которые позволили компьютерам лучше понимать человеческий язык.

Методы, разработанные в компьютерной лингвистике, использовались в других областях; например, при изучении стиля в литературе часто используется подсчет частотности языковых элементов, а при поиске информации обычно используется автоматический грамматический анализ.

Редакторы Британской энциклопедии Эта статья была недавно отредактирована и обновлена ​​Эриком Грегерсеном.

Несмотря на то, что были приложены все усилия для соблюдения правил стиля цитирования, могут быть некоторые расхождения. Если у вас есть какие-либо вопросы, обратитесь к соответствующему руководству по стилю или другим источникам.

Наши редакторы рассмотрят то, что вы отправили, и решат, нужно ли пересматривать статью.

компьютерная лингвистика, языковой анализ с использованием компьютеров. Вычислительный анализ часто применяется для обработки основных языковых данных, например, для согласования и подсчета частот звуков, слов и словесных элементов, хотя компьютеры могут выполнять множество других типов лингвистического анализа.

Интерес к компьютерной лингвистике возник с появлением электронных цифровых компьютеров после окончания Второй мировой войны, и примерно с 1955 по 1965 год исследователи в США и Великобритании предприняли проекты, которые привели к компьютеризированному или механическому переводу, в частности Русский язык, предполагающий грамматический и семантический анализ предложений. Поддержка исследований в области механического перевода уменьшилась после того, как стало очевидно, что проблема создания высококачественных автоматических переводов гораздо сложнее, чем предполагалось.

Под вычислительной лингвистикой понимается не более чем использование электронных цифровых компьютеров в лингвистических исследованиях. В.

Начиная с конца 1960-х годов, исследования в области компьютерной лингвистики опирались на подходы из работ по искусственному интеллекту, в частности, на создание программ, способных понимать язык. По мере того, как компьютеры становились все более мощными, а количество письменных материалов в Интернете росло с развитием Всемирной паутины, компьютерная лингвистика разработала статистические подходы к изучению языка, которые позволили компьютерам лучше понимать человеческий язык.

Методы, разработанные в компьютерной лингвистике, использовались в других областях; например, при изучении стиля в литературе часто используется подсчет частотности языковых элементов, а при поиске информации обычно используется автоматический грамматический анализ.

Редакторы Британской энциклопедии Эта статья была недавно отредактирована и обновлена ​​Эриком Грегерсеном.

Новейшее приложение лингвистики сочетает в себе возможности машинного обучения и человеческого языка, создавая область компьютерной лингвистики.Эта развивающаяся ветвь имеет большие перспективы, поскольку ее можно применять в самых разных контекстах и ​​революционизировать работу в других областях лингвистики.

Компьютерная лингвистика – это изучение методов, использующих огромную вычислительную мощность компьютеров для распознавания и создания языковых шаблонов. Эта область возникла в 1950-х годах как машинный перевод, когда военные США финансировали попытки разработать программы, предназначенные для автоматического перевода русского текста на английский. Результатом стал ряд сложных, написанных от руки правил, которым компьютер следовал для создания перевода. Хотя такие попытки имели ограниченный успех, эти инициативы сигнализировали о растущем интересе к вычислительным методам в лингвистике.

Улучшения в компьютерной лингвистике продолжались, и, возможно, самым большим достижением в этой области стало внедрение вероятностных и статистических методов. Более быстрые компьютеры и улучшенные стохастические алгоритмы, а также сбор огромных наборов данных, на которых можно было обучать программы, расширили роль компьютера; там, где раньше компьютеры применяли явные правила, предоставленные программистом, теперь они могли использовать индуктивное рассуждение для обнаружения и идентификации грамматических структур для себя.

Такое использование компьютеров для идентификации структур естественного языка известно как обработка естественного языка (NLP). НЛП имеет широкий спектр применения: от определения того, является ли отзыв об онлайн-продукте отрицательным или положительным (анализ настроений), до интерпретации словесной команды, отданной приложению на вашем мобильном телефоне (распознавание речи), и так далее. На самом деле, термин «вычислительная лингвистика» в значительной степени является синонимом «обработки естественного языка», хотя первый чаще используется для обозначения методов исследования, направленных на развитие лингвистической теории, а второй — для прикладных исследований. Использование компьютеров для создания языка известно как создание естественного языка (NLG).

Область компьютерной лингвистики предоставила инструменты для невероятных достижений как в теории, так и в приложениях в различных областях, и ее рост, похоже, не остановится в ближайшее время. В 2019 году UF Linguistics наняла доктора Кевина Танга, который теперь предлагает курс компьютерной лингвистики в дополнение к проведению собственных исследований. Надеясь стать лидером в этой области, UF Linguistics в настоящее время ищет еще одного преподавателя со специализацией в области вычислительной лингвистики. Если вам интересно узнать больше, мы рекомендуем вам посмотреть недавнюю презентацию нашего отдела о вычислительной лингвистике.

Компьютерные лингвисты разрабатывают компьютерные системы, работающие с человеческим языком. Им нужно хорошее понимание как программирования, так и лингвистики. Это сложная и техническая область, но квалифицированные компьютерные лингвисты востребованы и высокооплачиваемы. Компьютерные лингвисты создают системы, которые могут выполнять такие задачи, как распознавание речи (например, Siri), синтез речи, машинный перевод (например, Google Translate), проверку грамматики, анализ текста и другие приложения «больших данных» и многие другие.

Дополнительную информацию о работе в этой отрасли можно найти в презентациях Виты Маркман и Лауры Уолш-Дики.

В индустрии программного обеспечения также есть лингвистические профессии, которые не обязательно требуют большого опыта программирования, например, оценщики речевых данных, менеджеры лингвистических данных, аннотаторы и специалисты по локализации.

Как заняться компьютерной лингвистикой

В CSULB нет программы по компьютерной лингвистике, но вы можете выбрать курсы, которые подготовят вас к этой области. Вот области, на которых вы должны сосредоточиться:

  • Программирование. Кафедра компьютерной инженерии и компьютерных наук предлагает серию курсов, начиная с CECS 100 (критическое мышление в эпоху цифровой информации) и CECS 174 (введение в программирование и решение проблем). Для самостоятельного изучения попробуйте книги по программированию, специально предназначенные для лингвистов, например, книги Майкла Хаммондса по Perl и Java или книгу Берда и др. по Python. Существует также множество бесплатных онлайн-курсов, таких как курс Python от EdX.
  • Математика и статистика. Компьютерная лингвистика часто использует статистические методы. LING 301 (Введение в методы исследования) представляет собой базовое введение в статистику; есть также более продвинутые курсы, доступные на других факультетах. Кроме того, программирование требует некоторой математической подготовки; CECS 174 имеет необходимые компоненты CECS 100 и MATH 113, 122 или 123.
  • Лингвистика. Наиболее актуальными курсами для компьютерных лингвистов являются те, которые посвящены структурным аспектам языка (синтаксис, семантика, фонология, фонетика), моделям использования и вариациям (социолингвистика, дискурс), психолингвистике и методам исследования (включая корпусную лингвистику).
  • Обработка естественного языка.Доступны онлайн-курсы, в том числе от Национального исследовательского университета, Техасского университета в Остине и Стэнфорда.

Дополнительное образование

Университеты Калифорнии, предлагающие программы компьютерной лингвистики, включают:

Читайте также: