Что удовлетворяет качеству компьютерного перевода

Обновлено: 09.07.2026

Чтобы лучше понять, как мы можем оценивать качество машинного перевода, имеет смысл взглянуть на то, как мы в настоящее время оцениваем качество человеческого перевода.

Стандарты оценки человеческого перевода включают (но не ограничиваются ими) многомерные показатели качества (MQM), динамическую структуру качества (DQF) и показатель качества перевода J2450. Эти стандарты используются для оценки критериев качества, таких как лингвистическая правильность, понятность, беглость, культурная приемлемость и т. д.

Эти методы оценки обычно дают единую оценку, которая отражает количество ошибок и их серьезность по отношению к объему данного текста. Такие оценки можно настроить для соответствующего варианта использования (например, с помощью скорректированных пороговых значений), чтобы вы могли решить, является ли перевод хорошим или плохим, то есть подходит ли он для ваших целей или нет. Пока все хорошо.

Но какой бы стандарт вы ни выбрали и как бы ни определяли свои пороговые значения, задача обнаружения и классификации ошибок в соответствии с этими показателями полностью зависит от рецензентов.

А вот и плохие новости, которых вы так долго ждали: эта задача остается ручной задачей человека, даже когда вы оцениваете качество машинного перевода.

Так в чем тогда смысл автоматической оценки качества машинного перевода?

Ответ прост: автоматические оценки полезны, просто их полезность зависит от того, какой ответ вы ожидаете.

Проблемы с оценкой фактического качества перевода не исчезают волшебным образом при переходе от человеческого к машинному переводу. Кроме того, существуют различные показатели для измерения качества машинного перевода, и тот, который вы должны использовать, зависит от того, что вы хотите знать.

Например, если вы хотите оценить, можно ли использовать контент, переведенный с помощью машинного перевода, без постредактирования для определенного варианта использования, вы должны использовать ту же оценку качества, что и для человеческого перевода: квалифицированный лингвист просматривает перевод и своего источника, классифицирует ошибки, а затем получает оценку, которая показывает, прошел или не прошел необработанный МТ в соответствующем контексте. Нет никакого волшебного пути или обходного пути: если вы хотите быть уверены, что данный текст, переведенный с помощью машины, соответствует вашим ожиданиям в отношении качества, вам необходимо применить человеческую проверку.

Но что, если у вас есть другой вопрос? Что, если вы хотите сравнить машинный перевод с машинным переводом, то есть получить общее представление о том, насколько хорошо конкретный механизм машинного перевода работает для данного набора тестов по сравнению с другими механизмами? Для сравнительных оценок лучше всего подойдет метод двуязычной оценки (BLEU).

И, наконец, как насчет вопроса, наиболее важного в контексте постредактирования: экономим ли мы усилия при переводе за счет постредактирования машинного перевода по сравнению с переводом с нуля? И если да, то сколько? В этом случае, если вы хотите убедиться, что ваши колеса не крутятся, расстояние после редактирования (PED) может быть тем методом, который вам нужен.

Давайте подробнее рассмотрим BLEU и аналогичные методы, а также PED, чтобы лучше понять, что они на самом деле измеряют.

BLEU и подобные методы — есть только один правильный ответ

Методология подсчета очков при двуязычной оценке (BLEU) и аналогичные методы, такие как HTER (коэффициент ошибок перевода, ориентированный на человека) или LEPOR (штраф за длину, точность, штраф за разницу в позициях в n-граммах и отзыв), были разработаны инженерами MT в качестве быстрый и недорогой способ оценить успешность настройки двигателя МТ, потому что они не требуют участия человека-оценщика. Однако это означает, что они также не дают тех же ответов, что и оценщик-человек.

Как работает BLEU

BLEU основан на допущении, что существует только один хороший перевод текста, и что качество машинного перевода – это степень сходства результата машинного перевода с этим переводом. «Хороший перевод» называется эталонным переводом и представляет собой образец текста как на исходном, так и на целевом языках. Говоря более конкретно, это образец, который ранее был переведен человеком и считается качественным.

Поэтому измерение происходит на основе именно этого эталонного текста: исходный текст переводится одним или несколькими механизмами машинного перевода, и алгоритм вычисляет разницу между каждым результатом машинного перевода и эталонным переводом. Результатом является так называемая оценка BLEU, которая выражается числом от 0 до 1 или от 0 % до 100 %. Чем выше оценка BLEU, тем более похожи два текста.

Недостатки BLEU

Хотя способ, которым этот метод вычисляет сходство, довольно сложен, основная проблема с BLEU и подобными показателями заключается в том, что они предполагают, что для каждого текста существует только один хороший перевод.Однако профессиональные лингвисты обычно понимают, что для любого исходного текста может быть несколько подходящих переводов.

Таким образом, BLEU на самом деле не измеряет качество перевода, а скорее степень, в которой данный движок может имитировать определенные справочные тексты.

Нетрудно понять, что оценки BLEU для одного и того же механизма машинного перевода будут различаться в зависимости от справочного текста. Также ясно, что оценка BLEU, полученная с использованием справочного текста низкого качества, вообще не будет отражать качество машинного перевода. Кроме того, оценка будет зависеть от размера используемой вами выборки, набора символов измеряемых языков и других факторов. Теперь все не так просто, не так ли?

Также очевидно, что BLEU не вынесет вердикт о качестве новых текстов, поскольку для этого требуется тестовый сценарий с установленным (переведенным человеком) справочным текстом. Вы не можете использовать BLEU для измерения качества машинных переводов, которые никогда раньше не переводились людьми, что делает его непригодным для прогнозного применения.

Однако BLEU является действенным инструментом для измерения эффективности обучения движку и, в некоторой степени, для сравнения движков разных поставщиков машинного перевода. Однако важно отметить, что оценка BLEU — это не фиксированная характеристика механизма машинного перевода, а скорее тестовый сценарий. Один и тот же движок будет оцениваться по-разному в зависимости от эталонного перевода.

Вердикт BLEU

Хотя BLEU обычно коррелирует с человеческим суждением о качестве машинного перевода, на самом деле он не отвечает на вопрос о качестве данного текста. Он просто указывает, насколько вероятно, что текст, аналогичный эталонному переводу, будет правильным. Кроме того, появляется все больше свидетельств того, что даже в такой ограниченной сфере применения срок службы BLEU подходит к концу.

Расстояние PE — измерение в реальных условиях

Как работает допинг

Расстояние после редактирования (PED) измеряет объем редактирования, который требуется машинному переводу для соответствия ожиданиям по качеству. Основное отличие от BLEU заключается в том, что эталонный человеческий перевод фактически выполняется на основе машинного перевода, что увеличивает вероятность того, что машинный перевод и человеческий перевод будут похожи или идентичны. Это связано с тем, что переводчики с солидным опытом постредактирования не будут вносить ненужные изменения в МД. Поэтому, если предположить, что переводчики выполнили свою работу правильно, PED гораздо лучше отражает пригодность MT для постредактирования, чем BLEU.

Итак, может ли любой лингвист с опытом постредактирования выполнить постредактирование для анализа PED? Не совсем. Важным фактором здесь является то, что переводчик действительно понимает ожидания заказчика в отношении качества текста. Машинный перевод может звучать бегло, без явных смысловых ошибок, и при этом не соответствовать требованиям качества. Например, могла не применяться пользовательская терминология или стиль, тексты могли превышать ограничения по длине или информация о форматировании могла быть утеряна. Короче говоря, вам нужен лингвист, обладающий как опытом постредактирования, так и знаниями клиентов.

При использовании PED для получения достоверных данных требуются реальные условия, а расстояние после редактирования можно рассчитать только на основе постредактирования, которое соответствует ожиданиям по качеству. Алгоритм вычисляет разницу между необработанным MT и постредактированным переводом и выдает значение для каждого сегмента и образца текста. Это значение указывает процент необработанного машинного перевода, который был повторно использован переводчиком, начиная со 100 % (переводчик не вносил изменений в сегмент или текст) и уменьшаясь от этого значения. Высокие баллы PED указывают на реальный рост эффективности переводчика.

Как показатели PED связаны с усилиями по постредактированию?

Здесь действует эмпирическое правило: чем выше показатель PED, тем меньше усилий. Однако, как и в случае совпадений памяти переводов, существует определенный процентный порог, который должен быть достигнут, чтобы представить реальный прирост эффективности. Если общее значение PED для данного типа текста постоянно ниже этого порога, MT не экономит время.

Значит ли высокое значение PED, что переводчик не прилагал никаких усилий, и нужно ли вам платить за постредактирование, если PED близко к 100 %? Ответ таков: если вы хотите постредактирование, оно будет стоить денег. Важно отметить, что даже при очень высоком значении постредактирования усилия переводчика не равны нулю: они выполнили полный просмотр целевого текста и сравнили его с исходным текстом, подтвердили, что терминология, применяемая МТ система является правильной, потенциально проведены дополнительные исследования или получены разъяснения и т.д. Таким образом, усилия по постредактированию никогда не равны нулю, даже когда правок почти нет. Это сравнимо со вторым мнением врача: тот факт, что оба врача пришли к одному и тому же заключению, не означает, что второму не нужно было тщательно проверять пациента.

Надежные прогнозы усилий после редактирования

Оценивая значения PED для достаточно больших объемов аналогичного текста, вы можете получить надежное представление о затраченных усилиях и количественно оценить повышение эффективности. Небольшие случайные выборки не являются подходящей основой для такого рода анализа, поскольку они могут привести к слишком положительным или отрицательным значениям PED и, в конечном счете, не репрезентативным для средних реальных результатов. К счастью, тестирование с подходящими объемами не означает увеличения стоимости вашего обычного процесса перевода. Мы хорошо разбираемся в этом вопросе, поэтому не стесняйтесь обращаться к своему контактному лицу в Acolad за пилотной программой машинного перевода и узнайте, как рассчитать потенциальную экономию.

Взаимодействие человека для качественного машинного перевода

Франсиско Касакуберта, Хорхе Сивера, Эльза Кубель, Антонио Л. Лагарда, Гай Лапальме, Эллиот Маклович, Энрике Видаль
Communications of the ACM, October 2009, Vol. 52 № 10, страницы 135-138
10.1145/1562764.1562798
Комментарии

Перевод с исходного языка на целевой язык в последние годы стал очень важным видом деятельности как в официальных учреждениях (таких как Организация Объединенных Наций и ЕС, так и в парламентах многоязычных стран, таких как Канада и Испания), а также а также в частном секторе (например, для перевода руководств пользователя или газетных статей). Такие престижные клиенты, как эти, не могут обойтись приблизительными переводами; по самым разным причинам, начиная от юридических обязательств и заканчивая хорошей маркетинговой практикой, им требуются тексты на целевом языке самого высокого качества. Задача создания таких высококачественных переводов является сложной и трудоемкой задачей, которая обычно возлагается на опытных переводчиков-людей. Проблема в том, что с ростом глобализации спрос на высококачественный перевод неуклонно растет, и сегодня для его удовлетворения просто не хватает квалифицированных переводчиков. Это резко повысило потребность в улучшенных технологиях машинного перевода (MT).

За последние 15 лет в области машинного перевода произошла своего рода революция, связанная с внедрением эмпирических методов, основанных на данных, изначально вдохновленных успехом автоматического распознавания речи. 10 При наличии необходимых корпусов теперь можно разрабатывать новые системы машинного перевода за короткое время и с гораздо меньшими усилиями, чем это требовалось ранее в прежней доминирующей парадигме, основанной на правилах. Что касается качества переводов, производимых этим новым поколением систем машинного перевода, то здесь также был достигнут значительный прогресс; в целом, однако, он остается намного ниже человеческого перевода. Никто не стал бы всерьез рассматривать прямое использование вывода даже самых лучших из этих систем, например, для перевода резюме или корпоративного веб-сайта, не подвергая машинный перевод тщательной проверке человеком. В результате те, кому требуется перевод качества публикации, вынуждены делать трудный выбор между системами, которые являются полностью автоматическими, но вывод которых должен подвергаться тщательному постредактированию, и компьютерными системами перевода (или сокращенно CAT-инструментами) 7 , которые позволяют за высокое качество, но в ущерб полной автоматизации.

В настоящее время наиболее известными CAT-инструментами являются системы памяти переводов (TM). Эти системы повторно используют предложения, которые ранее были переведены либо в текущем документе, либо ранее в других документах. Это очень полезно для часто повторяющихся текстов, но бесполезно для подавляющего большинства текстов, состоящих из оригинальных материалов.

С тех пор, как системы TM были впервые представлены, появилось очень мало других типов CAT-инструментов. Заметными исключениями являются система TransType 6 и ее преемник TransType2 (TT2). 4 Эти системы представляют собой новую переработку старой идеи интерактивного машинного перевода (IMT). Первоначальные попытки создания TransType подробно описаны у Фостера; 5,6 здесь достаточно сказать, что принципиальная новизна системы заключается в том, что человеко-машинное взаимодействие фокусируется на составлении целевого текста, а не на устранении неоднозначности исходного текста, как во всех прежних системах IMT.

В проекте TT2 эта идея получила дальнейшее развитие. Полноценный механизм машинного перевода был встроен в интерактивную среду редактирования и использовался для создания предлагаемых вариантов завершения каждого переводимого целевого предложения. Эти дополнения могут быть приняты или изменены переводчиком; но после проверки они используются движком MT для создания дальнейших, возможно, улучшенных предложений. Это заметно отличается от традиционного машинного перевода, где обычно система сначала используется для создания полного проекта перевода исходного текста, который затем редактируется (исправляется) в автономном режиме переводчиком-человеком. Интерактивный подход TT2 предлагает значительное преимущество перед традиционным постредактированием.В последней парадигме система, находящаяся в автономном режиме, не может извлечь выгоду из исправлений пользователя; в TransType все наоборот. Как только пользователь начинает редактировать неправильный сегмент, система немедленно реагирует на эту новую информацию, предлагая альтернативное завершение целевого сегмента, совместимое с введенным пользователем префиксом.

Еще одной примечательной особенностью работы, описанной в этой статье, является важность, придаваемая формальному подходу к взаимодействию человека и машины, что редко учитывается в преобладающей сейчас структуре статистического распознавания образов.

Интерактивный машинный перевод

Мы начнем с наглядного примера того, как работает система IMT TT2 (см. рис. 1), прежде чем представить более формальное описание.

Предположим, что исходное английское предложение s = "Нажмите OK, чтобы закрыть диалоговое окно печати" должно быть переведено в целевое испанское предложение t. Первоначально, без информации о пользователе (t_p = ), система предлагает полный вариант перевода (t_s = "Haga clic para cerrar el diálogo de impresión").

В этом переводе пользователь помечает префикс как правильный (a="Haga clic") и начинает вводить остальную часть целевого предложения. В зависимости от системы или предпочтений пользователя новым вводом k может быть следующее слово или несколько букв из него (в нашем примере k — это следующее правильное слово "en"). Затем новый целевой префикс t_p определяется ранее проверенным префиксом вместе с новым вводом, который только что ввел пользователь (t_p = "Haga clic en").

Затем система создает новый суффикс t_s для завершения перевода: ACEPTAR para cerrar el diálogo de impresión». Взаимодействие продолжается. с новой проверкой, за которой, при необходимости, следует новый ввод пользователя и т. д., пока не будет получен полный и удовлетворительный перевод.

Этот тип интерактивного процесса перевода можно легко формализовать в элегантной статистической структуре для машинного перевода, впервые предложенной Брауном и др. 2 В этой структуре переводы генерируются на основе статистических и теоретико-информационных моделей, параметры которых автоматически выводятся («обучаются») на основе анализа двуязычных корпусов текстов.

Более формально, нам дается предложение s на исходном языке, и система должна найти лучший перевод на целевой язык. Согласно статистической теории принятия решений, лучшим переводом является предложение на целевом языке, что наиболее вероятно, учитывая исходное предложение:

Были предложены различные модели для приближения к тому или иному из этих вероятностных распределений, от статистических (на основе слов или фраз) моделей выравнивания (SAM) 2 для условного распределения до стохастические датчики конечных состояний (SFST) 3 для совместного распределения. В проекте TT2 были развернуты как SFST, так и SAM, хотя в этой статье мы сосредоточимся на результатах, полученных с помощью SFST. В этом случае перевод нового исходного предложения, заданного уравнением (1), осуществляется путем поиска оптимального пути во взвешенном графе, представляющем все возможные переводы исходного предложения. 3 SFST хорошо подходят для требований IMT в реальном времени.

В рамках проекта TT2 мы разработали и протестировали модели перевода для английского, испанского, французского и немецкого языков (с опорой на английский). Излишне говорить, что при наличии необходимых учебных корпусов формализм также может быть распространен на другие языки, хотя результаты перевода, как правило, хуже между языками, принадлежащими к разным семействам, таким как арабский или китайский.

В структуре IMT нам необходимо учитывать исправления, предоставленные переводчиком в виде подтвержденного префикса перевода, t_{p. Следовательно, вместо полного перевода система должна создать суффикс целевого предложения, t_s, который лучше всего дополняет пользовательский префикс (см. рис. 1). Следовательно, проблему, сформулированную в уравнении (1), необходимо переформулировать следующим образом:}

Поскольку t_pt_s = t, можно использовать те же модели, что и для уравнения (1). используется в случае IMT, но теперь задано t_p, и задачу поиска необходимо изменить, чтобы она работала с набором суффиксов, дополняющих данный префикс пользователя. 1

В первой итерации система может создать график слов, который представляет огромное подмножество всех возможных переводов исходного предложения. В каждой последующей человеко-машинной итерации соответствующий объединенный префикс t_p ограничивает пространство поиска подмножеством путей в графе слов, префикс которого соответствует t< sub>p, предоставленный пользователем.Обратите внимание, что tp на самом деле может не быть найдено в графе слов, и в этом случае необходимо использовать метод сопоставления с исправлением ошибок. 1

Оценка системы

Одной из причин, по которой оценка машинного перевода представляет собой сложную проблему, является отсутствие уникального золотого стандарта, с которым можно сравнивать системные переводы. Одно и то же предложение часто можно перевести по-разному, и все они передают одно и то же значение. Напротив, эта проблема не существует в других областях, таких как распознавание речи или категоризация текста. Эта особенность MT (и IMT в равной степени) вызвала некоторые оригинальные исследования по разработке автоматических и ручных показателей оценки. Автоматические метрики, основанные на двуязычных корпусах, особенно полезны для обеспечения быстрой и недорогой обратной связи о производительности системы на этапе ее разработки; но если цель состоит в том, чтобы оценить ожидаемое влияние системы MT или CAT на предполагаемых конечных пользователей, ничто не может заменить добросовестное исследование удобства использования.

Корпус. Статистический МП основан на подходе к переводу «Розеттского камня», который означает, что единственным источником знаний о переводе является набор двуязычных предложений. Поэтому неудивительно, что качество перевода должно коррелировать с количеством доступных данных двуязычного обучения. В зависимости от конкретных языковых пар иногда можно получить большие параллельные корпуса от международных организаций или правительств, хотя их компиляция и предварительная обработка обычно требуют значительного объема работы.

Представленная здесь оценка была проведена для так называемых корпусов Xerox, 4 состоящих из руководств пользователя для принтеров и копировальных аппаратов Xerox. В каждом случае исходным языком руководства был английский, а справочные переводы на французский, испанский и немецкий языки были любезно предоставлены языковыми службами компании. Для каждой языковой пары около 50 000 предложений и соответствующие им переводы использовались для обучения модели перевода, а 1000 предложений были зарезервированы для автоматической оценки системы IMT.

Автоматическая оценка. Мы сравнили перевод исходных тестовых предложений, созданный нашей системой перевода, с соответствующим целевым эталонным предложением, а затем вычислили оценочные значения, как описано ниже. Цель состояла в том, чтобы оценить усилия, которые потребуются человеку-переводчику для получения правильного перевода с использованием выходных данных системы TT2. Чтобы оценить это усилие, мы определяем соотношение между количеством нажатий клавиш, необходимых для получения эталонного целевого предложения, и количеством символов в эталонном предложении. По сути, эта цифра сводится к соотношению между количеством символов, которое переводчик должен напечатать с системой IMT и без нее. С этой целью целевой перевод, который реальный пользователь имел бы в виду при переводе предложения, моделируется переводом с одной ссылкой.

В тестовом корпусе соотношение нажатий клавиш всего 20 25% было получено с помощью нашей системы IMT с предсказанием суффиксов на основе SFST для перевода между английским и испанским языками. 1 В других языковых парах, включающих французский и немецкий, оценочное соотношение нажатий клавиш было несколько выше (примерно 45%), что, по-видимому, отражает большую изменчивость стиля в переводах Xerox для этих языков.

Человеческая оценка. Результаты метрик автоматической оценки, рассмотренные выше, были предназначены для того, чтобы дать нам приблизительное представление о том, как можно ожидать, что система будет работать при использовании настоящими переводчиками. Очевидным следующим шагом была оценка этого поведения в контролируемых лабораторией, но реалистичных условиях работы. Одна из наиболее интуитивно понятных метрик, предложенных для оценки систем IMT 8, заключается в измерении общего времени, необходимого для перевода тестового корпуса, включая время, необходимое пользователю для чтения и оценки предлагаемых системой переводов, в дополнение ко всем ее взаимодействиям. с системой КАТ. Следовательно, в наших пользовательских испытаниях мы оснастили графический интерфейс TranTypes системными часами, что позволило нам точно измерить время, которое потребовалось участникам испытания для завершения переводов как с использованием предлагаемых системой дополнений, так и без них. Участниками этих пользовательских испытаний были шесть профессиональных переводчиков, набранных из двух бюро переводов, участвовавших в проекте TT2. Снимок типичного сеанса TT2 показан на рис. 2.

Результаты продуктивности. В течение последних восемнадцати месяцев проекта TT2 было организовано пять раундов пользовательских испытаний. Первые раунды были в основном предназначены для обучения участников работе с новой системой и предоставления разработчикам важных отзывов о ее пользовательском интерфейсе, критическом моменте в интерактивной системе. Последние три раунда были более ориентированы на производство, и участники работали с системой в течение десяти последовательных сессий по полдня.Все тексты, использованные для этих испытаний, были взяты из описанного здесь корпуса Xerox.

Чтобы адекватно оценить вклад предлагаемых системой дополнений, каждый пробный раунд включал как минимум одну пробную сессию, во время которой участников просили перевести главу тестового корпуса на свои собственные, например, используя тот же текстовый редактор, но без прогнозов системы. Эти пробные занятия предоставили нам базовые показатели производительности, с которыми мы могли затем сравнить производительность участников при работе с теми же техническими руководствами, но переведенными с помощью предложенных системой дополнений.

Заключение

Наш подход можно назвать машинным переводом, ориентированным на человека, и под этим мы подразумеваем не только то, что человек-переводчик остается в производственном цикле, но и то, что он или она находится в самом центре процесса. процесс, целью которого является создание высококачественных автоматических переводов. Как разработчики CAT-технологии, мы очень серьезно относимся к критике, высказанной участниками наших пользовательских испытаний. Следовательно, основным компонентом нашей будущей работы над интерактивным машинным переводом будет изучение их основной жалобы на неспособность системы учиться на изменениях, которые они внесли в ее вывод, чтобы улучшить качество последующих прогнозов.

Кроме того, поведение пользователей свидетельствует о том, что продуктивность можно значительно повысить, разрешив другие способы взаимодействия, помимо клавиатуры и мыши. В этом направлении мультимодальные системы, предполагающие использование речевого взаимодействия, предложены и изучены в Vidal et al. 11 с обнадеживающими результатами.

Ссылки

<р>1. Баррачина С., Бендер и др. Статистические подходы к компьютерному переводу. Вычислительная лингвистика 35, 8 (2009), 328.

<р>2. Браун П.Ф., Делла Пьетра С.А., Делла Пьетра В.Дж. и Мерсер Р.Л. Математика статистического машинного перевода: оценка параметров. Вычислительная лингвистика 19, 2 (1993), 263310.

<р>3. Касакуберта Ф. и Видал Э. Машинный перевод с предполагаемыми стохастическими преобразователями с конечным числом состояний. Вычислительная лингвистика 30, 2 (2004), 205 225.

<р>4. Эстебан, Дж., Лоренцо, Дж., Вальдеррабанос, А.С., и Лапальме, Г. TransType2 - Инновационная компьютерная система перевода. В Дополнительном томе к материалам 42-го ежегодного собрания Ассоциации компьютерной лингвистики (Барселона, Испания, июль 2004 г.), 9497.

<р>5. Фостер, Г. Прогнозирование текста для переводчиков. Кандидатская диссертация, Университет Монреаля, май 2002 г.

<р>6. Фостер Г., Изабель П. и Пламондон П. Интерактивный машинный перевод, опосредованный целевым текстом. Машинный перевод 12, 12, (1997), 175 194.

<р>7. Изабель П. и Черч К. Специальный выпуск о новых инструментах для переводчиков. Машинный перевод 12, 12, 1997 г.

<р>8. Кинг М., Попеску-Белис А. и Хови Э. FEMTI: создание и использование основы для оценки машинного перевода. В Proceedings the Machine Translation Summit IX, 224231, (сентябрь 2003 г.), Новый Орлеан.

<р>9. Маклович, Э. TransType2: Последнее слово. В Proceedings of the 5th International Conference on Language Resources and Evaluation, (май 2006 г., Генуя, Италия), 167172.

<р>10. Ней, Х. Одно десятилетие статистического машинного перевода: 1996–2005 гг. В Proceedings of the MT Summit X, (сентябрь 2005 г., Пхукет, Таиланд), 1217.

<р>11. Видаль Э., Касакуберта Ф., Родригес Л., Сивера Дж. и Мартинес С. Компьютерный перевод с использованием распознавания речи. IEEE Transactions on Speech and Audio Processing, 14, 3, (2006), 941951.

Машинный перевод (МП) — это автоматический перевод. Это процесс, с помощью которого компьютерное программное обеспечение используется для перевода текста с одного естественного языка (например, английского) на другой (например, испанский).

Для обработки любого перевода, человеческого или автоматизированного, значение текста на исходном (исходном) языке должно быть полностью восстановлено на целевом языке, то есть в переводе. Хотя на первый взгляд это кажется простым, на самом деле все намного сложнее. Перевод — это не просто замена слова в слово. Переводчик должен интерпретировать и анализировать все элементы текста и знать, как каждое слово может влиять на другое. Это требует обширных знаний в области грамматики, синтаксиса (структуры предложений), семантики (значения) и т. д. в исходном и целевом языках, а также знакомства с каждым местным регионом.

У человеческого и машинного перевода есть свои проблемы. Например, никакие два отдельных переводчика не могут выполнить идентичный перевод одного и того же текста в одной и той же языковой паре, и может потребоваться несколько исправлений, чтобы удовлетворить клиента. Но более сложная задача заключается в том, как машинный перевод может производить переводы, пригодные для публикации.

Технология машинного перевода на основе правил

Машинный перевод на основе правил основан на бесчисленных встроенных лингвистических правилах и миллионах двуязычных словарей для каждой языковой пары.

Программное обеспечение анализирует текст и создает переходное представление, из которого создается текст на целевом языке. Этот процесс требует обширных словарей с морфологической, синтаксической и семантической информацией, а также больших наборов правил. Программное обеспечение использует эти сложные наборы правил, а затем переносит грамматическую структуру исходного языка в целевой язык.

Переводы строятся на гигантских словарях и сложных лингвистических правилах. Пользователи могут улучшить качество готового перевода, добавив свою терминологию в процесс перевода. Они создают пользовательские словари, которые переопределяют системные настройки по умолчанию.

В большинстве случаев есть два шага: первоначальные инвестиции, которые значительно повышают качество при ограниченных затратах, и постоянные инвестиции для постепенного повышения качества. Хотя машинный перевод на основе правил приближает компании к порогу качества и даже превышает его, процесс повышения качества может быть длительным и дорогостоящим.

Технология статистического машинного перевода

Статистический машинный перевод использует статистические модели перевода, параметры которых основаны на анализе одноязычных и двуязычных корпусов. Построение статистических моделей перевода — это быстрый процесс, но технология в значительной степени зависит от существующих многоязычных корпусов. Требуется минимум 2 миллиона слов для определенного домена и даже больше для общего языка. Теоретически можно достичь порога качества, но у большинства компаний нет такого большого количества существующих многоязычных корпусов, чтобы построить необходимые модели перевода. Кроме того, статистический машинный перевод потребляет много ресурсов ЦП и требует обширной аппаратной конфигурации для запуска моделей перевода со средним уровнем производительности.

Международный перевод на основе правил и статистический перевод

МТ на основе правил обеспечивает хорошее качество вне домена и по своей природе является предсказуемым. Настройка на основе словаря гарантирует улучшенное качество и соответствие корпоративной терминологии. Но результаты перевода могут быть недостаточно беглыми, как ожидают читатели. С точки зрения инвестиций цикл настройки, необходимый для достижения порога качества, может быть длительным и дорогостоящим. Производительность высокая даже на стандартном оборудовании.

Статистический машинный перевод обеспечивает хорошее качество при наличии больших и квалифицированных корпусов. Перевод беглый, что означает, что он хорошо читается и, следовательно, соответствует ожиданиям пользователей. Однако перевод не является ни предсказуемым, ни последовательным. Обучение на хороших корпусах автоматизировано и дешевле. Но обучение общеязыковым корпусам, то есть тексту, отличному от указанного домена, оставляет желать лучшего. Кроме того, статистический машинный перевод требует мощного оборудования для создания и управления большими моделями перевода.

< /tr>

Учитывая общие требования, существует очевидная потребность в третьем подходе, с помощью которого пользователи могли бы достичь лучшего качества перевода и высокой производительности (аналогично машинному переводу на основе правил) с меньшими затратами (аналогично статистическому машинному переводу).

В этом сообщении блога мы объясним, какие типы текста лучше всего подходят для машинного перевода.

У компаний есть широкий и разнообразный спектр потребностей в переводах. Для некоторых текстов качество перевода является наивысшим приоритетом. А есть тексты, для которых важнее всего быстрая доставка. Третий фактор — цена: в архивах может храниться огромное количество документации, которая остается непереведенной просто из-за высокой стоимости. Для последних двух случаев есть решение, которое упрощает повседневный обмен информацией и общение, даже если текст очень большой.

Что означает машинный перевод?

При машинном переводе тексты переводятся автоматически с помощью компьютерного программного обеспечения, поэтому переводчик-человек не принимает непосредственного участия в процессе. Отношения между переводчиками-людьми и системами машинного перевода заключались в том, что механизм машинного перевода был обучен переводам, созданным переводчиками-людьми. Бесспорным преимуществом машинного перевода является скорость процесса перевода. Клиенты могут получить нужные им переводы за считанные минуты.

Сильная сторона переводчиков-людей по-прежнему заключается в качестве перевода. Механизмы машинного перевода могут обеспечить такое же качество, как и переводчик-человек, только для нескольких типов текста. Сегодня машинный перевод лучше всего работает в тех случаях, когда текст необходимо передать в понятной форме на другом языке. Язык перевода не обязательно безошибочен или полностью логичен, но его можно понять. Порядок слов может быть странным, или одно слово может быть заменено странным синонимом. Например, перевод слова «объем» может относиться к громкости звука, количеству пространства или объему, независимо от фактического контекста. Однако читатель с базовыми языковыми навыками может понять смысл текста.

Безопасность данных часто упоминается при обсуждении машинного перевода. Механизм машинного перевода, предназначенный для использования компанией, является безопасным вариантом с точки зрения безопасности данных. На практике переводимый материал передается в зашифрованном виде между клиентом и системой машинного перевода. Переведенный материал остается в памяти механизма машинного перевода только на короткое время и не используется ни для каких других целей. Таким образом, даже тексты, содержащие коммерческую тайну, могут быть переведены с помощью машинного перевода. При использовании бесплатных общедоступных сервисов машинного перевода существует риск того, что переведенный текст останется в памяти механизма перевода. Часто сторона, предлагающая бесплатные услуги перевода, отказывается от права использовать переведенный материал.

В настоящее время машинный перевод вполне можно использовать, например, для непубличного, внутрикорпоративного общения и обмена информацией, особенно когда содержание текста необходимо передать быстро, но текст не распространяется на большой аудитория. Также важно, чтобы все стороны знали об использовании машинного перевода.

Как лучше всего использовать машинный перевод?

Машинный перевод можно использовать в самых разных ситуациях. Далее мы рассмотрим несколько сценариев, в которых машинный перевод может помочь в повседневной работе компании.

Внутренние электронные письма и другие письменные сообщения

Если компания работает в нескольких странах или даже на нескольких континентах, коммуникацией становится сложнее управлять. Языковые навыки сотрудников могут сильно различаться. Даже если английский язык был выбран в качестве официального языка компании, не все могут им пользоваться, по крайней мере достаточно хорошо. На самом деле многие люди предпочли бы общение на своем родном языке, что уменьшило бы двусмысленность. Однако это почти невозможно, когда у компании есть сайты по всему миру.

Машинный перевод может уменьшить или даже устранить языковой барьер в общении. Перевод текста можно получить быстро и в такой форме, которая позволяет получателям понять основное содержание сообщения.

Машинный перевод может быть особенно важен в тех случаях, когда необходимо донести острую проблему до большого количества людей. Когда, например, о нарушении производства можно быстро сообщить большой группе людей, на проблему можно также быстро и эффективно отреагировать. В такой ситуации получатель может быстро и легко перевести исходное сообщение на свой язык, или отправитель может позаботиться об этом.

Несмотря на то, что решения для машинного перевода постоянно развиваются, следует помнить, что переводы, которые они производят, не полностью свободны от ошибок. Поэтому на данный момент нельзя предполагать, что система машинного перевода всегда дает хорошие результаты.

Машинный перевод можно использовать по-разному, например, чтобы следить за развитием своей области знаний и получать информацию, связанную с конкуренцией. Могут быть переведены бюллетени и реклама местного конкурента, а также содержание местных патентов.

Машинный перевод может помочь в ситуациях, когда скорость является наиболее важным фактором. Вы почти сразу же получаете машинный перевод для использования. Также большое преимущество заключается в том, что машинный перевод можно использовать для простого перевода текстов, которые в противном случае не были бы переведены вообще, например, сообщений электронной почты.

Документация и инструкции

Компании, работающие в разных отраслях, могут накапливать значительный объем документации по продуктам, услугам и операционным моделям.Часто вся соответствующая информация записывается для использования в будущем либо для действий по разработке, либо просто для обслуживания. Как известно, лучше всего делиться информацией, но в многонациональной компании документацию сначала необходимо перевести на несколько языков. Полученная стоимость часто считается слишком высокой.

Также может быть большое количество различных инструкций, но их перевод не считается подходящим вариантом из-за стоимости.

Машинный перевод также можно использовать для перевода презентаций PowerPoint, бюллетеней внутренней сети и других подобных документов. Необходимость их перевода часто является срочной.

Машинный перевод — отличный выбор в ситуациях, когда перевод материалов переводчиком-человеком требует слишком больших затрат.

Цель состоит в том, чтобы обмениваться информацией внутри всей организации, чтобы как можно больше сотрудников имели доступ к самой лучшей информации, которая поддерживает их работу. Машинный перевод помогает организации лучше обмениваться важной информацией.

При необходимости для выбранных важных текстов можно заказать постредактирование, чтобы человек-переводчик отредактировал машинный перевод в более совершенный вид.

Одно из преимуществ службы машинного перевода Acolad заключается в том, что к заказу на машинный перевод можно прикрепить файл; нет необходимости вырезать и вставлять текст. Для срочных ситуаций через портал можно заказать немедленный перевод. Этот вариант подходит для ситуаций, когда перевод требуется как можно скорее.

Тексты с коротким жизненным циклом

Хорошим примером текстов с коротким жизненным циклом являются тексты отзывов о товарах в интернет-магазинах. От них клиенты могут получить важную для принятия решения о покупке информацию, которую невозможно найти где-либо еще. Письменный отзыв предоставляет ценную информацию как компании, так и клиентам, посещающим веб-сайт компании.

Если интернет-магазин работает в нескольких странах, использование машинного перевода для перевода отзывов может стать отличным способом обслуживания клиентов. Обзоры продуктов можно легко перевести на другой язык. Покупатели интернет-магазина могут прочитать отзыв на своем языке. Здесь машинный перевод помогает клиентам принять решение о покупке. Обычно самое главное для читателя — понять основное содержание рецензии; не имеет значения, если механизм машинного перевода время от времени допускает глупые ошибки или неуклюже формулирует предложения. Машинный перевод можно интегрировать в процесс перевода, чтобы переводы публиковались автоматически, или к процессу может быть подключена проверка качества специалистами-людьми.

Системы машинного перевода, интегрированные в интернет-магазин, часто используются в онлайн-сервисах туристической индустрии и онлайн-торговле потребительскими товарами. Отзывы обычно переводятся на язык веб-браузера клиента.

Когда каталог товаров интернет-магазина обширен, для перевода информации о товарах довольно часто используется машинный перевод. В этих случаях рекомендуется классифицировать продукты на более и менее важные, чтобы при необходимости можно было добавить человеческий контроль качества для переводов наиболее важных продуктов. Для менее важных товаров качества машинного перевода вполне может хватить, например, если описание товара состоит всего из пары предложений.

Интегрированные системы машинного перевода обычно используются в социальных сетях, где сообщения пользователей могут быть переведены на родной язык читателя одним щелчком мыши.

Когда требуется лучшее качество

Во многих случаях качество машинного перевода недостаточно. Если документация, которую нужно перевести, должна быть простой для понимания и, особенно, если документация критична с точки зрения безопасности, подходящим решением является постредактированный машинный перевод или традиционный перевод, выполненный профессиональным переводчиком. В процессе перевода с постредактированием исходный материал сначала переводится на целевой язык с помощью машинного перевода, а затем редактор проверяет и исправляет перевод.

Идея машинного перевода с постредактированием заключается в том, что человек исправляет любые очевидные ошибки, допущенные машиной. Кроме того, конечный результат постредактирования можно использовать для обучения механизма машинного перевода для дальнейшего улучшения его работы. Одним из преимуществ этого процесса является время доставки — оно часто короче, чем при переводе, выполняемом человеком от начала до конца.Однако более короткий график требует, чтобы исходный результат машинного перевода был достаточно хорошего качества.

Хорошим примером обучения механизма машинного перевода является ситуация, когда повторяющаяся ошибка возникает в переводах, производимых механизмом, например английские названия дней недели, написанные строчными буквами. Такие систематические ошибки можно легко исправить путем дальнейшего обучения механизма перевода.

Для перевода руководств пользователя, маркетинговых материалов и других общедоступных документов по-прежнему рекомендуется использовать переводчика-человека. Человек-профессионал может внести в текст более глубокие смыслы и желаемые нюансы. Только человек может интерпретировать, например, многоуровневый смысл публицистического или художественного текста. Машинный перевод не полностью заменяет людей-переводчиков, но может помочь людям с текстами, которые в противном случае, вероятно, вообще не были бы переведены.

Машинный перевод помогает обмениваться информацией и общаться

Современные системы машинного перевода могут помочь компаниям во внутренней и, в некоторых случаях, внешней коммуникации, по крайней мере, когда создаваемый ими текст проверяется перед публикацией. Машинный перевод также полезен при переводе внутренней документации. Нет необходимости в том, чтобы созданный контент был доступен только на одном языке, когда материал можно без труда перевести на другие языки. Таким образом, информация может быть распространена среди значительно более широкой целевой аудитории внутри компании. Информация наиболее полезна, когда она используется во всей организации.

Однако машинный перевод не подходит для всех переводческих задач. Когда нужен понятный, полезный и проверенный текст быстро, сочетание машинного перевода и постредактирования может быть правильным выбором. Когда требуется наилучшее качество перевода или тип текста сложен для механизма машинного перевода, следует выбрать переводчика-человека.

В вашей компании есть много внутренней документации, которую необходимо перевести на другие языки? Вы хотите облегчить внутреннюю, международную коммуникацию компании? Пожалуйста, свяжитесь с нами, и наши специалисты помогут вам найти решение, которое наилучшим образом соответствует вашим потребностям.

Читайте также:

MT на основе правил	Статистический MT
+ Стабильное и предсказуемое качество	– Непредсказуемое качество перевода
+ Качество перевода вне домена	– Плохое качество перевода вне домена
+ Знает грамматические правила	– Не знает грамматики
+ Высокая производительность и надежность	– Высокие требования к ЦП и дисковому пространству
+ Согласованность между версиями	– Несогласованность между версиями
– Отсутствие беглости	+ Хорошая беглость
– Сложно обрабатывать исключения из правил	+ Хорошо подходит для перехвата исключений из правил
– Высокие затраты на разработку и настройку	+ Быстрые и рентабельные затраты на разработку при условии наличия требуемого корпуса