Какие документы следует переводить с помощью систем компьютерного перевода
Обновлено: 20.11.2024
Начните строить в Google Cloud с бесплатными кредитами на 300 долл. США и более чем 20 бесплатными продуктами.
В то же время пакетный перевод позволяет клиентам переводить несколько файлов на несколько языков в одном запросе. Для каждого запроса клиенты могут отправить до 100 файлов с общим размером содержимого до 1 ГБ или 100 миллионов кодовых точек Unicode, в зависимости от того, какое ограничение будет достигнуто первым.
Высочайшая точность (SOTA) с гибкостью настройки
Для достижения наивысшего уровня точности вашего перевода теперь мы поддерживаем несколько вариантов:
Используйте глоссарии для определенных терминов и фраз. Глоссарий – это наша функция управления терминологией. Это позволяет вам импортировать исходный контент, чтобы определить предпочтительные переводы, такие как названия продуктов или названия отделов. Затем при вызове глоссария в запросе API будут применяться предпочитаемые вами переводы. Это будет работать как для слов, так и для фразового перевода.
Создание пользовательских моделей перевода с помощью AutoML. AutoML Translation — это набор продуктов машинного обучения, которые позволяют создавать высококачественные модели для вашего собственного варианта использования или данных, не требуя практически никаких знаний или опыта в области машинного обучения или кодирования. Используйте свои прошлые проверенные человеком переводы, чтобы повысить точность перевода для вашего домена.
Сохраняйте локальную локализацию с региональными конечными точками
Если вы являетесь клиентом, работающим в ЕС, мы недавно запустили конечную точку специально для регионализации ЕС. Это настраиваемая конечная точка для хранения и обработки машинным переводом данных клиентов только в нескольких регионах ЕС. На данный момент это поддерживает только наши предварительно обученные модели перевода и глоссарий, но вскоре появятся пакетные переводы.
Как Eli Lilly использует Cloud Translation для глобального перевода контента
Узнайте больше и даже посмотрите демоверсию от Томаса Гриффина, руководителя отдела переводов & Архитектор глобального регулирования для Eli Lilly.
Давайте посмотрим правде в глаза: в глобализированном мире, который сейчас как никогда зависит от цифрового спроса, вам необходимо масштабировать и охватывать своих клиентов именно там, где они есть. Перевод – важная часть работы, независимо от того, переводите ли вы веб-сайт на несколько языков или выпускаете документ, часть программного обеспечения или учебные материалы.
Ручной перевод не масштабируется, поэтому машинный перевод на основе машинного обучения (МО) становится все более важным для наших клиентов. Машинный перевод исторически был сложной задачей из-за огромного объема и широты контента, который может повысить ценность при переводе на несколько языков. Компании приобретают и обмениваются контентом на многих языках и в разных форматах, а масштабирование перевода в соответствии с потребностями — сложная задача из-за нескольких форматов документов, интеграции с оптическим распознаванием символов (OCR) и необходимости исправления терминологии, специфичной для предметной области.
Наша цель – упростить переводческие услуги, обеспечив при этом гибкость и контроль для удовлетворения уникальных потребностей наших клиентов в разных отраслях. Читайте дальше, чтобы узнать больше о последних функциях и обновлениях.
Форматирование имеет значение: перевод документов теперь общедоступен
Во многих случаях макет документа диктует, как его следует интерпретировать: например, читатели перемещаются по тексту и различают смысл на основе форматирования, например полужирного или курсивного текста, или пометок для заголовков, абзацев и столбцов. Раньше для автоматизации перевода документов текст нужно было отделять от этих атрибутов макета, что означало, что структура документа либо терялась, либо ее нужно было воссоздавать позже в процессе разработки, после того как текст был переведен. Это потребовало от команд переводчиков проделать много дополнительной работы и поддерживать много дополнительного кода. Но сейчас эти шаги излишни. Форматирование может сохраняться на протяжении всего процесса перевода и обрабатывается непосредственно с помощью Translation API Advanced.
Эта функция позволяет клиентам переводить документы более чем на 100 языков и поддерживает такие типы документов, как Docx, PPTx, XLSx и PDF, с сохранением форматирования документов.
А если ваши потребности выходят за рамки перевода документов, мы также можем помочь вам перевести аудио. Для потокового перевода в режиме реального времени воспользуйтесь API перевода мультимедиа, а для перевода транскрипции в автономном режиме объедините API перевода с API видеоаналитики.
Перевод в реальном времени, когда он вам нужен, пакетный перевод, когда он вам не нужен
Одним из главных отличий возможностей перевода документов в Translation API Advanced является возможность синхронной обработки одного файла в режиме реального времени.
Например, если вы переводите деловой документ, такой как документация отдела кадров, онлайн-перевод обеспечивает гибкость для файлов меньшего размера и обеспечивает более быстрые результаты.Вы можете легко интегрироваться с нашими API через REST или gRPC с мобильными или браузерными приложениями с мгновенным доступом к более чем 100 языковым парам, чтобы контент был понятен на любом поддерживаемом языке.
В то же время пакетный перевод позволяет клиентам переводить несколько файлов на несколько языков в одном запросе. Для каждого запроса клиенты могут отправить до 100 файлов с общим размером содержимого до 1 ГБ или 100 миллионов кодовых точек Unicode, в зависимости от того, какое ограничение будет достигнуто первым.
Высочайшая точность (SOTA) с гибкостью настройки
Для достижения наивысшего уровня точности вашего перевода теперь мы поддерживаем несколько вариантов:
Используйте модели перевода Google SOTA. Каждый год Google вкладывает значительные средства в повышение качества наших переводов в приложениях, облачных API и Chrome, а также в обеспечение многоязычных ответов в Поиске. Популярным показателем для автоматической оценки качества систем машинного перевода является оценка BLEU, основанная на сходстве между машинным переводом и эталонными переводами, созданными людьми. Хотя мы ежемесячно выпускаем дополнительные улучшения для отдельных моделей, бывают случаи, когда мы делаем существенные скачки. В выпусках, выпущенных с 2019 года, мы улучшили наш средний балл BLEU на 5 баллов в среднем по более чем 100 языкам и на 7 баллов по языкам с низким уровнем ресурсов.
Используйте глоссарии для определенных терминов и фраз. Глоссарий – это наша функция управления терминологией. Это позволяет вам импортировать исходный контент, чтобы определить предпочтительные переводы, такие как названия продуктов или названия отделов. Затем при вызове глоссария в запросе API будут применяться предпочитаемые вами переводы. Это будет работать как для слов, так и для фразового перевода.
Выберите предварительно обученную модель с выбором модели. Если вы создаете пользовательские модели для машинного перевода, мы не думаем, что вам нужно поддерживать несколько клиентских библиотек и несколько API, чтобы вы могли использовать лучшую модель для своих нужд. . Расширенный API перевода теперь поддерживает выбор модели. Выберите свою предварительно обученную модель или собственную модель машинного обучения, построенную на AutoML, для любой созданной вами языковой пары и используйте тот же API и одну и ту же клиентскую библиотеку.
Создание пользовательских моделей перевода с помощью AutoML. AutoML Translation — это набор продуктов машинного обучения, которые позволяют создавать высококачественные модели для вашего собственного варианта использования или данных, не требуя практически никаких знаний или опыта в области машинного обучения или кодирования. Используйте свои прошлые проверенные человеком переводы, чтобы повысить точность перевода для вашего домена.
Сохраняйте локальную локализацию с региональными конечными точками
Если вы являетесь клиентом, работающим в ЕС, мы недавно запустили конечную точку специально для регионализации ЕС. Это настраиваемая конечная точка для хранения и обработки машинным переводом данных клиентов только в нескольких регионах ЕС. На данный момент это поддерживает только наши предварительно обученные модели перевода и глоссарий, но вскоре появятся пакетные переводы.
Как Eli Lilly использует Cloud Translation для глобального перевода контента
Исторически переводы в Eli Lilly были сложными: требовалось множество поставщиков переводов для разных языков и организаций, каждый со своими процессами и ожиданиями. Кроме того, переводы были дорогостоящими и медленными.
Чтобы решить эту проблему, компания Eli Lilly применила систематизированный подход, позволяющий пользователям и системам тратить меньше времени и ресурсов на безопасное создание качественных переводов.
Узнайте больше и даже посмотрите демоверсию от Томаса Гриффина, руководителя отдела переводов и глобального архитектора нормативно-правовой базы компании Eli Lilly.
Когда вы хотите перевести документ онлайн, ваши цели могут быть самыми разными.
Иногда вам нужно только быстро понять содержание документа, иногда вам нужен быстрый перевод, а иногда вы можете начать строить свой рабочий процесс перевода и искать команду переводчиков.
Существует множество онлайн-сервисов, которые могут помочь вам с переводом документа, и вы должны выбрать тот, который больше всего соответствует вашим потребностям.
Машинный перевод
✔ Плюс: | дешево | ✔ Плюс: | очень быстро |
✘ Минусы: | недостаточное качество для профессионального использования |
Использование: | для быстрого понимания смысла текста или в симбиозе с людьми-переводчиками для снижения затрат на перевод и повышения скорости производства td> |
Многие участники рынка настаивают на том, чтобы сделать машинный перевод реальной возможностью, но пока эти инструменты можно использовать только для понимания смысла текста, а не для перевода всего документа.
За последние годы машинный перевод значительно улучшился, но эта технология пока еще не заменила людей-переводчиков.
Этот отчет о состоянии машинного перевода, подготовленный Intento, освещает достижения отрасли, а также доказывает, что машинный перевод может быть жизнеспособным решением только в сочетании с вмешательством человека.
1. Google-переводчик
Google Translate — самый известный в мире сервис машинного перевода. Те, кто пробовал его в прошлом, могут иметь горькие воспоминания о том, насколько плохим был этот сервис, но с появлением множества новых технологических достижений (в первую очередь Google Neural Machine Translation (GNMT)), Google Translate стал лучше. чрезвычайно.
Перейти на эту страницу
Нажмите «Документы»
Выберите исходный и целевой языки и загрузите документ.
Нажмите «Перевести». Google вернет вам переведенный документ.
2. Глубокий переводчик
Deepl — это сервис, запущенный в конце 2017 года и сразу же привлёкший внимание отрасли. Он поддерживает только 9 основных европейских языков (английский, немецкий, французский, испанский, португальский, итальянский, голландский, польский, русский), но перевод для некоторых языков оказался более точным и детальным, чем другие сервисы на рынке. Сервис поддерживает форматы .docx и .pptx.
Перейти на эту страницу
Наведите указатель мыши на верхнюю часть «Перевести документ». Появится возможность изменить целевой язык. Выберите целевой язык.
Нажмите «Перевести документ в…». Deepl переведет документ за несколько секунд.
3. Gengo – торговая площадка для переводов
✔ Плюс: | низкие затраты |
✔ Плюс: | перевод сделан носителями языка |
✘ Минусы: | многие переводчики не являются профессиональными переводчиками |
Используйте: | если ваш бюджет меньше и вам не нужны переводы бизнес-класса |
Gengo – это торговая площадка, на которой можно купить переводы.
Вы загружаете свой документ в Gengo (или вставляете текст)
Система проанализирует, сколько контента нужно перевести
Вы выбираете целевые языки, добавляете некоторые инструкции для переводчиков
Gengo сообщит вам цену и примерное время доставки
4. ProZ — Биржа переводчиков
✔ Плюс: | лучшее качество |
✔ Плюс: | большой выбор |
✘ Минусы: | высокие затраты |
Используйте: | если вам нужен качественный перевод |
ProZ — крупнейшая сеть переводчиков. Вы можете использовать их поисковик переводчиков, чтобы найти контакты переводчиков по всему миру. В поисковике вы можете указать, ищете ли вы переводчика-носителя языка исходного или целевого, область знаний и многие другие факторы.
Этот подход требует немного больше времени и усилий для выполнения работы, но ожидайте, что общее качество будет выше. Кроме того, связавшись с переводчиком из ProZ, вы можете установить с ним постоянное рабочее партнерство.
Начните правильно:
- создание глоссария терминологии, которую должен использовать переводчик
- убедиться, что вы получите память переводов по окончании его/ее обслуживания
5. Redokun: инструмент перевода с поддержкой машинного перевода
✔ Плюс: | больше контроля |
✔ Плюс: | интегрированный машинный перевод |
✔ Плюс: | более быстрое изготовление документов |
✘ Минусы: | можно использовать только в профессиональных средах |
Использование: | для перевода маркетинговых материалов штатными переводчиками или поставщиками переводов |
Когда компания распространяет свою продукцию в нескольких странах, отдел маркетинга должен подготовить каталоги и брошюры для всех целевых рынков.
Очень часто эти документы приходится разрабатывать в преддверии особых событий, таких как ярмарки или запуски новых продуктов, и поэтому существует острая необходимость в том, чтобы документы были готовы и без ошибок в кратчайшие сроки.
Любой, кто работает в отделе маркетинга, знает, как сложно составлять маркетинговые документы на языке.
Это действие, которое:
- ✘ занимает много времени;
- ✘ дорого и неэффективно;
- ✘ может привести к ошибкам (иногда даже досадным, таким как использование неправильной терминологии или незамещенный перевод);
Обновления, изменения и поправки к уже переведенным документам часто сдерживают целые команды и очень затрудняют соблюдение сроков.
Без правильных инструментов невозможно обеспечить точный контроль и гарантировать, что результат будет идеальным и уложится в сроки!
Если вы работаете с InDesign, попробуйте Redokun.
Redokun — это программное обеспечение для перевода (CAT-инструмент), которое упрощает и ускоряет создание многоязычных документов, и в то же время может быть быстро интегрировано в компанию, без крупных инвестиций и без изменения логики, с которой вы работаете. работа в команде.
- снижает производственные затраты (благодаря повторному использованию переводов и упрощению процессов)
- позволяет переводить документы сотрудникам из других частей мира (или другим компаниям-партнерам/поставщикам)
- позволяет пользователю использовать искусственный интеллект для перевода текстов, повышая производительность и снижая затраты.
- обеспечивает больший контроль над терминологией и повышает качество создаваемых документов
- позволяет постоянно контролировать выпуск документов
Лучшее качество Redokun заключается в том, что он сразу же окупается большими преимуществами, поскольку его ПРОСТО использовать и интегрировать.
Хотите узнать больше о Redokun и о том, чем мы выделяемся? Если да, обязательно прочтите о лучшем программном обеспечении для перевода в 2021 году.
Это минутное видео быстро объясняет, как работает Redokun:
Автоматический перевод документов может означать автоматизацию рабочего процесса перевода или строгое использование машинного перевода. Перевод нормативных или юридических документов, требующий абсолютной точности каждой страницы, может
Автоматический перевод документов может означать автоматизацию рабочего процесса перевода или строгое использование машинного перевода. Перевод нормативных или юридических документов, требующий абсолютной точности каждой страницы, может принести больше пользы в автоматизированном рабочем процессе перевода, поскольку он использует как машинную, так и человеческую проверку.
Однако такой же уровень детализации не всегда необходим. В некоторых случаях простой машинный перевод может обеспечить лучшую скорость и экономичность. Чтобы понять, нужен ли вам автоматический 7рабочий процесс или чисто машинный перевод, вам нужно ознакомиться с преимуществами и ограничениями обоих.
Как работает машинный перевод в автоматическом переводе документов
Автоматический машинный перевод (МП) – это исключительно компьютерный процесс, при котором люди не взаимодействуют с контентом, как, например, система нейронного машинного перевода Google или Translator Hub от Microsoft. Обе эти программы используют искусственный интеллект и естественный человеческий язык для быстрого перевода документов на сотни языков. Это быстрый и экономичный способ получить общее представление о документе, но на этом его эффективность заканчивается.
К любому документу, переведенному с помощью машинного перевода, нужно относиться с недоверием. Сама система может быть разумной, но это не человек; он не способен понять контекст. Без проверки человеком эти документы могут быть переведены так, что содержат бессмысленные или даже расистские или сексистские фразы.
Хорошим примером использования машинного перевода является перевод юридических документов на этапе обнаружения, когда юрист может получить тысячи страниц документов, но не знать, какие из них важны. Машинный перевод позволяет юристу фильтровать эти документы и отсеивать наиболее подходящие страницы для перевода.
Это также может подойти в тех случаях, когда на веб-сайте есть контент, который важно иметь, но который редко читается, например страницы технической документации.
В любом случае крайне важно иметь в начале контента четкий отказ от ответственности, подтверждающий, что он был переведен автоматически. это может помочь ограничить любые неправильные представления о документах и торговой марке, которую они представляют.
Мы также настоятельно рекомендуем использовать канал обратной связи, чтобы читатели могли запросить полный перевод конкретных документов. Это позволяет вам точно оценить, насколько ценен каждый фрагмент контента, и перераспределить приоритеты элементов, которые часто запрашивают читатели. После завершения этого процесса вы можете переместить наиболее приоритетные документы на следующий этап автоматизации перевода документов: автоматизированный рабочий процесс.
Вывод автоматического перевода документов на новый уровень
Машинный перевод — это лишь небольшой инструмент в общей автоматизированной системе рабочего процесса. С помощью платформы управления локализацией контент подвергается дополнительной проверке, выполняемой человеком, что обеспечивает точность и ясность контента. Процесс обычно включает следующие этапы:
- Материал загружен для перевода.
- Искусственный интеллект направляет этот контент опытному переводчику с определенным техническим и/или лингвистическим опытом, необходимым для выполнения работы.
- По мере перевода появляются строки и предложения, основанные на корпоративном лексиконе компании, памяти переводов и различных базах терминов. Это обеспечивает согласованность всего контента.
- Контент передается рецензенту, который оценивает его точность, вносит изменения и добавляет эти правки в централизованный источник достоверности для дальнейшего использования.
- Затем контент сохраняется внутри платформы для оптимизации перевода в будущем.
В целом автоматизация заменяет трудоемкую ручную административную работу. Этот процесс особенно полезен при переводе документов, поскольку многие документы строятся на основе шаблонов с одинаковыми пунктами и разделами. Используя готовые документы, уже находящиеся в системе, автоматизированный рабочий процесс локализации выполняет большую часть работы переводчика, делая предложения на основе ранее одобренных совпадений перевода. Этот процесс повышает точность машинного перевода, одновременно сокращая затраты и сроки выполнения.
Еще одно преимущество заключается в безопасности выполнения всех задач в одной системе. Во многих заданиях на перевод документы перемещаются туда и обратно по электронной почте, базам данных компании и рабочим процессам. Это создает потенциальные дыры в безопасности, поскольку материал наиболее уязвим при транспортировке. Благодаря переводу всех документов в едином централизованном пространстве перемещение всех файлов локализовано и контролируется, что повышает безопасность.
Какой тип автоматического перевода документов вам нужен?
Автоматический перевод документов может относиться к двум различным процессам. Машинный перевод позволяет вам воспользоваться преимуществами простоты технологий для получения базовых ограниченных результатов. Не каждый документ требует сложного и абсолютно точного перевода, и машинный перевод хорошо подходит для таких сценариев. Однако для материалов с более высокими ставками, где необходимы четкость и точность, автоматизация рабочего процесса может упростить эту задачу, обеспечив при этом качество и согласованность контента.
Bureau Works позволяет вам использовать оба типа автоматического перевода документов для получения быстрых, точных и экономичных результатов. Свяжитесь с нашей командой< /em> чтобы узнать о преимуществах автоматического перевода.
Использование компьютеров для перевода текста с одного языка на другой уже давно является мечтой компьютерных наук. Тем не менее, только в последние десять лет машинный перевод стал действенным инструментом, получившим более широкое распространение. Достижения в области обработки естественного языка, искусственного интеллекта и вычислительной мощности способствуют развитию этой все более полезной технологии.
Что такое машинный перевод?
Машинный перевод – это процесс автоматического перевода контента с одного языка (исходного) на другой (целевой) без участия человека.
Перевод был одним из первых применений вычислительной мощности, начиная с 1950-х годов.К сожалению, сложность задачи была намного выше, чем предполагали ранние ученые-компьютерщики, и требовала огромной мощности для обработки данных и хранения, далеко превосходящих возможности ранних машин.
Только в начале 2000-х программное обеспечение, данные и необходимое оборудование стали способны выполнять базовый машинный перевод. Ранние разработчики использовали статистические базы данных языков, чтобы «обучить» компьютеры переводить текст. Для обучения этих машин требовалось много ручного труда, и каждый добавленный язык требовал начинать разработку для этого языка заново.
В 2016 году у Google была экспериментальная команда, которая тестировала использование моделей нейронного обучения и искусственного интеллекта (ИИ) для обучения машин перевода. Когда методология небольшой группы была протестирована с основным механизмом статистического машинного перевода Google, она оказалась намного быстрее и эффективнее на многих языках. Кроме того, он «обучался» по мере использования, обеспечивая постоянное улучшение качества.
Нейронный машинный перевод оказался настолько эффективным, что Google изменил курс и принял его в качестве своей основной модели разработки. Другие крупные поставщики, включая Microsoft и Amazon, вскоре последовали их примеру, и современный машинный перевод стал жизнеспособным дополнением к технологии перевода. Многие системы управления переводами (TMS) теперь включают машинный перевод в свои решения для рабочих процессов своих пользователей.
Автоматический и машинный перевод: в чем разница?
Под автоматическим переводом понимается любая автоматизация, встроенная в традиционный инструмент автоматизированного перевода (инструмент CAT) или современную систему управления переводами (TMS) для автоматического выполнения повторяющихся задач, связанных с переводом.
В контент встроены триггеры, которые сообщают системе, что его можно автоматизировать. Это может включать в себя вставку часто используемого текста, такого как правовые оговорки, в документы из базы данных, такой как система управления контентом (CMS).
Автоматический перевод может использоваться для автоматизации машинного перевода текста на этапе рабочего процесса локализации. Однако автоматический перевод и машинный перевод не являются взаимозаменяемыми терминами, поскольку выполняют совершенно разные функции.
Какие типы машинного перевода существуют?
Существуют три наиболее распространенных типа машинного перевода:
Машинный перевод на основе правил (RBMT)
Самая ранняя форма машинного перевода, основанная на правилах, имеет несколько серьезных недостатков, в том числе необходимость значительного объема постредактирования человеком, необходимость добавления языков вручную и низкое качество в целом. Его можно использовать в очень простых ситуациях, когда требуется быстрое понимание смысла.
Статистический машинный перевод (SMT)
Statistical MT строит статистическую модель отношений между словами, фразами и предложениями в тексте. Он применяет модель ко второму языку, чтобы преобразовать эти элементы в новый язык. Таким образом, он лучше машинного перевода на основе правил, но имеет многие из тех же проблем.
Нейронный машинный перевод (NMT)
Как упоминалось выше, нейронная модель машинного перевода использует искусственный интеллект для изучения языков и постоянного улучшения этих знаний, подобно нейронным сетям в человеческом мозгу. Это более точно, проще добавлять языки и намного быстрее после обучения. Нейронный машинный перевод быстро становится стандартом в разработке движка машинного перевода.
Свяжитесь с нашими экспертами сегодня, чтобы узнать, как наши решения могут вам помочь.
Какой тип машинного перевода следует использовать?
Как правило, решение о том, какой тип машинного перевода следует использовать, зависит от:
- Доступный бюджет: нейронный машинный перевод обходится дороже, чем статистический машинный перевод, но улучшение качества стоит любой разницы в затратах. Многие системы отказываются от своих старых статистических моделей в пользу нейронного обучения.
- Задействованная отрасль. В некоторых отраслях требуется сложный и технический язык, который может потребовать более сложной обработки. Neural MT обеспечивает это.
- Необходимые языковые пары. Статистического машинного перевода часто бывает достаточно для определенных языковых пар, таких как латинские языки с похожими грамматическими правилами и синтаксисом.
- Объем данных, которые у вас есть: нейронный машинный перевод требует обработки большого количества текста, чтобы он научился и чтобы вы могли пожинать плоды.
- Контент, предназначенный для внутреннего использования, и контент, предназначенный для клиентов. Контент для клиентов, например маркетинговые или коммерческие материалы, отражающие качество бренда, требует самого сложного сочетания машинного перевода и постредактирования опытными переводчиками-людьми. Базовое общение сотрудников или внутренняя документация могут быть достигнуты с помощью базового машинного перевода, когда важными факторами являются время и стоимость.
Когда следует использовать машинный перевод?
Не весь контент поддается машинному переводу.Вообще говоря, более структурированный контент, такой как техническая документация, юридическая информация и интеллектуальная собственность, а также внутренняя коммуникация лучше работают с MT, чем более разговорный контент, такой как маркетинг и брендинг, или другой контент, ориентированный на клиента. В таких ситуациях можно использовать машинный перевод, но результаты потребуют дополнительного редактирования вручную, также известного как постредактирование машинного перевода, чтобы обеспечить их правильную локализацию.
Какую систему машинного перевода следует использовать?
Основные разработчики технологий машинного перевода — Google, Microsoft и Amazon — в настоящее время предпочитают метод нейронного машинного перевода, поскольку он позволяет выполнять перевод с большей точностью и постоянно добавлять языковые пары. Эта возможность роста стала возможной благодаря способности движков учиться и совершенствоваться по мере их использования.
Различия между этими службами машинного перевода могут сбивать с толку. Этот отчет о машинном переводе поможет получить более подробную и актуальную разбивку.
Общие механизмы машинного перевода
Машинный перевод работает с обучающими данными. В зависимости от ваших потребностей данные могут быть общими или пользовательскими. Общие данные — это просто сумма всех данных, полученных из всех переводов, выполненных с течением времени механизмом машинного перевода (MTE). Он включает универсальный инструмент перевода для всех видов приложений, включая текст, голос и полные документы, включая форматирование.
Специализированные обучающие данные – это данные, передаваемые на МП для создания специализации в предметной области, например инженерии, программировании, дизайне или любой другой дисциплине с собственными глоссариями.
Google Переводчик
Обычно считается одной из ведущих систем машинного перевода, исходя из использования, количества языков и интеграции с поиском. Google Translate был первым MTE, основанным на нейронной обработке языка, которая учится на многократном использовании.
Переводчик Amazon
Amazon Translate также использует нейронные сети и тесно интегрирован с Amazon Web Services (AWS). Некоторые данные свидетельствуют о том, что Amazon Translate точнее работает с некоторыми языками, особенно с китайским, однако при сравнении важно понимать, что все эти механизмы постоянно учатся и совершенствуются.
Переводчик Майкрософт
Другой облачный нейронный движок, Microsoft Translator, тесно интегрирован с MS Office и другими продуктами Microsoft, обеспечивая мгновенный доступ к возможностям перевода в документе или другом программном обеспечении.
Глубокий
DeepL — это продукт небольшой компании, базирующейся в Германии, и занимается исключительно разработкой механизма машинного перевода, требующего более точного и естественного вывода на основе собственного нейронного ИИ.
Пользовательские механизмы машинного перевода
Эти основные MTE общего назначения являются крупными игроками. Однако существует множество специализированных механизмов, разработанных для конкретных систем управления переводами, научных дисциплин и других специализированных целей. Они создаются путем использования базовой платформы и обучения ее дисциплине, основанной на предоставлении данных, характерных для этой дисциплины. Полный список систем машинного перевода можно найти здесь.
Каковы преимущества машинного перевода?
До введения нейронного обучения МП все еще был в значительной степени бета-версией продукта, генерирующего переводы, качество которых сильно различалось, иногда до смешного плохого или нечитаемого. Современные механизмы машинного перевода в значительной степени изменили все это и теперь служат незаменимым инструментом в процессе перевода. Его можно использовать «как есть» для менее важных приложений или в сочетании с постредактированием вручную для ускорения традиционных рабочих процессов перевода.
Скорость и громкость
MT работает быстро, почти мгновенно переводит миллионы слов и постоянно совершенствуется по мере перевода большего количества контента. Для очень объемных проектов MT может не только обрабатывать объемы на скорости, но также может работать с системами управления контентом для организации и маркировки этого контента. Это позволяет сохранить организацию и контекст при переводе контента на несколько языков.
Большой выбор языков
Поскольку основные поставщики предлагают 50–100 и более языков, переводы могут выполняться одновременно на несколько языков для глобальных выпусков продуктов и обновлений документации.
Снижение затрат и ускорение выполнения работ
Сочетание высокой пропускной способности, а также возможность выбора из существующих языковых пар, охватывающих десятки комбинаций, означает, что использование машинного перевода может сократить затраты и время на выполнение переводов, даже когда переводчики-люди все еще выполняют постредактирование. работа. По сути, MT делает первоначальную тяжелую работу, предоставляя простые, но полезные переводы. Затем переводчик-человек уточняет эти базовые версии, чтобы более точно отразить первоначальный замысел контента и обеспечить правильную локализацию для каждого региона.
Автоматизированная интеграция в рабочие процессы перевода
Многие системы управления переводами интегрируют в свой рабочий процесс один или несколько видов машинного перевода. Они включают в себя настройки для автоматического запуска перевода и отправки его как части пакета содержимого переводчика-человека. Учитывая низкую стоимость и отсутствие каких-либо задержек на этапе машинного перевода, на самом деле нет причин не включать машинно-переведенный контент в автоматизацию рабочих процессов, особенно для внутренней документации и коммуникаций (а не для клиентов и брендов). .
Машинный перевод и человеческий перевод
При начале проекта больше не нужно решать, использовать машинный перевод или ручной перевод. Концепция постредактирования, то есть редактирования контента, переведенного с помощью машинного перевода, лингвистом-человеком, все чаще принимается профессиональными переводчиками.
Рекомендации по постредактированию машинного перевода:
- Подготовьте контент для машинного перевода. Это включает в себя уточнение и упрощение написания с помощью более коротких предложений, активного залога и других передовых методов для четкого текста.
- Выберите механизм машинного перевода, который лучше всего подходит для поставленной задачи. Если вы разработали глоссарии, связанные, например, с линейкой продуктов или проектом, подумайте о том, чтобы приступить к созданию собственного механизма, адаптированного к вашей сфере деятельности, рынку или типу продукта.
- Выберите уровень качества постредактирования для проекта. Легкое постредактирование (LPE) фокусируется на устранении любых очевидных ошибок или проблем, в то время как полное постредактирование (FPE) обеспечивает полную локализацию контента, включая корректировку любых культурных отсылок, которые могут быть неуместными. Хорошая подготовка контента в начале процесса должна сделать это быстрее и проще.
Какая программа для машинного перевода самая лучшая?
Выбор наилучшего варианта может быть сложным, так как основные и специализированные механизмы имеют свои сильные и слабые стороны. В идеале должен быть доступ к более чем одному движку для тестирования результатов или для назначения движка проекту, для которого он подходит.
Лучшее программное обеспечение для машинного перевода позволяет использовать оптимальный механизм для вашего контента
В вашей системе управления переводами должны быть подключаемые модули или интерфейсы прикладного программирования (API), которые подключают TMS к выбранным механизмам машинного перевода. Некоторые системы предлагают возможность автоматизировать процесс выбора на основе искусственного интеллекта или алгоритмов, которые сканируют контент и сопоставляют его с оптимальным механизмом.
Лучший инструмент машинного перевода позволяет повысить производительность переводчика и сократить расходы
Одной из основных функций системы управления переводами является ее способность отслеживать время и затраты на проект. При использовании нескольких механизмов машинного перевода эти показатели могут быть надежным индикатором ценности механизма. Повышает ли это производительность переводчика или замедляет ее? Указывает ли это на повышение эффективности с течением времени с одним двигателем по сравнению с другим? Как только вы ответите на эти вопросы, вы сможете лучше понять его возможности.
Позвольте вашей TMS оценить качество машинного перевода
Современная система управления переводами предлагает доступ к нескольким вариантам машинного перевода. Затем он может сделать выбор за вас или дать рекомендации для проведения тестов различных вариантов. Современные TMS также используют ИИ для оценки качества машинно переведенного контента. С помощью оценки качества машинного перевода (MTQE) показатели качества рассчитываются автоматически до того, как будет выполнено какое-либо постредактирование, что избавляет от догадок из машинного перевода и повышает эффективность постредактирования.
В этом сообщении блога мы объясним, какие типы текста лучше всего подходят для машинного перевода.
У компаний есть широкий и разнообразный спектр потребностей в переводах. Для некоторых текстов качество перевода является наивысшим приоритетом. А есть тексты, для которых важнее всего быстрая доставка. Третий фактор — цена: в архивах может храниться огромное количество документации, которая остается непереведенной просто из-за высокой стоимости. Для последних двух случаев есть решение, которое упрощает повседневный обмен информацией и общение, даже если текст очень большой.
Что означает машинный перевод?
При машинном переводе тексты переводятся автоматически с помощью компьютерного программного обеспечения, поэтому переводчик-человек не принимает непосредственного участия в процессе.Отношения между переводчиками-людьми и системами машинного перевода заключались в том, что механизм машинного перевода был обучен переводам, созданным переводчиками-людьми. Бесспорным преимуществом машинного перевода является скорость процесса перевода. Клиенты могут получить нужные им переводы за считанные минуты.
Сильная сторона переводчиков-людей по-прежнему заключается в качестве перевода. Механизмы машинного перевода могут обеспечить такое же качество, как и переводчик-человек, только для нескольких типов текста. Сегодня машинный перевод лучше всего работает в тех случаях, когда текст необходимо передать в понятной форме на другом языке. Язык перевода не обязательно безошибочен или полностью логичен, но его можно понять. Порядок слов может быть странным, или одно слово может быть заменено странным синонимом. Например, перевод слова «объем» может относиться к громкости звука, количеству пространства или объему, независимо от фактического контекста. Однако читатель с базовыми языковыми навыками может понять смысл текста.
Безопасность данных часто упоминается при обсуждении машинного перевода. Механизм машинного перевода, предназначенный для использования компанией, является безопасным вариантом с точки зрения безопасности данных. На практике переводимый материал передается в зашифрованном виде между клиентом и системой машинного перевода. Переведенный материал остается в памяти механизма машинного перевода только на короткое время и не используется ни для каких других целей. Таким образом, даже тексты, содержащие коммерческую тайну, могут быть переведены с помощью машинного перевода. При использовании бесплатных общедоступных сервисов машинного перевода существует риск того, что переведенный текст останется в памяти механизма перевода. Часто сторона, предлагающая бесплатные услуги перевода, отказывается от права использовать переведенный материал.
В настоящее время машинный перевод вполне можно использовать, например, для непубличного, внутрикорпоративного общения и обмена информацией, особенно когда содержание текста необходимо передать быстро, но текст не распространяется на большой аудитория. Также важно, чтобы все стороны знали об использовании машинного перевода.
Как лучше всего использовать машинный перевод?
Машинный перевод можно использовать в самых разных ситуациях. Далее мы рассмотрим несколько сценариев, в которых машинный перевод может помочь в повседневной работе компании.
Внутренние электронные письма и другие письменные сообщения
Если компания работает в нескольких странах или даже на нескольких континентах, коммуникацией становится сложнее управлять. Языковые навыки сотрудников могут сильно различаться. Даже если английский язык был выбран в качестве официального языка компании, не все могут им пользоваться, по крайней мере достаточно хорошо. На самом деле многие люди предпочли бы общение на своем родном языке, что уменьшило бы двусмысленность. Однако это почти невозможно, когда у компании есть сайты по всему миру.
Машинный перевод может уменьшить или даже устранить языковой барьер в общении. Перевод текста можно получить быстро и в такой форме, которая позволяет получателям понять основное содержание сообщения.
Машинный перевод может быть особенно важен в тех случаях, когда необходимо донести острую проблему до большого количества людей. Когда, например, о нарушении производства можно быстро сообщить большой группе людей, на проблему можно также быстро и эффективно отреагировать. В такой ситуации получатель может быстро и легко перевести исходное сообщение на свой язык, или отправитель может позаботиться об этом.
Несмотря на то, что решения для машинного перевода постоянно развиваются, следует помнить, что переводы, которые они производят, не полностью свободны от ошибок. Поэтому на данный момент нельзя предполагать, что система машинного перевода всегда дает хорошие результаты.
Машинный перевод можно использовать по-разному, например, чтобы следить за развитием своей области знаний и получать информацию, связанную с конкуренцией. Могут быть переведены бюллетени и реклама местного конкурента, а также содержание местных патентов.
Машинный перевод может помочь в ситуациях, когда скорость является наиболее важным фактором. Вы почти сразу же получаете машинный перевод для использования. Также большое преимущество заключается в том, что машинный перевод можно использовать для простого перевода текстов, которые в противном случае не были бы переведены вообще, например, сообщений электронной почты.
Документация и инструкции
Компании, работающие в разных отраслях, могут накапливать значительный объем документации по продуктам, услугам и операционным моделям. Часто вся соответствующая информация записывается для использования в будущем либо для действий по разработке, либо просто для обслуживания.Как известно, лучше всего делиться информацией, но в многонациональной компании документацию сначала необходимо перевести на несколько языков. Полученная стоимость часто считается слишком высокой.
Также может быть большое количество различных инструкций, но их перевод не считается подходящим вариантом из-за стоимости.
Машинный перевод также можно использовать для перевода презентаций PowerPoint, бюллетеней внутренней сети и других подобных документов. Необходимость их перевода часто является срочной.
Машинный перевод — отличный выбор в ситуациях, когда перевод материалов переводчиком-человеком требует слишком больших затрат.
Цель состоит в том, чтобы обмениваться информацией внутри всей организации, чтобы как можно больше сотрудников имели доступ к самой лучшей информации, которая поддерживает их работу. Машинный перевод помогает организации лучше обмениваться важной информацией.
При необходимости для выбранных важных текстов можно заказать постредактирование, чтобы человек-переводчик отредактировал машинный перевод в более совершенный вид.
Одно из преимуществ службы машинного перевода Acolad заключается в том, что к заказу на машинный перевод можно прикрепить файл; нет необходимости вырезать и вставлять текст. Для срочных ситуаций через портал можно заказать немедленный перевод. Этот вариант подходит для ситуаций, когда перевод требуется как можно скорее.
Тексты с коротким жизненным циклом
Хорошим примером текстов с коротким жизненным циклом являются тексты отзывов о товарах в интернет-магазинах. От них клиенты могут получить важную для принятия решения о покупке информацию, которую невозможно найти где-либо еще. Письменный отзыв предоставляет ценную информацию как компании, так и клиентам, посещающим веб-сайт компании.
Если интернет-магазин работает в нескольких странах, использование машинного перевода для перевода отзывов может стать отличным способом обслуживания клиентов. Обзоры продуктов можно легко перевести на другой язык. Покупатели интернет-магазина могут прочитать отзыв на своем языке. Здесь машинный перевод помогает клиентам принять решение о покупке. Обычно самое главное для читателя — понять основное содержание рецензии; не имеет значения, если механизм машинного перевода время от времени допускает глупые ошибки или неуклюже формулирует предложения. Машинный перевод можно интегрировать в процесс перевода, чтобы переводы публиковались автоматически, или к процессу может быть подключена проверка качества специалистами-людьми.
Системы машинного перевода, интегрированные в интернет-магазин, часто используются в онлайн-сервисах туристической индустрии и онлайн-торговле потребительскими товарами. Отзывы обычно переводятся на язык веб-браузера клиента.
Когда каталог товаров интернет-магазина обширен, для перевода информации о товарах довольно часто используется машинный перевод. В этих случаях рекомендуется классифицировать продукты на более и менее важные, чтобы при необходимости можно было добавить человеческий контроль качества для переводов наиболее важных продуктов. Для менее важных товаров качества машинного перевода вполне может хватить, например, если описание товара состоит всего из пары предложений.
Интегрированные системы машинного перевода обычно используются в социальных сетях, где сообщения пользователей могут быть переведены на родной язык читателя одним щелчком мыши.
Когда требуется лучшее качество
Во многих случаях качество машинного перевода недостаточно. Если документация, которую нужно перевести, должна быть простой для понимания и, особенно, если документация критична с точки зрения безопасности, подходящим решением является постредактированный машинный перевод или традиционный перевод, выполненный профессиональным переводчиком. В процессе перевода с постредактированием исходный материал сначала переводится на целевой язык с помощью машинного перевода, а затем редактор проверяет и исправляет перевод.
Идея машинного перевода с постредактированием заключается в том, что человек исправляет любые очевидные ошибки, допущенные машиной. Кроме того, конечный результат постредактирования можно использовать для обучения механизма машинного перевода для дальнейшего улучшения его работы. Одним из преимуществ этого процесса является время доставки — оно часто короче, чем при переводе, выполняемом человеком от начала до конца. Однако более короткий график требует, чтобы исходный результат машинного перевода был достаточно хорошего качества.
Хорошим примером обучения механизма машинного перевода является ситуация, когда повторяющаяся ошибка возникает в переводах, производимых механизмом, например английские названия дней недели, написанные строчными буквами. Такие систематические ошибки можно легко исправить путем дальнейшего обучения механизма перевода.
Для перевода руководств пользователя, маркетинговых материалов и других общедоступных документов по-прежнему рекомендуется использовать переводчика-человека. Человек-профессионал может внести в текст более глубокие смыслы и желаемые нюансы. Только человек может интерпретировать, например, многоуровневый смысл публицистического или художественного текста. Машинный перевод не полностью заменяет людей-переводчиков, но может помочь людям с текстами, которые в противном случае, вероятно, вообще не были бы переведены.
Машинный перевод помогает обмениваться информацией и общаться
Современные системы машинного перевода могут помочь компаниям во внутренней и, в некоторых случаях, внешней коммуникации, по крайней мере, когда создаваемый ими текст проверяется перед публикацией. Машинный перевод также полезен при переводе внутренней документации. Нет необходимости в том, чтобы созданный контент был доступен только на одном языке, когда материал можно без труда перевести на другие языки. Таким образом, информация может быть распространена среди значительно более широкой целевой аудитории внутри компании. Информация наиболее полезна, когда она используется во всей организации.
Однако машинный перевод не подходит для всех переводческих задач. Когда нужен понятный, полезный и проверенный текст быстро, сочетание машинного перевода и постредактирования может быть правильным выбором. Когда требуется наилучшее качество перевода или тип текста сложен для механизма машинного перевода, следует выбрать переводчика-человека.
В вашей компании есть много внутренней документации, которую необходимо перевести на другие языки? Вы хотите облегчить внутреннюю, международную коммуникацию компании? Пожалуйста, свяжитесь с нами, и наши специалисты помогут вам найти решение, которое наилучшим образом соответствует вашим потребностям.
Читайте также: