Пн-Пт: 8:00 - 17:00 GMT+2

9:00 - 18:00 CET

Система автоматизации перевода – это не машинный перевод

Поделиться в facebook
Поделиться в twitter
Поделиться в linkedin

Система автоматизации перевода (CAT-программа, CAT-tool) – это рабочий инструмент профессиональных переводчиков и бюро переводов.

Машинный перевод – это автоматический перевод с исходного языка на целевой с помощью компьютерных программ или движков машинного перевода без участия человека.

Ещё в 1933 году Советский ученый Петр Троянский изобрел первую машину автоматического перевода, но толчок к началу развития МП дал Джорджтаунский эксперимент. В ходе него в 1954 году компьютер впервые перевел 60 предложений с русского языка на английский. С тех пор страны и компании начали разработки в этом направлении, а рост необходимости получения быстрого и качественного перевода в кратчайшие сроки заставляет людей не останавливаться и продолжать улучшать технологию машинного перевода.

Системы машинного перевода разделяют на 3 категории.

  • Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).

Такие системы базируются на базе встроенных словарей и наборе лингвистических правил. Таким образом, чтобы перевести предложение с английского на русский язык, RBMT будет искать каждое слово в двуязычном англо-русском словаре, а потом опираться на описание: часть речи, род, число, окончания слова. Эту систему использует Aliexpress для перевода описаний товаров.

  • Статистические системы (Statistical Machine Translation, SMT)

SMT используют статистический анализ: в программу загружаются сотни оригиналов текстов и переводы, которые сделал человек. Система находит межъязыковые соответствия, запоминает примеры словоупотреблений и синтаксических конструкций, после использует эти данные при выборе вариантов перевода. Статистические системы могут обучаться сами или же человеком, который будет править варианты переводов и выбирать лучшие. Гугл использует системы этой категории для перевода веб-страниц, а 4 года назад и в программе гугл транслейт.

  • Нейронные сети – наиболее перспективные на 2020 год. За ними большое будущее.

Они сочетают преимущества как систем на основе грамматических правил, так и статистических. Нейросети помогли сделать прорыв в развитии машинного перевода за последние 5 лет. Такой метод допускает на 17-50% меньше ошибок, чем RBMT или SMT. С 2016 года нейронные системы используются в Google Translate, с 2017 года – и в переводчике Яндекс.

Преимущество машинного перевода – быстрый и простой процесс. Для перевода загружаем текст в программу, запускаем и через несколько минут получаем результат. Однако, стоит ли экономия времени экономии на качестве перевода – сложный вопрос.

«Наполнитель для шеи с морской водой, материал для завязывания перьев» – машинный перевод статистическими системами машинного перевода с Aliexpress. Правильный перевод: «мушки-приманки для рыбалки».

Выше наглядный пример того, что машинному переводу еще нужно время и развитие для того, чтобы быть равнозначной заменой человеку. Стоит заметить, что ситуация с машинным переводом текстов с одинаковой структурой, множеством штампов и клише (технической и юридической документации, чертежей, инструкций и т.д.) отличается. Уже сейчас существуют программы, способные переводить такие документы качественно. Конечно, таким переводам ещё нужна корректура живого переводчика, но сам факт существования программ такого уровня дает понимание того, что в ближайшие 10-15 лет МП возьмет на себя 50-80% работы по переводу документов и текстов.

В бюро переводов «Фридом» пока еще запрещено использование машинного перевода, но в 2021 году это может измениться. Нейронные системы машинного перевода быстро учатся.

Yevhen Venherenko

Yevhen Venherenko

Оставьте комментарий




Отлично!

Ты нужен нам прямо сейчас!

Отправь примеры разверстанных файлов и оригиналов на почту perevod@itaf.biz. Приложи файл, в котором есть таблицы и картинки, помимо простого текста.

Напиши сколько лет работаешь верстальщиком и какие программы знаешь.




Этот сайт использует файлы cookie.

Этот сайт использует файлы cookie.