Система автоматизации перевода (CAT-программа, CAT-tool) – это рабочий инструмент профессиональных переводчиков и бюро переводов.
Машинный перевод – это автоматический перевод с исходного языка на целевой с помощью компьютерных программ или движков машинного перевода без участия человека.
Ещё в 1933 году Советский ученый Петр Троянский изобрел первую машину автоматического перевода, но толчок к началу развития МП дал Джорджтаунский эксперимент. В ходе него в 1954 году компьютер впервые перевел 60 предложений с русского языка на английский. С тех пор страны и компании начали разработки в этом направлении, а рост необходимости получения быстрого и качественного перевода в кратчайшие сроки заставляет людей не останавливаться и продолжать улучшать технологию машинного перевода.
Системы машинного перевода разделяют на 3 категории.
- Системы на основе грамматических правил (Rule-Based Machine Translation, RBMT).
Такие системы базируются на базе встроенных словарей и наборе лингвистических правил. Таким образом, чтобы перевести предложение с английского на русский язык, RBMT будет искать каждое слово в двуязычном англо-русском словаре, а потом опираться на описание: часть речи, род, число, окончания слова. Эту систему использует Aliexpress для перевода описаний товаров.
- Статистические системы (Statistical Machine Translation, SMT)
SMT используют статистический анализ: в программу загружаются сотни оригиналов текстов и переводы, которые сделал человек. Система находит межъязыковые соответствия, запоминает примеры словоупотреблений и синтаксических конструкций, после использует эти данные при выборе вариантов перевода. Статистические системы могут обучаться сами или же человеком, который будет править варианты переводов и выбирать лучшие. Гугл использует системы этой категории для перевода веб-страниц, а 4 года назад и в программе гугл транслейт.
- Нейронные сети – наиболее перспективные на 2020 год. За ними большое будущее.
Они сочетают преимущества как систем на основе грамматических правил, так и статистических. Нейросети помогли сделать прорыв в развитии машинного перевода за последние 5 лет. Такой метод допускает на 17-50% меньше ошибок, чем RBMT или SMT. С 2016 года нейронные системы используются в Google Translate, с 2017 года – и в переводчике Яндекс.
Преимущество машинного перевода – быстрый и простой процесс. Для перевода загружаем текст в программу, запускаем и через несколько минут получаем результат. Однако, стоит ли экономия времени экономии на качестве перевода – сложный вопрос.
«Наполнитель для шеи с морской водой, материал для завязывания перьев» – машинный перевод статистическими системами машинного перевода с Aliexpress. Правильный перевод: «мушки-приманки для рыбалки».
Выше наглядный пример того, что машинному переводу еще нужно время и развитие для того, чтобы быть равнозначной заменой человеку. Стоит заметить, что ситуация с машинным переводом текстов с одинаковой структурой, множеством штампов и клише (технической и юридической документации, чертежей, инструкций и т.д.) отличается. Уже сейчас существуют программы, способные переводить такие документы качественно. Конечно, таким переводам ещё нужна корректура живого переводчика, но сам факт существования программ такого уровня дает понимание того, что в ближайшие 10-15 лет МП возьмет на себя 50-80% работы по переводу документов и текстов.
В бюро переводов «Фридом» пока еще запрещено использование машинного перевода, но в 2021 году это может измениться. Нейронные системы машинного перевода быстро учатся.