Штучний інтелект і нейронні мережі машинного перекладу

Нейронні мережі машинного перекладу – це і є штучний інтелект. Навчені нейронні мережі вже сьогодні якісно перекладають тексти замість людей за основними мовними парами. Кількість мов стрімко розширюється.

Трохи історії

У 2017 році ми тестували кілька двигунів нейронного машинного перекладу з англійської мови на російську і прийшли до висновку продовжити заборону на використання машинного перекладу в нашій компанії. Причина: російський текст дуже схожий за стилістикою на англійський варіант. Перші 30-60 хвилин редактор бачить і виправляє кальку, але далі мозок людини починає сприймати її як належне. Якість перекладу помітно падає.

Захоплення і апатія одночасно

На момент написання цієї статті я вирішив оновити знання і протестував двигун нейронного машинного перекладу DeepL. Він з’явився на ринку в травні 2017 року і тоді не було технічної можливості підключити його до нашої САП. Ми переклали договір з англійської мови на російську. Отриманий результат викликав захоплення і апатію одночасно.

З одного боку, я зрадів якості перекладу без англійської кальки, з правильною термінологією і стилістикою російської мови. Звичайно, переклад потрібно прочитати, зробити коректуру, підправити теги, кілька термінів, кальку, яка іноді зустрічається. Але в цілому переклад хорошої якості.

З іншого боку, мене почало атакувати почуття апатії. У найближчі 5-10 років перекладачі стануть редакторами і коректорами машинного перекладу. Пізніше машини зможуть замінити людину приблизно на 50-80%. Такі реалії. Штучний інтелект вдосконалюється кожного дня.

Які тексти машини перекладають добре вже сьогодні

Чим простіше структура речень, тим якісніше машина зробить переклад. Це означає, що типову документацію вже сьогодні можна і потрібно перекладати двигунами нейронного машинного перекладу. Це технічні і юридичні документи. Ці дві тематики є лідерами за кількістю перекладу на світовому ринку. За ними напрацьовані величезні пам’яті перекладів, які робила людина. Для нейронних мереж, пам’ять перекладу – це база даних для навчання. Вважаю, що наступними тематиками будуть медичні та маркетингові тексти, потім все інше. У художній літературі багато складних оборотів і, швидше за все, машини не зможуть якісно перекладати такі тексти, хоча це питання часу.

Висновок

Ми будемо впроваджувати нейронні мережі машинного перекладу для перекладу юридичної та технічної документації в 2020 році. Звичайно, спочатку проведемо кілька десятків тестів, адаптуємо інструкції контролю якості під нові реалії. На жаль, більшість клієнтів зараз категорично проти машинного перекладу тому, що не фахівцеві складно зрозуміти різницю між класичним машинним перекладом і нейронними двигунами машинного перекладу. Але давайте згадаємо впровадження систем автоматизації перекладу (CAT-програм) з їх перевагами для клієнтів. На початковому етапі їх сприймали як технологію «переклад гуглом» і просили перекладати вручну, а сьогодні використання САП, пам’яті перекладу і глосарію стало обов’язковою умовою. Така ж історія буде з нейронними системами машинного перекладу, іншими словами – перекладом документів штучним інтелектом.

До речі, у DeepL є безкоштовний онлайн-перекладач. Мов менше, ніж у Google Translate, зате переклад якісніший. Він відмінно підходить для перекладу ділового листування та будь-яких інших текстів. Рекомендую.

Пишіть коментарі, ставте лайки, діліться статтею з друзями. Я намагався зробити її цікавою.

Yevhen Venherenko

Yevhen Venherenko

Додайте коментар