ИИ Baidu может выполнять синхронный перевод между любыми языками

Будущие путешественники по галактике, радуйтесь: китайский технический гигант Baidu изобрел систему перевода, которая приближает нас к программному обеспечению Babel fish.

ИИ Baidu с функцией синхронного переводаБудущие путешественники по галактике, радуйтесь: китайский технический гигант Baidu изобрел систему перевода, которая приближает нас к программному обеспечению Babel fish.

Для тех, кто не знаком с мастером научной фантастики Дугласа Адамса . Babel fish является вымышленным существом , которое поселяется в слуховом канале людей, постучав в их нервные системы , чтобы обеспечить мгновенный перевод любого языка , который они слышат.

STACL – это инновационный переводчик нового поколения

В реальном мире, до сих пор, нам приходилось обходиться людьми и программными переводчиками, которые прилагают все усилия, чтобы идти в ногу со временем. Но новый инструмент на базе ИИ от Baidu Research , называемый STACL , может значительно ускорить процесс. Он использует сложный тип обработки естественного языка, который отстает всего на несколько слов и продолжает двигаться вперед, предсказывая будущее.

«Что примечательно, так это то, что он предсказывает будущие слова, которые скажет человек», - говорит Лян Хуан , главный ученый из Лаборатории AI Silicon Valley компании Baidu. «Это очень важно для реальных применений технологии перевода в будущем».

Инструмент STACL сравним с переводчиками-людьми, которые сидят в кабинах во время встреч ООН. У этих людей тяжелая работа. Переводчики должны одновременно слушать, мысленно переводить и говорить на другом языке, обычно отставая лишь от нескольких слов. Это такая сложная задача, что устные переводчики ООН обычно работают в командах и меняются каждые 10-30 минут.

Задача, требующая такой параллельной обработки - прослушивания, перевода, говорения - кажется, хорошо подходит для компьютеров. Но до сих пор это было слишком тяжело для них. Лучшие системы перевода «в реальном времени» по-прежнему выполняют так называемый последовательный перевод, в котором они ждут завершения каждого предложения. Эти системы обеспечивают довольно точные переводы, но они медленны.

Хуан говорит IEEE Spectrum, что большая проблема в синхронном переводе происходит из-за различий в уровне слов на разных языках. «В ООН есть знаменитая шутка, что переводчик, который переводит с немецкого на английский, если остановится, то застрянет своей будке навсегда», - говорит он. «Если вы спросите, почему, говорят,« я жду немецкого глагола ».« На английском языке глагол приходится в начале предложения, объясняет он, а на немецком языке он приходится в самом конце предложения.

STACL обходит эту проблему, предсказывая глагол, исходящий от всех предложений, которые он видел в прошлом. В своей нынешней работе исследователи Baidu подготовили STACL по новостным статьям, где одна и та же история появляется на нескольких языках. В результате хорошо делать прогнозы о предложениях, касающихся международной политики. В своей нынешней работе исследователи продемонстрировали свои возможности в переводе с китайского на английский (два языка с большими различиями в порядке слов). «В принципе, он может работать на любой языковой паре», - говорит Хуан. «На всех этих языках есть данные. Мы еще не проводили такие эксперименты».

STACL ещё далек от идеала, но он усовершенствуется

Очевидно, что STACL может ошибаться. Если визит президента Франции не прошел хорошо, и Си Цзиньпин вместо этого выразил сожаление и разочарование, перевод имел бы вопиющую ошибку. На данный момент он не может исправить свои ошибки. «Переводчик-человек может извинится, но наша нынешняя система не имеет возможности пересмотреть ошибку», - говорит Хуан.

Тем не менее, система настраивается, и пользователи смогут делать компромисс между скоростью и точностью. Если STACL запрограммирован на более длительную задержку - чтобы отстать от пяти слов за исходным текстом вместо трех слов, более вероятно, что все будет в порядке. Хуан говорит, что STACL будет демонстрироваться на Всемирной конференции Baidu 1 ноября, где он обеспечит живой синхронный перевод выступлений. Ранее Baidu показывали прототип потребительского устройства, который выполняет перевод предложений по 1 предложению, исходным текстом вместо трех слов, более вероятно, что все будет в порядке.

Хуан говорит, что его команда планирует интегрировать STACL в этот гаджет. Прямо сейчас, STACL работает над преобразованием текста в текст и переводом речи в текст. Чтобы сделать его полезным для потребителя, исследователи хотят овладеть переводом речи в речь. Это потребует интеграции синтеза речи в систему. И когда речь синтезируется только по нескольким словам за раз, без какого-либо знания структуры всего предложения, это будет проблемой, чтобы сделать речь естественней. Хуан говорит, что его цель - сделать услуги мгновенного перевода более доступными и доступными для широкой публики. Но он отмечает, что STACL «не предназначен для замены человеческих переводчиков, особенно для ситуаций с высокими ставками, требующих точных и последовательных переводов». В конце концов, никто не хочет, чтобы ИИ находился в центре международного инцидента.



Автор статьи: Виктор Булавин