Как происходит развитие технологий автоматизированной языковой обработки с искусственным интеллектом

Каждый раз, когда вы разговариваете с Siri по телефону и задаете вопрос или даете команду, вы общаетесь с искусственным интеллектом. Единственная проблема в том, что у этого интеллекта есть пределы

Позволим компьютерам говорить или как происходит развитие этих технологий

Каждый раз, когда вы разговариваете с Siri по телефону и задаете вопрос или даете команду, вы общаетесь с искусственным интеллектом. Единственная проблема в том, что у этого интеллекта есть свои пределы. «На самом деле, по сравнению с человеческим интеллектом Siri можно даже назвать довольно глупой», - говорит Райан Коттерелл, профессор, работавший в ETH Zurich с февраля 2020 года. Коттерелл, назначенный в рамках инициативы медиа-технологий ETH профессором компьютерных наук, решил вывести на новый уровень автоматизированную языковую обработку и искусственный интеллект.

«Единственная причина, по которой Siri работает, - это то, что люди обычно используют очень простые вопросы и команды, когда говорят по телефону», - заявил он. Коттерелл настаивает на том, что мы не должны ожидать от ИИ того же, что и от человеческого интеллекта. По его словам, ни у кого из нас нет проблем с изучением родного языка, а англоговорящие люди могут интуитивно выявлять грамматические ошибки в английском предложении.

Тем не менее компьютерным программам все еще трудно определить, является ли английское предложение грамматически правильным или нет - и это потому, что программа языковой обработки работает совершенно иначе, чем человеческий мозг. «Ни одному переводчику никогда не приходилось выучивать столько слов, сколько нам нужно для обучения программе перевода», - говорит он.

Развитие технологии и первые рабочие проекты

Современные программы перевода учатся, используя огромное количество данных, оттачивая свои способности с миллионами пар предложений. Однако придумать несколько альтернатив для перевода отдельного предложения намного сложнее. Переводчики могут сделать это легко, но программы перевода обычно предлагают только одно решение.

Коттерелл надеется изменить это: «Мы хотим, чтобы у пользователей было несколько вариантов развития событий, а не просто предоставлялся один и тот же ответ. Это позволило бы пользователям выбрать наиболее подходящее предложение для каждого конкретного контекста». Тем не менее, он предупреждает, что разработка жизнеспособного алгоритма для этой цели - непростая задача.

Еще одна проблема - создание программ перевода и голосовых помощников для языков, которыми пользуется относительно небольшое количество людей. «Очень сложно разработать хорошую систему для языков с низким объемом данных», - говорит Коттерелл. Отсюда и берется его энтузиазм по поводу создания программы голосового помощника, говорящего на швейцарских диалектах и разработанного Центром медиа-технологий (MTC) в ETH Zurich.

О голосовом помощнике МТС

Это поистине выдающееся достижение не только потому, что существует так много региональных вариантов швейцарского диалекта, но и потому, что в этих языках отсутствует стандартизированная форма написания. Голосовой помощник MTC свободно говорит на бернском диалекте под названием «Bärndütsch» с 2019 года, и сейчас в разработке находятся другие диалекты.

Чтобы разработать это приложение, исследователи начали сотрудничать со Швейцарским радио и телевидением (SRF). Преимущество технологий, которые переводят стандартный немецкий на швейцарский немецкий или читают местные новости и погоду на определенных диалектах, заключается в их способности обеспечивать региональную аутентичность - даже при автоматическом преобразовании текста в речь.

Влияние компьютеров на сферу медиа

Необходимы дополнительные исследования языкового разнообразия в Швейцарии и Европе, особенно с учетом того, что большинство систем языковой обработки поступают из англоязычных регионов, включая те, которые подходят для использования в СМИ. «Вот почему мы не можем просто взять то, что американские и английские СМИ делают с компьютерной обработкой языка, и просто применить это здесь», - говорит Коттерелл. При поддержке медиа-компаний NZZ и TX Group он планирует создать систему перевода, которая будет переводить высококачественные статьи с немецкого на французский.

Северин Клинглер, управляющий директор Центра медиа-технологий, объясняет смысл разработки подобного приложения: «Идея состоит в том, чтобы выделить существующие технологии из англоязычных областей и сделать их доступными и для других языков». В сфере медиа огромное множество проблем. Фальшивые новости теперь являются неотъемлемой частью нашей повседневной работы со СМИ, но может ли ИИ предложить средства противодействия этому? Это один из вопросов, который в настоящее время изучает Центр медиа-технологий.

В рамках проекта «Механизм противодействия рекомендациям для новостных статей» исследователи пытаются бороться с пузырями фильтров, запрограммировав систему для поиска соответствующих контрмер. MTC также реализует проект, направленный на автоматизацию сортировки комментариев на основе критериев, связанных с содержанием. «Это может помочь сделать различия во мнениях более заметными», - говорит Клинглер. Единственное предостережение: те же методы можно использовать для создания пузырей фильтров и фейковых новостей.

Ранее этим летом при формировании заголовков использовался передовой искусственный интеллект для обработки языков от калифорнийской компании OpenAI. Эта масштабная языковая модель, известная как GPT-3, затмевает все, что было раньше. Одной из причин, по которой система привлекла такое внимание, был потенциальный риск фальшивых новостей, созданных искусственным интеллектом. Имея всего несколько примеров новостей, GPT-3 может генерировать правдоподобные новости на английском языке. Похоже, Райану Коттереллу и его коллегам-исследователям из Центра медиа-технологий предстоит проделать еще много работы.



Автор статьи: Виктор Булавин