Изучаем символы с роботом

Компьютер учится писать свою Азбуку.

Наглядный пример машинного обучения

Новая компьютерная модель теперь может имитировать способность человека изучать новые концепции из одного примера, а не из сотен или тысяч примеров, которые он использует для других методов машинного обучения, говорят исследователи.

Новая модель научилась писать придуманные символы из анимационного шоу Futurama, а также десятки алфавитов со всего мира. Он также показал, что он может изобретать свои собственные символы в стиле данного языка. Исследователи предполагают, что их модель может также узнать другие виды понятий, таких как речь и жесты.

Хотя в последние годы ученые добились больших успехов в машинном обучении, люди по-прежнему гораздо лучше изучают новые концепции, чем машины.

Машинное обучение или человеческое?

"Люди могут изучать новые концепции очень быстро, используя очень мало данных, часто только из одного или нескольких примеров. Вы показываете даже маленькому ребенку лошадь, школьный автобус, скейтборд, и они могут получить его из одного примера",-говорит соавтор исследования Джошуа Тененбаум в Массачусетском технологическом институте. Напротив, " стандартные алгоритмы в машинном обучении требуют, чтобы десятки, сотни или даже тысячи примеров выполнялись аналогично."

Чтобы сократить машинное обучение, исследователи стремились разработать модель, которая лучше имитировала человеческое обучение, что делает обобщения из очень немногих примеров концепции. Они сосредоточились на изучении простых визуальных концепций-рукописных символов из алфавитов по всему миру.

"Наша работа преследует две цели: лучше понять, как люди учатся — перепроектировать обучение в человеческом сознании — и создавать машины, которые учатся более гуманными способами", - говорит Тененбаум.

В то время как стандартные алгоритмы распознавания образов представляют символы в виде наборов пикселов или расположений признаков, новая модель, разработанная исследователями, представляла каждый символ как простую компьютерную программу. Например, буква " A " представлена программой, которая генерирует примеры того, что буква обводка за обводкой, когда программа выполняется. В процессе обучения программист не нужен-модель сама генерирует эти программы.

Кроме того, каждая программа предназначена для создания вариаций каждого символа при каждом запуске программы, помогая ему фиксировать, как экземпляры таких понятий могут отличаться, например, различия между тем, как два человека рисуют букву.

""Идея этого алгоритма возникла из удивительного открытия, которое мы получили, собирая набор рукописных символов со всего мира. Мы обнаружили, что если вы попросите горстку людей нарисовать новый персонаж, есть замечательная последовательность в том, как люди рисуют", - говорит ведущий Автор исследования Бренден Лейк в Нью-Йоркском университете. "Когда люди учатся, используют или взаимодействуют с этими новыми концепциями, они не просто видят персонажей как статические визуальные объекты. Вместо этого люди видят более богатую структуру — что — то вроде причинной модели или последовательности штрихов пера-которые описывают, как эффективно создавать новые примеры концепции."

Модель также применяет знания из предыдущих концепций, чтобы ускорить изучение новых концепций. Например, модель может использовать знания, полученные из латинского алфавита, чтобы выучить греческий алфавит. Они называют свою модель Байесовской программы обучения или рамки BPL.

Исследователи применили свою модель к более чем 1600 типам рукописных персонажей в 50 системах письма, включая Санскритский, Тибетский, Гуджаратский, Глаголический и даже придумали персонажей, таких как из мультсериала Футурама и онлайн-игры Темный Горизонт. В своего рода тесте Тьюринга ученые обнаружили, что добровольцы, набранные с помощью механического Турка Amazon, с трудом отличали машинно-письменные символы от написанных человеком.

Ученые также сосредоточили свою модель на творческих задачах. Они попросили свою систему создать совершенно новые концепции — например, создать новую Тибетскую букву, основанную на том, что она знает о буквах тибетского алфавита. Исследователи обнаружили, что человеческие добровольцы оценивали машинно-письменные символы наравне с разработанными людьми, набранными для той же задачи.

"Мы получили производительность человеческого уровня по этой творческой задаче", - соавтор исследования Руслан Салахутдинов в университете Торонто.

Потенциальные применения для этой модели смогли включить опознавание почерка, опознавание речи, опознавание жеста и опознавание предмета. "В конечном счете мы пытаемся понять, как мы можем получить системы, которые приближаются к отображению человеческого интеллекта",-говорит Салахутдинов. "Мы все еще очень, очень далеки от того, чтобы добраться туда." Ученые подробно изложили свои выводы в номере журнала "Наука" от 11 декабря.


Похожие материалы:

Комментарии (0)



Добавить новый комментарий: