Гиперпространственный ИИ может привести к улучшению способностей роботов

Гиперпространственный ИИ и способности роботов

Когда бейсболист ударяет по мячу, его мозг (человеческий интеллект) плавно и почти мгновенно объединяет ощущения (визуальная и звуковая информация об скорости и движении мяча) со знаниями, чтобы посылать нервные сигналы (команды) мышцам, что приводит к мощному удару по мячу. Даже с лучшим текущим ИИ и сенсорными возможностями у робота, столкнувшегося с той же ситуацией, не было бы никаких шансов на ее реализацию.

ИИ использует систему связи для медленной координации данных с датчиков и хранимых данных с возможностями и действиями двигателя робота. Кроме того, роботы не могут ничего вспомнить. Тем не менее, для роботов с большим стремлением к лиге, можно надеяться на новую статью исследователей Университета Мэриленда, которая была только что опубликована в журнале Science Robotics.

Их работа представляет новый способ объединения или интеграции восприятия ИИ и команд с использованием так называемой теории многомерных вычислений. Авторы - UMD Computer Science Ph.D. студенты Антон Митрохин и Петр Сутор-младший, Корнелия Фермюллер, научный сотрудник Института компьютерных исследований Университета Мэриленда. Профессор информатики Яннис Алоимонос - говорит, что такая интеграция - самая важная задача, стоящая перед робототехникой, и их новая статья отмечает первый раз, когда восприятие и действие были объединены.

В настоящее время датчики робота и исполнительные механизмы, которые его перемещают, представляют собой отдельные системы, связанные между собой центральным обучающим механизмом, который выводит необходимое действие с учетом данных датчика или наоборот. Эта громоздкая система искусственного интеллекта, состоящая из трех частей, каждая из которых говорит на своем собственном языке, представляет собой медленный способ заставить роботов выполнять сенсомоторные задачи.

Следующим шагом в робототехнике будет интеграция восприятия робота с его двигательными возможностями. Этот синтез, известный как «активное восприятие», обеспечит более эффективный и быстрый способ выполнения задач роботом.

Гиперпространственные вычисления для активного восприятия и памяти

В новой теории гипермерных вычислений авторов операционная система робота будет основана на гиперразмерных двоичных векторах (HBV), которые существуют в редком и чрезвычайно многомерном пространстве. HBV могут представлять отдельные отдельные вещи - например, одно изображение, концепцию, звук или инструкцию; последовательности, составленные из отдельных вещей; и группировки отдельных вещей и последовательностей.

Они могут учитывать все эти типы информации осмысленно сконструированным способом, связывая каждую модальность вместе в длинные векторы 1 и 0 с одинаковой размерностью. В этой системе возможности действий, сенсорный ввод и другая информация занимают одно и то же пространство, находятся на одном языке и сливаются, создавая своего рода память для робота. Гипермерная структура может превратить любую последовательность «моментов» в новые HBV и сгруппировать существующие HBV вместе, все с одинаковой длиной вектора.

Это естественный способ создания семантически значимых и информированных «воспоминаний». Кодирование все большего количества информации, в свою очередь, приводит к векторам «истории» и способности запоминать.

Сигналы становятся векторами, индексирование переводится в память, а обучение происходит посредством кластеризации. Воспоминания робота о том, что он почувствовал и сделал в прошлом, могут заставить его ожидать будущего восприятия и влиять на его будущие действия. Такое активное восприятие позволит роботу стать более автономным и лучше выполнять задачи. «Активный воспринимающий знает, почему он хочет ощущать, затем выбирает, что воспринимать, и определяет, как, когда и где достичь восприятия», - говорит Алоимонос.

«Он выбирает и фиксирует сцены, моменты времени и эпизоды. Затем он выравнивает свои механизмы, датчики и другие компоненты, чтобы действовать в соответствии с тем, что он увидел, и выбирает точки обзора, с которых он наилучшим образом использует полученную информацию».

«Наша гиперпространственная структура может решать каждую из этих задач», - говорит Мэриленд. Приложения исследования Мэриленда могут выходить далеко за рамки робототехники.

Конечная цель состоит в том, чтобы иметь возможность делать сам ИИ принципиально иным образом: от концепций до сигналов и языка. Гипермерные вычисления могут обеспечить более быструю и эффективную альтернативную модель итеративным нейронным сетям и методам искусственного интеллекта, которые в настоящее время используются в вычислительных приложениях, таких как интеллектуальный анализ данных, визуальное распознавание и перевод изображений в текст.

«Устройства с искусственным интеллектом на основе нейронных сетей большие и медленные, потому что они не способны запомнить», - говорит Митрохин. «Наш метод гипермерной теории может создавать воспоминания, которые потребуют намного меньше вычислений, и должны сделать такие задачи намного быстрее и эффективнее».

Сочетание гиперпространственных вычислений с улучшенным восприятием движения

Авторы также отмечают, что одним из наиболее важных улучшений, необходимых для интеграции восприятия робота с его действиями, является улучшение восприятия движения. Использование датчика динамического зрения (DVS) вместо обычных камер для этой задачи было ключевым компонентом проверки их теории многомерных вычислений. Большинство методов компьютерного зрения используют изображения, качество которых определяется плотностью пикселей.

Плотность пикселей хорошо отражает моменты во времени, но не идеальна для представления движения, потому что движение - это непрерывный объект. А датчик динамического зрения (DVS) отличается. Он не «делает снимки» в обычном смысле, а фиксирует движение, особенно края объектов при их движении. Таким образом, визуализация DVS лучше подходит роботизированным потребностям для наблюдения движения.

Вдохновленный зрением млекопитающих, DVS поддерживает широкий спектр условий освещения, от темного до яркого, и может разрешать очень быстрое движение с небольшой задержкой передачи (низкая задержка). Это идеальные свойства для приложений робототехники в реальном времени, таких как автономная навигация. Данные, которые накапливает DVS, намного лучше подходят для интегрированной среды теории гиперпространственных вычислений.

«Данные от этого датчик намного меньше, чем последовательности изображений», - говорит Фермюллер. «Кроме того, память содержит важную информацию для кодирования пространства и движения, концептуально контуров в окружении и их движения».



Похожие материалы:

Комментарии (0)



Разрешённые теги: <b><i><br>Добавить новый комментарий: