Fujitsu разрабатывает технологию Content-Aware Computing для ускорения обработки ИИ

Fujitsu Laboratories, Ltd. объявила о разработке новой технологии контентно-зависимых вычислений, которая может контролировать точность при одновременном повышении скорости вычислений

Fujitsu разрабатывает технологию Content-Aware Computing для ускорения обработки ИИ в 10 раз

Fujitsu Laboratories, Ltd. объявила о разработке новой технологии контентно-зависимых вычислений, которая может контролировать точность при одновременном повышении скорости вычислений. Технология была разработана в ответ на растущий спрос на вычислительную мощность, сопровождающий развитие и популяризацию технологий искусственного интеллекта.

Применение этой новой технологии к задачам глубокого обучения обещает увеличить скорость вычислений до десяти раз, упрощая использование ИИ для растущего числа будущих приложений.

История развития

В последние годы распространение технологий искусственного интеллекта в таких областях, как распознавание изображений и речи, способствовало увеличению требований к вычислительной мощности, в результате чего существующие технологии достигли своего предела. В ответ на эту тенденцию были разработаны новые типы графических и специализированных процессоров, оптимизированных для приложений ИИ такого рода.

Задачи искусственного интеллекта рассчитываются в различных средах в зависимости от конкретного приложения, от облачной среды до периферийных вычислительных контекстов. Технологии, обеспечивающие как стабильность, так и быструю обработку, станут все более необходимыми для предоставления вычислительной мощности, необходимой для решения сложных задач ИИ.

Проблемы

Графические процессоры (GPU) и выделенные процессоры улучшили производительность вычислений, но они не справились с вычислительными требованиями AI. В качестве средства дальнейшей оптимизации производительности для задач ИИ растет интерес к технологиям, которые уменьшают вычислительную нагрузку и увеличивают скорость.

Например, при расчете алгоритмов нейронной сети при глубоком обучении одним из способов достижения более высоких скоростей производительности является снижение точности операций с 32 до 8 бит и выполнение параллельных операций в 4 раза быстрее.

К сожалению, результат операции также ухудшается, если точность операции равномерно снижается. По этой причине обученный эксперт должен тщательно определить, какая точность расчета области должна быть уменьшена методом проб и ошибок. Этот метод требует много времени для настройки, требуя перенастройки при изменении входных данных или среды выполнения.

О недавно разработанной технологии

Чтобы преодолеть эти трудности, Fujitsu разработала технологию «Content-Aware Computing», которая автоматически контролирует и повышает точность вычислений. Это позволяет ускорить обработку AI в различных средах исполнения, включая графические процессоры и облака с данными. Особенности этой технологии заключаются в следующем.

  1. Автоматическое уменьшение битов в технологии Нейронные сети обычно имеют числовой диапазон, в котором каждый слой сходится к тому же числовому значению, что и процесс обучения. На основе распределения числового диапазона каждого слоя в нейронной сети во время вычисления степень применения точности вычисления определяется в соответствии с ситуацией обучения, когда битовая ширина может очень сильно варьироваться от максимальных до минимальных значений. Это позволяет проводить глубокое обучение в три раза быстрее, чем раньше, одновременно снижая ухудшение результатов вычислений.
  2. Технология синхронного смягчения, которая обеспечивает высокоскоростное выполнение в параллельной среде с колебаниями производительности. В облачной или другой среде, где многие приложения совместно используют ЦП, может возникнуть значительная задержка ответа на некоторые узлы из-за конфликтов связи, прерывания обработки. С другой стороны, в каждой операции параллельной обработки величина сокращение времени процесса, когда тот завершается, и оценивается степень влияния на результат операции, и время завершения каждой операции управляется так, что время обработки может быть уменьшено до максимальной степени без ухудшения результата операции. Это обеспечивает более быструю параллельную обработку, что приводит к подтвержденной производительности в 3,7 раза быстрее.

Итоги

В конечном итоге, новая технология Content-Aware Computing может ускорить обработку задач AI до 10 раз. Благодаря включению этой технологии в структуры и библиотеки AI становится возможным ускорить обработку AI в облачных средах и центрах обработки данных с использованием графических процессоров и процессоров со встроенными функциями низко разрядных вычислений.

Планы на будущее

В дальнейшем Fujitsu стремится внедрить эту технологию в широко используемую платформу искусственного интеллекта, которая послужит основой для выполнения служб искусственного интеллекта с использованием глубокого обучения.



Автор статьи: Виктор Булавин