В эпоху цифровых технологий трафик данных растет экспоненциально. Требования к вычислительной мощности для приложений искусственного интеллекта, таких как распознавание образов и речи, в частности, или для беспилотных транспортных средств, часто превышают возможности обычных компьютерных процессоров. Работая вместе с международной командой, исследователи из Университета Мюнстера разрабатывают новые подходы и архитектуры процессов, которые могут чрезвычайно эффективно справляться с этими задачами. Теперь они показали, что так называемые фотонные процессоры, с помощью которых данные обрабатываются с помощью света, могут обрабатывать информацию намного быстрее и параллельно – это то, на что электронные микросхемы не способны. Результаты опубликованы в журнале Nature.

Предпосылки и методология

Легкие процессоры для ускорения задач в области машинного обучения позволяют обрабатывать сложные математические задачи с чрезвычайно высокой скоростью (10–10 операций в секунду). Обычные микросхемы, такие как графические карты или специализированное оборудование, такое как TPU (Tensor Processing Unit) от Google, основаны на электронной передаче данных и работают намного медленнее. Команда исследователей во главе с профессором Вольфрамом Пернис из Института физики и Центра мягкой нанонауки при Мюнстерском университете реализовала аппаратный ускоритель для так называемого матричного умножения, которое представляет собой основную нагрузку на обработку при вычислении нейронных сетей. Нейронные сети — это серия алгоритмов, имитирующих человеческий мозг. Это полезно, например, для классификации объектов на изображениях и для распознавания речи.

Исследователи объединили фотонные структуры с материалами с фазовым переходом (PCMs) в качестве энергоэффективных элементов хранения. PCMs обычно используются с DVD или BluRay дисками в оптических хранилищах данных. В новом процессоре это позволяет хранить и сохранять элементы матрицы без необходимости в источнике энергии. Для параллельного выполнения матричного умножения нескольких наборов данных физики Мюнстера использовали частотную гребенку на основе микросхем в качестве источника света. Частотная гребенка обеспечивает множество длин оптических волн, которые обрабатываются независимо друг от друга в одном фотонном чипе. В результате это обеспечивает возможность высокопараллельной обработки данных за счет одновременного вычисления на всех длинах волн — также известного как мультиплексирование по длинам волн. «Наше исследование — первое, в котором частотные гребенки применяются в области искусственных нейронных сетей», — говорит Вольфрам Пернис.

В эксперименте физики использовали так называемую сверточную нейронную сеть для распознавания рукописных чисел. Эти сети представляют собой концепцию в области машинного обучения, вдохновленную биологическими процессами. Они используются в основном при обработке изображений или аудиоданных, так как в настоящее время достигают наивысшей точности классификации. «Сверточную операцию между входными данными и одним или несколькими фильтрами — например, выделение краев на фотографии — можно очень хорошо перенести на нашу матричную архитектуру», — объясняет Йоханнес Фельдманн, ведущий автор исследования. «Использование света для передачи сигнала позволяет процессору выполнять параллельную обработку данных посредством мультиплексирования по длинам волн, что приводит к более высокой плотности вычислений и множеству умножений матриц, выполняемых всего за один временной шаг. В отличие от традиционной электроники, которая обычно работает в диапазоне низких ГГц, скорость оптической модуляции может достигаться в диапазоне от 50 до 100 ГГц». Это означает, что процесс допускает скорость передачи данных и вычислительную плотность, то есть операции на единицу площади процессора, никогда ранее не достигнутые.

Результаты имеют широкий спектр применения. Например, в области искусственного интеллекта можно обрабатывать больше данных одновременно с экономией энергии. Использование более крупных нейронных сетей позволяет делать более точные и недостижимые до сих пор прогнозы, и более точный анализ данных. Например, фотонные процессоры поддерживают оценку больших объемов данных медицинских диагнозов, например, трехмерных данных с высоким разрешением, полученных с помощью специальных методов визуализации. Другие приложения находятся в областях беспилотных транспортных средств, которые зависят от быстрой и точной оценки данных датчиков, и ИТ-инфраструктур, таких как облачные вычисления, которые предоставляют пространство для хранения, вычислительные мощности или прикладное программное обеспечение.