Группа южнокорейских исследователей разработала чип ускорителя с плавающей запятой, который является основной технологией для суперкомпьютеров. Разработанный впервые в отечественном мире, ускорительный чип играет решающую роль в ускорении вычислений суперкомпьютеров. После коммерциализации эта технология изменит правила игры для Кореи и станет пятой страной в мире, производящей суперкомпьютеры.
Научно-исследовательский институт электроники и телекоммуникаций (ETRI) объявил о разработке ускорительной системы-на-кристалле (SoC) под названием «K-AB21». Разработанный исследователями ускорительный чип имеет размеры 77 мм x 67 мм и изготовлен по 12-нанометровому техпроцессу.
Недавно разработанный ускоритель для суперкомпьютеров интегрирован и встроен в процессор общего назначения и 64-разрядный блок параллельных вычислений и способен развивать производительность 8 терафлопс (TFLOPS) для параллельной обработки вычислений двойной точности с плавающей запятой (FP64). Один вычислительный узел размером 3U может вместить до двух ускорительных чипов, включая основной процессор и систему жидкостного охлаждения.
В ноябре ETRI продемонстрировала вычислительный узел с ускорительным чипом на SuperComputing24, крупнейшей в мире выставке суперкомпьютерных технологий, проходившей в Атланте, США. На этой выставке ETRI продемонстрировала возможности и работу основных функций K-AB21. В первой половине следующего года ETRI планирует провести верификацию на системном уровне высокопроизводительного вычислительного сервера на базе K-AB21, интегрированного со стеками программного обеспечения для параллельной обработки.
В настоящее время только четыре страны способны разрабатывать и производить суперкомпьютеры: США, Китай, Япония и ЕС (Франция). Каждая страна сосредоточена на внедрении акселератора общего назначения для повышения производительности.
Тем не менее, ускорители общего назначения имеют тенденцию уделять больше внимания вычислениям с более низкой точностью для искусственного интеллекта, что делает их менее эффективными для традиционных суперкомпьютерных приложений, требующих высокоточных вычислений. Кроме того, блок обработки нейронных сетей (NPU), который является ускорителем для вывода ИИ, поддерживает только вычисления низкой точности и, таким образом, не подходит для высокотехнологичного инженерного моделирования или крупномасштабных научных исследований.
Исследователи ETRI разработали несколько основных технологий для ускорения традиционных суперкомпьютерных приложений, которые включают в себя запатентованный суперкомпьютерный ускорительный чип (SoC), программное обеспечение и вычислительный узел. Этот ускоритель представляет собой массивно-параллельный процессор, содержащий почти 10 миллиардов транзисторов, что делает его крупнейшим в своем роде, разработанным в Корее.
Чип включает в себя «высокопроизводительное ядро, более 4000 параллельных операторов с плавающей запятой и сверхскоростные интерфейсы, такие как DDR5 и PCIe GEN5». Программное обеспечение состоит из компилятора, среды выполнения и драйвера устройства.
Учитывая диверсификацию рынка ускорителей в области технологий (GPGPU, TPU, NPU, IPU и т. д.), исследователи ожидают, что ETRI сможет укрепить технологическую базу и местную промышленность, одновременно стремясь к проникновению на глобальный рынок за счет развития этого ускорителя.
Старший вице-президент ETRI Иль Йон Чо из Исследовательской лаборатории вычислений искусственного интеллекта пояснил: «Эта разработка призвана создать ускоритель высшего класса, изготовленный по 12-нанометровому техпроцессу. От чипа до системы, этот бесценный результат, достигнутый усилиями исследователей, поможет создать и оживить экосистему высокопроизводительных вычислений в Корее».
Научный сотрудник ETRI Вуджонг Хан из отдела исследований суперкомпьютерных систем, который руководил проектом, сказал: «На рынке ускорителей, где доминируют глобальные крупные технологические компании, мы укрепим технологический суверенитет в области высокопроизводительных вычислений (HPC). Что касается высокопроизводительных компьютеров, то мы полностью зависели от иностранных технологий. Я надеюсь, что это достижение станет прочной отправной точкой для развития суперкомпьютеров с использованием отечественных технологий».
В рамках этого проекта команда исследователей подготовила 29 национальных и международных патентных заявок, 15 статей SCI и три документа о передаче технологий в промышленность.
Как только отрасль коммерциализирует эту технологию при условии проверки, исследователи ожидают, что она сможет нацелиться на конкретную область применения крупномасштабных высокопроизводительных вычислительных систем, настраивая масштаб и цену системы для конкретного клиента.
Исследователи планируют передать технологию, исходя из спроса, не только производителям суперкомпьютерных систем, но и более широкой отрасли высокопроизводительных центров обработки данных, системных интеграторов (SI) и систем жидкостного охлаждения, а также смежные области, такие как беспилотные транспортные средства, интеллектуальные роботы, периферийные серверы и обучение искусственному интеллекту облачных сервисов.
С последующими проектами НИОК они также рассчитывают на развитие технологий и укрепление отраслевой экосистемы для разработки высокопроизводительных вычислительных систем.
ETRI утверждает, что это достижение было связано с ее опытом и возможностями разработки системного программного обеспечения, полученными в рамках предыдущего проекта под названием MAHA, суперкомпьютера для геномного анализа.
На протяжении многих лет правительство поддерживало национальные НИОК для разработки основных технологий для крупномасштабных высокопроизводительных вычислений и укрепления национального потенциала в этой области. Такая устойчивая государственная поддержка позволит Корее стать пятой страной в мире, способной разрабатывать собственные суперкомпьютеры. Чтобы помочь исследователям преуспеть на мировой арене, правительство проводит политику активной поддержки экспорта технологий с помощью индивидуальной стратегии для отдельных рынков.
Что касается суперкомпьютеров, которые являются важной инфраструктурой для передового промышленного развития, науки и техники, Корея зависела от иностранной продукции. Тем не менее, этот прорыв создаст прочную основу для технологического суверенитета в области высокопроизводительных вычислений, укрепит отраслевую экосистему и будет способствовать развитию местных талантов.
1) К-АБ21: Кодовое название (имя собственное) для системы-на-кристалле (SoC) с функцией ультрапараллельного ускорения, разработанной ETRI
2) Терафлопс (TFLOPS, тера операций с плавающей запятой в секунду): Это метрика для количества вычислений, выполняемых в секунду. Терафлопс означает один триллион вычислений в секунду/операций с плавающей запятой в секунду (FLOPS), терафлопс означает 12 степеней 10, что составляет один триллион. Терафлопс означает один триллион вычислений в секунду.
3) Двойная точность с плавающей запятой: Числа с плавающей запятой являются одним из способов представления действительных чисел. В отличие от чисел с фиксированной запятой, числа с плавающей запятой приписывают свое название перемещению десятичных знаков. Числа с плавающей запятой можно разделить на типы данных половинной, одинарной и двойной точности в зависимости от количества битов, используемых для представления чисел (стандарт IEEE754). Чем больше битов используется, тем выше становится точность. FP64 с двойной точностью: 64-бит = 8 байт
4) Размер 3U: это единица, указывающая на высоту стандартного стеллажа, где 1U равен 1,75 дюйма. Размер 3U относится к стандартному блоку стойки высотой 5,25 дюйма.
5) DDR5, PCIe GEN5: DDR5 — это новейший стандарт DRAM для основной памяти, используемой в продуктах. Она определяется со скоростью передачи до 8800 МТ/с, при этом 4800 МТ/с широко распространена. PCIe Gen5 является продуктом пятого поколения стандарта PCI Express, предлагающим скорость 32 ГТ/с на контакт.
6) GPGPU (General Purpose Graphic Processing Unit): универсальный ускоритель с многоцелевым параллельным калькулятором для обработки искусственного интеллекта, графики и высокопроизводительных вычислений
7) TPU (Tensor Processing Unit): ускоритель, специализирующийся на обучении искусственного интеллекта и выводе в качестве калькулятора тензорных параллельных вычислений
8) NPU (Neural Processing Unit): ускоритель, специализирующийся на выводе искусственного интеллекта в качестве параллельного калькулятора низкой точности, фокусирующегося на операциях нейронной сети
9) IPU (Infra Processing Unit): ускоритель, специализирующийся на ускорении обработки данных
###
Это достижение стало результатом проекта «Разработка суперкомпьютерных вычислительных узлов на основе массивно-параллельного процессора», финансируемого Министерством науки и ИКТ и Национальным исследовательским фондом Кореи (NRF). Под руководством ETRI в качестве ведущего учреждения, Корейский институт науки и технологической информации возглавил разработку программного обеспечения, и около десяти университетских лабораторий и два отечественных предприятия сотрудничали в области исследований и разработок.
О Научно-исследовательском институте электроники и телекоммуникаций (ETRI)
ETRI является некоммерческим научно-исследовательским институтом, финансируемым правительством. С момента своего основания в 1976 году ETRI, глобальный научно-исследовательский институт в области ИКТ, прилагает огромные усилия для обеспечения значительного роста Кореи в области ИКТ-индустрии. ETRI делает Корею одной из ведущих стран мира в области ИКТ, неустанно развивая первые и лучшие в мире технологии.