Крошечный чиплет с регулятором напряжения от PowerLattice. Источник: PowerLattice.

Эти модные графические процессоры, гудящие в современном дата-центре, выглядят эффективно на бумаге. Топовому продукту может понадобиться всего 700 ватт для работы большой языковой модели. Но в реальной жизни этот же чип может потреблять около 1700 ватт, когда электричество пробивается через слои преобразования, сопротивления и тепла.

Эта скрытая неэффективность стала одним из менее обсуждаемых кризисов искусственного интеллекта. По мере того как дата-центры расширяются, чтобы питать всё более крупные модели, энергия тратит впустую на получение энергии Кому Чипы угрожают соперничать с энергией, используемой для самих вычислений.

Пэн Цзоу считает это абсурдом. И он верит, что у него есть доза.

В стартапе PowerLattice Зоу и его команда создали нечто достаточно маленькое, чтобы спрятаться под процессорным корпусом, но при этом достаточно амбициозное, чтобы обещать радикальное переосмысление того, как ИИ-оборудование потребляет энергию. Их идея основана на простом принципе: переместить преобразование энергии максимально близко к процессору, насколько позволяет физика.

Невидимый энергетический налог ИИ

Современные дата-центры работают на переменном токе из сети. Однако чипы ИИ могут переваривать только низковольтный постоянный ток — около одного вольта. Переход от одного этапа к другому требует нескольких шагов конверсии.

И каждый шаг наносит свою цену.

По мере падения напряжения ток увеличивается для экономии энергии. Этот высокий ток должен проходить через платы и межсоединения. И куда бы ни течёт течение, за ним следует тепло. Потеря энергии масштабируется пропорционально квадрату тока, что означает, что небольшие неэффективности быстро увеличиваются.

«Этот обмен происходит рядом с процессором, но ток всё равно проходит значительное расстояние в состоянии низкого напряжения», — объясняет Хан-Фук Ле, исследователь силовой электроники из Калифорнийского университета в Сан-Диего, который не связан с PowerLattice. «Чем ближе вы подходите к процессору, тем меньше расстояния должен пройти высокий ток, и таким образом мы можем уменьшить потери питания», — говорит он.

Годами инженеры постепенно решали эту проблему. Но искусственный интеллект вывел его на новое, неудобное место в центре внимания.

Учитывая стремительный рост спроса на электроэнергию дата-центров, «это почти стало сегодняшней проблемой», — сказал Цзоу IEEE Spectrum .

Преобразование движущейся мощности на миллиметры

Цифровой макет чиплета. Источник: Powerlattice.

Традиционные системы выполняют окончательное падение напряжения в нескольких сантиметрах от процессора. PowerLattice уменьшает это расстояние до миллиметров.

Компания разработала миниатюрные чиплеты для подачи питания, которые размещаются под самим корпусом процессора. Они преобразуют энергию в последний возможный момент, минимизируя расстояние для большого тока.

Каждый чиплет содержит индуктивности, схемы управления напряжением и программируемую логику. Всё устройство примерно вдвое больше ластика для карандаша и имеет толщину всего 100 микрометров — примерно ширину человеческого волоса.

Эта экстремальная тонкость позволяет чиплетам размещаться под процессором, не отнимая места у других критически важных компонентов. В аппаратном обеспечении дата-центров недвижимость — это всё.

Зоу утверждает, что эта близость фундаментально меняет математику потери энергии. Меньшее расстояние — меньше тепла. Меньше тепла — меньше потраченной энергии.

Но уменьшение силовой электроники создаёт свои собственные проблемы.

Проблема индуктивности

Индуктивности — это недооценённые рабочие лошадки в регулировании напряжения. Они кратковременно накапливают энергию, затем плавно её выпускают, сохраняя стабильность подачи энергии.

Они также упрямо физически.

Инженеры давно знают, что физический размер индуктивностей напрямую влияет на то, сколько энергии они могут использовать. Если сделать их меньше, их производительность обычно страдает.

PowerLattice решила это ограничение с помощью материаловедения. Команда построила индуктивности из специализированного магнитного сплава, который, по словам Зоу, «позволяет нам очень эффективно работать с индуктивностью на высокой частоте». Он добавляет: «Мы можем работать с частотой в сто раз выше, чем традиционное решение.»

На высоких частотах схемы могут полагаться на индуктивности с гораздо меньшей индуктивностью. Меньшая индуктивность означает меньше материала. А меньше материала — значит меньшие компоненты.

Многие магнитные материалы теряют свои желаемые свойства при столь сильном давлении. Сплав PowerLattice сохраняет свою работу, позволяя всему регулятору уменьшаться без сжатия.

Результат, по словам Зоу, — это стабилизатор напряжения менее одной двадцатой тОбласть современных решений.

Большие претензии, настоящие вопросы

PowerLattice утверждает, что её чиплеты могут снизить энергопотребление до 50 процентов, фактически удваивая производительность на ватт.

Это число справедливо вызывает удивление.

Разговор с IEEE Spectrum, Ле не отвергает эту идею сразу, но ведёт себя осторожен. Он отмечает, что 50-процентная экономия «может быть достижима, но это значит, что PowerLattice должен напрямую контролировать нагрузку, включая процессор».

Другими словами, самые заметные улучшения обычно достигаются, когда энергосистемы динамически регулируют напряжение и частоту в зависимости от того, что процессор делает в реальном времени. Эта технология, известная как динамическое масштабирование напряжения и частоты, требует глубокой интеграции с самим чипом.

PowerLattice не управляет процессором. Без такого контроля, говорит Ле, экономия всё равно может быть значимой — но, возможно, не такой уж чудесной, как заявлено.

Зоу возражает, что гибкость — часть дизайна. Чиплеты «высоко настраиваемы и масштабируемы», — говорит он. Клиенты могут внедрять несколько чиплетов или всего несколько, в зависимости от архитектуры и потребностей.

«Это одна из ключевых особенностей» подхода компании, — утверждает Зоу.

Переполненный и меняющийся рынок

Даже если технология сработает как обещано, PowerLattice сталкивается с знакомой проблемой стартапа: гиганты сталкиваются с той же проблемой.

Крупные производители микросхем, включая Intel, разрабатывают собственные полностью интегрированные регуляторы напряжения. Эти решения направлены на устранение аналогичных неэффективностей, интегрируя управление энергопотреблением напрямую в проектирование процессоров.

Зоу не волнуется. Он считает, что технологии Intel останутся внутри компании. «С точки зрения рыночной позиции мы довольно сильно отличаемся», — говорит он.

Десять лет назад эта разница могла обречить PowerLattice. Ле вспоминает время, когда производители процессоров строго контролировали целые экосистемы. Покупатели, приобретавшие чип, часто должны были приобретать сопутствующее оборудование управления питанием, иначе рисковали потерять гарантии надёжности.

«Qualcomm, например, — говорит Ле, — может продавать свой процессорный чип, и подавляющее большинство их клиентов также вынуждены покупать собственный чип для управления питанием Qualcomm.»

Это ограничение оставило мало места для независимых новаторов в сфере власти. Но современный аппаратный ландшафт выглядит иначе.

«Существует тенденция к тому, что мы называем реализацией чиплетов, поэтому интеграция является гетерогенной», — говорит Ле. Теперь системные дизайнеры комбинируют компоненты разных компаний, стремясь к производительности и эффективности, где только могут.

Небольшие стартапы, создающие процессоры и инфраструктуру ИИ, так же требовательны к энергии, как и их крупные конкуренты. Возможно, у них нет доступа к индивидуальным энергетическим решениям от крупнейших игроков. Для них сторонние инновации, такие как чиплеты PowerLattice, могут быть привлекательными.

«Таков рынок», — говорит Ле. «У нас есть стартап, который сотрудничает со стартапом и делает что-то, что действительно конкурирует с некоторыми крупными компаниями.»

Почему это важно за пределами дата-центров

Энергетический след ИИ стал общественной проблемой, а не только инженерной. По мере того как правительства и компании обещают сократить выбросы, дата-центры всё больше нагружают электросети. Улучшения энергоэффективности не только экономят деньги; Они снижают экологические затраты на вычисления и освобождают энергию для других целей.

Эффективность ИИ в основном сосредоточена на алгоритмах через обучающие трюки, методы обрезки или более умные архитектуры. Не поймите меня неправильно, такие вещи работают. Тем временем Hardware сжигает электроны за кулисами.

Работа PowerLattice является частью более широкого признания того, что будущее ИИ зависит от сантехники не меньше, чем от ума.

Иногда самые серьёзные проблемы можно решить, просто переместив критически важный компонент на несколько миллиметров ближе к месту фактической работы.