В погоне за энергоэффективностью
Summary: Отраслевые сайты, статьи и технические документы уже много лет предупреждают о «цунами данных». Как правило, основное внимание уделяется новым технологиям хранения данных, но не менее важна и способность обрабатывать этот огромный объем новых данных. ...
Symptoms
Уже более десяти лет ИТ-магазины борются с огромным ростом объемов данных в вычислительной среде. Отраслевые сайты, статьи и технические документы уже много лет предупреждают о «цунами данных». Как правило, основное внимание уделяется новым технологиям хранения данных, но не менее важна и способность обрабатывать этот огромный объем новых данных.
Машинное обучение и ИИ играют большую роль в этой области. В свою очередь, стремление к расширению возможностей обработки также усилилось, что привело к еще более высокой мощности ЦП и, в частности, стало причиной недавнего всплеска в использовании технологий ускорителей (графические процессоры, FPGA) для предоставления высокоскоростных возможностей параллельной обработки, необходимых для ресурсоемких приложений ИИ.
Эти передовые технологии ИИ и другие растущие потребности в вычислительных ресурсах требуют новой архитектуры питания для эффективного предоставления дополнительных функций обработки данных, и хотя эта возможность перепроектирования дает ряд преимуществ, решить ее не так просто.
Проблема с питанием
Стремление к расширению возможностей обработки влечет за собой серьезную проблему проектирования системы, связанную с подачей электроэнергии. Более тонкая производственная геометрия современных процессоров (менее 10 нм) обеспечивает более быстрое переключение питания, что приводит к меньшей задержке, и требует более низкого напряжения (менее 1 В) для обработки данных. Но, согласно закону Ома (P=V*I), если мощность (P) увеличивается, а напряжение (V) снижается, то ток (I) должен увеличиться. Это становится проблемой, так как для подачи более высокого тока на кристалл процессора или «пакет» требуется использовать больше контактных разъемов — контактные разъемы, которые иначе можно было бы использовать для обеспечения большей функциональности системы (то есть ввода-вывода, управления системой). Например, система на кристалле (SoC) обеспечивает больше функциональности самого чипа, поэтому возникает вопрос: как повысить эффективность энергопотребления без потери потенциальной функциональности. Это важно, так как при масштабировании даже небольшое повышение эффективности становится значительным. Один ватт на сервер для 100 000 серверов может сэкономить сотни тысяч долларов в течение жизненного цикла этих серверов.
Решение с повышенным напряжением
Одним из решений, принятых в отрасли на сегодняшний день, является подача повышенного напряжения (48 В) на сервер. На саммите Open Compute Project (OCP) Summit 2016 компания Google объявила об инициативе по продвижению серверной и распределительной инфраструктуры с напряжением 48 В в качестве стандарта для центров обработки данных. Эта модель включает в себя несколько изменений в архитектуре подачи питания (описанных ниже), которые могут обеспечить следующие преимущества:
- Повышенная мощность процессора (без уменьшения количества и размеров контактов и разъемов)
- Снижение потери энергии при преобразовании мощности (меньше преобразований, но они более эффективны)
- Уменьшение загруженности конструкции системной платы (меньше слоев питания и областей трассировки)
- Кабели, разъемы и шины меньшего размера
- Снижение энергопотерь при распределении питания
- Более высокие пределы мощности по сравнению со стойками 12 В
Выбор в пользу напряжения 48 В был сделан, так как оно не требует соблюдения особых мер безопасности. Все, что превышает 60 В, считается «высоким напряжением» и требует дополнительной защитной изоляции. Таким образом, в соответствии с законом Ома, напряжение в 48 В обеспечивает четырехкратное снижение тока, но при этом оставляет запас безопасности.
Следует отметить, что в конце 1990-х годов компания Intel продвигала серверы с напряжением 48 В, но затем они уступили место серверам на 12 В из-за ограниченной плотности стабилизаторов напряжения и эффективности преобразования мощности той эпохи, а также более высокой стоимости компонентов.
Подача питания
Чтобы понять преимущества модели с напряжением 48 В, сначала рекомендуется разобраться, как сегодня осуществляется подача электроэнергии. Сегодня энергоснабжающая организация обычно поставляет переменный ток напряжением от 220 до 240 В, который, в свою очередь, преобразуется блоком питания системы в напряжение 12 В. Он повторно преобразуется в стабилизаторе напряжения, расположенном на системной плате, с 12 В до 1,7 В (мы используем пример внедрения Intel). Это реле 1,7 В примерно в два раза превышает напряжение, которое в конечном итоге необходимо процессору, чтобы уменьшить ток, подаваемый с системной платы, и таким образом использовать меньше контактов для подачи питания на подложку процессора. Однако для достижения уровня напряжения менее одного вольта, необходимого для работы процессора, мощность необходимо преобразовать еще раз на кристалле и подложке.
Рис. 1. Современная модель подачи напряжения 12 В
Неэффективность распределения электроэнергии
На каждом этапе преобразования теряется некоторый объем мощности/энергии. По оценкам общая энергоэффективность современных традиционных центров обработки данных (от энергоснабжающей организации до процессоров и охлаждения) обычно находится в диапазоне чуть больше 80%, хотя неэффективность современных блоков питания и встроенных стабилизаторов напряжения уже значительно превышает 90%. Кроме того, эта энергия теряется в виде тепла, что приводит к тому, что центрам обработки данных требуется еще больше энергии (и затрат) для охлаждения этих высокопроизводительных систем. Повышение энергоэффективности (устранение потерь энергии) в конечном итоге позволяет сэкономить на охлаждении в контексте центров обработки данных. Повышение эффективности даже на один процент приводит к значительному увеличению финансовых и экологических показателей.
Потери в распределении электроэнергии зависят от квадрата тока (мощность = I2R). Таким образом, уменьшение количества тока (I) через определенное сопротивление (R) влияет на объем потерь. Снижения тока можно достичь за счет увеличения напряжения (закон Ома), что повышает интерес к модели 48 В.
Новые подходы к подаче питания
На данный момент эффективная подача питания на высокопроизводительные процессоры остается динамической областью, где применяются различные подходы. Два таких подхода и преимущества каждого из них описаны ниже.
Одним из подходов к повышению эффективности является подача напряжения 48 В непосредственно на подложку пакета процессора с последующим преобразованием его в напряжение менее 1 В на подложке. Такой подход исключает один этап преобразования (повышение эффективности) и позволяет подавать низкий ток на подложку (повышение доступности контактов). Однако, учитывая ограниченное доступное пространство на подложке упаковки, преобразователь питания от 48 В до менее 1 В должен иметь высокую плотность и низкий профиль, поэтому реализация этой технологии все еще является сложной и дорогостоящей.
Рис. 2. Модель подачи питания напрямую к подложке 48 В
Другим подходом является подача напряжения 48 В на системную плату. На этом этапе стабилизатор напряжения преобразует его в напряжение ниже 1 В (например, 0,85 В), а затем передает его непосредственно на процессор. Этот подход также исключает одно преобразование (повышение эффективности), но требует подачи более высокого тока на подложку, что не позволяет сэкономить на количестве контактов подачи питания. Этот подход более распространен, поскольку он менее сложный и менее дорогой, чем модель подачи питания напрямую.
Рис. 3. Модель подачи питания 48 В на системную плату
Другие преимущества
Переход на модель 48 В также имеет ряд других преимуществ. Поскольку шина 48 В проводит в 4 раза меньше тока, чем шина 12 В, для полностью интегрированного решения масштабирования стойки можно потенциально в 16 раз (I2) снизить потерю мощности при распределении электроэнергии, если та же шина используется для распределения питания в стойке. Это может привести к тому, что кабели (или шины) будут тоньше (более высокий расход), так как они переносят меньше тока.
Пространство и стоимость можно сэкономить, так как размеры компонентов (разъемов, конденсаторов, кабелей и шин) уменьшаются, а по мере освобождения пространства проектировщикам систем доступны дополнительные варианты конструкции.
На уровне стойки эти преимущества умножаются. Модель распределения питания в стойке 48 В (аналогичная распределению питания на уровне стойки 12 В) предоставляет возможность внедрения ИБП распределенного постоянного тока и устраняет необходимость в громоздком ИБП переменного тока на уровне объекта, который к тому же является негибким и сложным в обслуживании. В свою очередь, распределенный ИБП постоянного тока в сочетании с современными технологиями литиевых аккумуляторов более компактный, легкий и простой в обслуживании. Кроме того, он обладает дополнительным преимуществом, обеспечивающим возможность оплаты по мере использования, то есть динамическое добавление дополнительной емкости в любое время при необходимости.
Это по-прежнему мир систем 12 В
Несмотря на интерес к эффективности 48 В, современные серверные системные платы 12 В существуют уже более 20 лет. 12-вольтовая инфраструктура — это товар, который представлен в современном мире в огромном объеме, с оптимизированной цепочкой поставки устройств 12 В. Таким образом, переход на более высокое напряжение не будет распространяться на всю инфраструктуру. Например, жесткие диски по-прежнему будут иметь напряжение 12 В, чтобы использовать преимущества широкого спектра проверенных вариантов на современном рынке систем хранения данных, поэтому в ближайшем будущем стандартные серверы будут по-прежнему использовать питание 12 В. Но с высокой вычислительной мощностью можно ожидать большего количества дополнительных картриджей и системных плат с более высоким напряжением, как мы уже наблюдаем в сферах ИИ и машинного обучения.
Нет никаких сомнений, что ассортимент решений со стабилизаторами напряжения на 48 В, подходящих для стандартных системных плат или пакетов процессоров (т. е. с высокой плотностью, эффективностью и оптимизацией затрат), все еще ограничен. Но ведущие поставщики полупроводников для управления энергопотреблением совместно с отраслью преобразования энергии интенсивно работают над этим, и ожидается, что в ближайшие годы появятся более жизнеспособные решения. Достижения в области процессоров и технологий упаковки могут стать причиной начала эпохи, когда преобразование последнего этапа с более высоким коэффициентом преобразования напряжения сможет происходить в полупроводниках процессора и/или на подложке пакета, а более высокое напряжение можно будет подавать непосредственно на них.
Заключение
Одной из самых серьезных задач для центров обработки данных является повышение энергоэффективности. Во многих случаях стремление к повышению эффективности сводится к экономии энергии и связанных с ней эксплуатационных расходов, а также к снижению совокупной стоимости владения (TCO). Поэтому потребность в еще более высоком энергопотреблении значительно повышает важность обеспечения максимальной энергоэффективности.
Dell EMC работает с широким спектром заказчиков, помогая решать некоторые из наиболее сложных и интересных проблем машинного обучения. Группа Extreme Scale Infrastructure (ESI) стремится оставаться в курсе новейших технологий в области питания и применять их там, где это необходимо, чтобы мы могли помочь нашим заказчикам эффективно удовлетворять их растущие потребности в вычислительной мощности.
Для получения дополнительной информации о взаимодействии Dell EMC Extreme Scale Infrastructure с технологиями питания обращайтесь по адресу ESI@dell.com.
Cause
-
Resolution
-