Читаем Made at Intel: Сделано в Intel полностью

• AVX-512. Cледующая попытка удвоения производительности была связана с расширением длины SIMD. И вот тут, как говорится, «нашла коса на камень». Возражения возникли моментально, и сколько мы копий тогда сломали, в 2010-2013-х (примерно), пером не описать…

a. Нет в природе столь длинных векторов, чтобы эта машинка давала какие-то преимущества.

b. Tail processing[8]. Чем длиннее SIMD, тем большей проблемой становится обработка «хвостов» циклов, не кратных 8 (16, 32 и т. п.) операндам. Частично проблема решается маскированием, но лишь частично.

c. Mы в очередной раз уродуем кодировку команд, вводя расширение EVEX.

d. Bytes/Flop. Это было мое основное возражение. Мы усугубляем извечную проблему баланса между загрузками и числодробильными операциями (отношение stream/linpack). И эту архитектуру становится все тяжелее программировать.

e. Непонятно, насколько хорошо можно реализовать всю эту концепцию с физической точки зрения. Как ни странно, в тот момент «люди с паяльниками» вели себя на удивление тихо. Типа «надо – сделаем». И, как оказалось, напрасно…


И все же сила заклинания «Линпак – в двойку!» оказалась достаточной, чтобы перевесить все эти соображения. AVX-512 появился в Xeon Phi и Хeon (начиная со SkyLake) и сразу столкнулся со сложностями. Выяснилось, что основную роль играет именно последнее возражение. Функционирование AVX-512 приводит к перегреву кристалла, и непонятно, как с этим бороться. Упрощенно ситуацию можно описать так. При задействовании AVX-512 в единицу времени срабатывает очень много транзисторов. И они рассеивают много энергии в виде тепла. И ладно бы нагревание происходило равномерно по площади кристалла. С этим можно бороться – поставить кулер помощнее, подвести жидкостное охлаждение и т. п. Но беда в том, что перегрев происходит локально, и это делает проблему куда более злобной. Поначалу Intel пошел по пути наименьшего сопротивления – просто начал сбрасывать частоту при задействовании AVX-512 (в экстремальном случае чуть ли не на гигагерц). Это серьезно подсаживало производительность системы, но на тот момент представлялось временной мерой. Другой путь состоял в том, чтобы «размазать горячие вычисления» по площади кристалла (ядра). Однако тут возникла другая проблема – с синхронизацией и собиранием результата «в кучу». И она оказалась сложнее, чем представлялось изначально. За восемь лет усилий лучшие умы в области электроники так и не смогли подобраться к решению. То, что «Интел» постепенно отказывается от AVX-512, служит косвенным доказательством. И все же хочу сказать пару слов в защиту наших тогдашних решений. Это сейчас представляется «научно доказанным фактом», что 256 бит – оптимальная длина SIMD. А 10 лет назад это было ни разу не очевидно

. Наступать на грабли – удел пионеров.

Xeon Phi явился, наверно апогеем культа Linpack. AVX-512 хотя бы умирает (и не факт, что умрет) мучительной смертью, следуя пожеланиям обычно нордически-сдержанного Линуса Торвальдса. В то время как Xeon Phi так и не сумел толком оторваться от взлетной полосы. Он задумывался как ответ набиравшим силу GPGPU. Концепция была такая: давайте натыкаем кучу слабосильных (в Knights Corner использовалась архитектура Pentium), низкочастотных ядер с «православной» ISA и снабдим их зубодробительной длины SIMD. Все это неплохо работало ровно на одном бенчмарке (угадайте, каком). Как только Xeon Phi сталкивался с критическими участками однопоточного кода (а такими, например, являются огромных размеров «cвитчи» в MPI), он немедленно шел на дно (кстати, ISA тут ни при чем.) Всего этого можно было бы избежать, если б в качестве основного теста был взят не HPL, а хотя бы HPCC. Но увы, случилось так, как случилось…

И снова о «гениях»

В момент краха Xeon Phi я был от этого уже довольно далеко. Последние годы в Intel (2016–2020) я провел, возглавляя команду VTune. И фокус моего внимания был сильно смещен в сторону uncore. Во-первых, хотелось какого-то разнообразия. Во-вторых, uncore-поляна, в отличие от core, была сильно менее изученной и «затоптанной». В-третьих, становилось понятно, что с увеличением числа ядер в процессоре роль core падает, а uncore – растет. Центром «анкорной» мысли тогда была тусовка под названием IO-intensive workloads group[9]. Я еще в шутку называл ее «клубом любителей DPDK». Кроме самого DPDK, в игре были и другие прилаги – базы данных, Hadoop, Ceph. Но всепроникающая сила Линпака в «Интеле» была такова, что он сумел меня достать и там. Проблемы наша группа обсуждала суровые. Вот есть core, uncore, шина и девайс – и все это работает на разных частотах. Как сопрячь, буферизовать и синхронизировать? А как быть с RDMA? В общем, почти любой доклад на этой группе так или иначе превращался в «плач Ярославны». И если core-тусовка, периодически наступая на грабли, оставалась более или менее на позитиве, то наша лавочка напоминала сборище неисправимых нытиков.

Перейти на страницу:

Похожие книги

Руководство к своду знаний по управлению проектами (Руководство PMBOK®). Шестое издание. Agile: практическое руководство
Руководство к своду знаний по управлению проектами (Руководство PMBOK®). Шестое издание. Agile: практическое руководство

«Публикуемые Институтом управления проектами (Project Management Institute, Inc., сокращенно PMI) стандарты и руководства, к числу которых принадлежит и данный документ, разработаны согласно процессу разработки стандартов на основе добровольного участия и общего консенсуса. В ходе такого процесса объединяются усилия волонтеров и/или сводятся воедино замечания и мнения лиц, заинтересованных в предмете, которому посвящено данное издание. Хотя PMI администрирует этот процесс и устанавливает правила, гарантирующие непредвзятость при достижении консенсуса, PMI не занимается написанием документа, а также независимым тестированием, оценкой и проверкой точности или полноты материала, содержащегося в издаваемых PMI стандартах и руководствах. Подобным же образом, PMI не занимается проверкой обоснованности мнений, высказанных в этих документах…»

Коллектив авторов

Менеджмент / Финансы и бизнес
Секрет Власти. Принципы позитивного управления
Секрет Власти. Принципы позитивного управления

Это новое учение о менеджменте, созданное на основе 30-летнего управленческого опыта автора и последних научных исследований в области биологии, нейробиологии, эндокринологии и позитивной психологии. Виталий Антощенко проводит ревизию общепринятых, консервативных подходов к управлению и предлагает новый взгляд на работу с людьми, исключающий выгорание руководителя и создающий рабочую среду, в которой сотрудники инициативно действуют на благо бизнеса.В центре новой идеологии — понятие Власти, но не как инструмента насилия, доминирования и принуждения, а как инструмента создания и удержания баланса. Это книга про истинно сильную Власть, полную здоровья и энергии, с помощью которой можно творить чудеса, постоянно воодушевляя сотрудников. Главная ценность управления — в создаваемом им чувстве защищенности и безопасности. Методы позитивного управления, которые подробно рассматривает автор, позволяют созидать благополучие — основу успеха и процветания любой компании.В качестве ролевых моделей автор предлагает многочисленные примеры из отечественной истории, а не из западной, как большинство книг по менеджменту. Взяв на вооружение знания и опыт из этой книги, вы значительно повысите экономический и репутационный КПД своей компании, а также сможете наслаждаться работой в среде единомышленников и энтузиастов.

Виталий Александрович Антощенко , Виталий Антощенко

Деловая литература / Менеджмент / Финансы и бизнес
Материально-техническое снабжение на современном предприятии от А до Я
Материально-техническое снабжение на современном предприятии от А до Я

Эта книга – универсальное руководство по организации эффективного материально-технического снабжения на современном предприятии. Структурированное и последовательное изложение охватывает все ключевые аспекты управления цепочками поставок – от разработки стратегии до оптимизации оперативных процессов, от взаимодействия с поставщиками до управления запасами, от цифровой трансформации отрасли до экономического анализа. Особое внимание уделено адаптации лучших мировых практик и инновационных решений к российской специфике. Книга будет полезна как для опытных специалистов, желающих систематизировать и углубить свои знания, так и для новичков, стремящихся быстро погрузиться и освоить профессию.

Руслан Маков

Менеджмент / Финансы и бизнес
Чур, Авось и Золотой телец – три источника и три составные части наших реформ
Чур, Авось и Золотой телец – три источника и три составные части наших реформ

Мы не станем жить лучше, пока не увидим проблем в настоящем, а жить будем прошлым. Пока статистика будет игнорировать неимущих, малоимущих и безработных, а международные показатели и рейтинги вычислять по росту доходов у наиболее обеспеченных. Некоторые считают, что идея социального равенства лишила общество веры в Бога, а без Бога в душе мы пожинаем все проблемы. Якобы причиной является коммунистическая теория. Пофилософствуем на эту тему. Сегодня неравенство – это государственная политика: выводы логически вытекают из официальной статистики экономики, в которой правят монополии, оберегаемые государством. И инфляция (добавлена статья)– им союзник. Остальных спасает только чудо. Чтобы научиться защищать себя, в конце сборника я разместил шаблоны некоторых контрактов, договоров, соглашений, пример расчёта экспортной цены и кредита.

Николай Александрович Петров

Менеджмент / Финансы и бизнес