На фоне проблем, с которыми сталкивается Вычислительный центр для руководителей Министерства энергетики в Ок-Ридже Сборка и выпуск Первый в мире экзафлопсный суперкомпьютер (более квинтиллиона вычислений в секунду), Frontier, имел беспрепятственный доступ к одному из своих ключевых компонентов.
Неотъемлемой частью функциональности Frontier является его способность хранить огромные объемы данных, которые он производит, в собственной файловой системе. Орион. Но еще более важным для ученых-компьютерщиков, проводящих моделирование на Frontier, является их способность быстро записывать и читать в Orion и эффективно анализировать все эти данные. Именно здесь в игру вступает адаптивная система ввода-вывода или ADIOS.
По своей сути ADIOS — это платформа ввода-вывода или ввода-вывода, которая предоставляет ученым простой и гибкий способ описания данных в их коде, которые, возможно, потребуется записывать, читать или манипулировать во время моделирования. Это значительно облегчает исследователям анализ огромных объемов данных, которые они производят на Frontier. С момента своей первоначальной разработки в 2008 году в Окриджской национальной лаборатории Министерства энергетики США он стал… ADIOS имеет открытый исходный код Эта платформа стала важным инструментом для моделирования высокопроизводительных вычислений (HPC) по всему миру с постоянно развивающимся набором функций и пользователей.
«ADIOS всегда дает результат», — сказал Бронсон Мессер, директор по науке OLCF. «Благодаря Frontier мы перешли на новую параллельную файловую систему, и ADIOS обеспечил безупречную работу ADIOS на высокопроизводительных ПК, поэтому серьезные изменения в инфраструктуре, такие как новая файловая система, не влияют на наши флагманские проекты».
В ведущих вычислительных центрах, таких как OLCF (Управление научных пользователей Министерства энергетики США), расположенный в ORNL, ADIOS помогает ученым-вычислителям анализировать большие объемы данных, которые производят их проекты, еще до того, как они будут полностью написаны, что позволяет ученым получить раннее понимание своих результатов даже поскольку они… Они все еще проводят свои собственные симуляции.
«Моделирование создает все эти данные, но это не значит, что все нужно записать», — сказал Скотт Класки, который возглавляет разработку ADIOS и возглавляет группу систем рабочего процесса на факультете компьютерных наук и математики ORNL.
«Если вы хотите получить какие-то фрагменты, вы можете их получить — вы можете сохранить их или просто получить из памяти, а затем обработать их — в этом есть прелесть использования таких методов. Это была первая технология, которая позволила ученым. работать унифицированно с перемещением данных и статикой, и при этом оставаться самой быстрой технологией на сегодняшний день».
АДИОС ЭВОЛЮШН
Класки впервые задумался о необходимости промежуточного программного обеспечения, такого как ADIOS, когда он был аспирантом по физике в Техасском университете в Остине, где он работал над кодом для моделирования черных дыр, а затем в качестве научного сотрудника в Лаборатории физики плазмы в Принстон с использованием тороидальной гирокинетики. Код для понимания турбулентного транспорта в термоядерном реакторе.
«Я пытался сделать что-то простое с помощью современных параллельных систем ввода-вывода, доступных в то время: записать терабайт данных за день», — сказал Класки. «Некоторым сейчас терабайт кажется ничем, но в 1999 году мы использовали тысячи процессоров на суперкомпьютере IBM RS/6000 SP в Национальном научно-исследовательском вычислительном центре энергетики. художественные технологии, 50% вычислительного времени приходится на ввод-вывод».
И только после того, как Класки прибыл в ORNL в 2005 году, он начал заниматься тем, что впоследствии стало ADIOS. Он собрал команду для разработки структуры, одновременно привлекая исследователей из Технологического института Джорджии и Университета Рутгерса, а также других учреждений. Проект получил большую поддержку от ученого-компьютерщика Норберта Подгорски, который был нанят в ORNL в 2008 году и начал работу над ADIOS 1.0, целью которой было увеличение скорости ввода-вывода в десять раз для крупнейших приложений, работающих на суперкомпьютере Jaguar OLCF.
«Задолго до появления ADIOS всегда существовала необходимость иметь самоописывающиеся данные, чтобы облегчить жизнь учёным-компьютерщикам», — сказал Подгорски. «Однако они не обеспечили производительность, поскольку узкие места в конструкции привели к быстрому снижению общей пропускной способности при масштабировании приложения до тысяч процессов.
«Все, кто работал в области высокопроизводительных вычислений, особенно здесь, в Ок-Ридже, на этих больших компьютерах, были вынуждены работать с байтами, пытаясь создать свои собственные самодельные решения для обработки данных, исходя из основ: вы производили выходные данные и считывали данные побайтово. Это было очень болезненно, поэтому мы сказали: «О, может быть, мы сможем добиться большего».
Однако после 14 основных выпусков к 2015 году набором кодов ADIOS стало трудно управлять, и он потребовал обновления. Проект экзафлопсных вычислений (ECP) Министерства энергетики, который был запущен в 2016 году для подготовки программных приложений и технологий для будущих экзафлопсных систем, таких как Frontier, появился на сцене с финансированием для найма инженеров-программистов для разработки новой ADIOS.
«ADIOS 2.0 родился в 2016 году с нуля — никаких строк в ADIOS 1.0», — сказал Подгорски. «Мы перешли с C на C++11, что полностью изменило все. Наши основные цели были двоякими: во-первых, перепроектировать и повторно реализовать продукт для поддержки файловой системы для новых экзафлопсных компьютеров, и, во-вторых, обеспечить поддержку файловой системы для новых экзафлопсных компьютеров. создать сцену – сейчас, после многих лет исследований – а также качество продукции, которое может использоваться приложениями каждый день».
ADIOS 2.9, выпущенный в конце проекта ECP, позволяет ключевым приложениям суперкомпьютера Frontier создавать и потреблять несколько терабайт данных в секунду, используя файловую систему Orion.
АДИОС Наука
ADIOS продолжает оказывать длительное влияние на вычислительную науку, широко внедряясь командами, разрабатывающими или использующими важные коды моделирования, такие как Exascale Atomistic Capability for Accuracy, Long and Time на базе ECP или EXAALT, пакет программного обеспечения для моделирования молекулярной динамики, позволяющий идентифицировать лучшие материалы для строительства реакторов деления и термоядерного синтеза.
Некоторые из токенов, использующих ADIOS, включают недавних лауреатов одной из самых престижных наград в области вычислений: премии Гордона Белла от Ассоциации вычислительной техники. В 2023 году на территории Национального лабораторного комплекса будет сформирована группа из 19 человек по модели экзамасштабной энергетической системы Земли. Выиграл первую премию ACM Гордона Белла за моделирование климата. В рамках проекта Simple Cloud Resolve E3SM Atmography. Годом ранее группа из 16 человек из Национальной лаборатории Лоуренса Беркли, Ливерморской национальной лаборатории Лоуренса и Французского управления по альтернативной энергетике и атомной энергии Выиграл премию Gordon Bell Home Award 2022. За код моделирования кинетической плазмы WarpX. Оба победителя также управляли своими проектами на Frontier.
«Какой смысл в такой машине, как Frontier — считать быстрее?» — сказал Класки. «Я бы сказал, что это, вероятно, плохой ответ. Любой может производить расчеты, но что действительно важно, так это то, как данные, полученные в результате этих вычислений, используются в научных открытиях».
«Если вы можете очень эффективно генерировать данные или даже обрабатывать их на месте, не замедляя при этом расчеты, мы придаем этим большим устройствам гораздо большую ценность. Вот почему мы тесно сотрудничаем со многими командами разработчиков приложений по всему миру. Это ключевой элемент. нашего успеха: глубокое партнерство».
Многие из этих партнерств исходят от Министерства энергетики. Научные открытия посредством передовых вычисленийИли программное обеспечение SciDAC. Он был создан для того, чтобы объединить многих ведущих исследователей страны для разработки новых вычислительных методов для решения некоторых из наиболее сложных научных проблем. В составе Министерства энергетики Передовые научные компьютерные исследованияПрограмма ASCR сотрудничает с другими офисами и институтами Министерства энергетики для предоставления финансирования для разработки передовых научных программ.
«Помимо того, над чем мы работаем здесь, в ORNL, многие приложения, с которыми мы работаем, созданы SciDAC», — сказал Класки. «Мы работаем вместе через ASCR. Некоторые из фундаментальных исследований, которые мы проводим, — например, сокращение данных или запросы — представляют собой исследовательские предложения для ASCR. Когда мы обнаруживаем вещи, которые работают с определенными приложениями, мы затем говорим: «Можем ли мы теперь перенести эти вещи в ADIOS?» ?» «Тогда использовать его в других приложениях?»
ADIOS для промышленности
Способность ADIOS давать исследователям возможность записывать самоописывающиеся данные — в хранилище и из него, быстро и в больших масштабах — также имеет большую привлекательность для ученых-вычислителей в промышленных компаниях, занимающихся моделированием. В результате команда ADIOS часто помогала компаниям ускорить ввод-вывод в их коде, например, группе вычислительной гидродинамики FINE/Turbo немецкой компании по производству турбомашин FINE/Turbo или компании по страхованию имущества FM Global, использующей OpenFOAM для… Моделирование пожара на складе.
«Сотрудничество с промышленностью в разработке приложений — одна из интересных частей этой работы», — сказал Подгорски. «Это заставляет нас объединить все, что мы разработали, но у нас не было достаточно времени, чтобы интегрировать их во все, потому что мы всегда сосредоточены на исследованиях, у которых есть разные приоритеты. Приоритетом здесь является обеспечение бесперебойной работы. Поэтому очень полезно получать эти контракты на протяжении многих лет». И повысить качество всей программы».
Текущие исследования GE Aviation в OLCF исследуют турбулентность и конструкции турбин с использованием локального моделирования методом конечных элементов. Я получил огромный прирост скорости с помощью Podhorszki и ADIOS. General Electric хотела записать 100 терабайт данных за один день, но стоимость была бы слишком велика, если бы ввод-вывод не был значительно быстрее. Подгорски стремился к 100-кратному ускорению – и добился этого в 500 раз.
«Теперь GE может записывать больше данных, чем когда-либо ожидала», — сказал Класки. «И им не нужно менять приложение — они просто используют ADIOS, чтобы добиться успеха. Я думаю, в этом его сила».
Что тогда?
При вычислительной мощности более 1 экзафлопса пропускная способность Frontier значительна — около 10 петабайт в день. Но с таким объемом данных возникают новые проблемы управления данными.
«Вы можете производить 10 петабайт данных на Frontier каждый день, но вы не сможете эффективно обрабатывать столько данных, поэтому в будущем проблема изменится», — сказал Подгорски. «Теперь нам нужно сосредоточиться на следующей проблеме: у нас слишком много данных. Что нам с ними делать? Как мы можем поддержать их обработку и поиск в них научных данных?»
У Klasky есть решение, сравнимое с тем, как вы делаете тысячи фотографий, сделанных на смартфоне, доступными для просмотра. Большинство фотографий на самом деле не хранятся на вашем телефоне — они попадают в облачный сервис. Но приложение «Фото» на вашем телефоне предоставляет представление этих фотографий, поэтому вы можете увидеть, как они выглядят, и выбрать их для загрузки или публикации.
«Можем ли мы предоставить такой опыт работы с большими данными? Как вы можете работать с некоторыми из крупнейших наборов данных, которые существуют сейчас, например, на вашем ноутбуке? В вашем кластере?» — сказал Класки. «Я не думаю, что всем обязательно иметь Frontier, чтобы получить представление о том, в чем заключаются их данные. Итак, это большой стимул для того, куда мы направляемся — как мы можем это сделать?»
UT-Battelle управляет ORNL Управления науки Министерства энергетики, крупнейшего спонсора фундаментальных исследований в области физических наук в Соединенных Штатах. Научный отдел Министерства энергетики США работает над решением некоторых из наиболее острых проблем нашего времени. Для получения дополнительной информации посетите power.gov/science. — Кори Торзин
«Чрезвычайный решатель проблем. Ниндзя для путешествий. Типичный веб-наркоман. Проводник. Писатель. Читатель. Неизлечимый организатор».
More Stories
Сложный подъем для велосипедистов
AirPods Pro в списке «лучших изобретений» показывает, что Apple по-прежнему впечатляет
Apple включает неожиданные улучшения функций в свой MacBook Pro начального уровня