Без темы
<<  300 - летию со дня рождения М.В. Ломоносова посвящается Азбука нравственности  >>
Солнушкин Константин Сергеевич Измерение быстродействия ОЗУ ЭВМ и
Солнушкин Константин Сергеевич Измерение быстродействия ОЗУ ЭВМ и
Задачи работы
Задачи работы
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
V Всероссийская конференция молодых ученых
V Всероссийская конференция молодых ученых
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 1. Современный подход к синтезу ЭВМ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Масштабирование по частоте CPU
Масштабирование по частоте CPU
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Часть 2. Измерение быстродействия ОЗУ
Заключение и выводы по работе
Заключение и выводы по работе
Заключение и выводы по работе
Заключение и выводы по работе

Презентация: «V Всероссийская конференция молодых ученых». Автор: Gumbert Gumbert. Файл: «V Всероссийская конференция молодых ученых.ppt». Размер zip-архива: 719 КБ.

V Всероссийская конференция молодых ученых

содержание презентации «V Всероссийская конференция молодых ученых.ppt»
СлайдТекст
1 Солнушкин Константин Сергеевич Измерение быстродействия ОЗУ ЭВМ и

Солнушкин Константин Сергеевич Измерение быстродействия ОЗУ ЭВМ и

моделирование производительности (Научный руководитель – Валерий Дмитриевич Мазин, профессор, д.т.н.) 16 апреля 2008 г. – V Всероссийская конференция молодых ученых

Санкт-Петербургский государственный политехнический университет Главный информационно-вычислительный комплекс, Кафедра «Измерительные информационные технологии»

2 Задачи работы

Задачи работы

Измерить быстродействие ОЗУ ЭВМ в различных режимах работы Определить, как зависит производительность ЭВМ на реальных задачах от быстродействия ОЗУ Предложить модель, описывающую данную зависимость

2

3 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

За последние полгода суммарная пиковая производительность 50 самых мощных ЭВМ России и СНГ увеличилась в 3 раза Это беспрецедентный рост производительности за все время существования списка

3

4 V Всероссийская конференция молодых ученых
5 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Задача синтеза в упрощенной постановке: «Что нужно изменить в компьютере, чтобы достичь высокой производительности?» (Какие комплектующие установить?)

5

6 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Но при этом важно учитывать и стоимость… Задача в полной, традиционной постановке: «Создание (синтез) ЭВМ с минимальным значением критерия цена/производительность» Чтобы уметь посчитать значение такого критерия, надо знать и цену, и производительность.

6

7 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

По ценам данные фрагментарные, но получить их можно Кроме того, при желании можно оценить еще и стоимость владения (учет электроэнергии, затрат на текущее обслуживание и ремонт)

7

8 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

С производительностью дела обстоят хуже. Отсутствует даже общепринятое понимание этого термина Производительность на тесте Linpack претендует на роль всеобщего мерила, но все меньше удовлетворяет пользователей

8

9 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Причина разочарований: расхождение производительности на Linpack и на задачах пользователей Не все задачи заключаются в перемножении матриц!..

9

10 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Допустим, что мы определяем производительность как «количество задач пользователя, которое ЭВМ решает в единицу времени» При этом мы фиксируем алгоритм и входные данные, чтобы получить хоть сколько-нибудь согласующиеся результаты при повторных прогонах задачи

10

11 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

А теперь пример. Перед Вами – две ЭВМ: 2 CPU Intel Quad-Core Xeon E5420, 2.5 GHz, 12 MBytes cache 4 CPU AMD Quad-Core Barcelona 8350, 2.0 GHz, 4 MBytes cache Какая из них лучше на моей задаче? Посчитаем пиковую производительность.

11

12 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

12

2 CPU Intel Quad-Core Xeon E5420, 2.5 GHz, 12 MBytes cache Rpeak=80 GFLOPS 4 CPU AMD Quad-Core Barcelona 8350, 2.0 GHz, 4 MBytes cache Rpeak = 128 GFLOPS Разница – в 1,6 раза в пользу AMD. Но прямое сравнение характеристик компонентов невозможно! У Intel больше кэш-память, зато у AMD больше ядер работают над общей памятью и отсутствует общая шина, ограничивающая доступ к памяти Так какая ЭВМ лучше?

13 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

13

Сделаем сравнение интереснее – добавим стоимость и посчитаем цену одного GFLOPS: 2 CPU Intel Quad-Core Xeon E5420, 2.5 GHz, 12 MBytes cache Rpeak=80 GFLOPS, $4’700 $58 / GFLOPS 4 CPU AMD Quad-Core Barcelona 8350, 2.0 GHz, 4 MBytes cache Rpeak = 128 GFLOPS, $11’000 $86 / GFLOPS Разница – в 1,5 раза, но теперь – в пользу Intel. Так какая ЭВМ теперь лучше?

14 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Теперь будем использовать эти ЭВМ в качестве узлов для создания кластерной ЭВМ Воспользуемся Blade-решением от SuperMicro Нам необходимо шасси. Оно вмещает 10 узлов. Шасси стоит $17’000

14

15 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Стоимость решения от Intel: $4’700 * 10 (узлы) + $17’000 (шасси) = $64’000 Rpeak=800 GFLOPS $80 / GFLOPS Стоимость решения от AMD: $11’000 * 10 (узлы) + $17’000 (шасси) = $127’000 Rpeak=1280 GFLOPS $100 / GFLOPS Разница – только 25%. Может быть, Intel – не настолько лучше, как казалось сначала?

15

16 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

А ведь мы здесь рассчитывали цену «пиковых» GFLOPS’ов. В реальных задачах узлы от AMD могут оказаться лучше: там 16 ядер работают над общей памятью, и интерконнект не задействован В случае с Intel придется использовать 2 узла, то есть без интерконнекта не обойтись…

16

17 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

А если добавить к расчетам стоимость владения – хотя бы в виде счетов за электричество? Тогда будем использовать критерий «совокупная стоимость владения / производительность» Для достижения пиковой производительности 1280 GFLOPS требуется 10 узлов от AMD и 16 – от Intel. Какая комбинация будет потреблять больше электроэнергии – 40 процессоров AMD (в 10 узлах) или 32 процессора Intel (в 16 узлах)?

17

18 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Можно использовать процессоры с пониженным энергопотреблением, тогда уменьшатся счета за электричество Но эти процессоры дороже – возможно, затраты перекроют выгоду?

18

19 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

А если еще учитывать стоимость аренды места в вычислительном центре в долгосрочной перспективе? Решение от AMD занимает меньше места, значит, на аренде можно сэкономить…

19

20 Часть 1. Современный подход к синтезу ЭВМ

Часть 1. Современный подход к синтезу ЭВМ

Ход мыслей понятен? Слишком много вопросов «А что, если?»… …на которые пока нет полных и достоверных ответов. Решение заключается в построении адекватных моделей стоимости и производительности для кластерных ЭВМ

20

21 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Если мы хотим строить адекватные модели производительности ЭВМ, нам надо знать, от чего же зависит производительность Все знают, что зависит от тактовой частоты процессора От чего еще?

21

22 Масштабирование по частоте CPU

Масштабирование по частоте CPU

© Вл.В.Воеводин, конференция ПаВТ-2008

Производительность, Mflops

23 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Попробуем исследовать скоростные характеристики ОЗУ в разных режимах и выяснить, как они влияют на производительность ЭВМ Проблема №1: нет общепринятого подхода к измерению скоростных характеристик ОЗУ Проблема №2: скоростных характеристик у ОЗУ целых две – пропускная способность и время доступа Все эти «тесты быстродействия ОЗУ» - что они на самом деле измеряют?

23

24 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Будем исследовать тест “STREAM” Создан в академической среде Открытый исходный код Можно разобраться, что он измеряет и как

24

25 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

25

Все тесты быстродействия ОЗУ – это, в конечном счете, программы. Пропускная способность и время доступа – это характеристики, присущие ОЗУ в отрыве от ЭВМ. Они задаются частотой шины памяти и таймингами памяти соответственно С помощью программы (теста быстродействия) мы не можем наблюдать в чистом виде ни пропускную способность, ни время доступа В тесте “STREAM” мы измеряем время передачи блока памяти заданной длины Это время является функцией пропускной способности и времени доступа. То есть с помощью тестов быстродействия мы измеряем интегральную скоростную характеристику ОЗУ.

26 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

26

To complicate matters even further… Термином «пропускная способность» обозначают как номинальную характеристику ОЗУ (задается тактовой частотой в отрыве от ЭВМ), так и эффективную скоростную характеристику (измеряемую с помощью тестов быстродействия) Всякий тест быстродействия скажет Вам, что измеряет именно «пропускную способность» - так вот, речь идет об «эффективной пропускной способности» Эти сложности в терминологии как будто нарочно созданы, чтобы запутать исследователей

27 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Как работает тест “STREAM”? В памяти размещается несколько больших массивов Выполняются вычислительные ядра теста:

27

Таблица 1. Вычислительные ядра теста "STREAM"

28 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Будем исследовать ЭВМ на основе ЦП “AMD Athlon” При измерении будем варьировать следующие параметры подсистемы памяти: частоту шины памяти режим работы контроллера – одноканальный, двухканальный

28

29 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

29

30 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

30

31 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Теперь исследуем производительность ЭВМ на реальной задаче при разных режимах работы памяти «Производительность» определяем так: сколько задач можно решить в единицу времени

31

32 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

В качестве задачи рассмотрим численное моделирование сгорания природного газа с учетом турбулентности Моделирование будем проводить в программной системе “FLUENT” Расчетная сетка содержит 350 тысяч элементов В терминах системы “FLUENT” определяют «рейтинг» - количество задач, которое ЭВМ может решить за сутки Фактически, это и есть интересующая нас «производительность»

32

33 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

33

34 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

34

35 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

Мы рассмотрели: График зависимости быстродействия ОЗУ от параметров подсистемы памяти График зависимости производительности ЭВМ на реальной задаче от параметров подсистемы памяти Возникает гипотеза: возможно, между быстродействием ОЗУ и производительностью ЭВМ есть корреляция?

35

36 Часть 2. Измерение быстродействия ОЗУ

Часть 2. Измерение быстродействия ОЗУ

36

37 Заключение и выводы по работе

Заключение и выводы по работе

Детально исследован способ измерения быстродействия ОЗУ с помощью тестового пакета “STREAM” Измерено быстродействие ОЗУ в различных режимах работы

37

38 Заключение и выводы по работе

Заключение и выводы по работе

Исследована зависимость производительности ЭВМ на реальных задачах от быстродействия ОЗУ Предложена линейная модель для описания этой зависимости

38

«V Всероссийская конференция молодых ученых»
http://900igr.net/prezentacija/filosofija/v-vserossijskaja-konferentsija-molodykh-uchenykh-114595.html
cсылка на страницу
Урок

Философия

20 тем
Слайды
900igr.net > Презентации по философии > Без темы > V Всероссийская конференция молодых ученых