№ | Слайд | Текст |
1 |
 |
Архитектура современных ЭВМКафедра Параллельных вычислений (ИВМиМГ) Кафедра Параллельных вычислительных технологий Маркова Валентина Петровна, markova@ssd.sscc.ru Куликов Игорь Михайлович, kulikov@ssd.sscc.ru |
2 |
 |
Определение архитектуры компьютераАрхитектура компьютера – логическая организация компьютера с точки зрения программиста, (программно-видимые средства) IA-32, Intel Core, AMD x86-64, STI Cell, IBM POWER Микроархитектура компьютера – совокупность аппаратных решений для серии процессоров, реализующих ее программную модель IA-32 (Intel Architecture 32 bit) представлена двумя микроархитектурами: P6 (Pentium Pro, Pentium II и Pentium III) NetBurst (Celeron, Pentium 4, Xeon ,….) |
3 |
 |
Архитектурные принципы компьютера фон НейманаПринцип программного управления Принцип хранимой программы Синхронное функционирование Принцип условного перехода Принцип использования двоичной системы счисления Принцип иерархичности ЗУ |
4 |
 |
Схема компьютера фон Неймана |
5 |
 |
Выполнение команды |
6 |
 |
Выполнение команды |
7 |
 |
Машины потока командХарактерной чертой компьютеров фон Неймана является наличие глобально адресуемой памяти и счетчика команд, которые позволяют УУ многократно повторять один и тот же цикл действий: 1) Извлечение очередной команды машинного кода, 2) Декодирование и выполнение команды в автоматическом режиме. В результате глобально адресуемая память и счетчик команд создают поток команд, которые УУ декодирует, а АЛУ исполняют. |
8 |
 |
Управляющие стратегии вычисленийКоманда выполняется, если предыду-щая команда, определенная в машин-ном коде, выполнена (control flow). Команда выполняется, когда требуе-мые операнды готовы (data flow). Команда выполняется, когда ее резу-льтат требуется другой команде (demand driven). Команда выполняется, когда появля-ются частичные образы данных (pattern driven). |
9 |
 |
Узкие места архитектуры фон НейманаПоследовательное выпол-нение команд. Хранение данных и прог-раммы в одном ОЗУ. Один канал связи. |
10 |
 |
Усовершенствования архитектуры фон НейманаУсовершенствования в области CБИС-технологий. Программного обеспечения. Архитектурные усовершенствования. |
11 |
 |
Прогресс в СБИС-технологияхЗакон Мура |
12 |
 |
Усовершенствование ПОЯзыки программирования ВУ. Компиляторы. Библиотеки подпрограмм. Параллельные языки програм-мирования. Коммуникационные библиотеки. |
13 |
 |
Архитектурные усовершенствованияОптимизация подсистемы памяти Контроллер памяти Высокоскоростная шина Кэш и иерархия памяти Виртуальная память Аппаратная предвыборка данных и команд Оптимизация выполнения команд Конвейеризация Упрощение набора команд Истинный параллелизм Данные Инструкции Потоки Программы |
14 |
 |
Очень сложное ядро |
15 |
 |
Характеристики суперкомпьютера Roadrunner (№1 http://wwwtop500.org) Процессоры PowerXCell 8i 3.2 ГГц (12 240 шт.) Opteron DC 1.8 ГГц (6 562 шт.) Всего ядер 122 400 Общая память 98 Тбайт Производительность 1026 TFlops (макс) 1375.78 TFlops (пиковая) 437 MFlops/watt Энергопотребление 2.35 мегаватт |
16 |
 |
Иерархия памяти |
17 |
 |
Конвейер командСтупени Время Запись результата Вычисление операции Выборка операндов Декодирование команды Выборка команды 1 2 1 2 3 1 2 3 1 2 3 1 2 |
18 |
 |
Конвейер командВсе ступени конвейера активны Ступени Время Латентность конвейера Запись результата Вычисление операции Выборка операндов Декодирование команды Выборка команды 1 2 3 4 5 6 9 7 8 1 2 3 4 5 6 9 7 8 1 2 3 4 5 6 9 7 8 1 2 3 4 5 6 9 7 8 1 2 3 4 5 6 9 7 8 |
19 |
 |
Параллелизм на уровне инструкций (ILP)CPU INT Окно команд FP MEM BR |
20 |
 |
Параллелизм на уровне инструкций (ILP)Время |
21 |
 |
Параллелизм на уровне нитей (TLP)CPU Окно команд Нить №1 INT FP Окно команд MEM Нить №2 BR |
22 |
 |
Параллелизм на уровне нитей (TLP)Нить №1 Нить №2 Время |
23 |
 |
Многоядерность (Multi-Core)Процесс №1 Процесс №2 Окно команд Окно команд |
24 |
 |
Основные проблемыPower Wall – стена мощности Процессоры греются Memory Wall – стена памяти Память медленнее процессоров Frequency Wall – стена частоты Транзисторы маленькие, процессоры большие Complexity Wall – стена сложности Процессоры больше управляют вычислениями, чем вычисляют |
25 |
 |
ИтогиСовременные архитектуры произрастают из корня фон-Неймана Оптимизации идут экстенсивно вплоть до стен (walls) |
26 |
 |
Разработка IBM: 500 GHz |
27 |
 |
Intel Polaris 80 ядер, 1 ТФлопс |
28 |
 |
University of Texas at Austin |
29 |
 |
Алмазные кристаллы1000 vs 150 °C 200 vs 20 Вольт |
«Архитектура современных ЭВМ» |
http://900igr.net/prezentacija/informatika/arkhitektura-sovremennykh-evm-111488.html