История архитектуры
<<  История города в памятниках и архитектуре Архитектура системной платы современных компьютеров  >>
Обзор современных процессорных архитектур
Обзор современных процессорных архитектур
Начало: Архитектура фон Неймана
Начало: Архитектура фон Неймана
Улучшения архитектуры фон Неймана
Улучшения архитектуры фон Неймана
Улучшения архитектуры фон Неймана
Улучшения архитектуры фон Неймана
Очень Сложное Ядро
Очень Сложное Ядро
Очень Сложное Ядро
Очень Сложное Ядро
И появились проблемы:
И появились проблемы:
И появились проблемы:
И появились проблемы:
И появились проблемы:
И появились проблемы:
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Многопоточность, Многоядерность
Решение проблем: Контроллер памяти на чипе
Решение проблем: Контроллер памяти на чипе
Решение проблем: Контроллер памяти на чипе
Решение проблем: Контроллер памяти на чипе
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Специализация ядер
Решение проблем: Графические ускорители
Решение проблем: Графические ускорители
Решение проблем: Графические ускорители
Решение проблем: Графические ускорители
Решение проблем: Графические ускорители
Решение проблем: Графические ускорители
Общая картина
Общая картина
Разработки завтрашнего дня: GPGPU процессор: Intel Larrabee
Разработки завтрашнего дня: GPGPU процессор: Intel Larrabee
Разработки будущего: 500 GHz
Разработки будущего: 500 GHz
Разработки будущего: 80 ядер
Разработки будущего: 80 ядер
Разработки будущего: EDGE
Разработки будущего: EDGE
Разработки будущего: EDGE
Разработки будущего: EDGE
Разработки будущего: EDGE
Разработки будущего: EDGE
Обзор современных процессорных архитектур
Обзор современных процессорных архитектур

Презентация: «Обзор современных процессорных архитектур». Автор: Сергей. Файл: «Обзор современных процессорных архитектур.ppt». Размер zip-архива: 4037 КБ.

Обзор современных процессорных архитектур

содержание презентации «Обзор современных процессорных архитектур.ppt»
СлайдТекст
1 Обзор современных процессорных архитектур

Обзор современных процессорных архитектур

2 Начало: Архитектура фон Неймана

Начало: Архитектура фон Неймана

Принцип программного управления Принцип однородности памяти Принцип адресуемости памяти

3 Улучшения архитектуры фон Неймана

Улучшения архитектуры фон Неймана

Иерархия памяти Параллелизм на уровне команд конвейер, суперскаляр / VLIW, SIMD Исполнение команд вне порядка Повышение частоты Рост длины конвейера RISC (microOps в CISC) …

4 Улучшения архитектуры фон Неймана

Улучшения архитектуры фон Неймана

Иерархия памяти Параллелизм на уровне команд конвейер, суперскаляр / VLIW, SIMD Исполнение команд вне порядка Повышение частоты Рост длины конвейера RISC (microOps в CISC) …

В результате имеем…

5 Очень Сложное Ядро

Очень Сложное Ядро

Предел: 4 - 6 RISC-инструкций за такт

6 Очень Сложное Ядро

Очень Сложное Ядро

Как программировать? Просто… Правильно использовать память Обработка данных блоками Последовательный обход Кэш-буксование Правильно сформировать последовательность команд Компилятор справится… Векторизовать

7 И появились проблемы:

И появились проблемы:

Power Wall – барьер мощности Процессоры греются Memory Wall – барьер памяти Память медленнее процессоров Frequency Wall – барьер частоты Транзисторы маленькие, процессоры большие Complexity Wall – барьер сложности Процессоры больше управляют вычислениями, чем вычисляют

8 И появились проблемы:

И появились проблемы:

Power Wall – барьер мощности Процессоры греются Memory Wall – барьер памяти Память медленнее процессоров Frequency Wall – барьер частоты Транзисторы маленькие, процессоры большие Complexity Wall – барьер сложности Процессоры больше управляют вычислениями, чем вычисляют

9 И появились проблемы:

И появились проблемы:

Power Wall – барьер мощности Процессоры греются Memory Wall – барьер памяти Память медленнее процессоров Frequency Wall – барьер частоты Транзисторы маленькие, процессоры большие Complexity Wall – барьер сложности Процессоры больше управляют вычислениями, чем вычисляют

Усложнять и разгонять дальше некуда!

10 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

11 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Intel xeon X7460 2.66 ghz 6 ядер intel xeon i7 975 XE 3.33 ghz 4 ядра, 2 потока на ядро AMD opteron 8435 2.6 ghz 6 ядер AMD phenom X4 955 3.2 ghz 4 ядра IBM POWER6 5.0 ghz 2 ядра, 2 потока на ядро

12 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Intel xeon X7460 2.66 ghz 6 ядер intel xeon i7 975 XE 3.33 ghz 4 ядра, 2 потока на ядро AMD opteron 8435 2.6 ghz 6 ядер AMD phenom X4 955 3.2 ghz 4 ядра IBM POWER6 5.0 ghz 2 ядра, 2 потока на ядро

13 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Intel xeon X7460 2.66 ghz 6 ядер intel xeon i7 975 XE 3.33 ghz 4 ядра, 2 потока на ядро AMD opteron 8435 2.6 ghz 6 ядер AMD phenom X4 955 3.2 ghz 4 ядра IBM POWER6 5.0 ghz 2 ядра, 2 потока на ядро

14 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Intel xeon X7460 2.66 ghz 6 ядер intel xeon i7 975 XE 3.33 ghz 4 ядра, 2 потока на ядро AMD opteron 8435 2.6 ghz 6 ядер AMD phenom X4 955 3.2 ghz 4 ядра IBM POWER6 5.0 ghz 2 ядра, 2 потока на ядро

15 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Как программировать? Можно просто запустить много задач…

16 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Как программировать одну задачу? Параллельное программирование с общей памятью

Задачи: Совместное использование данных и ресурсов потоками Синхронизация потоков

17 Решение проблем: Многопоточность, Многоядерность

Решение проблем: Многопоточность, Многоядерность

Как программировать одну задачу? Параллельное программирование с общей памятью

Задачи: Совместное использование данных и ресурсов потоками Синхронизация потоков

Больше потоков – больше нагрузка на память!

18 Решение проблем: Контроллер памяти на чипе

Решение проблем: Контроллер памяти на чипе

Core2

Core2

Core2 i7

Core2 i7

19 Решение проблем: Контроллер памяти на чипе

Решение проблем: Контроллер памяти на чипе

Просто все работает быстрее!

Core2

Core2

Core2 i7

Core2 i7

20 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Процессор Cell

PPE – ядро общего назначения SPE – векторные ядра EIB – быстрая асинхронная шина

21 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Процессор Cell – как программировать? Разбить задачу на подзадачи для вычисления на ядрах SPE Организовать передачу данных между ядрами одновременно с вычислениями Векторизовать вычисления на ядрах SPE

22 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Процессор Cell – как программировать? Разбить задачу на подзадачи для вычисления на ядрах SPE Организовать передачу данных между ядрами одновременно с вычислениями Векторизовать вычисления на ядрах SPE

Сложно?

23 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Процессор Cell – как программировать? Есть средства для автоматизации создания потоковых программ и программ с массовым параллелизмом.

24 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Roadrunner на базе opteron и cell самый мощный суперкомпьютер

25 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

Roadrunner на базе Opteron и Cell Почти самый «зеленый» суперкомпьютер

26 Решение проблем: Специализация ядер

Решение проблем: Специализация ядер

А почему только ядер?... Есть и другие специальные вычислители…

27 Решение проблем: Графические ускорители

Решение проблем: Графические ускорители

GPGPU – General-Purpose computing on Graphics Processing Units Расширение возможностей графического конвейера для решения вычислительных задач общего назначения

28 Решение проблем: Графические ускорители

Решение проблем: Графические ускорители

29 Решение проблем: Графические ускорители

Решение проблем: Графические ускорители

Как программировать? Разбить задачу на большое число (сотни, тысячи) одинаковых маленьких потоков. Использовать для хранения данных нужный тип памяти, правильно к нему обращаться. registers, local, shared, global, constant, texture Только блоки из 8 потоков могут взаимодействовать между собой.

30 Общая картина

Общая картина

Производительность «в среднем» Универсальность

Специализация Производительность на «специальных» задачах

31 Разработки завтрашнего дня: GPGPU процессор: Intel Larrabee

Разработки завтрашнего дня: GPGPU процессор: Intel Larrabee

32 Разработки будущего: 500 GHz

Разработки будущего: 500 GHz

Исследования IBM: Процессор с частотой 500 GHz А они всё разгоняют…

33 Разработки будущего: 80 ядер

Разработки будущего: 80 ядер

Исследования Intel: Процессор Polaris с 80 ядрами (1 TFLOP)

34 Разработки будущего: EDGE

Разработки будущего: EDGE

University of Texas at Austin EDGE – Explicit Data Graph Execution Явное исполнение в соответствии с графом зависимостей по данным До 16 команд за такт До 1024 команд в обработке

35 Разработки будущего: EDGE

Разработки будущего: EDGE

Процессор TRIPS (Tera-op, Reliable, Intelligently adaptive Processing System)

36 Разработки будущего: EDGE

Разработки будущего: EDGE

Программа – последовательность гиперблоков до 128 команд в гиперблоке Подготовка кода для исполнения:

37 Обзор современных процессорных архитектур
«Обзор современных процессорных архитектур»
http://900igr.net/prezentacija/mkhk/obzor-sovremennykh-protsessornykh-arkhitektur-161224.html
cсылка на страницу
Урок

МХК

58 тем
Слайды
900igr.net > Презентации по МХК > История архитектуры > Обзор современных процессорных архитектур