Хранение информации
<<  Концепции хранения данных На гп евразии для интерактивной доски триумф  >>
Вид трехмерного куба
Вид трехмерного куба
DW с витринами данных
DW с витринами данных
Многомерный куб с несколькими таблицами фактов
Многомерный куб с несколькими таблицами фактов
Гибрид нормализованного и пространственного Хранилищ данных
Гибрид нормализованного и пространственного Хранилищ данных
Картинки из презентации «Кубы данных (многомерная модель данных)» к уроку информатики на тему «Хранение информации»

Автор: Шаповалова Оксана. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока информатики, скачайте бесплатно презентацию «Кубы данных (многомерная модель данных).ppt» со всеми картинками в zip-архиве размером 217 КБ.

Кубы данных (многомерная модель данных)

содержание презентации «Кубы данных (многомерная модель данных).ppt»
Сл Текст Сл Текст
1Лекция 2 Технологии хранения данных 18агрегаты. 18.
Лекции читает Кандидат технических наук, 19Работа Хранилища СIF состоит из
доцент Перминов Геннадий Иванович. Учебный следующих этапов: скоординированное
курс Хранилища данных. извлечение данных из источников. загрузка
22. Кубы данных (многомерная модель реляционной базы данных, состоящей из
данных). 2. таблиц в третьей нормальной форме,
3Понятие о кубах. Куб OLAP - это содержащей атомарные данные. получившееся
структура, в которой хранятся совокупности нормализованное Хранилище используется для
данных, полученные из базы данных OLAP того, чтобы наполнить информацией
путем всех возможных сочетаний измерений с дополнительные репозитории презентационных
фактами продаж в таблице фактов. Исходя из данных, т.е. данных, подготовленных для
этого, создание окончательного отчета анализа. Эти репозитории, в частности,
выполняется гораздо эффективнее, поскольку включают специализированные Хранилища для
не требует выполнения никакого сложного изучения и "добычи" данных (Data
запроса. 3. Mining), a также витрины данных. 19.
4Вид трехмерного куба. 4. 20Концепция Data Warehouse Bus.
5Основными понятиями многомерной модели Использование пространственной модели
данных являются: Показатель - это величина организации данных с архитектурой
(обычно числового типа), которая "звезда" (star scheme).
собственно и является предметом анализа. Использование двухуровневой архитектуры,
Один OLAP-куб может обладать одним или которая включает стадию подготовки данных,
несколькими показателями. Измерение недоступную для конечных пользователей, и
(dimension) - это множество объектов Хранилище. В состав последнего входят
одного или нескольких типов, несколько витрин атомарных данных,
организованных в виде иерархической несколько витрин агрегированных данных и
структуры и обеспечивающих информационный персональная витрина данных, но оно не
контекст числового показателя. Измерение содержит одного физически целостного или
принято визуализировать в виде ребра централизованного Хранилища данных.
многомерного куба. Объекты, совокупность Хранилище Кимболла - скорее
которых и образует измерение, называются "виртуальный" объект. Это
членами измерений (members). Члены коллекция витрин данных, которые могут
измерений визуализируют как точки или быть пространственно разобщенными. 20.
участи, откладываемые на осях гиперкуба. 21Гибридное хранилище данных. В
Например, временное измерение: Дни, последнее время все более популярной
Месяцы, Кварталы, Годы - наиболее часто становится идея совместить концепции
используемые в анализе, могут содержать хранилища и витрины данных в одной
следующие члены: 8 мая 2002 года, май 2002 реализации и использовать хранилище данных
года, 2-ой квартал 2002 года и 2002 год. в качестве единственного источника
Как уже было сказано, объекты в измерениях интегрированных данных для всех витрин
могут быть различного типа, например данных. Тогда естественной становится
"производители" - "марки трехуровневая архитектура системы. 21.
автомобиля" или "годы" - 22Гибрид нормализованного и
"кварталы". Эти объекты должны пространственного Хранилищ данных. 22.
быть организованы в иерархическую 23Первый уровень гибридного хранилища.
структуру так, чтобы объекты одного типа На первом уровне реализуется корпоративное
принадлежали только одному уровню хранилище данных на основе одной из
иерархии. Ячейка (cell) - атомарная развитых современных реляционных СУБД. Это
структура куба, соответствующая хранилище интегрированных в основном
конкретному значению некоторого детализированных данных. Реляционные СУБД
показателя. Ячейки при визуализации обеспечивают эффективное хранение и
располагаются внутри куба и здесь же управление данными очень большого объема,
принято отображать соответствующее но не слишком хорошо соответствуют
значение показателя. 5. потребностям OLAP-систем, в частности, в
6Роль измерений в кубе. Измерения связи с требованием многомерного
играют роль индексов, используемых для представления данных. 23.
идентификации значений показателей, 24Второй уровень гибридного хранилища.
находящихся в ячейках гиперкуба. На втором уровне поддерживаются витрины
Комбинация членов различных измерений данных на основе многомерной системы
играют роль координат, которые определяют управления базами данных (примером такой
значение определенного показателя. системы является Oracle Express Server).
Поскольку для куба может быть определено Такие СУБД почти идеально подходят для
несколько показателей, то комбинация целей разработки OLAP-систем, но пока не
членов всех измерения будет определять позволяют хранить сверхбольшие объемы
несколько ячеек со значениями каждого из данных (предельный размер многомерной базы
показателей. Поэтому для однозначной данных составляет 10-40 Гбайт). В данном
идентификации ячейки необходимо указать случае это и не требуется, поскольку речь
комбинацию членов всех измерений и идет о витринах данных. Витрина данных не
показатель. 6. обязательно должна быть полностью
7Иерархии в измерениях необходимы для сформирована. Она может содержать ссылки
возможности агрегации и детализации на хранилище данных и добирать оттуда
значений показателей. Существуют следующие информацию по мере поступления запросов.
типы иерархий: сбалансированные Конечно, это несколько увеличивает время
(balanced); несбалансированные отклика, но зато снимает проблему
(unbalanced); Неровные (balanced). 7. ограниченного объема многомерной базы
8Сбалансированные иерархии. Это - данных. 24.
иерархии, в которых число уровней 25Третий уровень гибридного хранилища.
определено её структурой и неизменно, и На третьем уровне находятся клиентские
каждая ветвь иерархического дерева рабочие места конечных пользователей, на
содержит объекты каждого из уровней. которых устанавливаются средства
Каждому производителю автомобилей может оперативного анализа данных. 25.
соответствовать несколько марок 26Форматы хранения данных в OLAP кубах.
автомобилей, а каждой марке - несколько 26.
моделей автомобилей, поэтому можно 27Данные форматы различаются методами
говорить о трёхуровневой иерархии этих хранения кубов данных. Многомерный
объектов. В этом случае на первом уровне olap-формат (multi-dimensional OLAP -
иерархии располагаются производители, на MOLAP); реляционный olap-формат
втором - марки, а на третьем - модели. Как (relational OLAP - ROLAP); гибридный
видно, для формирования сбалансированной olap-формат (hybrid OLAP - HOLAP). 27.
иерархии необходимо наличие связи 28MOLAP. MOLAP является многомерным
"один-ко-многим" между объектами форматом хранения данных, который
менее детального уровня по отношению к отличается высоким быстродействием. Помимо
объектам более детального уровня. В поддержки OLAP самих кубов данных при
принципе каждый уровень сбалансированной выборе данного формата данные будут
иерархии можно представить как отдельное храниться в многомерных структурах на
простое измерение, но тогда эти измерения OLAP-сервере (OLAP-структуры). MOLAP
окажутся зависимыми, в значит неизбежно обеспечивает наилучшее быстродействие
повышение разреженности куба. 8. выполнения запросов, поскольку этот формат
9Несбалансированные иерархии. Это - специально оптимизирован для многомерных
иерархии, в которых число уровней может запросов к данным. 28.
быть изменено, и каждая ветвь 29Преимущества и недостатки MOLAP.
иерархического дерева может содержать Поскольку MOLAP требует копирования и
объекты, принадлежащие не всем уровням, преобразования всех данных в надлежащий
только нескольким первым. Необходимо формат для многомерной структуры хранилища
заметить, что все объекты данных, MOLAP можно применять для
несбалансированной иерархии принадлежат небольших или средних объемов данных.
одному типу. Типичный пример Основное преимущество MOLAP заключается в
несбалансированной иерархии - иерархия превосходных свойствах индексации; ее
типа "начальник-подчиненный", недостаток — низкий коэффициент
где все объекты имеют один и тот же тип - использования дискового пространства,
"Сотрудник". 9. особенно в случае разреженных данных. 29.
10Неровные иерархии. Это- иерархии, в 30Область применения MOLAP. Объем
которых число уровней определено её исходных данных для анализа не слишком
структурой и постоянно, однако в отличие велик (не более нескольких гигабайт), т.Е.
от сбалансированной иерархии некоторые Уровень агрегации данных достаточно высок;
ветви иерархического дерева могут не набор информационных измерений стабилен
содержать объекты какого-либо уровня. (поскольку любое изменение в их структуре
Иерархии такого вида содержат такие члены, почти всегда требует полной перестройки
логические "родители" которых не гиперкуба); время ответа системы на
находятся на непосредственно вышестоящем нерегламентированные запросы является
уровне. Типичным примером является наиболее критичным параметром; широкое
географическая иерархия, в которой есть использование сложных встроенных функций
уровни "Страны", "Штаты требуется для выполнения кроссмерных
" и "Города", но при этом в вычислений над ячейками гиперкуба, в том
наборе данных имеются страны, не имеющие числе возможности написания
штатов или регионов между уровнями пользовательских функций. 30.
"Страны" и "Города". 31ROLAP. Реляционные хранилища OLAP
10. содержат данные, передаваемые в кубы
11Агрегаты. Агрегатами называют данных, вместе с агрегациями данных куба,
агрегированные по определенным условиям причем данные хранятся в реляционных
исходные значения показателей. Обычно под таблицах, размещенных в реляционном ХД.
агрегацией понимается любая процедура 31.
формирования меньшего количества значений 32Преимущества ROLAP : в большинстве
(агрегатов) на основании большего случаев корпоративные хранилища данных
количества исходных значений. В дальнейшем реализуются средствами реляционных СУБД, и
под терминами агрегирование и агрегация инструменты ROLAP позволяют производить
будем понимать исключительно процесс анализ непосредственно над ними. При этом
суммирования данных. Заблаговременное размер хранилища не является таким
формирование и сохранение агрегатов с критичным параметром, как в MOLAP; при
целью уменьшения времени отклика на переменной размерности задачи, когда
пользовательский запрос является основным изменения в структуру измерений приходится
свойством систем поддержки оперативного вносить достаточно часто, ROLAP-системы с
анализа. 11. динамическим представлением размерности
12DW с витринами данных. 12. являются оптимальным решением, так как в
13Многомерный куб с несколькими них такие модификации не требуют
таблицами фактов. 13. физической реорганизации БД; реляционные
14Варианты реализации хранилищ данных: СУБД обеспечивают значительно более
Виртуальное хранилище данных Концепция CIF высокий уровень защиты данных и хорошие
Концепция Data Warehouse Bus Гибридная возможности разграничения прав доступа.
многоуровневая архитектура хранилища 32.
данных. 14. 33Недостатки ROLAP. Главный недостаток
15Виртуальное хранилище данных. В данном ROLAP по сравнению с MOLAP — меньшая
случае в отличие от классического производительность. Для обеспечения
(физического) ХД данные из оперативных производительности, сравнимой с
источников данных (ОИД) не копируются в многомерными базами данных, необходимо
единое хранилище. Они извлекаются, использовать звездообразные схемы. В этом
преобразуются и интегрируются случае производительность реляционных
непосредственно при выполнении систем может быть приближена к
аналитических запросов в оперативной производительности систем на основе MOLAP.
памяти компьютера. Фактически такие 33.
запросы напрямую адресуются к ОИД. 15. 34HOLAP. Гибридная архитектура, которая
16Минимизация объема памяти, занимаемой объединяет технологии ROLAP и MOLAP. В
на носителе информацией; работа с отличие от MOLAP, которая работает лучше,
текущими, детализированными данными. когда данные более плотные, серверы ROLAP
Основными достоинствами виртуального ХД лучше в тех случаях, когда данные довольно
являются: 16. разрежены. Серверы HOLAP применяют подход
17Недостатки технологии виртуального ROLAP для разреженных областей
хранилища. Время обработки запросов к многомерного пространства и подход MOLAP —
виртуальному ХД значительно превышает для плотных областей. Серверы HOLAP
соответствующие показатели для физического разделяют запрос на несколько подзапросов,
хранилища. Интегрированный взгляд на направляют их к соответствующим фрагментам
виртуальное хранилище возможен только при данных, комбинируют результаты, а затем
выполнении условия постоянной доступности предоставляют результат пользователю. При
всех ОИД. Таким образом, временная использовании данного формата OLAP-данные,
недоступность хотя бы одного из источников передаваемые в куб данных, хранятся в
может привести либо к невыполнению реляционных базах данных подобно ROLAP. А
аналитических запросов, либо к неверным агрегации данных (данные куба)
результатам. Различные ОИД могут записываются и представляются в
поддерживать разные форматы и кодировки многомерном формате. 34.
данных. Часто на один и тот же вопрос 35Преимущества и недостатки HOLAP.
может быть получено несколько вариантов Преимуществом данной системы является
ответа. Это может быть связано с обеспечение возможности связи с огромными
несинхронностью моментов обновления данных наборами данных в реляционных таблицах и
в разных ОИД, отличиями в описании прирост производительности за счет
одинаковых объектов и событий предметной использования многомерных хранилищ.
области, ошибками при вводе, утерей Недостаток состоит том, что количество
фрагментов архивов и т. д. Главным же проводимых преобразований между ROLAP и
недостатком виртуального хранилища следует MOLAP системами может существенно влиять
признать практическую невозможность на общую эффективность. 35.
получения данных за долгий период времени. 36Сравнительные характеристики. 36.
При отсутствии физического хранилища 37Достоинства OLAP: Простота
доступны только те данные, которые на использования и восприятия выходных
момент запроса есть в ОИД. Основное таблиц; полнота аналитических данных;
назначение OLTP-систем — оперативная полная и легкая настройка отчета без
обработка текущих данных, поэтому они не программиста; возможность детализировать
ориентированы на хранение данных за отчет в процессе анализа данных (от итогов
длительный период времени. По мере к деталям); формирование отчетов в 10 раз
устаревания данные выгружаются в архив и быстрее; непротиворечивость данных в
удаляются из оперативной БД. 17. отчетах; консолидация информации из разных
18Концепция Corporate Information баз данных; повышенная защита данных;
Factory, (сокр. СIF) Билла Инмона. эквивалентность одного olap-отчета целому
Концепция CIF объединила оперативные набору простых отчетов. 37.
приложения, накопители оперативных данных 38Недостатки OLAP: Не ориентирован на
(Operational Data Store, ODS, получение форм отчетности с произвольным
OLTP-системы), центральное хранилище дизайном; некоторые пользователи визуально
данных (DW), витрины данных (Data Mart) и плохо воспринимают выходные таблицы;
системы интеллектуального анализа данных ограниченные возможности создания
(Data Mining) в единый процесс выработки и оперативных отчетов; основная проблема:
потребления информации на предприятии. В необходимость разработки хранилищ данных.
CIF оперативные приложения служат для 38.
управления частными процессами. ODS 39Литература. Перминов Г.И. УМК -
накапливают в себе временные срезы «Системы интеллектуального анализа данных»
различных процессов, происходящих на (Business Intelligence). ГУ-ВШЭ, 2007.
предприятии, и согласуют их между собой. Microsoft SQL Server 2005. Analysis
ODS часто используется как оперативный Services. Под ред. Горбач И. –С-Пб,:
источник информации. Как правило, ODS БХВ-Петербург, 2007 Э. Спирли.
хранят значительно более детализированную Корпоративные хранилища данных.
информацию, чем хранилище, но за меньший Планирование, разработка, реализация. Том.
период времени — от полугода до года, так 1: Пер. с англ. - М.: "Вильямс",
как для доступа к данным в нем не 2001. http://www.dw-institute.com/lessons.
используются предварительно рассчитываемые 39.
Кубы данных (многомерная модель данных).ppt
http://900igr.net/kartinka/informatika/kuby-dannykh-mnogomernaja-model-dannykh-210216.html
cсылка на страницу

Кубы данных (многомерная модель данных)

другие презентации на тему «Кубы данных (многомерная модель данных)»

«Техническое творчество» - Картодром (11 га). Городской методический кабинет. Учебные отделы. Административный комплекс. Сроки и этапы реализации Программы: РАДИОСПОРТ Скоростная радиотелеграфия Спортивная радиопеленгация. АВТОМОДЕЛЬНЫЙ СПОРТ Кордовые модели Радиоуправляемые модели Трассовые модели. Какие проблемы необходимо решить:

«Хранение информации» - Современная технология информационных носителей развивается стремительно. А память человека — великолепным устройством для хранения полученной информации. Носитель информации — материальный объект, предназначенный для хранения и передачи информации. Поиск надежных и доступных способов хранения информации идет и по сей день.

«Научная техническая революция» - Некоторые страны с крупным внешним долгом (конец 80-х годов). НТР привела развитые страны к эпохе массового потребления. Новые изобретения. Резко возросли требования к уровню образования, квалификации и организованности работников . Рукотворные катастрофы. Однако вскоре мир постигла очередная беда : Великая Депрессия .

«Статистические данные» - Красный. Март. Любимый цвет. Tele2. Обоснование проекта: Статистические данные в градусах: Тема опроса: «Телефоном какой марки вы пользуетесь?». Статистические данные в процентах. Ноябрь. Май. Месяц рождения. Рассмотреть связь статистики и математики. Статистика - status в переводе с латинского означает «состояние» или «политическое состояние».

«Технический прогресс» - Нейтральный технический прогресс по Солоу (2). Поэтому выделяют технический прогресс: Капиталосберегающий; Трудосберегающий; Нейтральный. Лекция 4. Модель Солоу с техническим прогрессом (1). Нейтральный технический прогресс по Солоу (1). В чем здесь дело? Нейтральный технический прогресс по Хиксу (4).

«Техническое задание» - Определение целей и задач сайта. Учредители Состав редакции: сферы ответственности, контакты, фото) Подписка Состав аудитории Расценки на рекламу. Навигация по сайту. Страница сайта Правительства Штата Калифорния до и после ре-дизайна. Рекомендации по информационному наполнению веб-страницы: Какой контент будет представлен.

Хранение информации

9 презентаций о хранении информации
Урок

Информатика

130 тем
Картинки
900igr.net > Презентации по информатике > Хранение информации > Кубы данных (многомерная модель данных)