Базы данных
<<  Творческий путь ю трифонова Решения на базе платформы Itanium - надежность, масштабируемость, безопасность  >>
Картинок нет
Картинки из презентации «Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы» к уроку информатики на тему «Базы данных»

Автор: Kudryavcev Yuri. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока информатики, скачайте бесплатно презентацию «Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы.ppt» со всеми картинками в zip-архиве размером 75 КБ.

Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы

содержание презентации «Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы.ppt»
Сл Текст Сл Текст
1Olap-анализ данных: решаемые задачи, 21[reference models] [PARTITION BY
технологии, актуальные проблемы. Кудрявцев (<cols>)] DIMENSION BY
Юрий, ВМиК МГУ mail@ykud.com 22 февраля (<cols>) MEASURES (<cols>)
ACM SIGMOD Москва. [IGNORE NAV] | [KEEP NAV] [RULES [UPSERT |
2Организационное. UPDATE] [AUTOMATIC ORDER | SEQUENTIAL
http://ykud.com/sigmod/2007 1,5 часа ORDER] [ITERATE (n) [UNTIL
Вашего времени Вопросы приветствуются. <condition>] ] (
3План. Задачи анализа, определение OLAP <cell_assignment> =
OLAP-расширения SQL MOLAP продукты <expression> ... ).
Вопросы, перспективные технологии. http://www.oracle.com/technology/products/
4Появление термина OLAP. Статья Кодда i/db/10g/model_examples.html.
“Providing OLAP for End-User Analysis” 22Oracle Model By (model_by_simple.sql).
отосланная в IEEE Computer – 12 признаков select region,month, sales from sales_data
OLAP-системы. model partition by (region) dimension by
512 признаков OLAP. Многомерная (month) measures (sales) rules (sales[7] =
концепция данных. OLAP оперирует CUBE (sales[5]+sales[6])/2) order by region,
данными, которые являются многомерными month; Считаем продажи в 7ом месяце.
массивами данных. Число измерений OLAP REGION MONTH SALES north 1 5 north 2 7
кубов не ограничено. Прозрачность. OLAP north 3 10 north 4 20 north 5 5 north 6 10
системы должны опираться на открытые north 7 7,5 south 1 20 south 2 30 south 3
системы, поддерживающие гетерогенные 20 south 4 40 south 5 50 south 6 60 south
источники данных. Доступность. OLAP 7 55. REGION MONTH SALES south 1 20 south
системы должны представлять пользователю 2 30 south 3 20 south 4 40 south 5 50
единую логическую схему данных. Постоянная south 6 60 north 1 5 north 2 7 north 3 10
скорость выполнения запросов. north 4 20 north 5 5 north 6 10.
Производительность не должна падать при 23Oracle Model By
росте числа измерений. Клиент\сервер (model_by_running_total.sql). select
архитектура. Системы должны базироваться region,month, sales,sales_rt from
на открытых, модульных системах. Различное sales_data model partition by (region)
число измерений. Системы не должны dimension by (month) measures (sales,0
ограничиваться 3хмерной моделью sales_rt) rules (sales_rt[any] = case when
представления данных. Причем измерения cv(month) = 1 then (sales[cv(month)]) else
должны быть эквивалентны по применению (sales_rt[cv(month)-1] + sales[cv(month)])
любых функций. end ) order by region, month;
612 признаков OLAP. Динамическое Running_total (sales_rt) – накопленный
представление разреженных матриц. Идея итог продаж.
относится к «нулям» в реляционных базах 24Oracle Model By
данных и сжатию больших файлов, (model_by_running_total.sql).
«разреженная матрица» - матрица, не каждая Running_total (sales_rt) – накопленный
ячейка которой содержит данные. OLAP итог продаж. REGION MONTH SALES south 1 20
системы должны содержать средства хранении south 2 30 south 3 20 south 4 40 south 5
и обработки больших объемов данных. 50 south 6 60 north 1 5 north 2 7 north 3
Многопользовательская поддержка. OLAP 10 north 4 20 north 5 5 north 6 10. REGION
системы должны поддерживать MONTH SALES SALES_RT north 1 5 5 north 2 7
многопользовательский режим работы. 12 north 3 10 22 north 4 20 42 north 5 5
Неограниченные многомерные операции. 47 north 6 10 57 south 1 20 20 south 2 30
Аналогично, требованию о различном числе 50 south 3 20 70 south 4 40 110 south 5 50
измерений : все измерения считаются 160 south 6 60 220.
равными и многомерные операции не должны 25Oracle Model By
накладывать ограничений на отношения между (model_by_iterate.sql). Прогноз продаж
ячейками. Интуитивно понятные инструменты считаем на базе предыдущего прогноза и
манипулирование данными. В идеале, факта. select region,month, sales,
пользователи не должны пользоваться sales_forecast from sales_data model
различными усложненными меню и прочим, return updated rows partition by (region)
чтобы сформулировать многоуровневые dimension by (month) measures (sales, 0
запросы. Гибкая настройка конечных sales_forecast) rules ITERATE(100) UNTIL
отчетов. Пользователи должны иметь (ABS((PREVIOUS(sales_forecast[6]) -
возможность видеть только то, что им sales_forecast[6]) ) < 0.001 ) (
необходимо, причем все изменения данных sales_forecast[any] = case when
должны немедленно отображаться в отчетах. sales_forecast[cv(month)-1] > 0 then
Отсутствие ограничений на количество (sales[cv(month) -1] + sales_forecast
измерений и уровней агрегации данных. [cv(month)-1])/2 --
7Но. Последние 4 страницы статьи (sales_forecast[cv(month)] + else (1.5 *
посвящены Essbase – проверка соответствия sales[cv(month)-1]) end ) order by region,
OLAP критериям Жена Кодда в это время month.
работает в Arbor Software (разработчик 26Oracle Model By
Essbase) Arbor Software спонсировало (model_by_iterate.sql). Прогноз продаж
написание статьи. считаем на базе предыдущего прогноза и
8Результат. Журнал Computer после факта. REGION MONTH SALES south 1 20 south
публикации официально изымает статью Кодда 2 30 south 3 20 south 4 40 south 5 50
из своих архивов. south 6 60 north 1 5 north 2 7 north 3 10
9Простое определение OLAP. Nigel Pendse north 4 20 north 5 5 north 6 10. REGION
-- olapreport.com FASMI FAST Analysis MONTH SALES SALES_FORECAST north 1 5 north
Shared Multidimensional. 2 7 7,5 north 3 10 7,25 north 4 20 8,625
10Для задач анализа мы вводим north 5 5 14,3125 north 6 10 9,65625 south
«многомерность» данных В SQL измерения – 1 20 south 2 30 30 south 3 20 30 south 4
обычно аргументы запроса с Group By 40 25 south 5 50 32,5 south 6 60 41,25.
Drill-up\down, slice&dice 2 задачи для 27Проблемы ROLAP. Хранение агрегатов
примера: Кросс-таблица Нарастающий итог за (материализация) или вычисление на лету
квартал. Моделирование измерений и вычислений Схемы
11Olap-расширения SQL. Группировка хранения «снежинка» и «звезда» (Кимбалл и
данных Grouping Set Rollup Cube Инмон).
Row_Number(), Rank Window By SQL-1999. 28Достаточно ли подобных расширений SQL?
12На чем запускать запросы. MySQL 294 типа OLAP систем по Кодду.
Microsoft SQL Server Oracle IBM DB2 Categorical – простые запросы exegetical –
Postgres. многомерный анализ, drill-up\down
13Нужен ORACLE 10.2.0.1.0 + OLAP Option contemplative – изменение расчетных
(EE) Таблицы не создаются – достаточно результатов, при изменении входных
прав на TEMP. параметров formulaic – задание правил
14Grouping Set (grouping_sets.sql). поведения системы и цель, сценарное
select dept,job_title, count(*) as моделирование.
staff_quantity from emp_data group by 30Задачи 3его, 4го типа. Goal-Seeking,
grouping sets (dept,job_title). EMPID DEPT BackSolving – многомерные обратные расчеты
JOB_TITLE 1 hr manager 2 it sysadmin 3 it уравнений Вводим данные в ячейку,
dba 4 hr clerk 5 it networkadmin 6 hr являющуюся пересечением формул по двум
clerk 7 it networkadmin 8 it clerk. DEPT измерениям (например, Продажи по всем
JOB_TITLE STAFF_QUANTITY hr 3 it 5 продуктам (сумма), в Год (сумма)) Пересчет
networkadmin 2 dba 1 clerk 3 sysadmin 1 по профилям.
manager 1. 31Многомерные Базы Данных. Статисческие
15Rollup (rollup.sql). select базы данных (SBD) Модель данных изначально
dept,job_title, count(*) as staff_quantity включающая измерения (с иерархиями) как
from emp_data group by rollup объекты Особая роль измерения Время
(dept,job_title). Group By Rollup (a,b,c) Использование многомерных формул.
== Group by grouping sets 32Molap-продукты. Essbase Express Ms
(a,b,c)(a,b)(a)(). DEPT JOB_TITLE Analysis Services.
STAFF_QUANTITY hr clerk 2 hr manager 1 hr 33Hyperion Essbase. Extended Spread
3 it dba 1 it clerk 1 it sysadmin 1 it Sheet database Arbor Software Роберт Эйрль
networkadmin 2 it 5 8. EMPID DEPT – column-based storage.
JOB_TITLE 1 hr manager 2 it sysadmin 3 it 34Oracle Express. MIT (1975)
dba 4 hr clerk 5 it networkadmin 6 hr ->…->IRI Software->Oracle (1995)
clerk 7 it networkadmin 8 it clerk. Express 4GL Схема работы Model By.
EMP_Data. 35Схема работы Model By.
16Cube (cube.sql). select 36MicroSoft. Analysis Services – HOLAP
dept,job_title, count(*) as staff_quantity движок Новая разработка Panorama ->
from emp_data group by cube Microsoft MDX – новый язык запросов к
(dept,job_title) ; Group By Cube == Group многмерным данным (поддерживается
by grouping sets Hyperion).
(a,b,c)(a,b)(b,a)(b,c)(a)(b)(c)(). DEPT 37MDX (пример синтаксиса). SELECT {
JOB_TITLE STAFF_QUANTITY 8 dba 1 clerk 3 [Measures].[Dollar Sales],
manager 1 sysadmin 1 networkadmin 2 hr 3 [Measures].[Unit Sales] } on columns, {
hr clerk 2 hr manager 1 it 5 it dba 1 it [Time].[Q1, 2005], [Time].[Q2, 2005] } on
clerk 1 it sysadmin 1 it networkadmin 2. rows FROM [Sales] WHERE ([Customer].[MA]).
EMPID DEPT JOB_TITLE 1 hr manager 2 it 38А что же IBM? Перепродавали Essbase,
sysadmin 3 it dba 4 hr clerk 5 it как IBM OLAP Server, прекратили в 2006
networkadmin 6 hr clerk 7 it networkadmin Сделали IBM Cube Views – не продавался.
8 it clerk. EMP_Data. 39Open-Source. Mondrian – ROLAP,
17Row_Number. Возвращает номер кортежа поддерживает MDX PALO – memory-based
Варианты определения: IDENTITY (MicroSoft) MOLAP, новая разработка.
– колонка в таблице ROWID (ORACLE) – 40Стандарты OLAP. OLAP Council. JOLAP –
физический номер в сегменте ROW_NUMBER() – поддерживался Hyperion и Mondrian =>
функция (Sybase WatCom SQL). мертв APB-1 Benchmark – набор тестов для
18Row_Number (rownum.sql). select определения производительности OLAP-движка
dept,job_title, row_number() over (order XML\A – стандарт взаимодействия с MS
by empid) as row_num from emp_data; DEPT Analysis Services (описание сервиса).
JOB_TITLE ROW_NUM hr manager 1 it sysadmin Использует MDX.
2 it dba 3 hr clerk 4 it networkadmin 5 hr 41Выводы и замечания. Что такое OLAP?
clerk 6 it networkadmin 7 it clerk 8. Нет стандартов, ни в модели данных, ни в
19Ранжирование. RANK | DENSE_RANK | языках Статистические пакеты сближаются с
PERCENT_RANK | CUME_DIST -- разные типы OLAP-приложениями Сервера отчетности не
ранжирования по значению меры. используют возможности SQL.
20Window By (window_by.sql). 42Новые решения. Языки векторного
Moving_total – нарастающий итог за программирования (APL, K) In-memory базы
квартал. select region,month, sales, данных (TimesTen, Applix, KX) как буфера
sum(sales) over (partition by region order для хранения агрегатов в СУРБД. Streaming
by month asc rows 2 preceding) as OLAP.
moving_average from sales_data. REGION 43Рекомендуемая Литература. Codd E.F.
MONTH SALES south 1 20 south 2 30 south 3 Providing OLAP for end-user analysys: An
20 south 4 40 south 5 50 south 6 60 north IT mandate. Thomsen E. OLAP Solutions:
1 5 north 2 7 north 3 10 north 4 20 north Building Multidimensional Information
5 5 north 6 10. REGION MONTH SALES Systems. Second Edition. Wiley, 2002.
MOVING_AVERAGE north 1 5 5 north 2 7 12 Rafanelli M. Multidimensional Databases —
north 3 10 22 north 4 20 37 north 5 5 35 Problems and Solutions. Idea Grouping
north 6 10 35 south 1 20 20 south 2 30 50 Publ., Hershey, London, Melbourne,
south 3 20 70 south 4 40 90 south 5 50 110 Singapore, Beijing, 2003. Celko J.
south 6 60 150. Analytics and OLAP in SQL. Morgan
21Oracle Model By. <prior clauses of Kaufmann, 2006.
SELECT statement> MODEL [main]
Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы.ppt
http://900igr.net/kartinka/informatika/olap-analiz-dannykh-reshaemye-zadachi-tekhnologii-aktualnye-problemy-217649.html
cсылка на страницу

Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы

другие презентации на тему «Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы»

«Изучение баз данных» - Применение условных выражений для создания запросов. Требования к уровню знаний ученика после изучения темы «Базы данных». Исторические места (музеи) нашего города. В российской системе образования применяется новый подход к изучению информатики как фундаментальной общеобразовательной дисциплины. Примеры шаблонов.

«Информация и данные» - Базы данных и информационные системы. Для формального определения таблицы используется понятие отношения (relation - отношение). Информационные системы. Пример реляционной таблицы. Примеры информационных систем: справочники, словари, записная книжка. Тема урока: Access (продолжение). Access базы данных.

«Структура данных» - Абстрактные представления. Абстрактное представление возможных приложений на основе MPEG-7: Рисунок из http://book.itep.ru/2/25/mpeg_7.htm. Стандартизация: MPEG-7. Организация мультимедийной информации. Информация о взаимодействии пользователя с материалом (предпочтения пользователя, история использования).

«Архивация данных» - Резервное копирование – создание архивированных копий файла или группы файлов. По pасшиpению аpхивного файла можно опpеделить, каким аpхиватоpом создан аpхив. Цели использования архиваторов: Книга. Самораспаковывающиеся архивы. Тема: Архивация данных. Создание электронных архивов; Перенос данных из одного ПК на другой.

«База данных» - Интерфейс БД. Экономические данные. Инструментарий сбора, обработки и анализа данных для управления качеством образования. Демографические данные. Данные образовательной статистики. Основное отличие новой БД от старой. Вид главного меню. Используемые данные в БД. Функции усовершенствованной БД. Дополнительная информация (ЕГЭ и др.).

«Базы данных 9 класс» - Что такое ключ в БД? Главное Меню Сервис Схема данных. Таблица – основной объект базы данных, хранилище информации. Переходим в режим конструктора. Какого типа могут быть поля в БД? Свойства полей: Размер поля Формат поля Обязательное для заполнения. Практическая часть. Что в БД называют записью? Типы БД: Иерархические Сетевые Реляционные.

Базы данных

19 презентаций о базах данных
Урок

Информатика

130 тем
Картинки
900igr.net > Презентации по информатике > Базы данных > Olap-анализ данных: решаемые задачи, технологии, актуальные проблемы