№ | Слайд | Текст |
1 |
 |
ТЕМА 5. Стадия проектирования и реализации ИСЛекция 21. Способы организации информационной базы. 1 |
2 |
 |
Информационная базаИнформационная база (ИБ) — это совокупность данных, организованная определенным способом и хранимая в памяти вычислительной системы в виде файлов, с помощью которых удовлетворяются информационные потребности аппарата управления и функциональных подсистем ИС. 2 |
3 |
 |
Классификация файлов ИБПо смысловому содержанию По этапам обработки По роли в машинной обработке и технологии использования По назначению (по типу функциональных подсистем) По типу носителя По типу логической организации (линейная, иерархическая, реляционная структура записи) 3 |
4 |
 |
По этапу обработкиПо технологии использования Основные 4 |
5 |
 |
Виды массивов по этапам обработкиВид массивов Назначение и содержание Входные Содержат исходные и текущие данные, запросы на решение задач и выполнение процессов. Предназначены для ввода данных или обновления базовых файлов. Выходные (результатные) Содержат совокупность показателей, необходимых для формирования отчетности и принятия решений в последующий период. Внутренние (базовые) Содержат справочную, нормативную, служебную информацию. Предназначены для переработки информации из входных массивов и формирования выходных массивов. 5 |
6 |
 |
Виды массивов по технологии использованияВид массивов Назначение и характеристики. Постоянные Формируются до начала функционирования ИС. Содержат директивные, нормативные, справочные и другие, редко меняющиеся, данные. Переменные (оперативные) Формируются из первичных документов. Содержат текущую информацию о состоянии объекта управления. Вспомогательные (рабочие) Являются результатом логических преобразований постоянных массивов. Создаются для решения конкретных задач с целью сокращения времени обработки информации. Промежуточные Содержат информацию, возникающую на стыке различных задач. Не имеют самостоятельного значения для целей управления объектом. Архивные Формируются на основе выходных массивов. Предназначены для хранения информации, необходимой для обработки в будущих отчетных периодах, для решения аналитических, прогнозных задач. Служебные Содержат информацию, необходимую для обработки всех выше упомянутых массивов. Предназначены для ускорения поиска информации в основных файлах. 6 |
7 |
 |
Требования к внутримашинному ИОПолнота, целостность, согласованность и непротиворечивость хранимой информации. Минимизация времени выборки данных при решении задач управления. Независимость структуры массивов от программных средств их организации. Динамичность структуры ИБ. Релевантность ИБ. Удобство языкового интерфейса. Разграничение прав доступа пользователей. 7 |
8 |
 |
Способы организации информационной базыИнформационная база Совокупность локальных файлов Интегрированная база данных Поддерживается функциональными пакетами прикладных программ Основывается на использовании универсальных программных средств загрузки, хранения, поиска и ведения данных (СУБД). 8 |
9 |
 |
Особенности пофайловой организации ИОСпециализация структуры данных под решаемые задачи высокая скорость обработки данных. Не предусматривается установления связи между файлами, исключается работа в диалоге. Применяется при решении узкоспециализированных задач с небольшим объемом данных, хранящихся в обособленных файлах. 9 |
10 |
 |
Стандартные операции с файламиФайл представляет собой линейную последовательность записей, над которой можно выполнить следующие стандартные операции: создать файл (требуемого типа и размера); открыть ранее созданный файл; прочитать из файла некоторую запись (текущую, следующую, предыдущую); записать в файл на место текущей записи новую запись; добавить новую запись в конец файла. 10 |
11 |
 |
Недостатки пофайловой организации внутримашинного ИОЗависимость программ от данных (структура записи файла известна только программе, которая с ним работает) Сложность авторизации (принят децентрализованный принцип управления доступом, когда администрирование режимом доступа к каждому файлу осуществляется его владельцем) Сложность реализации многопользовательского доступа (эффективный многопользовательский доступ возможен только в режиме чтения файлов) 11 |
12 |
 |
Организация ИО в виде БДБаза данных – это интегрированная совокупность файлов, обеспечивающая хранение информационных ресурсов, удобное взаимодействие между ними и быстрый доступ к данным. Преимущества: обеспечение совместимости данных; уменьшение синтаксической и семантической избыточности; соответствие данных реальному состоянию объекта управления; обеспечение многопользовательского доступа к данным. Проблемы: необходимость усиления контроля ввода данных; необходимость разграничения прав доступа пользователей; необходимость обеспечения защиты данных. 12 |
13 |
 |
Виды БДПо используемой модели данных: Иерархические; Сетевые; Реляционные; Объектно-ориентированные. По организации хранения данных и технологии их обработки: Централизованные; Распределенные. 13 |
14 |
 |
Критерий выбора способа организации ИБДостижение минимальных трудовых и стоимостных затрат на: проектирование структуры ИБ, проектирование программного обеспечения системы ведения файлов, перепроектирование ИБ при возникновении новых задач. 14 |
15 |
 |
Требования к организации БДлогическая и физическая независимость данных; контролируемая избыточность данных; стандартизация данных за счет использования классификаторов; наличие словаря данных; специализация интерфейса для администратора БД и пользователей системы; контроль целостности данных; защита данных от несанкционированного доступа; наличие вспомогательных программных средств (утилит) проектирования и эксплуатации БД. 15 |
16 |
 |
Виды БД по технологии хранения и обработки данныхЦентрализованные БД Распределенные БД Расположение: один компьютер Назначение: организация более простого и дешевого способа информационного обслуживания пользователей; Объемы данных: небольшие Задачи: несложные Надежность: более высокая за счет организационной независимости Расположение: несколько компьютеров, объединенных в единую вычислительную систему с помощью вычислительных сетей; Назначение: предоставление более гибких форм обслуживания множеству удаленных пользователей Объемы данных: значительные Задачи: сложные Надежность обеспечивается за счет средств резервирования. 16 |
17 |
 |
Принципы организации централизованной БДОбеспечение логической организации данных с помощью построения глобальной модели данных; представление информационных потребностей для каждой задачи в виде подмоделей данных; выделение специального языка описания данных для получения схем и подсхем; описание процедур обработки данных с использованием языка манипулирования данными; разделение доступа к полям данных; защита данных через пароль; обеспечение доступности данных одновременно для нескольких пользователей. 17 |
18 |
 |
Принципы организации распределенной БДучет территориального расположения подразделений ЭИС; обеспечение независимости данных от их территориального расположения; оптимальное размещение БД между клиентами и серверами; сокращение стоимости информационного обслуживания клиентов; обеспечение решения сложных межведомственных задач; надежность хранения обработки данных; использование СУБД, ориентированных на работу в сети; возможность параллельного обращения к данным из различных узлов обработки данных. 18 |
19 |
 |
Условия централизации и децентрализации данныхДанные централизуются, если: данные непрерывно обновляются, а территориально разобщенные пользователи должны получать всякий раз последнее состояние данных; поиск производится во всей совокупности данных; над данными осуществляются операции со вторичными ключами. Данные могут быть децентрализованными, если они используются локально в точке их происхождения. При низкой скорости обновления допустимо хранение нескольких копий данных. 19 |
20 |
 |
Классификация систем по способам распределения и обработки данныхЦентрализованная обработка Распределенная обработка Распределенная обработка 20 |
21 |
 |
Централизованные данныеЦентрализованные данные, централизованная обработка Централизованные данные, распределенная обработка 21 |
22 |
 |
Иерархические данныеЗависимые данные Эталонная копия данных 22 |
23 |
 |
Расщепленные данныеСтруктура данных и программы их обработки в подсистемах одни и те же. Содержание различно. 23 |
24 |
 |
Разделенные данныеСтруктура данных, их содержание и программы обработки в подсистемах различны. 24 |
25 |
 |
Реплицированные данныеКопии одних и тех же данных. Структура данных и программы обработки идентичны. 25 |
26 |
 |
Комбинированные формы распределения данных26 |
27 |
 |
Концепция информационных хранилищИнформационное хранилище позволяет обеспечить: хранение разнородных данных из различных источников в течение больших периодов времени; быстрый доступ к данным и поиск релевантной запросу информации. Информация Знания Данные 27 |
28 |
 |
Причины появления информационных хранилищОсознание руководством предприятий того, что в данных содержатся скрытые закономерности (знания), характеризующие процесс управления в целом, способные повысить его эффективность; снижение стоимости средств хранения информации, дающее возможность хранить данные, накопленные за длительные интервалы времени; снижение стоимости элементной базы сложных архитектур; переход от массового обслуживания к индивидуальному (учет разнообразных требований заказчика). 28 |
29 |
 |
Проблемы интеграции данныхИсточники могут использовать различные модели данных и предоставлять различные интерфейсы для доступа к своим данным. Данные источника могут быть неструктурированными. Источники могут быть автономными. 29 |
30 |
 |
Решение задачи интеграции данных30 |
31 |
 |
Хранилище данных — это «предметно-ориентированная, интегрированная,содержащая исторические данные, неразрушаемая совокупность данных, предназначенная для поддержки принятия управленческих решений» (Уильям Инмон, 1992). Хранилище данных (Content Repository) – программная подсистема ИС, сочетающая в себе функции системы управления версиями, поисковой машины и СУБД. Хранилище данных (Data Warehouse) – очень большая предметно-ориентированная корпоративная база данных, специально разработанная и предназначенная для подготовки отчетов, анализа бизнес-процессов с целью поддержки принятия решений в организации. Хранилище данных – это автоматизированная информационно-технологическая система организации, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию в виде наборов данных. 31 |
32 |
 |
Структура хранилища данных32 |
33 |
 |
Концепция хранилищ данныхИнтеграция ранее разъединенных детализированных данных в едином хранилище. Тематическое и временное структурирование, согласование и предварительная обработка. Разделение хранящихся данных по их назначению – для операционной обработки и для использования в задачах анализа. Цель использования ХД – подготовка данных к последующему анализу. OLTP (On-line Transaction Processing) – задачи оперативной обработки данных; OLAP (On-line Analytical Processing) – задачи аналитической обработки данных 33 |
34 |
 |
Свойства данныхПредметная ориентированность Интегрированность Неизменяемость и целостность Хронологическая структурированность 34 |
35 |
 |
Категории данных35 |
36 |
 |
Операции над даннымиСбор данных (пополнение хранилища данных) очистка – устранение ненужной информации; агрегирование – вычисление сумм, средних; трансформация – преобразование типов данных, реорганизация структур хранения; объединение из внешних и внутренних источников – приведение к единым форматам; синхронизация – соответствие одному моменту времени. Поддержка целостности и непротиворечивости данных использование репозитория (словаря-справочника) проверка данных на соответствие их структуре и назначению Организация доступа к данным 36 |
37 |
 |
Требования к хранилищам данныхВысокая скорость загрузки данных. производительность процесса загрузки не должна накладывать ограничения на размер хранилища Обеспечение полнофункциональной технологии загрузки преобразование данных фильтрация данных переформатирование данных проверка целостности данных организация физического хранения данных индексирование данных обновление метаданных Высокое качество хранилища данных Мера качества хранилища – объективность исходных данных и степень разнообразия возможных запросов Поддержка различных видов данных 37 |
38 |
 |
Требования к хранилищам данныхВысокая скорость обработки запросов зависит от сложности запроса, а не от объема хранилища Масштабируемость. поддержка СУБД параллельной обработки запросов сохранение работоспособности в случае локальных аварий обслуживание любого числа пользователей без потери производительности Широкие возможности администрирования контроль за приближением к ресурсным ограничениям анализ затрат ресурсов установка приоритетов для различных категорий пользователей и операций осуществление настройки системы на максимальную производительность. 38 |
39 |
 |
Транзакционные и аналитические системыТранзакционные системы ориентированы на операционную, или транзакционную обработку данных (автоматизированные информационные системы, осуществляющие учет и хранение оперативной информации по бизнес-процессам предприятия); Аналитические системы ориентированы на анализ данных (системы поддержки принятия решений DSS - Decision Support System). 39 |
40 |
 |
ПризнакТранзакционная система Аналитическая система Цель Учет, хранение и оперативная обработка непрерывно поступающих данных. Получение и хранение обобщенных данных об объекте управления, предоставление информации для принятия решений. Вид данных Детализированные данные Обобщенные данные Частота обновления данных Непрерывно, небольшими порциями Редко Представление результатов работы Составление определенного набора отчетных форм Получение большого числа разнообразных отчетов в удобном для понимания виде 40 |
41 |
 |
Характер использования системыТранзакционная система Аналитическая система Автоматизация бизнес-процессов на уровне цехов, отделов, бюро. Получение на основе хранящихся данных показателей, определяющих закономерности развития предприятия и эффективность его работы. Предоставление средств и инструментов для обработки показателей с использованием различных методик анализа. Взаимодействие с различными программными пакетами, осуществляющими специализированную обработку данных (статистическими методами, с помощью нейронных сетей или нечеткой логики). 41 |
42 |
 |
Взаимное сочетание транзакционной, аналитической систем и хранилищаданных зависит от специфики деятельности организации, количества и характера информации. OLTP – online transaction processing OLAP – online analytical processing ETL – extract, transformation and load (система извлечения, преобразования и загрузки данных ) 42 |
43 |
 |
Варианты использования ХДВариант 1 Тс 1 Тс 2 Тс 3 Хд АС – аналитическая система ТС – транзакционная система ХД – хранилище данных Независимые источники данных Ас 43 |
44 |
 |
Варианты использования ХДВариант 1 Вариант 2 Тс 1 Тс 2 Тс 3 Тс Хд Хд АС – аналитическая система ТС – транзакционная система ХД – хранилище данных Независимые источники данных Источник Данных Ас Ас 44 |
45 |
 |
Варианты использования ХДВариант 1 Вариант 2 Вариант 3 Тс 1 Тс 2 Тс 3 Тс Тс Хд Хд Архивные БД Хд Ас АС – аналитическая система ТС – транзакционная система ХД – хранилище данных Независимые источники данных Источник Источник Данных Данных Ас Ас 45 |
46 |
 |
Витрины данныхВитрина данных (Data Mart) – это тематическая база данных, содержащая информацию, относящуюся к отдельным аспектам деятельности организации. Витрина данных является частью хранилища данных, специфицированной для использования конкретным подразделением или определенной группой пользователей. 46 |
47 |
 |
Независимые витрины данных47 |
48 |
 |
Преимущества витрин данныхНедостатки витрин данных Простота и невысокая стоимость реализации Экономия технических ресурсов Более высокий уровень безопасности данных Высокая производительность Дублирование данных Необходимость синхронизации данных Трудности расширения и объединения витрин Ограниченность использования 48 |
49 |
 |
Многоуровневое решение ХД49 |
50 |
 |
Концептуальная модель информационного хранилища50 |
51 |
 |
Шесть уровней архитектуры хранилища данныхSRD - Sample Restructure Deliver ETL – Extract Transformation Load 51 |
52 |
 |
Рекомендуемая структура корпоративного хранилища данных52 |
53 |
 |
Виртуальные хранилищаПри использовании виртуальных хранилищ данные хранятся в удаленных источниках. Запрос к источнику транслируется через систему интеграции. 53 |
54 |
 |
Виртуальные хранилищаДостоинства Недостатки Всегда обновленные («свежие») данные Простота и малая стоимость реализации Единая платформа с источником информации Отсутствие сетевых соединений между источником информации и хранилищем данных. Сложность оптимизации запросов Дополнительные расходы на конвертацию данных во время выполнения запроса Более низкая производительность Сложность интеграции данных с другими источниками Отсутствие истории чистоты данных Зависимость от доступности и структуры основной базы данных. 54 |
55 |
 |
Логический уровень виртуального хранилищаЛогический уровень определяется выбором модели данных и языка запросов для этой модели. Модель используется для представления данных, извлекаемых из всех источников. Модель данных должна обеспечить прозрачность доступа к внешним источникам. Пользователь получает возможность унифицированного доступа ко всем интегрируемым данным, т.е. видит внешние данные как локальные в выбранной модели и не заботится об управлении доступом к источнику. 55 |
56 |
 |
Физический уровень виртуального хранилищаОбертка (wrapper) используется для хранения информации о внешнем источнике и организации к нему доступа. Посредник (mediator) осуществляет интеграцию данных из различных источников 56 |
57 |
 |
Облачное хранилище данных (cloud storage)Модель онлайн-хранилища, в котором данные хранятся на многочисленных распределённых в сети серверах, предоставляемых в пользование клиентам, в основном, третьей стороной. 57 |
58 |
 |
ДостоинстваНедостатки Клиент платит только за то место в хранилище, которое фактически использует, но не за аренду сервера, все ресурсы которого он может и не использовать. Отсутствие затрат на приобретение, поддержку и обслуживание собственной инфраструктуры по хранению данных. Все процедуры по резервированию и сохранению целостности данных производятся провайдером облачного центра. Безопасность при хранении и пересылке данных Возможное снижение производительности по сравнению с работой в условиях собственного хранилища Надежность и своевременность получения и доступности данных в облаке очень сильно зависит от многих промежуточных параметров. 58 |
«Стадия проектирования и реализации ИС» |
http://900igr.net/prezentacija/ekonomika/stadija-proektirovanija-i-realizatsii-is-136412.html