Обработка информации
<<  Основы математической обработки информации Методы получения и обработки маркетинговой информации  >>
Основы математической обработки информации
Основы математической обработки информации
Зачем нужны меры центральной тенденции
Зачем нужны меры центральной тенденции
Меры центральной тенденции
Меры центральной тенденции
Виды средних
Виды средних
Виды средних
Виды средних
Виды средних
Виды средних
Используемые обозначения
Используемые обозначения
Среднее арифметическое и его свойства
Среднее арифметическое и его свойства
Среднее арифметическое и его свойства
Среднее арифметическое и его свойства
Среднее арифметическое и его свойства
Среднее арифметическое и его свойства
Среднее, мода и медиана объединенных групп
Среднее, мода и медиана объединенных групп
Структурные средние
Структурные средние
Мода
Мода
Свойства моды
Свойства моды
Вычислить меры центральной тенденции
Вычислить меры центральной тенденции
Интерпретация моды, медианы и среднего
Интерпретация моды, медианы и среднего
Интерпретация моды, медианы и среднего
Интерпретация моды, медианы и среднего
Критерии выбора меры центральной тенденции
Критерии выбора меры центральной тенденции
Задача 1. Где строить дом
Задача 1. Где строить дом
Задача 2. Какую меру центральной тенденции выбрать
Задача 2. Какую меру центральной тенденции выбрать
Рекомендуемая литература
Рекомендуемая литература
Меры вариабельности данных
Меры вариабельности данных
Зачем нужны меры вариабельности данных
Зачем нужны меры вариабельности данных
Наиболее часто используемые меры вариабельности данных
Наиболее часто используемые меры вариабельности данных
Лимиты
Лимиты
Размах
Размах
Размах
Размах
Квантили
Квантили
Квантили
Квантили
Зачем нужны квантили
Зачем нужны квантили
Зачем нужны квантили
Зачем нужны квантили
Дисперсия
Дисперсия
Формула для вычисления дисперсии
Формула для вычисления дисперсии
Свойства дисперсии
Свойства дисперсии
Задача 3. Вычислить средние и дисперсии совокупностей:
Задача 3. Вычислить средние и дисперсии совокупностей:
Стандартное отклонение
Стандартное отклонение
Среднее отклонение
Среднее отклонение
Коэффициент вариации
Коэффициент вариации
Стандартизированные данные
Стандартизированные данные
Задача 4. Вычислить средние и дисперсии двух массивов
Задача 4. Вычислить средние и дисперсии двух массивов
Задача 5. Вычислить дисперсию тестового балла
Задача 5. Вычислить дисперсию тестового балла
Рекомендуемая литература
Рекомендуемая литература

Презентация на тему: «Основы математической обработки информации». Автор: Maslak. Файл: «Основы математической обработки информации.ppt». Размер zip-архива: 163 КБ.

Основы математической обработки информации

содержание презентации «Основы математической обработки информации.ppt»
СлайдТекст
1 Основы математической обработки информации

Основы математической обработки информации

ЛЕКЦИИ 5,6 Лектор: Поздняков Станислав Александрович, кандидат технических наук, доцент

2 Зачем нужны меры центральной тенденции

Зачем нужны меры центральной тенденции

Это наиболее важная статистика больших массивов информации (статистика – это любая функция данных). Средние значения обладают большей устойчивостью. Средние значения – это наиболее репрезентативные значения. Если нужно заменить весь массив одним числом – то нужно использовать среднее значение. Разные виды средних обладают разными свойствами. Выбор вида среднего выбирается в каждой конкретной ситуации.

04.11.2015

Основы математической обработки информации

2

3 Меры центральной тенденции

Меры центральной тенденции

Среднее арифметическое Среднее гармоническое Среднее квадратическое Среднее кубическое Среднее геометрическое Мода Медиана

04.11.2015

Основы математической обработки информации

3

4 Виды средних

Виды средних

Автомобиль движется из пункта А в пункт Б с постоянной скоростью 80 км/час, а из пункта Б в пункт А с постоянной скоростью 40 км/час. Определить среднюю скорость движения автомобиля.

04.11.2015

Основы математической обработки информации

4

5 Виды средних

Виды средних

Диаметр одной корзины подсолнуха равен 10 см, диаметр другой корзины подсолнуха равен 30 см. Определить средний диаметр корзин подсолнуха.

04.11.2015

Основы математической обработки информации

5

6 Виды средних

Виды средних

Диаметр одного яйца равен 5 см, диаметр другого яйца равен 3 см. Определить средний диаметр яиц.

04.11.2015

Основы математической обработки информации

6

7 Используемые обозначения

Используемые обозначения

Точка (.) вместо индекса обозначает суммирование по этому индексу

Обозначает усреднение

Черточка над переменной

По индексам, по которым проводилось суммирование

04.11.2015

Основы математической обработки информации

7

8 Среднее арифметическое и его свойства

Среднее арифметическое и его свойства

Если каждое значение совокупности уменьшить или увеличить на одно и то же число, то среднее ? Если каждое значение совокупности умножить или разделить на одно и то же число, то среднее ?

04.11.2015

Основы математической обработки информации

8

9 Среднее арифметическое и его свойства

Среднее арифметическое и его свойства

Среднее двух совокупностей является взвешенным средним этих совокупностей ? Сумма отклонений значений совокупности от ее среднего равно ? Сумма квадратов отклонений от их средней меньше суммы квадратов отклонений тех же значений от любой другой величины.

04.11.2015

Основы математической обработки информации

9

10 Среднее арифметическое и его свойства

Среднее арифметическое и его свойства

Откуда

04.11.2015

Основы математической обработки информации

10

11 Среднее, мода и медиана объединенных групп

Среднее, мода и медиана объединенных групп

Для того, чтобы найти объединенное среднее, необходимо знать число элементов в подгруппах. Для того, чтобы найти объединенную моду, необходимо знать какие элементы встречаются наиболее часто во всех подгруппах. Для того, чтобы найти объединенную медиану, необходимо знать распределение во всех подгруппах.

04.11.2015

Основы математической обработки информации

11

12 Структурные средние

Структурные средние

Мода – это то значение, которое в выборке встречается наиболее часто. Медиана – это то значение, относительно которого упорядоченная по возрастанию или по убыванию выборка делится пополам. Как считать доход на душу населения? (как среднее или как медиану?)

04.11.2015

Основы математической обработки информации

12

13 Мода

Мода

Мода – это наиболее частое значение, а не частота этого значения. 1. Если все значения встречаются в массиве одинаково часто, то массив не имеет моды. 2. Если два соседних значения имеют одинаковую частоту и они больше частоты любого другого значения, то мода есть среднее этих двух значений 3. Если два несмежных значения в массиве имеют равные частоты и они больше частоты любого значения, то массив является бимодальным

04.11.2015

Основы математической обработки информации

13

14 Свойства моды

Свойства моды

Мода вычисляется наиболее просто – ее можно определить на глаз. Для очень больших массивов данных это достаточно стабильная мера центра распределения. Во многих задачах мода близка к двум другим мерам – медиане и среднему.

04.11.2015

Основы математической обработки информации

14

15 Вычислить меры центральной тенденции

Вычислить меры центральной тенденции

Диаметры корзинок подсолнухов: 15, 13, 11, 16, 8, 13, 15, 16, 17, 15 Вычислить Мо = Ме =

04.11.2015

Основы математической обработки информации

15

16 Интерпретация моды, медианы и среднего

Интерпретация моды, медианы и среднего

Интерпретация осуществляется в терминах ошибок, возникающих из-за того, что все значения в выборке заменяются одним значением (наиболее репрезентативным) Мода – наиболее репрезентативное значение в том смысле, что совпадает с наибольшим числом значений в выборке.

04.11.2015

Основы математической обработки информации

16

17 Интерпретация моды, медианы и среднего

Интерпретация моды, медианы и среднего

Медиана – это такая точка на числовой оси, для которой сумма абсолютных разностей всех значений меньше суммы разностей для любой другой точки. Среднее – обеспечивает минимальное значение суммы квадратов отклонений значений от среднего.

04.11.2015

Основы математической обработки информации

17

18 Критерии выбора меры центральной тенденции

Критерии выбора меры центральной тенденции

1. В малых группах мода очень нестабильна (1,1,1,3,5,7,7,8) Мо =1. Но если 1?0 и 1?2, то Мо =7. 2. На медиану не влияют большие и малые (экстремальные) значения 3. На величину среднего влияет каждое значение. (Как?) Для каких массивов среднее, мода и медиана совпадают?

04.11.2015

Основы математической обработки информации

18

19 Задача 1. Где строить дом

Задача 1. Где строить дом

П.1

П.2

П.3

П.4

П.5

0

1

2

3

4

5

6

7

8

04.11.2015

Основы математической обработки информации

19

20 Задача 2. Какую меру центральной тенденции выбрать

Задача 2. Какую меру центральной тенденции выбрать

Доходы 5 мужчин: 1. 25 центов 2. 25 центов 3. 2 000 долларов 4. 15 000 долларов 5. 5 000 000 долларов Как охарактеризовать их средний доход? В США средний доход – это медиана, а не среднее

04.11.2015

Основы математической обработки информации

20

21 Рекомендуемая литература

Рекомендуемая литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2004, 479 с. 2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2004, 400 с. 3. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. – М.: Издательство «Прогресс», 1976. -496 с. 4. Маслак А.А. Основы планирования и анализа сравнительного эксперимента в педагогике и психологии. – Курск: РОСИ, 1998. – 167 с.

04.11.2015

Основы математической обработки информации

21

22 Меры вариабельности данных

Меры вариабельности данных

Меры центральной тенденции говорят нам о концентрации данных на числовой оси. Каждая такая мера в каком-то смысле наилучшим образом «представляет» данные. Меры центральной тенденции игнорируют различия между данными. Для измерения вариабельности данных требуются другие описательные статистики.

04.11.2015

Основы математической обработки информации

22

23 Зачем нужны меры вариабельности данных

Зачем нужны меры вариабельности данных

Научная работа связана с понятием вариабельности данных. Если есть много необъяснимых причин вариабельности, прогнозы будут неточными. Задача науки найти причины вариабельности данных и тем самым увеличить точность прогноза. Например установлено, что наследственность и окружающая среда влияют на IQ ребенка. Поэтому информация о родителях ребенка и его воспитании позволяет более точно прогнозировать его умственное развитие в зрелости. Без такой информации прогноз будет менее точным.

04.11.2015

Основы математической обработки информации

23

24 Наиболее часто используемые меры вариабельности данных

Наиболее часто используемые меры вариабельности данных

Лимиты Размах Квантили Дисперсия Стандартная ошибка Среднее отклонение Коэффициент вариации

04.11.2015

Основы математической обработки информации

24

25 Лимиты

Лимиты

Это самая простая мера изменчивости. Определяется минимальное (Xmin) и максимальное значение (Xmax) массива данных. Между этими статистиками находятся все данные массива. Несмотря на свою простоту эта мера используется редко, потому что экстремальные значения сильно подвержены ошибкам. Поэтому трудно определить влияние факторов на вариабельность данных.

04.11.2015

Основы математической обработки информации

25

26 Размах

Размах

Определяет расстояние на числовой оси, в пределах которого варьируются данные. R=Xmax-Xmin. Исключающий размах – это разность максимального и минимального значений. Включающий размах – это разность между естественной верхней границей интервала, содержащего максимальное значение и естественной нижней границей интервала, содержащего минимальное значение.

04.11.2015

Основы математической обработки информации

26

27 Размах

Размах

Например рост 5 мальчиков равен: 150, 155, 157, 165 и 168 Исключающий размах равен: 168-150=18 Включающий размах равен: 168,5 – 149,5=19

04.11.2015

Основы математической обработки информации

27

28 Квантили

Квантили

Это характеристики вариационного ряда, которые отсекают определенную его часть. Наиболее часто используются квартили, децили и процентили. Квартиль – это статистика, отсекающая ? часть ряда. Три квартиля Q1, Q2 и Q3 делят ряд на четыре, равные по объемы части (кварты).

04.11.2015

Основы математической обработки информации

28

29 Квантили

Квантили

Дециль (Di) – это статистика, отсекающая 1/10 часть ряда. Девять децилей делят ряд на 10 равных частей. Процентиль (Pi) - это статистика, отсекающая 1/100 часть ряда. Девяносто девять процентилей делят ряд на 100 равных частей.

04.11.2015

Основы математической обработки информации

29

30 Зачем нужны квантили

Зачем нужны квантили

Квантили, как и медиана, - это важные характеристики вариационного ряда, особенно для асимметричных распределений. Часто квантили используются для установления границ тех или иных нормативов.

04.11.2015

Основы математической обработки информации

30

31 Зачем нужны квантили

Зачем нужны квантили

Размах от 90-ого до 10-ого процентиля является более стабильной мерой, чем размах. Полу-междуквартильный размах Q3-Q1 содержит 50% наблюдений вариационного ряда.

04.11.2015

Основы математической обработки информации

31

32 Дисперсия

Дисперсия

При вычислении всех предыдущих мер вариабельности не учитывалось каждое отдельное значение массива данных. Отклонения наблюдений от мер центральной тенденции несут информацию о вариабельности данных. Чем больше отклонения, тем больше вариабельность. Однако:

04.11.2015

Основы математической обработки информации

32

33 Формула для вычисления дисперсии

Формула для вычисления дисперсии

04.11.2015

Основы математической обработки информации

33

34 Свойства дисперсии

Свойства дисперсии

Прибавление константы с к каждому значению не влияет на дисперсию (а на среднее?) Умножение каждого значения на константу с увеличивает дисперсию в с2 раз. Дисперсия объединенной совокупности зависит как от дисперсий, так и от средних объединяемых групп

04.11.2015

Основы математической обработки информации

34

35 Задача 3. Вычислить средние и дисперсии совокупностей:

Задача 3. Вычислить средние и дисперсии совокупностей:

А (3, 3, 3, 3) и В (7,7,7,7)

04.11.2015

Основы математической обработки информации

35

36 Стандартное отклонение

Стандартное отклонение

Эта мера тесно связана с дисперсией. Стандартное отклонение – это положительный корень из дисперсии. Стандартное отклонение измеряется в тех же единицах, что и исходные данные. Например, как интерпретировать кг2 или л2? Полезность этой меры еще и в том, что для многих распределений мы знаем, какая доля наблюдений находится внутри одного, двух, трех и более стандартных отклонений. Поэтому эта мера используется наиболее часто.

04.11.2015

Основы математической обработки информации

36

37 Среднее отклонение

Среднее отклонение

Формула имеет вид Несмотря на легкость вычисления и простоту интерпретации эта мера используется редко. Это объясняется тем, что эта мера неудобна для аналитический преобразований (например необходимо брать производную для поиска минимума функции). Эта формула неудобна также для вычисления стандартизированных отклонений.

04.11.2015

Основы математической обработки информации

37

38 Коэффициент вариации

Коэффициент вариации

Формула для вычисления имеет вид: Эта мера позволяет сравнивать вариабельность признаков имеющих разные единицы измерения. Эта мера часто используется в биологии и других науках, где измеряемые признаки отличны от нуля.

04.11.2015

Основы математической обработки информации

38

39 Стандартизированные данные

Стандартизированные данные

Формула для вычисления имеет вид: Таким образом любое множество данных на основе вычисленных среднего и стандартного отклонения можно преобразовать в стандартизированное множество с нулевым средним и единичной дисперсией. Это удобно для проверки различных статистических гипотез.

04.11.2015

Основы математической обработки информации

39

40 Задача 4. Вычислить средние и дисперсии двух массивов

Задача 4. Вычислить средние и дисперсии двух массивов

x1

10

15

20

25

30

35

40

45

50

x1.

x2

10

28

28

30

30

30

32

32

50

x2.

(x1-x.)

?

(x2-x.)

?

(x1-x.)2

?

(x2-x.)2

?

04.11.2015

Основы математической обработки информации

40

41 Задача 5. Вычислить дисперсию тестового балла

Задача 5. Вычислить дисперсию тестового балла

1

6

0

0

2

4

-2

4

3

7

1

1

4

10

4

16

5

7

1

1

6

2

-4

16

Сумма

36

0

38

04.11.2015

Основы математической обработки информации

41

42 Рекомендуемая литература

Рекомендуемая литература

1. Гмурман В.Е. Теория вероятностей и математическая статистика. – М.: Высшая школа, 2004, 479 с. 2. Гмурман В.Е. Руководство к решению задач по теории вероятностей и математической статистике. – М.: Высшая школа, 2004, 400 с. 3. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии. Пер. с англ. – М.: Издательство «Прогресс», 1976. -496 с. 4. Маслак А.А. Основы планирования и анализа сравнительного эксперимента в педагогике и психологии. – Курск: РОСИ, 1998. – 167 с.

04.11.2015

Основы математической обработки информации

42

«Основы математической обработки информации»
http://900igr.net/prezentacija/informatika/osnovy-matematicheskoj-obrabotki-informatsii-176313.html
cсылка на страницу
Урок

Информатика

130 тем
Слайды
900igr.net > Презентации по информатике > Обработка информации > Основы математической обработки информации