Эволюция
<<  Биологический организм с позиции системного анализа Виртуальные эксперименты на уроке: использование интерактивной творческой среды «1С:Биологический конструктор 1.5» в учебном процессе  >>
Наиболее распространенные ошибки статистического анализа данных в
Наиболее распространенные ошибки статистического анализа данных в
«Как блестящие идеи, так и научные нелепости одинаковым образом можно
«Как блестящие идеи, так и научные нелепости одинаковым образом можно
Большинство ошибок возникает при использовании простейших
Большинство ошибок возникает при использовании простейших
Ошибки статистического анализа данных
Ошибки статистического анализа данных
Данные
Данные
Шкалы измерений
Шкалы измерений
Ошибка первая: подмена типов данных
Ошибка первая: подмена типов данных
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Основные типы задач, решаемых с помощью метода статистической
Основные типы задач, решаемых с помощью метода статистической
Ошибка вторая: округление
Ошибка вторая: округление
Задаем n и доверительную вероятность, например,
Задаем n и доверительную вероятность, например,
Округляем абсолютную и относительную погрешность до двух значащих цифр
Округляем абсолютную и относительную погрешность до двух значащих цифр
Качественный номинальный признак – мода; Ранговый признак – мода и
Качественный номинальный признак – мода; Ранговый признак – мода и
Среднее или все же медиана
Среднее или все же медиана
Ошибка четвертая: стандартная ошибка среднего
Ошибка четвертая: стандартная ошибка среднего
Ошибка пятая: анализируемые данные не соответствуют условиям критерия
Ошибка пятая: анализируемые данные не соответствуют условиям критерия
Общая схема процедуры проверки гипотезы:
Общая схема процедуры проверки гипотезы:
Возможные ошибки
Возможные ошибки
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Формирование выборок для параметрических критериев
Формирование выборок для параметрических критериев
Проверка равенства дисперсий:
Проверка равенства дисперсий:
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
...
...
ANOVA post hoc tests
ANOVA post hoc tests
Непараметрические методы
Непараметрические методы
Параметрические тесты более мощные, чем непараметрические;
Параметрические тесты более мощные, чем непараметрические;
1:3 ??
1:3 ??
Розовые
Розовые
?
?
32 55
32 55
«Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов
«Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов
Пример1
Пример1
Пример 2
Пример 2
Наиболее распространенные ошибки статистического анализа данных в
Наиболее распространенные ошибки статистического анализа данных в
Пример 3
Пример 3
Заключение
Заключение
http://www
http://www

Презентация: «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля». Автор: Марина. Файл: «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля.ppt». Размер zip-архива: 1135 КБ.

Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля

содержание презентации «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля.ppt»
СлайдТекст
1 Наиболее распространенные ошибки статистического анализа данных в

Наиболее распространенные ошибки статистического анализа данных в

квалификационных работах биологического профиля

Карпенко М.Н. 2013г.

2 «Как блестящие идеи, так и научные нелепости одинаковым образом можно

«Как блестящие идеи, так и научные нелепости одинаковым образом можно

облечь во впечатляющий мундир формул и теорем». В.В. Налимов

3 Большинство ошибок возникает при использовании простейших

Большинство ошибок возникает при использовании простейших

статистических методов! Специфика научного исследования заключается в том, что использование автором неадекватного метода даже на одном из этапов работы лишает его выводы достоверности. Выход: соблюдать несколько простейших правил! George S.L. Statistics in medical journals: a survey of current policies and proposal for editors. Med Pediat Oncol. 1985;13:109?12. Lang T., Secic M. How to report statistics in medicine: annotated guideline for authors, editors, and reviewers. Philadelphia (PA): American Colleje of Physicians;1997.

4 Ошибки статистического анализа данных

Ошибки статистического анализа данных

Ошибки в описании результатов

Ошибки в представлении данных

Ошибки в выборе статистического критерия

5 Данные

Данные

Количественные

Качественные (их нельзя выстроить в последовательность)

Ранговые (качественные, но могут быть упорядочены; размер интервалов на шкале неодинаковый)

Непрерывные

Дискретные

Потеря информации и точности

6 Шкалы измерений

Шкалы измерений

Шкала наименований

Шкала отношений

Шкала интервалов

Шкала порядка

Мощность шкалы

7 Ошибка первая: подмена типов данных

Ошибка первая: подмена типов данных

Замена количественных данных качественными; Качественные данные анализируются как количественные.

8 Разбиение данных на подгруппы на основании модальности распределения

Разбиение данных на подгруппы на основании модальности распределения

Мультимодальное

Унимодальное

Бимодальное

Обычно возникают, если популяция имеет естественные обособленные подгруппы

9 Основные типы задач, решаемых с помощью метода статистической

Основные типы задач, решаемых с помощью метода статистической

группировки:

Задачи

Принцип группировки

Выделение типов явлений;

Типологический – по атрибутивным признакам;

Изучение структуры явления и структурных сдвигов, происходящих в явлении;

Структурный -разделение совокупности по какому-либо одному признаку ;

Выявление взаимосвязей и взаимозависимостей между явлениями и признаками, характеризующими эти явления.

Аналитический - характеризует взаимосвязь между признаками один из которых является факторным другой результативным.

10 Ошибка вторая: округление

Ошибка вторая: округление

Количественные данные представляются с излишней точностью.

ПРАВИЛО: числовое значение результата измерений представляется так, чтобы оно оканчивалось десятичным знаком того же разряда, какой имеет погрешность этого результата. Погрешности измерения сами определяются с некоторой погрешностью. «Погрешность погрешности» обычно такова, что в окончательном результате погрешность приводят с одной-двумя значащими цифрами.

11 Задаем n и доверительную вероятность, например,

Задаем n и доверительную вероятность, например,

=0,95; проводим эксперимент; Вычисляем среднее выборочное; Вычисляем ошибку среднего; Для заданных n и ? находим tn?, По паспорту прибора определяем инструментальную погрешность ?ин. В паспорте, если не указано иное, приведена погрешность для ?=0,997, поэтому при заданной ?=0,95 ?ин учитываем с коэффициентом 2/3. Находим абсолютную погрешность по формуле: Находим относительную погрешность по формуле:

округление: Алгоритм действий

12 Округляем абсолютную и относительную погрешность до двух значащих цифр

Округляем абсолютную и относительную погрешность до двух значащих цифр

(если первая из них меньше или равна 3) и до одной (если первая из них больше 3). Округляем результат измерения. Число значащих цифр результата измерений должно быть ограничено поом величины абсолютной. Записываем результат.

13 Качественный номинальный признак – мода; Ранговый признак – мода и

Качественный номинальный признак – мода; Ранговый признак – мода и

медиана; Количественный признак – мода, медиана, среднее.

Ошибка третья: неправильное использование статистических оценок

Средняя температура по больнице с учетом гнойного отделения и морга составила 36,60С.

14 Среднее или все же медиана

Среднее или все же медиана

Пример. Средняя зарплата: мода показывает какова зарплата «среднего» работника, а среднее – отражает среднюю зарплату на предприятии. Среднее выборочное вычисляется только для признаков, измеряемых в шкале отношений и исключительно для выборки, подчиняющейся нормальному закону распределения!

15 Ошибка четвертая: стандартная ошибка среднего

Ошибка четвертая: стандартная ошибка среднего

Среднее – описывает центральную тенденцию; СКО - вариабельность данных; СОС – показатель точности оценки среднего. Пример: измеряем массу тела у N=100 мужчин, среднее м=72 кг, СКО=8кг, тогда СОС=0,8. Вывод 1: примерно в 68% случаев результат измерений будет лежать в диапазоне (64; 80)кг. Вывод 2: примерно в 68% случаев средняя масса тела составит (71,2;72,8)кг.

16 Ошибка пятая: анализируемые данные не соответствуют условиям критерия

Ошибка пятая: анализируемые данные не соответствуют условиям критерия

использование параметрических критериев для анализа данных, не подчиняющихся нормальному распределению; использование критериев для независимых выборок при анализе парных данных. использование t-критерия (критерия Манна-Уитни) для сравнения трех и более групп, а также для сравнения долей.

17 Общая схема процедуры проверки гипотезы:

Общая схема процедуры проверки гипотезы:

Формулируем Н0 и Н1. Строим распределения такие, как будто Н0 верна: распределение исследуемой переменной; распределение параметра выборки; распределение статистики критерия. Устанавливаем условия, при которых мы отвергнем Н0 – Определяем: уровень значимости; односторонний или двусторонний будет тест; критическое значение статистики критерия. Считаем параметр выборки и статистику критерия для реальной выборки, сравниваем их с критическими значениями. Интерпретируем результаты: Можем ли мы отвергнуть Н0? Т.е., достоверны ли результаты статистически? Если да, достоверны ли они ПРАКТИЧЕСКИ?

Это делает человек, а не компьютер

18 Возможные ошибки

Возможные ошибки

Заметим: ошибку 1-го рода можно сделать только отвергая Н0, а ошибку 2-го рода – только «принимая» Н0 (нельзя сделать одновременно обе ошибки).

ПРАВИЛЬНО! (чувствительность критерия)

Истинное (но неизвестное нам) положение дел

Истинное (но неизвестное нам) положение дел

Верна H0

Верна H1

Мы «приняли» H0

ОШИБКА 2-го рода

Мы отвергли H0

ОШИБКА 1-го рода (уровень значимости)

ПРАВИЛЬНО! (мощность критерия)

19 Двухвыборочные критерии

Двухвыборочные критерии

Различаются ли по массе тигры-самцы и тигры-самки в зоопарке? Сравниваем средние массы наших зверьков.

Мы анализируем влияние пола на массу тигров. Зависимая переменная – масса. Независимая (группирующая) – пол (группы: 1. самцы; 2. самки)

Самец

Самка

20 Двухвыборочные критерии

Двухвыборочные критерии

Критерий Стьюдента для независимых выборок

Общий вопрос: получены ли выборки из одной популяции? Частный вопрос: равны ли средние значения между собой?

Размеры выборок могут отличаться Выборки должны иметь нормальное распределение и их дисперсии должны быть равны. Критерий может быть односторонним и двусторонним

21 Двухвыборочные критерии

Двухвыборочные критерии

Разность выборочных средних

Ошибка

Ошибка считается из средних квадратов стандартных отклонений в выборках

Основное распределение - t-распределение (Стьюдента)

* Это статистика для двустороннего критерия

22 Двухвыборочные критерии

Двухвыборочные критерии

Проверка гипотезы о законе распределения

Соответствует ли распределение мотыльков на дереве НОРМАЛЬНОМУ РАСПРЕДЕЛЕНИЮ? Переменная – высота от земли в метрах

Тест Колмогорова-Смирнова (Kolmogorov-Smirnov test) (если известны дисперсия и среднее в популяции) D-статистика. Lilliefors test – если НЕизвестны дисперсия и среднее в популяции – «улучшенный К-С тест» Shapiro-Wilk’s W test (самый мощный, размер выборки до 5000) – наиболее предпочтительный.

23 Двухвыборочные критерии

Двухвыборочные критерии

Критерий Стъюдента для связанных выборок

К тиграм-самцам пришёл новый служитель, и возможно, они стали по-другому питаться. Мы хотим узнать, не изменилась ли их масса.

Мы анализируем влияние служителя на массу тигров-самцов. Зависимая переменная – масса. Независимая – группы: 1. до нового служителя; 2. после)

24 Двухвыборочные критерии

Двухвыборочные критерии

Критерий Стъюдента для связанных выборок

Тест может быть односторонним и двусторонним

Каждый тигр два раза участвует в наблюдениях: он входит в обе группы.

Таких D столько, сколько пар.

У них есть среднее.

Идентично одновыборочному t-критерию!

Статистика:

25 Формирование выборок для параметрических критериев

Формирование выборок для параметрических критериев

В случае t-критериев Стьюдента: выборки случайные из популяций с нормальным распределением, равными дисперсиями, N?10, лучше всего – от 30. НО: 1. небольшие отклонения от нормального распределения допустимы, если: распределение симметрично; тест двусторонний (односторонний НЕ рекомендуется) размеры выборок одинаковы 2. Для двухвыборочных тестов несоблюдение требования равенства дисперсий (приводит к увеличению ошибки 1-го рода) допустимо, если: распределения соответствуют нормальному; выборки отличаются по размеру не больше, чем на 10% 3. Двухвыборочные тесты Стьюдента и пр. не просто так названы двухвыборочными – они не подходят для 3-х и более выборок!!.

26 Проверка равенства дисперсий:

Проверка равенства дисперсий:

Проверка равенства дисперсий F-test – для двух групп; Levene’s test – более надёжный, подходит для двух и более групп; Brown & Forsythe's test – подходит для выборок разного размера Barlett’s test – для трёх и более групп /Если выборки гетерогенны, есть способы сделать их гомогенными./

вставлена в Статистике в блоки с соответствующими параметрическими тестами (t-тест, ANOVA)

27 Множественные сравнения или кошмар Бонферрони

Множественные сравнения или кошмар Бонферрони

Предположим, у нас 4 группы тигров, которых кормят по-разному. Различается ли средняя масса тигра в этих группах?

27

28 ...

...

ANOVA

Одна зависимая переменная (variable): масса; Одна независимая (группирующая, factor) – тип еды.

Тигров кормили: овощами; фруктами; рыбой; мясом.

Это сложная гипотеза (omnibus hypothesis). Она включает в себя много маленьких гипотез (для 3-х групп – 3, для 4-х – 12 …):

Комплексные (complex) нулевые гипотезы

Парные (pairwise) нулевые гипотезы

One-way ANOVA

Формулируем гипотезу Н0:

28

29 ANOVA post hoc tests

ANOVA post hoc tests

Если у нас 3 и более групп: Сначала сравнить ВСЕ группы между собой с помощью ANOVA Если различия есть, использовать методы множественного сравнения (группы сравнивают попарно, но вводят поправки) Если различий нет, мы НЕ ИМЕЕМ ПРАВА ПРЕДПРИНИМАТЬ ДАЛЬНЕЙШИЙ АНАЛИЗ!

Двухвыборочный t-критерий для сравнения групп попарно после проведения ANOVA тоже не годится! Например, если мы сравним две крайние группы, это уже будут не случайные выборки из генеральной совокупности, и уже будет не 0.05!

29

30 Непараметрические методы

Непараметрические методы

Свойства распределения неизвестны, и параметры распределения (среднее, дисперсию и т. п.) мы использовать не можем Основной подход – ранжирование (ranking) наблюдений (выстраиваем их по порядку от самого маленького значения к наибольшему). подразумевается, что сравниваемые распределения имеют одинаковую форму и дисперсию.

31 Параметрические тесты более мощные, чем непараметрические;

Параметрические тесты более мощные, чем непараметрические;

Непараметрические безопаснее в плане ошибки 1-го рода; Чем больше размер выборки, тем менее критичны требования к распределению (по Центральной предельной теореме); для выборок N ? 100 используют параметрические тесты даже при больших отклонениях от нормального распределения. АНОВА не очень чувствительна к отклонениям от нормального распределения (для одинаковых по размеру групп).

32 1:3 ??

1:3 ??

Анализ частот

Заметим, что речь идёт только о частотах, но не о параметрах распределения.

Родились: 84 розовых мыши и 16 зелёных. H0: выборка получена из популяции, где соотношение розовых и зелёных – 3:1. H1: выборка получена из популяции, где соотношение розовых и зелёных не равно 3:1

33 Розовые

Розовые

Зелёные

Всего

Oi

84 75

84 75

16 25

16 25

100

100

Ei

df = k-1=1

Чем больше значение ?2,тем хуже наши данные соответствуют теоретическому распределению – тем меньше р

?2cv = 3.841<4.320

p=0.038

H0 отвергаем – соотношение мышей не соответствует ожидаемому

34 ?

?

?

?

Анализ частот

Сравниваем независимые выборки, причём все переменные (?2) категориальные.

Критерий ?2 (?2 analysis of contingency tables = ?2 test of independence)

Tests of independence – проверяют, зависит ли форма распределения одной переменной от значений другой переменной (переменных).

Связаны ли пол и цвет у коз?

35 32 55

32 55

43 65

16 64

9 16

100 200

87

108

80

25

300

Таблицы вида a ? b. Общая Н0 гипотеза: частоты в строчках не зависят от частот в столбцах.

H0: цвет меха не зависит от пола в популяции коз; H1: цвет меха зависит от пола в популяции коз.

Мы для каждой ячейки рассчитываем ожидаемую частоту (на основе общих частот для столбцов и строк).

Пол

Белые

Красные

Жёлтые

Серые

Всего

Самцы самки

Всего

36 «Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов

«Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов

Ошибки при описании результатов

37 Пример1

Пример1

Что такое «граница нормального распределения»? Зачем ее находили? С помощью какого критерия проверялась гипотеза о виде распределения? Что такое «неправильное распределение»? Данные описаны с помощью среднего и стандартного отклонения. ANOVA – параметрический критерий.

38 Пример 2

Пример 2

Гипотеза о виде распределения не проверялась. Что такое «достоверность параметров»? Гипотеза о равенстве дисперсий не проверяется. Уровень значимости не указан.

39 Наиболее распространенные ошибки статистического анализа данных в
40 Пример 3

Пример 3

Статья "Влияние гиперлипидемии на чувствительность тимоцитов к апоптозу у мышей линии CBA и C57BI/C." Киселева Е.П., Пузырева В.П., Огурцова Р.П., Ковалева И.Г. Институт экспериментальной медицины РАМН, Санкт-Петербург. Бюллетень экспериментальной биологии и медицины, вып. 8, 2000, стр. 200-202.

В работе не сообщается о проверке условий необходимых и достаточных для использования t-критерия Стьюдента - нормальности распределения и равенства генеральных дисперсий (для всех признаков и во всех группах). Используя данные таблицы, проведем проверку гипотез о равенстве дисперсийдля нескольких случайно выбранных пар. Поскольку для каждой конкретной группы сравнения в статье не указан объем выборки, то используем минимально возможное в данное случае значение, равное 8. Для пары 2,4±0,1 и 6,0±0,3 значение критерия Фишера F = 9,719 (р=0,0048). Для пары 2,3±0,1 и 3,8±0,2 значение критерия Фишера F = 4 (р=0,044). Для пары 1,6±0,1 и 3,0±0,2 значение критерия Фишера F = 4 (р=0,044). Для пары 17,6±0,1 и 26,0±0,2 значение критерия Фишера F = 4 (р=0,044). Для пары 17,2±0,1 и 22,7±0,4 значение критерия Фишера F = 16 (р=0,0008). Для пары 8,6±0,2 и 13,1±0,4 значение критерия Фишера F = 4 (р=0,044). Итак, поскольку достигнутый уровень значимости гораздо меньше 5%, то гипотеза о равенстве дисперсий для этих случаев отвергается! Вывод: если даже предположить, что во всех сравниваемых группах наблюдалось нормальное распределение, что само по себе весьма маловероятно, тем не менее, критерий Стьюдента не может быть использован в данных условиях вследствие неравенства генеральных дисперсий (см. проблему Беренса-Фишера). . Из чего следует, что выводы авторов не могут быть признаны корректно обоснованными методами статистики, а стало быть надежность их весьма сомнительна.

Цитаты из статьи

Наш комментарий

"Полученные данные обработаны статистически с использованием t критерия Стьюдента." Далее в тексте приведены выражения вида (M±m)" и результаты сравнения отдельных групп между собой. Для конкретных сравниваемых пар гурпп не сообщается объем выборок, однако в тексте статьи сказано, что объем выборок изменялся в интервале от 8 до 16.

41 Заключение

Заключение

Признак

Признак

Исследование

Исследование

Исследование

Исследование

Исследование

Количественный (нормальное распределение*)

Качественный

Порядковый

Две группы

Более двух групп

Группа до и после лечения

Одна группа несколько видов лечения

Связь признаков

Критерий Стьюдента

ANOVA

Парный критерий Стьюдента

Дисперсион- ный анализ повторных измерений

Линейная регрессия, корреляция, или метод Блэнда- Алтмана

Критерий ?2 Z-критерий

Критерий ?2

Критерий Мак- Нимара

Критерий Кокрена

Коэффициет сопряжен- ности

Критерий Манна Уитни

Критерий Крускала Уоллиса

Критерий Уилкок- сона

Критерий Фридмана

Коэффици- ент ранговой корреляции Спирмена

42 http://www

http://www

biometrica.tomsk.ru/

«Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля»
http://900igr.net/prezentacija/biologija/naibolee-rasprostranennye-oshibki-statisticheskogo-analiza-dannykh-v-kvalifikatsionnykh-rabotakh-biologicheskogo-profilja-79017.html
cсылка на страницу
Урок

Биология

136 тем
Слайды
900igr.net > Презентации по биологии > Эволюция > Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля