Эволюция
<<  Биологический организм с позиции системного анализа Виртуальные эксперименты на уроке: использование интерактивной творческой среды «1С:Биологический конструктор 1.5» в учебном процессе  >>
Ошибка первая: подмена типов данных
Ошибка первая: подмена типов данных
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Разбиение данных на подгруппы на основании модальности распределения
Задаем n и доверительную вероятность, например,
Задаем n и доверительную вероятность, например,
Задаем n и доверительную вероятность, например,
Задаем n и доверительную вероятность, например,
Округляем абсолютную и относительную погрешность до двух значащих цифр
Округляем абсолютную и относительную погрешность до двух значащих цифр
Среднее или все же медиана
Среднее или все же медиана
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Двухвыборочные критерии
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Множественные сравнения или кошмар Бонферрони
Непараметрические методы
Непараметрические методы
?
?
?
?
?
?
?
?
?
?
«Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов
«Смутно пишут о том, о чем смутно представляют» М.В. Ломоносов
Пример1
Пример1
Пример 2
Пример 2
Наиболее распространенные ошибки статистического анализа данных в
Наиболее распространенные ошибки статистического анализа данных в
http://www
http://www
Картинки из презентации «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля» к уроку биологии на тему «Эволюция»

Автор: Марина. Чтобы познакомиться с картинкой полного размера, нажмите на её эскиз. Чтобы можно было использовать все картинки для урока биологии, скачайте бесплатно презентацию «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля.ppt» со всеми картинками в zip-архиве размером 1135 КБ.

Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля

содержание презентации «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля.ppt»
Сл Текст Сл Текст
1Наиболее распространенные ошибки 24D столько, сколько пар. У них есть
статистического анализа данных в среднее. Идентично одновыборочному
квалификационных работах биологического t-критерию! Статистика:
профиля. Карпенко М.Н. 2013г. 25Формирование выборок для
2«Как блестящие идеи, так и научные параметрических критериев. В случае
нелепости одинаковым образом можно облечь t-критериев Стьюдента: выборки случайные
во впечатляющий мундир формул и теорем». из популяций с нормальным распределением,
В.В. Налимов. равными дисперсиями, N?10, лучше всего –
3Большинство ошибок возникает при от 30. НО: 1. небольшие отклонения от
использовании простейших статистических нормального распределения допустимы, если:
методов! Специфика научного исследования распределение симметрично; тест
заключается в том, что использование двусторонний (односторонний НЕ
автором неадекватного метода даже на одном рекомендуется) размеры выборок одинаковы
из этапов работы лишает его выводы 2. Для двухвыборочных тестов несоблюдение
достоверности. Выход: соблюдать несколько требования равенства дисперсий (приводит к
простейших правил! George S.L. Statistics увеличению ошибки 1-го рода) допустимо,
in medical journals: a survey of current если: распределения соответствуют
policies and proposal for editors. Med нормальному; выборки отличаются по размеру
Pediat Oncol. 1985;13:109?12. Lang T., не больше, чем на 10% 3. Двухвыборочные
Secic M. How to report statistics in тесты Стьюдента и пр. не просто так
medicine: annotated guideline for authors, названы двухвыборочными – они не подходят
editors, and reviewers. Philadelphia (PA): для 3-х и более выборок!!.
American Colleje of Physicians;1997. 26Проверка равенства дисперсий: Проверка
4Ошибки статистического анализа данных. равенства дисперсий F-test – для двух
Ошибки в описании результатов. Ошибки в групп; Levene’s test – более надёжный,
представлении данных. Ошибки в выборе подходит для двух и более групп; Brown
статистического критерия. & Forsythe's test – подходит для
5Данные. Количественные. Качественные выборок разного размера Barlett’s test –
(их нельзя выстроить в для трёх и более групп /Если выборки
последовательность). Ранговые гетерогенны, есть способы сделать их
(качественные, но могут быть упорядочены; гомогенными./. вставлена в Статистике в
размер интервалов на шкале неодинаковый). блоки с соответствующими параметрическими
Непрерывные. Дискретные. Потеря информации тестами (t-тест, ANOVA).
и точности. 27Множественные сравнения или кошмар
6Шкалы измерений. Шкала наименований. Бонферрони. Предположим, у нас 4 группы
Шкала отношений. Шкала интервалов. Шкала тигров, которых кормят по-разному.
порядка. Мощность шкалы. Различается ли средняя масса тигра в этих
7Ошибка первая: подмена типов данных. группах? 27.
Замена количественных данных 28... ANOVA. Одна зависимая переменная
качественными; Качественные данные (variable): масса; Одна независимая
анализируются как количественные. (группирующая, factor) – тип еды. Тигров
8Разбиение данных на подгруппы на кормили: овощами; фруктами; рыбой; мясом.
основании модальности распределения. Это сложная гипотеза (omnibus hypothesis).
Мультимодальное. Унимодальное. Она включает в себя много маленьких
Бимодальное. Обычно возникают, если гипотез (для 3-х групп – 3, для 4-х – 12
популяция имеет естественные обособленные …): Комплексные (complex) нулевые
подгруппы. гипотезы. Парные (pairwise) нулевые
9Основные типы задач, решаемых с гипотезы. One-way ANOVA. Формулируем
помощью метода статистической группировки: гипотезу Н0: 28.
Задачи. Принцип группировки. Выделение 29ANOVA post hoc tests. Если у нас 3 и
типов явлений; Типологический – по более групп: Сначала сравнить ВСЕ группы
атрибутивным признакам; Изучение структуры между собой с помощью ANOVA Если различия
явления и структурных сдвигов, есть, использовать методы множественного
происходящих в явлении; Структурный сравнения (группы сравнивают попарно, но
-разделение совокупности по какому-либо вводят поправки) Если различий нет, мы НЕ
одному признаку ; Выявление взаимосвязей и ИМЕЕМ ПРАВА ПРЕДПРИНИМАТЬ ДАЛЬНЕЙШИЙ
взаимозависимостей между явлениями и АНАЛИЗ! Двухвыборочный t-критерий для
признаками, характеризующими эти явления. сравнения групп попарно после проведения
Аналитический - характеризует взаимосвязь ANOVA тоже не годится! Например, если мы
между признаками один из которых является сравним две крайние группы, это уже будут
факторным другой результативным. не случайные выборки из генеральной
10Ошибка вторая: округление. совокупности, и уже будет не 0.05! 29.
Количественные данные представляются с 30Непараметрические методы. Свойства
излишней точностью. ПРАВИЛО: числовое распределения неизвестны, и параметры
значение результата измерений распределения (среднее, дисперсию и т. п.)
представляется так, чтобы оно оканчивалось мы использовать не можем Основной подход –
десятичным знаком того же разряда, какой ранжирование (ranking) наблюдений
имеет погрешность этого результата. (выстраиваем их по порядку от самого
Погрешности измерения сами определяются с маленького значения к наибольшему).
некоторой погрешностью. «Погрешность подразумевается, что сравниваемые
погрешности» обычно такова, что в распределения имеют одинаковую форму и
окончательном результате погрешность дисперсию.
приводят с одной-двумя значащими цифрами. 31Параметрические тесты более мощные,
11Задаем n и доверительную вероятность, чем непараметрические; Непараметрические
например, ?=0,95; проводим эксперимент; безопаснее в плане ошибки 1-го рода; Чем
Вычисляем среднее выборочное; Вычисляем больше размер выборки, тем менее критичны
ошибку среднего; Для заданных n и ? требования к распределению (по Центральной
находим tn?, По паспорту прибора предельной теореме); для выборок N ? 100
определяем инструментальную погрешность используют параметрические тесты даже при
?ин. В паспорте, если не указано иное, больших отклонениях от нормального
приведена погрешность для ?=0,997, поэтому распределения. АНОВА не очень
при заданной ?=0,95 ?ин учитываем с чувствительна к отклонениям от нормального
коэффициентом 2/3. Находим абсолютную распределения (для одинаковых по размеру
погрешность по формуле: Находим групп).
относительную погрешность по формуле: 321:3 ?? Анализ частот. Заметим, что
округление: Алгоритм действий. речь идёт только о частотах, но не о
12Округляем абсолютную и относительную параметрах распределения. Родились: 84
погрешность до двух значащих цифр (если розовых мыши и 16 зелёных. H0: выборка
первая из них меньше или равна 3) и до получена из популяции, где соотношение
одной (если первая из них больше 3). розовых и зелёных – 3:1. H1: выборка
Округляем результат измерения. Число получена из популяции, где соотношение
значащих цифр результата измерений должно розовых и зелёных не равно 3:1.
быть ограничено поом величины абсолютной. 33Розовые. Зелёные. Всего. Oi. 84 75. 84
Записываем результат. 75. 16 25. 16 25. 100. 100. Ei. df =
13Качественный номинальный признак – k-1=1. Чем больше значение ?2,тем хуже
мода; Ранговый признак – мода и медиана; наши данные соответствуют теоретическому
Количественный признак – мода, медиана, распределению – тем меньше р. ?2cv =
среднее. Ошибка третья: неправильное 3.841<4.320. p=0.038. H0 отвергаем –
использование статистических оценок. соотношение мышей не соответствует
Средняя температура по больнице с учетом ожидаемому.
гнойного отделения и морга составила 34? ? ? Анализ частот. Сравниваем
36,60С. независимые выборки, причём все переменные
14Среднее или все же медиана? Пример. (?2) категориальные. Критерий ?2 (?2
Средняя зарплата: мода показывает какова analysis of contingency tables = ?2 test
зарплата «среднего» работника, а среднее – of independence). Tests of independence –
отражает среднюю зарплату на предприятии. проверяют, зависит ли форма распределения
Среднее выборочное вычисляется только для одной переменной от значений другой
признаков, измеряемых в шкале отношений и переменной (переменных). Связаны ли пол и
исключительно для выборки, подчиняющейся цвет у коз?
нормальному закону распределения! 3532 55. 43 65. 16 64. 9 16. 100 200.
15Ошибка четвертая: стандартная ошибка 87. 108. 80. 25. 300. Таблицы вида a ? b.
среднего. Среднее – описывает центральную Общая Н0 гипотеза: частоты в строчках не
тенденцию; СКО - вариабельность данных; зависят от частот в столбцах. H0: цвет
СОС – показатель точности оценки среднего. меха не зависит от пола в популяции коз;
Пример: измеряем массу тела у N=100 H1: цвет меха зависит от пола в популяции
мужчин, среднее м=72 кг, СКО=8кг, тогда коз. Мы для каждой ячейки рассчитываем
СОС=0,8. Вывод 1: примерно в 68% случаев ожидаемую частоту (на основе общих частот
результат измерений будет лежать в для столбцов и строк). Пол. Белые.
диапазоне (64; 80)кг. Вывод 2: примерно в Красные. Жёлтые. Серые. Всего. Самцы
68% случаев средняя масса тела составит самки. Всего.
(71,2;72,8)кг. 36«Смутно пишут о том, о чем смутно
16Ошибка пятая: анализируемые данные не представляют» М.В. Ломоносов. Ошибки при
соответствуют условиям критерия. описании результатов.
использование параметрических критериев 37Пример1. Что такое «граница
для анализа данных, не подчиняющихся нормального распределения»? Зачем ее
нормальному распределению; использование находили? С помощью какого критерия
критериев для независимых выборок при проверялась гипотеза о виде распределения?
анализе парных данных. использование Что такое «неправильное распределение»?
t-критерия (критерия Манна-Уитни) для Данные описаны с помощью среднего и
сравнения трех и более групп, а также для стандартного отклонения. ANOVA –
сравнения долей. параметрический критерий.
17Общая схема процедуры проверки 38Пример 2. Гипотеза о виде
гипотезы: Формулируем Н0 и Н1. Строим распределения не проверялась. Что такое
распределения такие, как будто Н0 верна: «достоверность параметров»? Гипотеза о
распределение исследуемой переменной; равенстве дисперсий не проверяется.
распределение параметра выборки; Уровень значимости не указан.
распределение статистики критерия. 39
Устанавливаем условия, при которых мы 40Пример 3. Статья "Влияние
отвергнем Н0 – Определяем: уровень гиперлипидемии на чувствительность
значимости; односторонний или двусторонний тимоцитов к апоптозу у мышей линии CBA и
будет тест; критическое значение C57BI/C." Киселева Е.П., Пузырева
статистики критерия. Считаем параметр В.П., Огурцова Р.П., Ковалева И.Г.
выборки и статистику критерия для реальной Институт экспериментальной медицины РАМН,
выборки, сравниваем их с критическими Санкт-Петербург. Бюллетень
значениями. Интерпретируем результаты: экспериментальной биологии и медицины,
Можем ли мы отвергнуть Н0? Т.е., вып. 8, 2000, стр. 200-202. В работе не
достоверны ли результаты статистически? сообщается о проверке условий необходимых
Если да, достоверны ли они ПРАКТИЧЕСКИ? и достаточных для использования t-критерия
Это делает человек, а не компьютер. Стьюдента - нормальности распределения и
18Возможные ошибки. Заметим: ошибку 1-го равенства генеральных дисперсий (для всех
рода можно сделать только отвергая Н0, а признаков и во всех группах). Используя
ошибку 2-го рода – только «принимая» Н0 данные таблицы, проведем проверку гипотез
(нельзя сделать одновременно обе ошибки). о равенстве дисперсийдля нескольких
ПРАВИЛЬНО! (чувствительность критерия). случайно выбранных пар. Поскольку для
Истинное (но неизвестное нам) положение каждой конкретной группы сравнения в
дел. Истинное (но неизвестное нам) статье не указан объем выборки, то
положение дел. Верна H0. Верна H1. Мы используем минимально возможное в данное
«приняли» H0. ОШИБКА 2-го рода. Мы случае значение, равное 8. Для пары
отвергли H0. ОШИБКА 1-го рода (уровень 2,4±0,1 и 6,0±0,3 значение критерия Фишера
значимости). ПРАВИЛЬНО! (мощность F = 9,719 (р=0,0048). Для пары 2,3±0,1 и
критерия). . . 3,8±0,2 значение критерия Фишера F = 4
19Двухвыборочные критерии. Различаются (р=0,044). Для пары 1,6±0,1 и 3,0±0,2
ли по массе тигры-самцы и тигры-самки в значение критерия Фишера F = 4 (р=0,044).
зоопарке? Сравниваем средние массы наших Для пары 17,6±0,1 и 26,0±0,2 значение
зверьков. Мы анализируем влияние пола на критерия Фишера F = 4 (р=0,044). Для пары
массу тигров. Зависимая переменная – 17,2±0,1 и 22,7±0,4 значение критерия
масса. Независимая (группирующая) – пол Фишера F = 16 (р=0,0008). Для пары 8,6±0,2
(группы: 1. самцы; 2. самки). Самец. и 13,1±0,4 значение критерия Фишера F = 4
Самка. (р=0,044). Итак, поскольку достигнутый
20Двухвыборочные критерии. Критерий уровень значимости гораздо меньше 5%, то
Стьюдента для независимых выборок. Общий гипотеза о равенстве дисперсий для этих
вопрос: получены ли выборки из одной случаев отвергается! Вывод: если даже
популяции? Частный вопрос: равны ли предположить, что во всех сравниваемых
средние значения между собой? Размеры группах наблюдалось нормальное
выборок могут отличаться Выборки должны распределение, что само по себе весьма
иметь нормальное распределение и их маловероятно, тем не менее, критерий
дисперсии должны быть равны. Критерий Стьюдента не может быть использован в
может быть односторонним и двусторонним. данных условиях вследствие неравенства
21Двухвыборочные критерии. Разность генеральных дисперсий (см. проблему
выборочных средних. Ошибка. Ошибка Беренса-Фишера). . Из чего следует, что
считается из средних квадратов стандартных выводы авторов не могут быть признаны
отклонений в выборках. Основное корректно обоснованными методами
распределение - t-распределение статистики, а стало быть надежность их
(Стьюдента). * Это статистика для весьма сомнительна. Цитаты из статьи. Наш
двустороннего критерия. комментарий. "Полученные данные
22Двухвыборочные критерии. Проверка обработаны статистически с использованием
гипотезы о законе распределения. t критерия Стьюдента." Далее в тексте
Соответствует ли распределение мотыльков приведены выражения вида (M±m)" и
на дереве НОРМАЛЬНОМУ РАСПРЕДЕЛЕНИЮ? результаты сравнения отдельных групп между
Переменная – высота от земли в метрах. собой. Для конкретных сравниваемых пар
Тест Колмогорова-Смирнова гурпп не сообщается объем выборок, однако
(Kolmogorov-Smirnov test) (если известны в тексте статьи сказано, что объем выборок
дисперсия и среднее в популяции) изменялся в интервале от 8 до 16.
D-статистика. Lilliefors test – если 41Заключение. Признак. Признак.
НЕизвестны дисперсия и среднее в популяции Исследование. Исследование. Исследование.
– «улучшенный К-С тест» Shapiro-Wilk’s W Исследование. Исследование. Количественный
test (самый мощный, размер выборки до (нормальное распределение*). Качественный.
5000) – наиболее предпочтительный. Порядковый. Две группы. Более двух групп.
23Двухвыборочные критерии. Критерий Группа до и после лечения. Одна группа
Стъюдента для связанных выборок. К несколько видов лечения. Связь признаков.
тиграм-самцам пришёл новый служитель, и Критерий Стьюдента. ANOVA. Парный критерий
возможно, они стали по-другому питаться. Стьюдента. Дисперсион- ный анализ
Мы хотим узнать, не изменилась ли их повторных измерений. Линейная регрессия,
масса. Мы анализируем влияние служителя на корреляция, или метод Блэнда- Алтмана.
массу тигров-самцов. Зависимая переменная Критерий ?2 Z-критерий. Критерий ?2.
– масса. Независимая – группы: 1. до Критерий Мак- Нимара. Критерий Кокрена.
нового служителя; 2. после). Коэффициет сопряжен- ности. Критерий Манна
24Двухвыборочные критерии. Критерий Уитни. Критерий Крускала Уоллиса. Критерий
Стъюдента для связанных выборок. Тест Уилкок- сона. Критерий Фридмана. Коэффици-
может быть односторонним и двусторонним. ент ранговой корреляции Спирмена.
Каждый тигр два раза участвует в 42http://www.biometrica.tomsk.ru/.
наблюдениях: он входит в обе группы. Таких
Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля.ppt
http://900igr.net/kartinka/biologija/naibolee-rasprostranennye-oshibki-statisticheskogo-analiza-dannykh-v-kvalifikatsionnykh-rabotakh-biologicheskogo-profilja-79017.html
cсылка на страницу

Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля

другие презентации на тему «Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля»

«Биологические ресурсы» - Тест. Грибы. Узнать. Одуванчик. Использование древесных ресурсов. Ель. Древесные, стружечные плиты. Морские и речные животные. Лесные ресурсы. Промыслово – охотничьи ресурсы. Музыкальные инструменты. «Зеленая аптека». Родиола розовая. Лесные. Боровая и водная дичь. Пастбища для оленей. Калина. Сегодня на уроке я хочу:

«Биологические ресурсы» - Создают почву, повышают плодородие почвы. Цель национального парка: Растения обогащают воздух кислородом. Пища – культурные растения являются основной (на 80%) пищей для людей. Роль живых организмов в жизни Земли. Природоохранная и рекреационная. Особо охраняемые природные территории. Биологические ресурсы России.

«Статистические данные» - Красный. Развитие представлений о статистике. Любимый предмет. Июнь. Рассмотреть связь статистики и математики. Мегафон. Август. «Статистика и математика». Март. Мтс. Статистика - status в переводе с латинского означает «состояние» или «политическое состояние». Группа занималась изучением истории возникновения статистики.

«Статистическая информация» - Федеральная служба государственной статистики. Категории пользователей статистической информации. Виды информационных услуг, предоставляемых органами государственной статистики. Подведомственные организации, осуществляющие коммерческую реализацию статистической продукции. Формы предоставления информации пользователям.

«Биологические препараты» - АДМИНИСТРАТИВНЫЙ РЕГЛАМЕНТ от 30.10.06. №736. Мексика. Энциклопедический словарь терминов фармакологии, фармакотерапии и фармации под ред. Циклоспорины; Факторы свертывания крови; Колониестимулирующий фактор; Вакцины. Примеры отзывов биоаналогов с рынка. Эритропоэтин человека, связанный с рецептором.

«Статистические данные на графиках» - Диаграммы: круговые, столбчатые(гистограммы), линейные. Способы представления данных: Сколько детей в вашей семье? Ваш размер обуви. Таблицы. Ваш рост. Какие телепередачи вы смотрите? Назовите самый любимый школьный предмет. Какую музыку вы слушаете? Ваш вес. Работа в группах. По данным «размер обуви» найдите среднее арифметическое и моду.

Эволюция

21 презентация об эволюции
Урок

Биология

136 тем
Картинки
900igr.net > Презентации по биологии > Эволюция > Наиболее распространенные ошибки статистического анализа данных в квалификационных работах биологического профиля