Анализ качественных признаков биостатистика

Содержание
  1. СРСП 4. Анализ качественных признаков. Таблицы сопряженности
  2. БиоСтатистика — 10. Тема 6. Сравнение распределений
  3. 6.1. Примеры проблем, требующих сравнения распределений
  4. 6.2. Определение связи качественных признаков с помощью кросстабуляции
  5. 6.3. Сравнение распределений с помощью модуля непараметрической статистики
  6. БиоСтатистика — 01. Содержание курса. Тема 1. Основные понятия биостатистики
  7. Содержание
  8. Тема 1. Основные понятия биостатистики
  9. Тема 2. Использование программы Statistica
  10. Тема 3. Визуализация данных (на примере результатов описания зеленых лягушек)
  11. Тема 4. Сравнение выборок
  12. Тема 5. Краткое введение в дисперсионный анализ
  13. Тема 6. Сравнение распределений
  14. Тема 7. Связь между признаками
  15. Тема 8. Кластерный анализ
  16. Тема 9. Метод главных компонент
  17. Тема 10. Дискриминантный анализ
  18. Тема 11. Некоторые методы, характерные для зоологии и экологии
  19. Программа раздела большого практикума «Статистический анализ данных в зоологии и экологии»
  20. Тема 1. Основные понятия биостатистики
  21. 1.1. Что такое биостатистика и зачем она нужна
  22. 1.2. Вероятность
  23. 1.3. Генеральная совокупность и выборка
  24. 1.4. Что такое значимость? Шуточный пример
  25. 1.5. Статистическая значимость; нулевая и альтернативная гипотезы
  26. 1.6. Признаки

СРСП 4. Анализ качественных признаков. Таблицы сопряженности

Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «профессия» или «вид патологии», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?

В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.

Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.

Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации).

В общем случае Н(0)формулируется следующим образом:

· в генеральных совокупностях доля объектов с интересующими нас признаками одинакова

· или частота встречаемости одного признака не зависит от частоты встречаемости другого признака

· или какой-либо фактор не влияет на частоту встречаемости признака (признаков)

СЛУЧАЙ 1. Выборки независимые

Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности

Первая признак (первая градация) Первый признак (вторая градация) Всего
Второй признак (первая градация) Частота встречаемости a Частота встречаемости b a +b
Второй признак (вторая градация) Частота встречаемости c Частота встречаемости d с+d
n1=a+c n2=b+d n =a+b+c+d

Критерием для проверки нулевой гипотезы является хи-квадрат Пирсонас поправкой Йетса

Его критическое значение находится для заданного уровня значимости α и числа степеней свободы f=(m-1)(n-1), где m-число столбцов,n– число строк (Приложение 5).

Если то Н(0) принимается,

В случае принимается Н(1)

Можно вычислить меру связи между двумя признаками – ею является коэффициент ассоциацииЮла Q(аналог коэффициента корреляции)

Qлежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю – связь отсутствует.

Работа с преподавателем

Зададим уровень значимости α=0,05

Сформулируем Н(0): в генеральной совокупности доля больных тромбозом не зависит от приема аспирина.

Занесем результаты испытания в таблицу.

Тромбоз есть Тромбоза нет
Плацебо
Аспирин
Всего

Посчитаем значение критерия хи-квадрат с поправкой Йетса

Q=0,7 показывает сильную связь между приемом аспирина и вероятностью тромбоза.

Случай 2. Выборки зависимые

Над одними и теми же объектами проводятся два наблюдения: до и после. (прием лекарства, обучение, внушение и т.д.)

Подсчитывается сколько раз данное свойство встречается:

Наличие признака«после»
Наличие признака«до» нет(-) есть(+)
есть(+) a Число изменений от (+) к (-) c Число сохранивших (+)
нет (-) b Число сохранивших (-) d Число изменений от (–) к (+)

Н(0) –доля объектов с интересующим нас признаком«после»не изменилась по сравнению с«до»

• Вычисляем критерий хи-квадрат Мак-Нимара

Если то Н(0)принимается

Если то принимаем Н(1),

Работа с преподавателем.Было проведено исследование эффективности антитабачной рекламы. Для этого сравнили соотношение курящих/некурящих до и после проведения рекламной компании.

Сформулируем Н(0): рекламная компания, проведенная в генеральной совокупности, не повлияет на долюкурящих.

Зададим уровень значимости α=0,01

Рекламная компания была проведена среди 100 человек. В результате исследования были получены следующие результаты

мы отвергаем нулевую гипотезу и принимаем альтернативную о том, что с вероятностью 99 % рекламная компания повлияет на соотношение курящих и некурящих в популяции (генеральной совокупности).

Контрольные вопросы

1. Для каких целей используются таблицы сопряженности

2. Структура таблицы сопряженности

3. Сформулирйте нулевую гипотезу для общего случая

4. Какие данные заносятся в таблицу сопряженности в случае зависимых выборок

5. Какие критерии используются при анализе таблицы сопряженности

Задание к СРСП 4.

1. Сформулируйте цель проведенного исследования

2. Сформулируйте нулевую и альтернативную гипотезы

3. Составьте таблицу сопряженности

4. Решите задачу на уровне значимости 0,05

Вариант 1

Исследовалась заболеваемость в сельской и городской местности. Выборочные исследования показали, что в селе из ста жителей обращались к врачу 36 человека, в городе из 100 жителей посетили врача 28 человек. Определить зависит ли обращаемость к врачу от места жительства.

Вариант 2.

Среди 84 лиц, страдающих гипертонией, с давлением более 160 мм.рт.ст. было 24 человека. После приема препарата их стало 18. Сделайте вывод об эффективности препарата.

Вариант 3

Сравнивалась эффективность двух методов лечения и получены следующие данные

1 вид лечения 2 вид лечения
Вылечились
Не вылечились

Отличаются ли по эффективности эти два вида лечения?

Вариант 4

В конце первого года обучения в вузе в группе студентов из 15 человек было 6 отличников. В конце второго года обучения их стало 8. Определить, меняется ли успеваемость на втором курсе.

Вариант 5

1000 человек классифицировали по признаку дальтонизма. По приведенным ниже данным проверить, есть ли зависимость между наличием дальтонизма и полом человека.

Мужчины Женщины
Дальтоники
Не дальтоники

Вариант 6

Во время эпидемии гриппа изучалась эффективность прививок против этого заболевания. Получены следующие результаты:

С прививкой Без прививки
заболели не заболели заболели не заболели

Указывают ли эти результаты на эффективность прививок?

Вариант 7

До внедрения новой системы профилактики заболеваний к врачу обращался каждый третий из 90 человек. После внедрения уже обращается каждый шестой. Охарактеризовать эффективность новой системы профилактики.

Вариант 8

Данные социологического исследования показали, что среди молодежи спортом занимаются 42 человека из 200 опрошенных, среди лиц старшего возраста – 55 из 325 опрошенных. Определите, есть ли зависимость увлеченности спортом от возраста.

Вариант9.

Среди 84 подземных рабочих хронический бронхит регистрируется у четверти, у строителей он диагностирован у трети из 105 обследованных. Определить влияет ли профессия на риск возникновения хронического бронхита. У кого эта вероятность выше?

Вариант 10.

500 человек классифицировали по признаку аллергии к полыни. По приведенным ниже данным проверить, есть ли зависимость между наличием аллергии и полом человека.

Мужчины Женщины
Есть аллергия
Нет аллергии

Вариант 11

До открытия бассейна в детском саду у 16 детишек из 150 наблюдались частые ОРВИ. Через год занятий в бассейне в этой группе количество таких лиц уменьшилось до 12.

Нужно ли строить бассейны в детских садах.

Вариант 12.

После первого года обучения в группе студентов было 9 хорошистов и 6 троечников. На втором курсе группа пополнилась еще тремя студентами и по итогам сессии 11 стали хорошистами и 7 троечниками. Определить меняется ли успеваемость от курса к курсу?

Вариант 13.

В исследуемом регионе в текущем году родилось 286 мальчиков и 314 девочек. Соотносятся ли эти данные с предположением, что вероятность рождения мальчиков и девочек одинакова.

Источник

БиоСтатистика — 10. Тема 6. Сравнение распределений

Тема 6. Сравнение распределений

6.1. Примеры проблем, требующих сравнения распределений

Вероятно, сравнение распределений — столь же частая, как и сравнение значений, задача биологических исследований. В этом тексте тема сравнения распределений затрагивалась, как минимум, три раза.

Во-первых, примером сравнения распределений является сравнение выборок по критерию Фишера, описанное в пункте 4.3 (см. рис. 4.3.1). Это — параметрическое сравнение, так как распределения в этом случае сравниваются по одному параметру, основанному на предположении о том, что обе выборки имеют нормальное распределение.

Во-вторых, процедура сравнения распределений методом Пирсона автоматически вызывается при сравнении выборок по Краскелу-Уоллису, описанной в пункте 4.11 (см. рис. 4.11.3). Это вполне логично: если мы хотим установить, к одной или нескольким генеральным совокупностям принадлежит несколько выборок, мы можем использовать их сравнение и по абсолютным значениям (сравнение средних или медиан), и по характеру их распределений.

В-третьих, мы уже рассмотрели ситуации, в которых приходится проверять распределения выборок на нормальность. Эта проверка имеет смысл во многих случаях, когда надо выбрать, параметрические или непараметрические методы следует использовать. Простой способ такой проверки описан в пункте 5.2 (см. рис. 5.2.1).

Как указывалось ранее (см. пункт 1.5), далеко не все признаки выражаются числом из непрерывного (метрические) или дискретного (меристические) числового ряда. Многие важные для биологического исследования признаки носят качественный (политомический или дихотомический), а также ранговый характер. Чтобы сравнить выборки по таким признакам, необходимо сравнение распределений. Приведем примеры нескольких задач, требующих использование методов, которые рассматриваются в этой теме:
— отличаются ли соседствующие локальные популяции по частотам характерных фенов (единичных качественных внешних признаков);
— отличаются ли представители разных полов по склонности к определенному заболеванию;
— действительно ли использование какого-то способа лечения приводит к более частому выздоровлению пациентов;
— зависимо или нет варьируют в изученной совокупности объектов два (или большее количество) качественных признаков.

Начнем рассмотрение методов сравнения распределений с использования критерия Пирсона дл я решения последней из перечисленных задач.

6.2. Определение связи качественных признаков с помощью кросстабуляции

Обратимся к нашему файлу Pelophylax_example.sta. В нем рассмотрено 57 лягушек, относящихся к 5 разным генотипам и 2 разным полам. Распределение по полу и генотипу изученных лягушек не равномерное: одни сочетания встречаются чаще, другие — реже. Отражает ли наблюдаемое распределение связь между полом и генотипом? Можно ли предположить, что для одних генотипов у нас статистически значимо чаще попадались самки, а для других — самцы?

Чтобы ответить на этот вопрос, надо определиться с тем, какое распределение мы бы считали равномерным. То, в котором все 10 (2×5) возможных сочетаний пола и генотипа представлены с равной (или приблизительно равной частотой)? Но, весьма вероятно, некоторые генотипы (например, LLR) встречаются реже, а некоторые (как RR) — чаще. Как нам построить исследование, чтобы разная представленность генотипов и разная представленность полов в нашей выборке не мешала нам получить ответ на заданный вопрос?

Для ответа на этот вопрос откроем файл Pelophylax_example.sta и пройдем по пути Statistics / Basic Statistics and Tables / Tables and banners.

Рис. 6.2.1. Удобный диалог для сравнения распределений находится здесь

Мы попадем на вкладку Crosstabulation Tables. Выберем там переменные, соответствующие полу и генотипу.

Рис. 6.2.2. Выбор переменных, связь между которыми надо проанализировать

В окне Crosstabulation Tables Results снимем галочку Highlight counts, которая позволяет выделить красным цветом значения в тех ячейках, куда попало относительно много наблюдений (по умолчани ю — 10). Пос тавим галочки в окошке Expected frequencies, выводящем отдельное окно с ожидаемыми частотами (при наблюдаемых краевых суммах), а также в окошке Pearson & M-L Chi-square, которое вызывает сравнение наблюдаемых и ожидаемых частот по методу .

Рис. 6.2.3. Настройки, требуемые для сравнения ожидаемого и наблюдаемого распределений

Нажав на кнопку Summary, мы получим сразу две таблицы.

Рис. 6.2.4. Результат анализа. Выше — наблюдаемое распределение, ниже — ожидаемое (при тех же краевых суммах). Убедитесь, что краевые суммы (суммы элементов в каждой строке и каждом столбце) не изменились!

Интерпретация первой из полученных таблиц очень проста. Это наблюдаемые частоты разных сочетаний двух выбранных переменных. Той переменной, которая была выбрана первой, соответствуют строки этой таблицы, а второй переменной соответствуют столбцы. Кстати, с помощью обсуждаемого диалога можно изучать взаимосвязь также и трех или большего количества переменных, однако интерпретация таких многовходовых таблиц оказывается непростым делом (попробуйте и убедитесь сами!).

В таблице наблюдаемых частот посчитаны краевые суммы. В нашем случае это общее количество самок и самцов, а также особей различных генотипов. Обратите внимание: лягушек с генотипом LL исследовано 5 штук. Общее соотношение самок и самцов в нашей выборке 31:26. Если бы у особей с генотипом LL наблюдалось то же самое соотношение, мы могли бы ожидать у них соотношения приблизительно 2,7:2,8. С другой стороны, общее распределение генотипов в нашей выборке 5:11:14:13:14. Если бы особи были распределены равномерно, те же самые соотношения долей наблюдались бы и у самок, и у самцов.

Итак, таблица, содержащая Expectad Frequencies строится на основании эмпирически зарегистрированных краевых сумм, на основании предположения о том, что значения рассматриваемых переменных распределены все связи друг с другом. Распределения генотипов для разных полов соответствуют распределению генотипов во всей выборке; распределения полов для разных генотипов соответствуют распределению полов для всей выборки. Эта таблица дает ожидаемое распределение полов в том случае, если нулевая гипотеза (постулирующая отличие связи между переменными) верна.

Нам осталось сравнить наблюдаемое и ожидаемое распределение. В таблице это сделано с использованием критерия (или критерия согласия), предложенного Карлом Пирсоном в 1900 году. Историки науки высказывали мысль, что статья, в которой Пирсон предложил этот критерий, открыла новый век в истории статистики. Не вдаваясь в детали, скажем, что Пирсон исследовал, насколько сильно распределение выборки может отличаться от распределения генеральной совокупности, из которой оно получено. Мера различия двух распределений вычисляется на основании суммы квадратов различий наблюдаемых и ожидаемых частот (в нашем случае — значений в ячейках двух таблиц, показанных на предыдущем рисунке). Естественно, «вес» этой меры различия распределений зависит от количества степеней свободы (количества ячеек, значения в которых можно изменять независимо). Эта мера различия распределений названа . Для разных степеней свободы построены распределения вероятностей ; зная значение этой величины, зарегистрированное в нашем сравнении, мы можем определить вероятность его случайного возникновения (т.е. вероятность нулевой гипотезы).

Итак, в нашем сравнении вычисленное значение критерия — 2,72, а количество степеней свободы df=4. Почему именно 4? Представьте себе, мы имеем таблицу с заданными краевыми частотами. В одну из ячеек, соответствующих самкам или самцам первого генотипа, мы можем вписать любое число, не превышающее количество представителей этого генотипа (и общее количество представителей этого пола во всей выборке); этим мы сразу определим и значение второй ячейки (оно высчитывается как общая численность представителей данного генотипа, из которой вычтено количество представителей первого пола данного генотипа). То же самое мы можем сделать со вторым, третьим и четвертым генотипами. После этого численность представителей обоих полов последнего, пятого генотипа уже окажется жестко заданной (количество самок вычисляется вычитанием из общего количества самок количества самок первого, второго, третьего и четвертого генотипов). Итак, в таблице 2×5 мы можем независимо менять 4 значения, т.е. df=4.

Как это отражено на предыдущем рисунке, связь между рассматриваемыми переменными в нашем примере оказалась незначимой (p=0,686; мы имеем тело с тем случаем, когда Statistica не ставит 0 перед десятичным разделителем). Итак, материал в нашем исследовании представлен неравномерно, но значимой связи между полом и генотипом мы не зарегистрировали.

6.3. Сравнение распределений с помощью модуля непараметрической статистики

В предыдущем пункте мы приняли зарегистрированные нами краевые частоты (общее количество самцов, самок, а также представителей разных генотипов) в нашей выборке как заданные. Мы предположили, что они отражают разное количество представителей разных полов и разных генотипов в той генеральной совокупности, из которой мы получили нашу выборку. Однако в некоторых случаях имеет смысл иная постановка вопроса. А можем ли мы на основании нашей выборки предположить, что разные полы и генотипы распределены в генеральной совокупности, которую мы изучаем, неравномерно? Для этого нам надо сравнить зарегистрированное распределение с иным, где в каждой ячейке находится одинаковое количество особей (легко понять, как его определить: 57/10=5,7). Для этого нам придется сделать файл с таким распределением.

Рис. 6.3.1. В первом столбце приведены зарегистрированные частоты, во втором — ожидаемые частоты в том случае, если численность представителей обоих полов (а также разных генотипов) одинакова

Для того способа анализа, к которому мы планируем приступить, важно, чтобы общая численность обоих распределений была одинакова. В нашем случае это условие выполняется: мы сгенерировали ожидаемое распределение в пересчете на зарегистрированное количество особей. Тем же способом можно сравнивать и два эмпирических распределения, только при этом нужно пересчитать большее так, чтобы количество наблюдений в нем соответствовало меньшему.

Рис. 6.3.2. Используемый нами метод относится к числу непараметрических

Осталось указать, какие распределения мы сравниваем, и получить результат.

Рис. 6.3.3. Результат сравнения эмпирического и расчетного распределений. Разница незначима

На последнем рисунке мы можем увидеть, как происходит вычисление статистики . Для каждой пары ячеек (для каждой категории сравниваемых нами распределений) определяется их разница, которая возводится в квадрат и делится на количество сравниваемых пар. Сумма этих величин и является величиной . Обратите внимание: величина в данном случае выше, чем в предыдущем расчете, а значимость меньше. Почему? Потому что выше количество степеней свободы. В данном случае, зная общее количество наблюдений, мы можем независимо менять (в определенных пределах, естественно) значения в 9 ячейках.

Итак, мы не нашли подтверждений предположению, что пола и генотипы лягушек распределены неравномерно (а в прошлом пункте — что они связаны друг с другом). На основании рассмотренных данных у нас нет достаточных причин отвергать нулевую гипотезу. Важное дополнение заключается в том, что для рассматриваемой проблемы известно, что нулевая гипотеза неверна. На территории изучения частоты разных генотипов неравны; для некоторых генотипов достаточно часто наблюдается преобладание самом или самцов. Однако эти утверждения делаются не на основании данных, находящихся в файле Pelophylax_example.sta, а с учетом иных, значительно более представительных исследований.

Таким образом, в нашем случае нулевая гипотеза не отвергнута. Как и во всех остальных случаях, это не означает, что она верна.

Источник

БиоСтатистика — 01. Содержание курса. Тема 1. Основные понятия биостатистики

Содержание курса.
Тема 1. Основные понятия биостатистики

Содержание

Тема 1. Основные понятия биостатистики

Тема 2. Использование программы Statistica

Тема 3. Визуализация данных (на примере результатов описания зеленых лягушек)

Тема 4. Сравнение выборок

Тема 5. Краткое введение в дисперсионный анализ

Тема 6. Сравнение распределений

Тема 7. Связь между признаками

Тема 8. Кластерный анализ

Тема 9. Метод главных компонент

Тема 10. Дискриминантный анализ

Тема 11. Некоторые методы, характерные для зоологии и экологии

Программа раздела большого практикума «Статистический анализ данных в зоологии и экологии»

М. А. Гхазалі. Статистичні методи в зоології. Матеріали відкритих лекцій, прочитаних в інституті зоології імені І.І.Шмальгаузена у 2017/2018 навчальному році для аспірантів 1-го курсу

Перспективные темы для расширения курса:

Тема 1. Основные понятия биостатистики

1.1. Что такое биостатистика и зачем она нужна

Статистический анализ результатов биологических исследований позволяет решать несколько типов задач:
1. наглядно представлять результаты описания разнообразия изучаемых объектов;
2. обоснованно (с определенной вероятностью ошибки) принимать или не принимать предположения о наличии закономерностей, отражающихся в варьировании изучаемой величины;
3. обнаруживать неявные закономерности, скрытые в варьировании изучаемых данных.

Не следует думать, что существует какая-то особая биологическая статистика, принципиально отличающаяся от математической статистики вообще. Однако изменчивость биологических объектов обладает определенными особенностями, отличающими их, к примеру, от изменчивости финансовых показателей или результатов технологических процессов на производстве. Это приводит к тому, что набор методов, используемых в биологии, отличается от такового в других областях применения статистики. Кроме того, следует помнить, что статистическое исследование в биологии не является самоцелью: оно подчинено задачам биологического исследования и не может быть полностью интерпретировано вне изучаемой биологической проблемы. Однако не только анализ данных должен быть подчинен логике биологического исследования; оно и само должно строится с учетом будущего анализа. Сбор эмпирических данных и постановка экспериментов должны заранее учитывать, как именно будет организован анализ получнных данных. Итак, хотя применение статистики в биологии невозможно полностью отграничить от математической статистики как таковой или изучаемых с помощью тех или иных методов разделов биологии, оно все равно составляет особую отрасль науки, особый комплекс проблем и способов их решения. Для этой отрасли можно использовать термин, предложенный в 1899 году Френсисом Гальтоном — биометрия. Поскольку термин «биометрия» перехватили специалисты по идентификации личности на основании индивидуальных признаков, во многих случаях проще оказывается использовать термин биостатистика.

Объекты, которые изучает биология, обладают высоким уровнем уникальности. Практически в любом биологическом феномене проявляются как общие закономерности, так и влияние особых обстоятельств, часто связанных с той или иной уникальностью биосистем. Это означает, что для биологических исследований очень важны методы, позволяющие увидеть общие закономерности, проявляющиеся за изменчивостью частных проявлений. Возможно, поэтому биологи внесли большой вклад в развитие статистики в целом. Результаты работ Френсиса Гальтона, Карла Пирсона, Рональда Фишера составляют важную часть не только биостатистики, но и математической статистики в целом.

1.2. Вероятность

Статистически можно изучать повторяемые события. Например, мы вслепую выбираем кроликов из ящика. Кролики могут быть черными или белыми. Каждый выбор — элементарное событие. Человек засовывает руку в отверстие ящика и хватает там какого-то кролика… Можно ли узнать, какого кролика он схватил? Нет (если нет иных источников получения информации и иных факторов, влияющих на результат). Можем ли мы узнать, каково соотношение черных и белых кроликов в ящике? Тоже нет.

Как только кролик будет извлечен наружу, мы не просто узнаем, какого он цвета. Мы сможем кое-что узнать о составе кроликов в ящике. Например, если вытащен белый кролик, мы можем утверждать, что в ящике был как минимум один белый кролик. Немного. Однако если последовательно вытащить 10 кроликов, по составу группы кроликов, собирающихся у ног вытаскивающего их человека, можно высказать более детальное предположение о составе кроликов в ящике. Эти предсказания основываются на феномене вероятности, проявляющейся в регулярных, повторяющихся событиях. Вероятность – числовая мера возможности события. Вероятность 1 означает, что событие произойдет наверняка, а вероятность 0 – что оно невозможно.

Предположим, в ящике 50 белых и 50 черных кроликов. Какова вероятность случайно выбрать белого кролика при однократном выборе? Из общего количества возможных исходов (100) этому условию соответствует 50, значит вероятность — 50/100 = 1/2 = 0,5.

А надо ли рассматривать вариант, что, например, в вынутой из ящика руке не было ни одного кролика или, к примеру, два? В реальной жизни — надо, а в ее упрощенной модели, к которой можно применить аппарат основ теории вероятности — можно и не учитывать. Те случаи, когда человек не достал ни одного кролика или достал за раз сразу двух, не соответствуют условиям однократного выбора. Впрочем, если бы читатель этого текста засунул руку в настоящий ящик, заполненный уворачивающимися и лягающимися кроликами, вероятностью, что он ничего не вытащит, пренебрегать было бы нельзя.

А какова вероятность выбрать два кролика одного цвета? Может показаться, что 0,5, хотя на самом деле меньше. После того, как выбран кролик определенного цвета, вероятность выбора второго такого же составляет 49/99 против 50/99. Итак, вероятность выбора двух кроликов одного цвета составляет 49/99 = 0,4949…, а двух белых — 0,24747…

1.3. Генеральная совокупность и выборка

Генеральная совокупность — действительная или гипотетическая совокупность всех объектов, относящихся к изучаемой категории. В большинстве случаев изучать генеральную совокупность невозможно, и исследователи работают с выборками (эмпирическими совокупностями, выборочными совокупностями) — группами объектов, полученных из генеральной совокупности.

Объем генеральной совокупности определяется задачей исследования (и может в существенной степени изменяться при ее переформулировании). Сравнение роста юношей и девушек в группе, изучающей биометрию, может быть исследованием именно этой группы (при этом в выборку попадет вся генеральная совокупность), исследованием студентов конкретного университета (генеральная совокупность при этом хотя бы конечна), студентов вообще или людей вообще (в двух последних случаях генеральная совокупность, по крайней мере, гипотетическая, оказывается потенциально бесконечной).

Существенный парадокс статистики заключается в том, что исследователь работает с выборками, а изучает при этом те совокупности, откуда эти выборки получены.

Можно ли по выборке судить о генеральной совокупности, которая существенно шире этой выборки? В определенной степени, да. Впрочем, понятно, что не всякая выборка отражает состав генеральной совокупности, из которой она получена. Можно ли брать выборку, по которой судить о изменчивости роста людей, из числа студентов? Нет, поскольку в эту выборку попадут люди преимущественно молодого возраста, которые захотели получать высшее образование и смогли поступить в соответствующий вуз. Такая выборка является смещенной. Чтобы получить полностью случайную выборку, следовало бы организовать процесс ее формирования таким образом, что любой из объектов в составе генеральной совокупности имел бы одинаковую вероятность попадания в выборку. В большинстве случаев такой отбор практически неосуществим. Тем не менее, для изучения генеральной совокупности следует использовать только репрезентативные (представительные) выборки, при формировании которых отклонения от случайного характера при их формировании не могут привести к существенному смещению выборки.

Неслучайность формирования выборок, с которыми работает биолог, являются одной из постоянных (и полностью неустранимых) проблем при биологическом исследовании. Представьте себе, что нам надо не доставать черных и белых кроликов из ящика, а определить их соотношение в том или ином местообитании. Как это сделать? Например, выйти в поле и посчитать попадающихся на пути исследователя кроликов того и другого цвета. Однако на черной пахоте более заметными окажутся белые кролики, а после выпадения снега — черные. Может, стоит не полагаться на зрение исследователя, и ловить кроликов ловушками? Однако если белые кролики являются альбиносами, они могут иметь худшее зрение, чем черные, и чаще попадаться в ловушки. Выборка кроликов, которые наблюдались во время маршрутного учета и выборка кроликов, которые попались в ловушки, не являются вполне репрезентативными для оценки генеральной совокупности кроликов, населяющих изучаемую территорию.

Теперь представьте себе, что зоолог пытается оценить состав популяции прытких ящериц. Он посетил местообитание этой популяции в пасмурный ветреный день, перед которым несколько дней подряд шли дожди. В такую погоду вышли на поверхность для поисков корма только молодые особи и беременные (вынашивающие созревающие яйца) самки (те особи, которые испытывают особо сильный голод). Исследователь собрал несколько особей, которые показались ему «типичными», а также еще несколько экземпляров, которые заинтересовали его своей необычностью. В ходе дальнейшего анализа он будет судить о свойствах изучаемой генеральной совокупности (ящериц данной популяции) на основании свойств имеющейся у него выборки. Увы, никакими методами статистического анализа полностью исправить смещение такой выборки будет невозможно.

1.4. Что такое значимость? Шуточный пример

Рассмотрим шуточный пример. Всем известен фокус, при котором фокусник достает из шляпы кролика (рис. 1.4.1). Откуда берется извлеченный фокусником кролик? Неизвестно… Можно представить себе, что шляпа — «вход» в какой-то аналог ящика с кроликами, наподобие того, на примере которого мы обсуждали понятие вероятности. Процедуру извлечения кроликов из шляпы можно сравнить с получением выборки из генеральной совокупности. Выборкой является извлеченные кролики (возможно — один, возможно — большее количество, один за другим), а генеральной совокупностью — кролики в том «магическом пространстве», из которого они извлекаются.

Рис. 1.4.1. Что мы можем утверждать о том «магическом пространстве», из которого фокусник извлек кролика (т.е. что мы в данном случае можем узнать о генеральной совокупности по полученной нами выборке)?
Там был по крайней мере один белый кролик…

Предположим, фокусник вытаскивает кроликов вслепую: что ухватит рука, засунутая в шляпу, то он и вытащит. Просунув руку в одну шляпу, он вытащил белого кролика, а просунув в другую — черного (рис. 1.4.2).

Рис. 1.4.2. Из другой шляпы появился другой кролик, черный… В том пространстве, куда ведет правая шляпа, был, по крайней мере, один черный кролик. А две шляпы ведут в одно пространство, или в разные (иначе говоря, две выборки получены из одной генеральной совокупности или из разных)?
У нас недостаточно оснований для выбора одного из этих вариантов. Может, две выборки получены из одной генеральной совокупности, где есть и черные, и белые кролики, а возможно — из разных совокупностей

Можем ли мы по составу кроликов из двух выборок, соответствующих двум шляпам, установить, получены ли они из одной генеральной совокупности? Иногда полученные нами данные бесполезны для выбора какой-либо из взаимоисключающих возможностей, а иногда они могут быть основанием для обоснованных предположений (рис. 1.4.3).

Рис. 1.4.3. Информации для принятия решения стало больше…
Если мы примем, что через две шляпы фокусник дотягивается до двух разных совокупностей кроликов, нам не понадобится никаких дополнительных предположений. Если обе выборки получены из одной генеральной совокупности, нам придется предположить, что реализовался не самый вероятный вариант

Какова вероятность того, что фокусник получит в одной выборке два белых кролика, а с другой — два черных, если он берет их из одной генеральной совокупности? Какое мы можем ожидать соотношение белых и черных кроликов в генеральной совокупности (если она одна)? Мы точно знаем, что там есть и белые, и черные, а их соотношение мы можем оценить по объединенной выборке (мы, в таком случае, предполагаем, что отличия между кроликами из разных шляп — следствие одной лишь случайности). Самый вероятный вариант — белых и черных поровну, так как именно это соответствует общей полученной выборке.

Засунув руку в первый раз в одну из шляп, фокусник вытащил какого-то кролика. Показанный на рис. 1.4.3 вариант реализуется в том случае, если из этой шляпы будет вытащен кролик того же цвета (т.е. произойдет событие, вероятность которого мы оценили как ½), а из другой шляпы два раза подряд будут вытащены кролики иного цвета (т.е. произойдет два независимых события, вероятность каждого из которых — тоже по ½). Таким образом, такое распределение, как на рисунке, получится в случае общего пространства лишь в одном случае на восемь попыток. Вероятнее предположить, что совокупности кроликов разные, хотя, конечно, для того, чтобы отбросить предположение о том, что кролики берутся из одной общей совокупности, оснований у нас недостаточно…

Впрочем, возможны случаи и посложнее (рис. 1.4.4)…

Рис. 1.4.4. Информации еще больше, но расчет вероятности не столь тривиален, как в предыдущем случае

Общее соотношение белых и черных кроликов по-прежнему одинаково. Вероятность того, что в одной выборке соотношение окажется 1 к 3, а в другой — 3 к 1 (без учета того, в каком порядке извлекались кролики в каждой выборке) оказывается той же, что и в предыдущем примере: при заданных численностях выборок показанный на рисунке исход наблюдается в одном случае из восьми.

А как изменятся наши оценки, если выборки станут больше, а отличия между ними — нагляднее (рис. 1.4.5)?

Рис. 1.4.5. В этом случае на вопрос, в одно «магическое пространство» запускает фокусник руки через разные шляпы, или в разные, можно дать весьма вероятный ответ: в разные. Если бы пространство было одно, разделение на 10 кроликов одного цвета в одной выборке и 10 кроликов другого цвета — в другой, могло бы наблюдаться лишь в одном случае на 524288 попыток

Можно было бы предположить, что в том случае, если выборки не отличаются по составу (рис. 1.4.6), мы могли бы принять противоположное решение, и предположить, что обе шляпы являются порталами для попадания в одно и то же место. Однако такое решение было бы неправильным. Мы установили только то, что предположение об одинаковом соотношении белых и черных кроликов в совокупностях, к которым ведут правая и левая шляпы на рис. 1.4.6, вполне вероятное с точки зрения сравнения извлеченных из них кроликов. Но у нас нет никаких оснований выбрать между предположениями о том, что это два разных пространства с одинаковым составом, или же что это одно общее пространство.

Рис. 1.4.6. Согласуется ли наблюдаемая в этом случае картина с тем предположением, что через правую и левую шляпы фокусник засовывает руки в разные «магические пространства»? Вполне согласуется!

Итак, случай на рис. 1.4.5 дает основания для определенного вывода, а случай на рис. 1.4.6 — нет! Это — отражение общей закономерности: сравнивая две выборки мы иногда можем доказать, что они происходят из разных генеральных совокупностей (т.е. обосновать, что противоположное заключение является крайне маловероятным), но не можем доказать, что они происходят из одной совокупности! Впрочем, можно обосновать, что отличие между совокупностями, из которых взяты две выборки, с той или иной вероятностью не превышает определенного уровня…

В случае сравнения выборок, которое мы рассматривали в этом примере, вероятность того, что выборки получены из одной совокупности и отличия между ними являются следствием случайности, называется статистической значимостью предположения о том, что генеральные совокупности, из которых получены выборки — разные. В иных случаях (например, при изучении связи между изменчивостью двух признаков) статистическая значимость определяется аналогичным образом — это вероятность того, что зарегистрированный эффект является следствием случайности. Коротко можно сформулировать следующее: уровень значимости — это вероятность того, что зарегистрирован просто результат случайности при формировании выборки.
Что означает фраза «результат статистически значим»? Она означает, что случайное возникновение этого результата очень маловероятно, что у нас есть все основания считать результат неслучайным, отражающим особенности того, что мы изучаем.

1.5. Статистическая значимость; нулевая и альтернативная гипотезы

Чтобы формализовывать подобные логические выборы, принято формулировать две гипотезы, выбор между которыми нужно сделать в ходе статистического исследования.

Нулевая гипотеза (H) утверждает, что между совокупностями, из которых взяты выборки, нет отличий (а разница между выборками — следствие случайности в ходе их формирования).

Альтернативная гипотеза (H1) утверждает, что отличия между выборками отражают отличия между совокупностями, откуда они получены.

Однозначно выбрать одну из этих возможностей нельзя, и всегда сохраняется возможность ошибки. Нужно по имеющимся данным о составе выборок оценить вероятность справедливости нулевой и альтернативной гипотез и выбрать оптимальное решение. Для этого выбора используются статистические критерии — правила, позволяющие делать такой выбор.

Нулевая и альтернативная гипотеза могут быть ненаправленными (важен сам факт отличия между совокупностями, откуда взяты выборки), а могут быть и направленными (например, важно, что определенное воздействие повышает значение признака; в совокупности подвергнутых воздействию объектов значение признака выше). К примеру, когда мы определяем, влияет ли пол на длину хвоста, мы можем рассматривать как примеры такого влияния и тот случай, когда хвост у самок длиннее, чем у самцов, и тот, при котором он короче. Когда мы определяем, «работает» ли новое лекарство, случаи, когда оно способствует выздоровлению и когда оно препятствует выздоровлению, представляются совершенно различными. Альтернативная гипотеза должна заключаться именно в том, что лекарство способствует выздоровлению. Итак, в первом случае следует применять ненаправленные критерии, а во втором — направленные.

Уровень статистической значимости — это вероятность того, что мы сочли различие существенным (приняли альтернативную гипотезу), а они на самом деле случайны. Можно определить уровень статистической значимости как вероятность того, что приняв альтернативную гипотезу в ситуации, когда на самом деле верна нулевая гипотеза, мы совершили ошибку I рода. Ошибкой II рода называется принятие нулевой гипотезы, когда верна альтернативная. Обычно ошибки I рода оказываются более опасными. Вероятность ошибки первого рода обозначается как α; а второго рода — как β. В соответствии с этим мощность критерия можно определить как = 1 — β.

Часто приходится наблюдать примеры неправильного употребления слов «достоверность» и «значимость». Понятие «статистическая значимость» (или просто «значимость») имеет четкую математическую трактовку. Статистическая значимость (significance) определенного результата (например, регистрации разницы между группами данных или связи между двумя переменными) — низкая вероятность его случайного возникновения. Утверждение «две выборки отличаются статистически значимо» означает, что вероятность их получения из одной совокупности настолько низка, что можно считать доказанным их получение из разных совокупностей. «Достоверность» — намного более широкое понятие, которое может использоваться в самых разных сферах (от юриспруденции до философии) и не имеет математического определения. Его используют для обозначения обоснованного, доказательного знания. Утверждение «выводы диссертации достоверны» означает, что они обоснованы логикой построения и изложени я материала. Запомните: достоверные выводы делаются на основании статистически значимых результатов!

Кстати, при неправильной организации эксперимента или при ошибках интерпретации недостоверные выводы могут ссылаться на множество статистически значимых феноменов.

В подавляющем большинстве источников принято говорить просто об «уровне значимости». Это ни в коем случае не является ошибкой, и такое словоупотребление вполне допустимо. Однако на том основании, что данный текст носит учебный характер, его автор будет стараться во всех случаях использовать полную формулировку: понятие «статистическая значимость»; так проще напоминать о его статистической природе.

1.6. Признаки

При описании каких-то объектов исследователи фиксируют значение тех или иных признаков – характеристик, по которым сравниваемые объекты могут отличаться друг от друга. Признаки могут иметь различную природу.

Источник

Читайте также:  Испуг у ребенка признаки как лечить воском
Adblock
detector