Алгебраическая сумма отклонений индивидуальных значений признака

Средняя арифметическая

Самым распространенным видом средней является средняя арифметическая.

Средняя арифметическая простая

Простая среднеарифметическая величина представляет собой среднее слагаемое, при определении которого общий объем данного признака в совокупности данных поровну распределяется между всеми единицами, входящими в данную совокупность. Так, среднегодовая выработка продукции на одного работающего — это такая величина объема продукции, которая приходилась бы на каждого работника, если бы весь объем выпущенной продукции в одинаковой степени распределялся между всеми сотрудниками организации. Среднеарифметическая простая величина исчисляется по формуле:

Простая средняя арифметическая — Равна отношению суммы индивидуальных значений признака к количеству признаков в совокупности

Найти среднюю заработную плату
Решение: (3 + 3,2 + 3,3 +3,5 + 3,8 + 3,1) / 6 = 3,32 тыс. руб.

Средняя арифметическая взвешенная

Если объем совокупности данных большой и представляет собой ряд распределения, то исчисляется взвешенная среднеарифметическая величина. Так определяют средневзвешенную цену за единицу продукции: общую стоимость продукции (сумму произведений ее количества на цену единицы продукции) делят на суммарное количество продукции.

Представим это в виде следующей формулы:

Взвешенная средняя арифметическая — равна отношению (суммы произведений значения признака к частоте повторения данного признака) к (сумме частот всех признаков).Используется, когда варианты исследуемой совокупности встречаются неодинаковое количество раз.

Заработная плата одного рабочего
тыс.руб; X
Число рабочих
F
3,2 20
3,3 35
3,4 14
4,0 6
Итого: 75

Средняя заработная плата может быть получена путем деления общей суммы заработной платы на общее число рабочих:

Средняя арифметическая для интервального ряда

При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем — среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Средние, вычисляемые из интервальных рядов являются приближенными.

Пример 3. Определить средний возраст студентов вечернего отделения.

Возраст в годах
!!х??
Число студентов

Среднее значение интервала Произведение середины интервала (возраст)
на число студентов
до 20 65 (18 + 20) / 2 =19
18 в данном случае граница нижнего интервала. Вычисляется как 20 — (22-20)
1235
20 — 22 125 (20 + 22) / 2 = 21 2625
22 — 26 190 (22 + 26) / 2 = 24 4560
26 — 30 80 (26 + 30) / 2 = 28 2240
30 и более 40 (30 + 34) / 2 = 32 1280
Итого 500 11940

Средние, вычисляемые из интервальных рядов являются приближенными. Степень их приближения зависит от того, в какой мере фактическое распределение единиц совокупности внутри интервала приближается к равномерному.

При расчете средних в качестве весов могут использоваться не только абсолютные, но и относительные величины (частость):

Средняя арифметическая обладает целым рядом свойств, которые более полно раскрывают ее сущность и упрощают расчет:

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты, т.е.

2.Средняя арифметическая суммы варьирующих величин равна сумме средних арифметических этих величин:

3.Алгебраическая сумма отклонений индивидуальных значений признака от средней равна нулю:

6.Если все варианты ряда уменьшить или увеличить в раз, то средняя также уменьшится или увеличится в раз:

7.Если все частоты (веса) увеличить или уменьшить в раз, то средняя арифметическая не изменится:

Источник

Свойства средней арифметической.

Средняя арифметическая обладает некоторыми свойствами, которые определяют ее широкое применение в экономических расчетах и в практике статистического исследования.

Свойство 1.Средняя арифметическая постоянной величины равна этой постоянной:

Свойство 2 (нулевое).Алгебраическая сумма линейных отклонений (разностей) индивидуальных значений признака от средней арифметической равна нулю:

Это свойство можно сформулировать следующим образом: сумма положительных отклонений от средней равна сумме отрицательных отклонений.

Логически оно означает, что все отклонения от средней в ту и в другую сторону, обусловленные случайными причинами, взаимно погашаются.

Свойство 3 (минимальное).Сумма квадратов отклонений индивидуальных значений признака от средней арифметической есть число минимальное:

что означает: сумма квадратов отклонений индивидуальных значений признака каждой единицы совокупности от средней арифметической всегда меньше суммы квадратов отклонений вариантов признака от любого значения (А), сколь угодно мало отличающегося от средней у выбранной единицы исследуемой совокупности.

Для сгруппированных данных имеем:

Минимальное и нулевое свойства средней арифметической применяются для проверки правильности расчета среднего уровня признака; при изучении закономерностей изменения уровней ряда динамики; для нахождения параметров уравнения регрессии при изучении корреляционной связи между признаками.

Рассмотренные свойства выражают сущностные черты средней арифметической. Существуют также расчетные (вычислительные) свойства средней арифметической, имеющие прикладное значение:

В настоящее время вычислительные свойства средней арифметической потеряли свою актуальность в связи с использованием ЭВМ при расчете обобщающих статистических показателей.

18.Упрощенный способ расчета средней арифметической.

Способ моментов

Часто мы сталкиваемся с расчетом средней арифметической упрощенным способом. В этом случае используются свойства средней величины. Метод упрощенного расчета называется способом моментов, либо способом отсчета от условного нуля.

Способ моментов предполагает следующие действия:

1) Если возможно, то уменьшаются веса.

2) Выбирается начало отсчета – условный нуль. Обычно выбирается с таким расчетом, чтобы выбранное значение признака было как можно ближе к середине распределения. Если распределение по своей форме близко к нормальному, но за начало отсчета выбирают признак, обладающий наибольшим весом.

3) Находятся отклонения вариантов от условного нуля.

4) Если эти отклонения содержат общий множитель, то рассчитанные отклонения делятся на этот множитель.

5) Находится среднее значение признака по следующей формуле

до 70 -30 -3 -45
70-80 -20 -2 -34
80-90 -10 -1 -13
90-100
100-110
110-120
120-130
130-140
140 и более
Сумма -12

▲ 19 Мода и медиана и их использование в статистике.

▲ 24 Дисперсия альтернативного признака.

▲ 25 Выборочное наблюдение, значение и условия применения.

22 Выборочное наблюдение, значение и условия применения.
статистическое наблюдение, при котором исследованию подвергают не все элементы изучаемой совокупности (называемой при этом «генеральной»), а только некоторую, определённым образом отобранную их часть. Отобранная часть элементов совокупности (выборка) будет представлять всю совокупность с приемлемой точностью при двух условиях: она должна быть достаточно многочисленной, чтобы в ней могли проявиться закономерности, существующие в генеральной совокупности; элементы выборки должны быть отобраны объективно, независимо от воли исследователя, так чтобы каждый из них имел одинаковые шансы быть отобранным или же чтобы шансы эти были известны исследователю. Эти условия устанавливаются математической теорией выборочного метода. Она основана на ряде важнейших теорем теории вероятностей, составляющих так называемый закон больших чисел (см. Больших чисел закон). Лишь при соблюдении этих условий возникает объективная возможность оценить точность Выборочное наблюдение на основании самих выборочных данных. Точность Выборочное наблюдение измеряется с помощью средней ошибки выборки, величина которой прямо пропорциональна степени вариации изучаемых признаков и обратно пропорциональна объёму выборки. Выборочное наблюдение можно произвести быстрее сплошного, с меньшими затратами и получить результаты, по точности мало уступающие результатам сплошного наблюдения, а с учётом же возможности более тщательного наблюдения — даже нередко превосходящие их.

▲ 26 Ошибки выборочного наблюдения.

23 Ошибки выборочного наблюдения.
Между признаками выборочной совокупности и признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называют ошибкой статистического наблюдения. При массовом наблюдении ошибки неизбежны, но возникают они в результате действия различных причин. Величина возможной ошибки выборочного признака слагается из ошибок регистрации и ошибок репрезентативности. Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.
Под ошибкой репрезентативности (представительства) понимают расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности. Ошибки репрезентативности бывают случайными и систематическими.
Систематические ошибки связаны с нарушением установленных правил отбора. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности
. В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки. Особенность ошибки смещения состоит в том, что, представляя собой постоянную часть ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается. Кроме того, величину случайной ошибки можно определить, тогда, как размер ошибки смещения непосредственно практически определить очень сложно, а иногда и невозможно. Поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.

▲ 27 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора.

24 Методы определения ошибки выборки для средней и для частости, при различных способах и методах отбора.
-Отклонение результатов, полученных с помощью выборочного наблюдения от истинных данных генеральной совокупности.
Ошибка выборки бывает двух видов – статистическая и систематическая. Статистическая ошибка зависит от размера выборки. Чем больше размер выборки, тем она ниже.

▲ 28 Определение численности выборки.

25 Определение численности выборки.
Определение необходимого объема выборки – это важная задача, с которой сталкивается исследователь, организующий выборочное наблюдение.
При этом ему, как правило, известно: какие характеристики генеральной совокупности он хотел бы оценить, какую величину ошибки он считал бы несущественной, какой метод выбора данных он использует. Известно также расположение генеральной совокупности и часто (но не всегда) количество элементов в ней.
Расчет численности выборки основывается на статистическом подходе обработки данных и за ним стоит множество вычислений, но для простоты, ниже мы представим формулу, следуя которой можно достичь хороших результатов.

Дата добавления: 2014-12-23 ; просмотров: 223 ; Нарушение авторских прав

Источник

Характеристика разнообразия признаков в статистической совокупности

Среднее арифметическое обычно рассчитывается для получения стандартов, норм, эталонов, например стандартов физического развития, лабораторных стандартов, физиологических норм, норм нагрузки и т. п.

В связи с развитием новых методов и форм управления здравоохранением, разработкой автоматизированных систем управления, мониторинга здоровья рассчитываются стандарты для многих статистических показателей деятельности учреждений и служб здравоохранения. Порой приходится обобщать совокупность случаев, в которых варианты представляют собой отклонения фактических величин от их средних уровней. В этих случаях определяется критерий разнообразия (вариабельности, колеблемости, рассеяния) признака в статистической совокупности. Чем ближе по значению друг к другу отдельные варианты, тем меньше колеблемость (рассеяние), тем типичнее средняя величина. Одинаковые по размеру средние величины могут быть получены из вариационных рядов с разной степенью колеблемости (разнообразия) признака. При исследовании разнообразия изучаемого признака (его колеблемости или вариации) в статистике применяются следующие характеристики:

·лимит (Lim) – это крайние значения вариант в вариационном ряду:

·среднеквадратическое отклонение (сигма): σ;

·коэффициент вариации: CV.

Лимит и амплитуда характеризуют разнообразие изучаемого признака только по двум крайним вариантам без учета распределения вариант между ними, игнорируя внутреннюю структуру статистической совокупности. Эта характеристика является неточной и применяется только для быстрой, ориентировочной оценки.

Наиболее полную характеристику разнообразия признака в статистической совокупности дает среднеквадратическое отклонение, которое ликвидирует первого способа оценки и делает характеристику колеблемости более рельефной, выпуклой.

Существует два способа расчета среднеквадратического отклонения: непосредственный (среднеарифметический) и способ моментов.

При непосредственном (среднеарифметическом) способе расчеты производятся по формулам:

а) для простого вариационного ряда (p = 1), при небольшом числе

σ = ,

где d (deviation) – это разность между каждой вариантой ряда, и средней

арифметической (истинное отклонение вариант от истинной средней):

Алгебраическая сумма положительных и отрицательных отклонений от

средней всегда равна нулю.

б) для взвешенного вариационного ряда, при небольшом числе

σ = ;

в) для взвешенного вариационного ряда, при большом числе наблюдений:

(n 30);

σ = .

Таким образом, вычисление среднеквадратического отклонения необходимо произвести шесть последовательных действий:

1) определить отклонения вариант от средней: d = V – M;

2) возвести отклонения в квадрат: d 2 ;

3) перемножить квадраты отклонений и частоты: d 2 p;

4) суммировать произведения квадратов отклонений и частот:∑ d 2 p;

5) разделить эту сумму на число наблюдений: ;

6) извлечь из частного квадратный корень: σ = ;

В окончательном виде формула среднеквадратического отклонения будет иметь вид: σ =

Аналогичным образом проводятся вычисления среднеквадратического отклонения и по данным сгруппированного ряда.

σ =i .

где — условное отклонение вариант от условной средней: = V1 – A.

При этом: момент первой степени;

– момент второй степени.

В целом, для получения среднеквадратического отклонения из данных сгруппированного вариационного ряда по способу моментов необходимо последовательно выполнить следующие действия:

1) определить число наблюдений в ряду (n) и величину интервала (i);

2) определить отклонения от условной средней в единицах интервалов

3) перемножить отклонения на соответствующие частоты (αip);

4) суммировать произведения с учетом алгебраических знаков (∑αip);

5) разделить сумму на число наблюдений, получая первый момент:

;

6) перемножить первый момент на величину интервала:

;

7) возвести отклонения от условной средней в единицах интервалов в

квадрат ( );

8) перемножить квадраты отклонений на соответствующие частоты ( p);

9) суммировать произведения ( p);

10) разделить сумму на число наблюдений, получая второй момент:

11) возвести в квадрат первый момент: ;

12) вычесть из второго момента квадрат первого момента:

13) извлечь из разности квадратный корень и, умножив результат на величину интервала, получить среднеквадратическое отклонение:

σ = i .

Этот принцип расчета положен в основу получения дисперсии(среднего квадрата отклонения) определяющей степень однородности статистической совокупности. Дисперсия бывает простая и взвешенная. Дисперсия (σ 2 ) выражается моментом второй степени.

Простая дисперсия:σ 2 = ;

Взвешенная дисперсия: σ 2 = ;

Среднеквадратическое отклонение находит разнообразное применение в практике врача. В симметричном вариационном ряду:

— в пределах (в интервале) M ± 1σ должно находиться 68,37 % всех вариант;

— в пределах M ± 3σ – 99,7 % всех вариант.

В последнем случае определяется самая высокая степень оценки колеблемости данных. Если 95 % всех вариант находится в пределах M ± 2σ, то средняя арифметическая является типичной (увеличивать число случаев не следует).

Правило трех сигм используется также для оценки единичной варианты. Если единичная варианта лежит в пределах:

M ± 1σ – это норма (нормальный рост, масса тела и др.);

M ± 2σ – рост или масса выше или ниже среднего (субнорма);

M ± 3σ – высокий или низкий рост, масса тела (субпатология).

Разновидностью этого приема оценки единичных вариант является вычисление так называемого нормированного отклонения:t(доверительный коэффициент) = , которое позволяет определить, находится ли отклонение варианты от средней в пределах одной, двух или трех сигм, а также направленность (знак) этого отклонения, т.е. сколько сигм составляет отклонение индивидуального признака от средней арифметической:

Коэффициент вариации

Вариация — различие значений какого-либо признака у разных единиц совокупности за один и тот же промежуток времени.

Причиной возникновения вариации являются различные условия существования разных единиц совокупности. Вариация — необходимое условие существования и развития массовых явлений.Определение вариации необходимо при организации выборочного наблюдения, статистическом моделировании и планировании экспертных опросов. По степени вариации можно судить об однородности совокупности, устойчивости значений признака, типичности средней, о взаимосвязи между какими-либо признаками.

Коэффициент вариации (Cv) определяет изменчивость вариационного ряда в процентах и дает возможность судить о качественной однородности изучаемой совокупности.

Коэффициент вариации является относительной мерой разнообразия, так как исчисляется как процентное отношение среднеквадратического отклонения (σ) к средней арифметической величине (M).

Формула коэффициента вариации выглядит следующим образом:

Cv = * 100 %

Коэффициент вариации применяют при сравнении степени разнообразия признаков, имеющих различия в величине признаков или неодинаковую их размерность.

Источник

Читайте также:  Общие признаки строения клетки животных и растений
Adblock
detector