Центральное значение признака в интервале

Средняя арифметическая взвешенная

Когда исходные данные сгруппированы, то расчёт средней производится по

формуле средней арифметической взвешенной:

Где fi – частота ряда распределения, с которой отдельные варианты встречаются в совокупности (или удельный вес отдельных значений во всей совокупности).

Например: Рабочие бригады по возрасту распределились следующим образом:

Возраст рабочих, лет (X)
Численность рабочих, чел. (fi)

Средний возраст рабочего бригады составляет

Если исходная информация представлена в виде интервального ряда распределения, то средняя арифметическая взвешенная определяется по формуле:

Где Xc — центральное (серединное) значение признака в интервале.

Например: По имеющимся данным определить средний стаж рабочего бригады:

Для расчёта средней арифметической взвешенной интервального ряда распределения определим центральное (серединное) значение признака в каждом интервале. Среднее значение интервала находится как полусумма нижней границы данного интервала и нижней границы следующего интервала:

Оформим исходные данные а следующем виде:

Средний стаж рабочего бригады составляет

Если в интервальном ряду распределения имеются «открытые» интервалы, то для установления центральных (серединных) значений «открытых» интервалов на каждый из них условно распространяется величина смежного «закрытого» интервала.

Например: Работники организации по величине заработной платы за январь 2013 года распределились следующим образом:

Определить по имеющимся данным среднюю зарплату работников организации.

Для расчёта средней арифметической взвешенной интервального ряда распределения определим центральное (серединное) значение признака в каждом интервале. На каждый открытый интервал условно распространим величину смежного закрытого интервала:

Частоты при расчете средних арифметических могут быть выражены не только абсолютными величинами, но и относительными величинами – частостями. Результаты применительно к одинаковым вариантам будут совпадать. В данном примере численность работников выражена не частотами, а частостями – удельными весами численности отдельных групп во всей совокупности, что не влияет на порядок расчёта средней.

Средняя зарплата работников организации за январь 2013 года составляет:

Необходимо небольшое пояснение применительно к расчету средней в интервальных рядах распределения. В действительности распределение отдельных вариантов в пределах интервала может оказаться неравномерным. В этом случае середина интервала будет в той или иной степени отличаться от фактической средней по интервалу. Это в свою очередь может повлиять на правильность общей средней, исчисленной по данным интервального ряда. Степень расхождения зависит от ряда причин. Во-первых, от числа вариант, чем больше число вариант, тем вероятнее, что середина интервала будет мало отличаться от групповой средней. Во-вторых, от величины интервала. Если интервал невелик, то ошибка будет незначительной, т.к. групповая средняя будет мало отличаться от середины интервала. В-третьих, от характера распределения. Чем симметричнее распределение, тем ошибка меньше. В-четвертых, размер ошибки зависит от принципа построения интервального ряда. При равных интервалах середина интервала будет ближе к средней по данной группе. При наличии открытых интервалов расхождение, как правило, взрастает из-за условного обозначения неизвестных границ. Общая средняя равна средней из частных (групповых) средних, взвешенных по численности соответствующих частей совокупности. Это правило имеет большое значение для всей статистики – организации сбора и обработки данных, их анализа.

Свойства средней арифметической:

1. Произведение средней на сумму частот всегда равно сумме произведений вариант на частоты. Другими словами, постоянный множитель может быть вынесен за знак средней.

2. Если от каждой варианты отнять (прибавить) какое-либо произвольное число, то новая средняя уменьшится (увеличится) на то же число:

Читайте также:  Признаки белой горячки у мужчин как лечить

3. Если каждую варианту умножить (разделить) на какое-то произвольное число, то средняя арифметическая увеличится (уменьшится) во столько раз

4. Если все частоты (веса) разделить или умножить на какое-либо число, то средняя арифметическая от этого не изменится. Дело в том, что веса при исчислении средней арифметической выполняют роль удельного веса (соотношений между группами по количеству единиц). Поэтому замена частот частостями не меняет значения средней.

5. Сумма отклонений отдельных вариантов от средней арифметической всегда равняется нулю.

Перечисленные свойства могут быть использованы для того, чтобы облегчить технику исчисления средней арифметической.

Например. Можно из всех значений признака вычесть произвольную постоянную величину (лучше значение серединной варианты или варианты с наибольшей частотой), полученные разности сократить на общий множитель (лучше на величину интервала), а частоты выразить частостями (в процентах) и исчисленную среднюю умножить на общий множитель и прибавить произвольную постоянную величину. Иногда этот способ расчета средней арифметической также называется способом расчета от условного нуля. Широкое применение для обработки статистических материалов современных ЭВМ сужает необходимость исчисления средних по упрощенным схемам.

Источник

Расчет средней величины в интервальном вариационном ряду

Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот ЗДЕСЬ. Такое различие вполне объяснимо – это связано с особенностью интервальных рядов, в которых изучаемый признак приведен в интервале от и до.

Итак, посмотрим особенности расчета на примере.

Пример 1. Имеются данные о дневном заработке рабочих предприятия.

Дневной заработок рабочего, руб. Число рабочих, чел.
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Нам необходимо рассчитать среднедневную заработную плату рабочего.

Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть в этой статье.

Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.

Дневной заработок рабочего, руб. х Число рабочих, чел. f
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.

Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.

Проведем необходимые расчеты и подставим данные в таблицу.

И так далее по всем интервалам рассчитываем центральное значение. В итоге получаем следующие результаты.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’
500-1000 15 750
1000-1500 30 1250
1500-2000 80 1750
2000-2500 60 2250
2500-3000 25 2750
Итого 210

После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.

Читайте также:  Плоский эпителий с признаками дискератоза
Дневной заработок рабочего, руб. х Число рабочих, чел. f х’ x’f
500-1000 15 750 11250
1000-1500 30 1250 37500
1500-2000 80 1750 140000
2000-2500 60 2250 135000
2500-3000 25 2750 68750
Итого ∑f = 210 ∑ x’f = 392500

В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.

Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.

Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.

Длительность производственного стажа, лет Число сотрудников, человек
до 3 19
3-6 21
6-9 15
9-12 10
12 и более 5
Итого 70

В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.

Поступить в этой ситуации можно двумя способами:

Средняя продолжительность стажа 5,83 года.

Средняя продолжительность стажа 6,13 года.

Домашнее задание

Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!

Источник

ХАРАКТЕРИСТИКИ ЦЕНТРАЛЬНОЙ ТЕНДЕНЦИИ РАСПРЕДЕЛЕНИЯ

К показателям центра распределенияотносятся:среднее значение признака в совокупности, мода и медиана. Все показатели центра распределения характеризуют центральную тенденцию в изучаемом распределении, т.е. отражают характерный (типичный) уровень признака в конкретной совокупности, однако каждый из показателей несет и свою особую аналитическую информацию.

В качестве весов в формуле средней арифметической взвешенноймогут быть использованы как частоты, так и частости. Если средняя величина рассчитывается по интервальному вариационному ряду, то в качестве индивидуальных значений признака принимаются значения, соответствующие середине каждого интервала. Предполагается, что внутри групп присутствует равномерное распределение единиц.

На основе данных таблицы 2.7 рассчитаем среднее значение денежных доходов населения регионов России:

Мода (M) – наиболее часто встречающееся значение признака в совокупности. По интервальному вариационному ряду мода находится расчетным путем. Для нахождения значения моды сначала определяется модальный интервал. Модальным считается интервал, которому соответствует максимальная частота(в таблице 2.7. – это второй интервал с частотой 33). Затем,по приведенной ниже формуле, рассчитывается значение моды:

, (2.1)

где — нижняя граница модального интервала; h – величина группировочного интервала; — частота модального интервала; — частота интервалов, предшествующего и следующего за модальным.

Приведем расчет значения моды по данным таблицы распределения 2.7.

Таким образом, для значительного числа регионов России в 2013 году характерный (типический) уровень СДДД населения был близок к 20174 рублей на человека.

, (2.2)

Далее представим значения характеристик центральной тенденции распределения регионов России по величине СДДН, полученные в программе STATISTICA, см. таблицу 2.8. Следует обратить внимание на закономерное расхождение значений показателей, рассчитанных с использованием программы и на основе построенной таблицы распределения. Несовпадение обусловлено тем, что в программе вычисления проводятся по не сгруппированным данным, а формулы применялись к сгруппированным данным (к интервальному вариационному ряду).

Ответ на вопрос, какой характеристики центра распределения отдать предпочтение в рамках конкретного практического исследования, зависит от типа показателя, по которому построен ряд распределения, а также от цели исследования. Если показатель количественный, то могут быть рассчитаны все характеристики центра распределения: и средняя величина, и мода, и медиана. Тогда выбор предпочтения зависит от цели исследования и характера изучаемого распределения. Если распределение соответствует нормальному (симметричному), то целесообразно ориентироваться на среднее значения признака в совокупности. Приоритет средней величины обусловлен тем, что при ее расчете, в отличие от моды и медианы, учитываются значения показателя всех единиц совокупности. Если в распределении наблюдается существенная асимметрия, то предпочтение следует отдать моде или медиане, исходя из целей анализа.

Читайте также:  Гипоксия плода при беременности признаки симптомы ощущения женщины

При изучении распределений по атрибутивным признакам (форма собственности, организационно-правовая форма, уровень образования, национальность, и т.п.) средняя величина не может быть рассчитана. Медиана может быть определена только для ряда, построенного по порядковому атрибутивному признаку, т.е. поддающемуся ранжированию, например: уровень образования, должность. Если признаки измерены по номинальной шкале, то может быть определен только показатель моды: распределение населения города по национальности, распределение организаций по формам собственности (см. таблицу 2.9) и т.п.

Форма собственности 2005 г. 2012 г.
Всего,в т.ч.
государственная 2,2 1,5
муниципальная 0,2 0,1
общественных и религиозных организаций 3,4 1,6
частная 88,2 91,9
смешанная российская 1,6 0,5
иностранных юридических лиц и иностранных граждан 1,9 2,6
совместная российская и иностранная 2,4 1,7
прочие 0,1 0,1

Показатели структуры распределения: медиана, квартили, децили и прочие перцентили (процентили).

Для более детального анализа структуры распределения используются такие показатели, как квартили, делящие ранжированный ряд на четыре равные части, децили – на 10 равных частей. Возможность и необходимость расчета тех или иных показателей определяется размером изучаемой совокупности и целью исследования. Чем больше объем совокупности, тем более детально, с разбивкой на большее число частей можно изучать структуру распределения.

По интервальному вариационному ряду квартили рассчитываются по формулам, аналогичным формуле расчета медианы. Для расчета первого квартиля находят квартильный интервал (первый интервал, в который попадает 25% единиц совокупности), и значение первого квартиля рассчитывается по следующей формуле:

, (2.3)

где — значение нижней границы квартильного интервала; — частоты квартильного интервала и предшествующего ему.

Значение третьего квартиля находится в интервале, в который попадает 75% единиц совокупности, и его величина рассчитывается:

. (2.4)

где — значение нижней границы квартильного интервала; — частоты квартильного интервала и предшествующего ему.

Значения показателей структуры для анализируемого распределения представлены в таблице 2.10.

Рассмотрим содержательную интерпретацию этих характеристик. Как было сказано выше, средняя величина СДДН в регионах России в 2013 году составляла 21934 руб./чел., однако значение медианы указывает на то, что в 50 процентах всех регионов уровень показателя был ниже 20430 руб./чел. В 25 процентах регионов величина СДДН не превышала 18123 руб./чел., но при этом в ряде регионов, доля которых составляет так же 25 процентов, СДДН были выше 24343 руб./чел. В 50 процентах регионов России, находящихся в центре распределения, максимальный уровень денежных доходов населения превышал минимальный на 6220 руб./чел. Этот показатель характеризует размах вариации доходов, но не во всей совокупности регионов, а в центральной части распределения. Чтобы повысить информативность данныхпоказателей, их можно сравнивать с аналогичными характеристиками распределений за предыдущие годы или с данными по другим странам, предварительно приведя показатели к сопоставимому виду.

Источник

Adblock
detector