Виды степенной средней в статистике. Средние величины и вариация

Наиболее распространенной формой статистических показателей, используемой в экономических исследованиях, является средняя величина , представляющая собой обобщенную количественную характеристику признака в статистической совокупности в конкретных условиях места и времени.

Важнейшее свойство средней величины заключается в том, что она отражает то общее, что присуще всем единицам исследуемой совокупности, ведь значения признака отдельных единиц совокупности колеблются в ту или иную сторону под влиянием множества факторов, среди которых могут быть и случайные.

Приведем примеры экономических показателей, основанных на вычислении средней величины и раскрывающих ее сущность:

  • расчет средней заработной платы работников предприятия осуществляется делением общего фонда заработной платы на число работников;
  • средний размер вклада в банке находят делением суммы вкладов в денежном выражении на количество вкладов;
  • для определения средней дневной выработки одного работника необходимо объем работ (количество деталей), выполненных работником за определенный период разделить на число дней в этом периоде.

Виды средних величин, используемых в статистике

Рассмотрим основные виды средних величин, используемых при решении социально-эконмических и аналитических задач.

Средняя арифметическая простая вычисляется по формуле:

При расчете средних величин отдельные значения осредняемого признака могут повторяться, встречаться по несколько раз. В подобных случаях расчет средней производится по сгруппированным данным или вариационным рядам. Пример применения формулы средней арифметической взвешенной представлен в задаче 2.

Средняя гармоническая простая определяется по формуле:

Средние гармонические используются тогда, когда по экономическому содержанию имеется информация для числителя, а для знаменателя ее необходимо предварительно определить.

Средняя гармоническая взвешенная определяется по формуле:

Данная формула используется для расчета средних показателей не только в статике, но и в динамике, когда известны индивидуальные значения признака и веса W за ряд временных интервалов. Пример применения формулы средней гармонической взвешенной представлен в задаче 3.

Средняя геометрическая простая (невзвешенная) опеределяется по формуле:

Наиболее широкое применение этот вид средней получил в анализе динамики для определения среднего темпа роста.

Средняя квадратическая простая (невзвешенная) опеределяется по формуле:

Средняя квадратическая лежит в основе вычислений ряда сводных расчетных показателей.

Наиболее часто используемыми в экономической практике структурными средними являются мода и медиана. Мода (Мо) представляет собой значение изучаемого признака, повторяющееся с наибольшей частотой. Медианой (Ме) называется значение признака, приходящееся на середину ранжированной (упорядоченной) совокупности. Пример определения медианы и моды для дискретного ряда чисел представлен в задаче 1.

Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины.

Для интервального ряда расчет моды осуществляется по формуле:

где Хо - нижняя граница модального интервала (модальным называется интервал, имеющий наибольшую частоту); i - величина модального интервала; f Мо - частота модального интервала; f Мо-1 - частота интервала, предшествующего модальному; f Мо+1 - частота интервала, следующего за модальным.

Для интервального ряда расчет медианы осуществляется по формуле:

Хо - нижняя граница медианного интервала (медианным называется первый интервал, накопленная частота которого превышает половину общей суммы частот); i - величина медианного интервала; Sme-1 - накопленная частота интервала, предшествующего медианному; f Me - частота медианного интервала.

Примеры решения задач по теме «Средние величины в статистике»

Задача 1 . Дан ряд чисел: 15; 15; 12; 14; 13. Найдите размах, среднее арифметическое, медиану и моду этого ряда.

Решение

1) Размах ряда чисел – это разность между наибольшим и наименьшим из этих чисел. В данном случае размах равен R = 15-12 = 3

2) Среднее арифметическое данного ряда находим по формуле средней арифметической простой. Хср = (15+15+12+14+13)/5=13,8

3) Для определения медианы необходимо предложенный ряд упорядочить – расположить числа, например, в порядке возрастания: 12; 13; 14; 15; 15.
Медиана нечетного количества чисел в дискретном ряде – это число, записанное посередине. Медиана четного количества чисел – это среднее арифметическое двух чисел, находящихся посередине.
Поскольку в нашем случае количество чисел ряда нечетноне, то Ме = 14.

4) Мода дискретного ряда чисел – это число, которое встречается в данном ряде чаще других. Так как число 15 встречается в нашем ряде чаще других, то Мо = 15.

Задача 2 . Имеется информация о численности студентов ВУЗов города и удельном весе (%) обучающихся студентов на коммерческой основе:

Определить: 1) средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе; 2) число этих студентов.

Решение

Для решения расширим предложенную таблицу:

Средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе определим по формуле средней арифметической взвешенной: Хср = (15×15+3×10+7×20) / (15+3+7) = 15,8%.

Ответ . Средний удельный вес студентов ВУЗов, обучающихся на коммерческой основе равен 15,8%, число этих студентов – 3 950 человек.

Задача 3 . Сумма невыплаченной своевременно задолженности по кредитам на 1 июля составила 92,4 млн. денежных единиц. По отдельным отраслям экономики она распределялась следующим образом:

Определить средний процент невыплаченной своевременно задолженности. Обоснуйте выбор формы средней.

Решение

Поскольку на различных предприятиях сумма задолженности по кредитам разная при разных удельных весах, то применим формулу средней гармонической взвешенной.
Хср = ΣW / Σ(W/х) = (32+14+46,4)/(32/20+14/28+46,4/16) = 92,4/5 = 18,48 %.

Ответ . Средний процент невыплаченной своевременно задолженности равен 18,48%.

Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.

Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.

Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.

Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.

При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.

Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.

Средняя выработка отражает общее свойство всей совокупности.

Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.

Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.

Существуют различные средние:

    средняя арифметическая;

    средняя геометрическая;

    средняя гармоническая;

    средняя квадратическая;

    средняя хронологическая.

Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.

Средняя арифметическая

Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.

Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через. Следовательно, средняя арифметическая простая равна:

По данным дискретного ряда распределения видно, что одни и те же значения признака (варианты) повторяются несколько раз. Так, варианта х встречается в совокупности 2 раза, а варианта х-16 раз и т.д.

Число одинаковых значений признака в рядах распределения называется частотой или весом и обозначается символом n.

Вычислим среднюю заработную плату одного рабочего в руб.:

Фонд заработной платы по каждой группе рабочих равен произведению варианты на частоту, а сумма этих произведений дает общий фонд заработной платы всех рабочих.

В соответствии с этим, расчеты можно представить в общем виде:

Полученная формула называется средней арифметической взвешенной.

Статистический материал в результате обработки может быть представлен не только в виде дискретных рядов распределения, но и в виде интервальных вариационных рядов с закрытыми или открытыми интервалами.

Исчисление средней по сгруппированным данным производится по формуле средней арифметической взвешенной:

В практике экономической статистики иногда приходится исчислять среднюю по групповым средним или по средним отдельных частей совокупности (частным средним). В таких случаях за варианты (х) принимаются групповые или частные средние, на основании которых исчисляется общая средняя как обычная средняя арифметическая взвешенная.

Основные свойства средней арифметической .

Средняя арифметическая обладает рядом свойств:

1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.

Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.

2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:

3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:

4. Если х = с, где с - постоянная величина, то
.

5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:

Средняя гармоническая.

Наряду со средней арифметической, в статистике применяется средняя гармоническая величина, обратная средней арифметической из обратных значений признака. Как и средняя арифметическая, она может быть простой и взвешенной.

Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.

Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.

Для интервальных рядов распределения с равными интервалами мода определяется по формуле:

где
- начальное значение интервала, содержащего моду;

- величина модального интервала;

- частота модального интервала;

- частота интервала, предшествующего модальному;

- частота интервала, следующего за модальным.

Медиана - это варианта, расположенная в середине вариационного ряда. Если ряд распределения дискретный и имеет нечетное число членов, то медианой будет варианта, находящаяся в середине упорядоченного ряда (упорядоченный ряд - это расположение единиц совокупности в возрастающем или убывающем порядке).

Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Например, средний возраст лиц, осужденных за кражу.

В судебной статистике средние величины используют для характеристики:

Средних сроков рассмотрения дел данной категории;

Среднего размера иска;

Среднего числа ответчиков, приходящихся на одно дело;

Среднего размера ущерба;

Средней нагрузки судей, и др.

Средняя всегда величина именованная и имеет ту же размерность, что и признак у отдельной единицы совокупности. Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному варьирующему признаку, поэтому за всякой средней скрывается ряд распределения единиц этой совокупности по изучаемому признаку. Выбор вида средней определяется содержанием показателя и исходных данных для расчета средней величины.

Все виды средних величин, используемые в статистических исследованиях, подразделяются на две категории:

1) степенные средние;

2) структурные средние.

Первая категория средних величин включает: среднюю арифметическую, среднюю гармоническую, среднюю геометрическую и среднюю квадратическую . Вторая категория - это мода и медиана . При этом каждый из перечисленных видов степенных средних величин может иметь две формы: простую и взвешенную . Простая форма средней величины используется для получения среднего значения изучаемого признака, когда расчет осуществляется по несгруппированным статистическим данным, либо когда каждая варианта в совокупности встречается только один раз. Взвешенными средними называют величины, которые учитывают, что варианты значений признака могут иметь различную численность, в связи, с чем каждый вариант приходится умножать на соответствующую частоту. Иными словами, каждый вариант «взвешивают» по своей частоте. Частоту называют статистическим весом.

Средняя арифметическая простая - самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а N - число единиц совокупности.

Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:

где x i - значение i -й варианты признака; f i - частота i -й варианты.

Таким образом, каждое значение варианты взвешивается по своей частоте, поэтому частоты иногда называют статистическими весами.


Замечание. Когда речь идет о средней арифметической величине без указания ее вида, подразумевается средняя арифметическая простая.

Таблица 12.

Решение. Для расчета используем формулу средней арифметической взвешенной:

Таким образом, в среднем на одно уголовное дело приходится два обвиняемых.

Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х" i , после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, в которую вместо x i подставляют х" i .

Пример. Данные о возрасте преступников, осужденных за совершение кражи, представлены в таблице:

Таблица 13.

Определить средний возраст преступников, осужденных за совершение кражи.

Решение. Для того, чтобы определить средний возраст преступников на основе интервального вариационного ряда необходимо сначала найти серединные значения интервалов. Так как дан интервальный ряд с открытыми первым и последним интервалами, то величины этих интервалов принимаются равными величинам смежных закрытых интервалов. В нашем случае величина первого и последнего интервалов равны 10.

Теперь находим средний возраст преступников по формуле средней арифметической взвешенной:

Таким образом, средний возраст преступников, осужденных за совершение кражи, приближенно равен 27 лет.

Средняя гармоническая простая представляет собой величину, обратную средней арифметической из обратных значений признака:

где 1/x i - обратные значения вариантов, а N - число единиц совокупности.

Пример. Для определения средней годовой нагрузки на судей районного суда при рассмотрении уголовных дел провели обследование нагрузки 5 судей этого суда. Средние затраты времени на одно уголовное дело для каждого из обследованных судей оказались равными (в днях): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Найти средние затраты на одно уголовное дело и среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел.

Решение. Для определения средних затрат времени на одно уголовное дело, воспользуемся формулой средней гармонической простой:

Для упрощения расчетов в примере возьмем число дней в году равным 365, включая выходные (это не влияет на методику расчета, а при вычислении аналогичного показателя на практике необходимо вместо 365 дней подставить количество рабочих дней в конкретном году). Тогда средняя годовая нагрузка на судей данного районного суда при рассмотрении уголовных дел составит: 365(дней) : 5,56 ≈ 65,6 (дел).

Если бы мы для определения средних затрат времени на одно уголовное дело, воспользовались формулой средней арифметической простой, то получили бы:

365 (дней) : 5,64 ≈ 64,7 (дела), т.е. средняя нагрузка на судей оказалась меньше.

Проверим обоснованность такого подхода. Для этого воспользуемся данными о затратах времени на одно уголовное дело для каждого судьи и рассчитаем число уголовных, рассмотренных каждым из них за год.

Получим соответственно :

365(дней) : 6 ≈ 61 (дело), 365(дней) : 5,6 ≈ 65,2 (дел), 365(дней) : 6,3 ≈ 58 (дел),

365(дней) : 4,9 ≈ 74,5 (дела), 365(дней) : 5,4 ≈ 68 (дел).

Теперь вычислим среднюю годовую нагрузку на судей данного районного суда при рассмотрении уголовных дел:

Т.е. средняя годовая нагрузка такая же, как и при использовании средней гармонической.

Таким образом, использование средней арифметической в данном случае неправомерно.

В тех случаях, когда известны варианты признака, их объемные значения (произведение варианты на частоту), но неизвестны сами частоты, применяется формула средней гармонической взвешенной:

где x i - значения вариантов признака, а w i - объемные значения вариантов (w i = x i · f i ).

Пример. Данные о цене единицы однотипного товара, произведенного различными учреждениями уголовно-исполнительной системы, и об объемах его реализации приведены в таблице 14.

Таблица 14

Найти среднюю цену реализации товара.

Решение. При расчете средней цены мы должны пользоваться отношением суммы реализации к количеству реализованных единиц. Нам неизвестно количество реализованных единиц, но известны суммы реализаций товаров. Поэтому для нахождения средней цены реализованных товаров воспользуемся формулой средней гармонической взвешенной. Получаем

Если здесь использовать формулу средней арифметической, то можно получить среднюю цену, которая будет нереальна:

Средняя геометрическая вычисляется извлечением корня степени N из произведения всех значений вариантов признака:

где x 1 ,x 2 , … ,x N - индивидуальные значения варьирующего признака (варианты), а

N - число единиц совокупности.

Этот вид средней используется для вычисления средних показателей роста рядов динамики.

Средняя квадратическая применяется для расчета среднеквадратического отклонения, являющегося показателем вариации, и будет рассмотрена ниже.

Для определения структуры совокупности используют особые средние показатели, к которым относятся медиана и мода , или так называемые структурные средние. Если средняя арифметическая рассчитывается на основе использования всех вариантов значений признака, то медиана и мода характеризуют величину того варианта, который занимает определенное среднее положение в ранжированном (упорядоченном) ряду. Упорядочение единиц статистической совокупности может быть проведено по возрастанию или убыванию вариантов изучаемого признака.

Медиана (Ме) - это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Таким образом, медиана - это тот вариант ранжированного ряда, по обе стороны от которого в данном ряду должно находиться равное число единиц совокупности.

Для нахождения медианы сначала необходимо определить ее порядковый номер в ранжированном ряду по формуле:

где N - объем ряда (число единиц совокупности).

Если ряд состоит из нечетного числа членов, то медиана равна варианте с номером N Me . Если же ряд состоит из четного числа членов, то медиана определяется как среднее арифметическое двух смежных вариант, расположенных в середине.

Пример. Дан ранжированный ряд 1, 2, 3, 3, 6, 7, 9, 9, 10. Объем ряда N = 9, значит N Me = (9 + 1) / 2 = 5. Следовательно, Ме = 6, т.е. пятой варианте. Если дан ряд 1, 5, 7, 9, 11, 14, 15, 16, т.е. ряд с четным числом членов (N = 8), то N Me = (8 + 1) / 2 = 4,5. Значит медиана равна полусумме четвертой и пятой вариант, т.е. Ме = (9 + 11) / 2 = 10.

В дискретном вариационном ряду медиану определяют по накопленным частотам. Частоты вариант, начиная с первой, суммируются до тех пор, пока не будет превзойден номер медианы. Значение последней просуммированной варианты и будет медианой.

Пример. Найти медиану числа обвиняемых, приходящихся на одно уголовное дело, используя данные таблицы 12.

Решение. В данном случае объем вариационного ряда N = 154, следовательно, N Me = (154 + 1) / 2 = 77,5. Просуммировав частоты первой и второй варианты, получим: 75 + 43 = 118, т.е. мы превзошли номер медианы. Значит Ме = 2.

В интервальном вариационном ряду распределения сначала указывают интервал, в котором будет находиться медиана. Его называют медианным . Это первый интервал, накопленная частота которого превышает половину объема интервального вариационного ряда. Затем численное значение медианы определяется по формуле:

где x Ме - нижняя граница медианного интервала; i - величина медианного интервала; S Ме-1 - накопленная частота интервала, который предшествует медианному; f Ме - частота медианного интервала.

Пример. Найти медиану возраста преступников, осужденных за совершение кражи, на основе статистических данных, представленных в таблице 13.

Решение. Статистические данные представлены интервальным вариационным рядом, значит сначала определим медианный интервал. Объем совокупности N = 162, следовательно, медианным интервалом является интервал 18-28, т.к. это первый интервал, накопленная частота которого (15 + 90 = 105) превышает половину объема (162: 2 = 81) интервального вариационного ряда. Теперь численное значение медианы определяем по приведенной выше формуле:

Таким образом, половина осужденных за совершение кражи младше 25 лет.

Модой (Мо) называют значение признака, которое наиболее часто встречается у единиц совокупности. К моде прибегают для выявления величины признака, имеющей наибольшее распространение. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Например, для дискретного ряда, представленного в таблице 3 Мо = 1, так как этому значению варианты соответствует наибольшая частота - 75. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). Затем в пределах этого интервала находят то значение признака, которое может являться модой.

Его значение находят по формуле:

где x Mo - нижняя граница модального интервала; i - величина модального интервала; f Мо - частота модального интервала; f Мо-1 - частота интервала, предшествующего модальному; f Мо+1 - частота интервала, следующего за модальным.

Пример. Найтимодувозраста преступников, осужденных за совершение кражи, данные о которых представлены в таблице 13.

Решение. Наибольшая частота соответствует интервалу 18-28, следовательно, мода должна находиться в этом иртервале. Ее величину определяем по приведенной выше формуле:

Таким образом, наибольшее число преступников, осужденных за совершение кражи, имеет возраст 24 года.

Средняя величина дает обобщающую характеристику всей совокупности изучаемого явления. Однако две совокупности, имеющие одинаковые средние значения, могут значительно отличаться друг от друга по степени колеблемости (вариации) величины изучаемого признака. Например, в одном суде были назначены следующие сроки лишения свободы: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 лет, а в другом - 5, 5, 6, 6, 7, 7, 7, 8, 8, 8 лет. В обоих случаях средняя арифметическая равна 6,7 лет. Однако эти совокупности существенно различаются между собой разбросом индивидуальных значений назначенного срока лишения свободы относительно среднего значения.

И для первого суда, где этот разброс достаточно большой, средняя величина срока лишения свободы плохо отражает всю совокупность. Таким образом, если индивидуальные значения признака мало отличаются друг от друга, то средняя арифметическая будет достаточно показательной характеристикой свойств данной совокупности. В противном случае средняя арифметическая будет ненадежной характеристикой этой совокупности и применение ее на практике малоэффективно. Поэтому необходимо учитывать вариацию значений изучаемого признака.

Вариация - это различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Термин «вариация» имеет латинское происхождение - variatio, что означает различие, изменение, колеблемость. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Для измерения вариации признака применяются различные абсолютные и относительные показатели.

К основным показателям вариации относятся следующие:

1) размах вариации;

2) среднее линейное отклонение;

3) дисперсия;

4) среднее квадратическое отклонение;

5) коэффициент вариации.

Кратко остановимся на каждом из них.

Размах вариации R самый доступный по простоте расчета абсолютный показатель, который определяется как разность между самым большим и самым малым значениями признака у единиц данной совокупности:

Размах вариации (размах колебаний) - важный показатель колеблемости признака, но он дает возможность увидеть только крайние отклонения, что ограничивает область его применения. Для более точной характеристики вариации признака на основе учета его колеблемости используются другие показатели.

Среднее линейное отклонение представляет собой среднее арифметическое из абсолютных значений отклонений индивидуальных значений признака от средней и определяется по формулам:

1) для несгруппированных данных

2) для вариационного ряда

Однако наиболее широко применяемым показателем вариации является дисперсия . Она характеризует меру разброса значений изучаемого признака относительно его среднего значения. Дисперсия определяется как средняя из отклонений, возведенных в квадрат.

Простая дисперсия для не сгруппированных данных:

Взвешенная дисперсия для вариационного ряда:

Замечание. На практике для вычисления дисперсии лучше использовать следующие формулы:

Для простой дисперсии

Для взвешенной дисперсии

Среднее квадратическое отклонение - это корень квадратный из дисперсии:

Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем, однороднее совокупность и тем лучше средняя арифметическая отражает собой всю совокупность.

Рассмотренные выше меры рессеяния (размах вариации, дисперсия, среднее квадратическое отклонение) являются абсолютными показателями, судить по которым о степени колеблемости признака не всегда возможно. В некоторых задачах необходимо использовать относительные показатели рассеяния, одним из которых является коэффициент вариации.

Коэффициент вариации - выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:

Коэффициент вариации используют не только для сравнительной оценки вариации разных признаков или одного и того же признака в различных совокупностях, но и для характеристики однородности совокупности. Статистическая совокупность считается количественно однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному распределению).

Пример. Имеются следующие данныео сроках лишения свободы 50 осужденных, доставленных для отбывания назначенного судом наказания в исправительное учреждение уголовно-исполнительной системы: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2, 5, 6, 4, 3, 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6, 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Построить ряд распределения по срокам лишения свободы.

2. Найти среднее значение, дисперсию и среднее квадратическое отклонение.

3. Вычислить коэффициент вариации и сделать заключение об однородности или неоднородности изучаемой совокупности.

Решение. Для построения дискретного ряда распределения необходимо определить варианты и частоты. Варианта в данной задаче - это срок лишения свободы, а частоты - численность отдельных вариант. Рассчитав частоты, получим следующий дискретный ряд распределения:

Найдем среднее значение и дисперсию. Поскольку статистические данные представлены дискретным вариационным рядом, то для их вычисления будем использовать формулы среднего арифметического взвешенного и дисперсии. Получим:

Теперь вычисляем среднее квадратическое отклонение:

Находим коэффициент вариации:

Следовательно, статистическая совокупность количественно неоднородна.

Загрузка...
Top