Тема 9 Показатели вариации
Показатели вариации в анализе взаимосвязей
Для измерения степени колеблемости отдельных значений признака относительно средней исчисляют основные показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для полного анализа изучаемого процесса или явления. Иногда совершенно непохожие по своему внутреннему строению совокупности могут иметь равные средние величины. Поэтому для более детального изучения того или иного явления необходимо учитывать разброс или вариацию значений отдельных единиц совокупности. Измерение вариации признаков имеет как теоретическое, так и практическое значение.
Так, например, для выявления наиболее стабильно работающего коллектива или предприятия наравне с другими показателями рассчитывают и основные показатели вариации. Эти показатели дают возможность количественно определить размеры устойчивости производительности труда, уровня квалификации, цен на основные виды выпускаемой продукции и т.п. Измерение размеров вариации такого показателя, как «выполнение работ в срок» имеет важное значение для принятия решений заказчиками и инвесторами, т.к. ситуация, в которой присутствует изменчивость признака, часто содержит риск. Особое значение показатели вариации приобретают в анализе рынка ценных бумаг, где мера колеблемости отождествляется с мерой рискованности вложения денежных средств.
Основными показателями, характеризующими вариацию, являются:
1) Размах вариации
2) Среднее линейное отклонение исчисляют для того, чтобы дать обобщающую характеристику распределению отклонений:
где –
3. Дисперсия – это средняя арифметическая квадратов отклонений отдельных значений признака от их средней арифметической:
4. Среднее квадратическое отклонение – корень квадратный из дисперсии:
5. Коэффициент вариации – используется для сравнительной оценки вариации, а также для характеристики однородности совокупности:
Пример. Для иллюстрации расчетов воспользуемся данными нижеприведенной табл. 9.1:
Таблица 9.1 ‑ Данные о продаже основных марок холодильников:
Рассчитаем размах вариации.
R= 1200-460=740$
Пример вычисления размаха вариации
Размах вариации служит незаменимой мерой разброса экстремальных значений признака. Кроме характеристики границ разброса признака, размах вариации может быть использован для выявления ошибок. При наличии очень больших (или очень малых) ошибочно записанных значений признака размах вариации сразу резко возрастает, что требует проверки и корректировки исходных данных.
Недостатком данного показателя является то, что он оценивает только границы варьирующего признака и не отражает его колеблемость внутри этих границ. Вследствие этого размах вариации может неправильно характеризовать общую колеблемость признака.
Этого недостатка лишен другой показатель – дисперсия, рассчитываемый как средний квадрат отклонений значений признака от их средней величины.
Между индивидуальными отклонениями от средней и колеблемостью признака существует прямая зависимость: чем сильнее колеблемость признака, тем больше отклонения его значений от средней величины и менее устойчив изучаемый показатель.
Как и средняя величина этот показатель может быть рассчитан в двух формах: взвешенной и невзвешенной
По приведенным выше данным определим средневзвешенную цену холодильника:
Далее рассчитаем дисперсию:
. Следует отметить, что дисперсия еще не дает представления об однородности совокупности, и этому показателю трудно дать экономическую интерпретацию, т.к. он рассчитан в квадратных единицах. Поэтому следующим шагом в исследовании однородности совокупности является расчет среднего квадратического отклонения, показывающего, насколько в среднем отклоняются конкретные варианты признака от его среднего значения. Оно определяется как квадратный корень из дисперсии и имеет ту же размерность что и изучаемый признак. .
Рассчитаем среднее квадратическое отклонение
Рассмотренные показатели позволяют получить абсолютное значение вариации признака. Однако для сравнения разных совокупностей с точки зрения устойчивости какого-либо одного признака или для определения однородности совокупности рассчитывают относительные показатели.
Эти показатели вычисляются как отношение размаха вариации, среднего линейного отклонения или среднего квадратического отклонения к средней арифметической или медиане. Чаще всего эти показатели выражаются в процентах.
Определим значение показателя вариации по вышеприведенным данным таблицы
Совокупность считается однородной, если V не превышает 33%.
Если V 25% – вариация сильная.
Вывод: Рассчитанная величина свидетельствует о неоднородности цен на холодильники, т.к. однородной совокупность считается, если коэффициент вариации меньше 33% (для распределений близких к нормальному).
!! Следует отметить, что коэффициент вариации может быть более 100%, что, в частности, может быть при наличии значений сильно отличающихся от средней величины. Такой результат означает, что в исследуемой совокупности сильна вариация признаков по отношению к средней величине.
Изучая вариацию интересующего нас признака в пределах исследуемой совокупности и опираясь на общую среднюю в расчетах, трудно оценить степень воздействия на него какого-либо отдельного признака.
При проведении такого анализа исходная совокупность должна представлять собой множество единиц, каждая из которых характеризуется двумя признаками – факторным (оказывающим влияние на взаимосвязанный с ним признак) и результативным (подверженным влиянию).
Для выявления взаимосвязи исходная совокупность делится по факторному признаку на группы. Выводы о степени взаимосвязи базируются на анализе вариации результативного признака. Если статистическая совокупность разбита на группы по какому-либо признаку, то для оценки влияния различных факторов, определяющих вариацию индивидуальных значений признака, используют правило сложения дисперсий.
Общая дисперсия представляет собой сумму средней из виутригрупповой и межгрупповой и дисперсий:
Общая дисперсия характеризует вариацию признака по всей совокупности как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
Межгрупповая дисперсия характеризует вариацию, обусловленную влиянием фактора, положенного в основу группировки.
Средняя из внутригрупповых дисперсий отражает ту часть вариации результативного признака, которая обусловлена действием всех прочих неучтенных факторов, кроме фактора, по которому осуществлялась группировка. Другими словами внутригрупповая дисперсия отражает случайную вариацию. Внутригрупповая дисперсия рассчитывается отдельно по каждой j-ой группе.
Для всех групп в целом вычисляется средняя из внутригрупповых дисперсий, взвешенных на частоты соответствующих групп по формуле:
Взаимосвязь между тремя видами дисперсий получила название правила сложения дисперсий. Таким образом, зная два вида дисперсий всегда можно определить третий:
Из этого равенства следует, что общая дисперсия, как правило, будет больше средней из групповых дисперсий. Это обусловлено тем, что при расчленении общей совокупности единиц на части по какому-либо признаку образуются более или менее однородные группы, в результате чего сокращается колеблемость признаков в пределах каждой группы. Это приводит к тому, что средняя из групповых дисперсий оказывается меньше дисперсии признака по всей совокупности единиц, причем разница между этими показателями будет тем больше, чем однороднее получаются группы в результате расчленения общей совокупности.
Теснота связи между факторным и результативным признаками оценивается на основе эмпирического корреляционного отношения:
Данный показатель может принимать значения от 0 до 1. Чем ближе к 1 будет его величина, тем сильнее взаимосвязь между рассматриваемыми признаками.
Пример. На следующем условном примере исследуем зависимость объема выполненных работ от формы собственности проектно-изыскательских организаций.
Таблица 9.2. Выполнение работ проектно-изыскательскими организациями разной формы собственности
| Форма собственности | Количество предприятий | Итого | |
| Государственная | 4 | 10,30,20,40 | 100 |
| Негосударственная | 6 | 20, 40, 60, 20, 50, 50 | 240 |
| Итого | 10 | 340 |
1) Определим средний объем работ для предприятий двух форм собственности.
2) Определим средний объем работ для каждой формы собственности.
3) Рассчитаем общую и внутригрупповые (т.е. для каждой группы) дисперсии.
4) Определим среднюю из внутригрупповых и межгрупповую дисперсию. Для этого полученные ранее данные заносятся в таблицу расчета.
Таблица 9.3. – Вспомогательная таблица
Пример. Средняя из внутригрупповых дисперсий
Пример. Межгрупповая дисперсия
На последнем этапе решения задачи необходимо проверить тождество, отражающее закон сложения дисперсий:
Проверка закона сложения дисперсий: 54,0+189,8=243,8
Вывод: Таким образом, можно сделать вывод о том, что объем работ, выполненных проектно-изыскательскими организациями на 22% [(54,0/243,8) х 100%] зависит от фактора, положенного в основание группировки, т.е. от формы собственности, а на 78% [(189,8/243,8)х100%)] ‑ от прочих факторов.
Вывод о том, что объем выполненных работ в гораздо большей степени зависит от каких-либо других факторов, чем от формы собственности предприятий подтверждается и величиной эмпирического корреляционного отношения:
Вывод: Величина этого показателя свидетельствует о том, что зависимость объема работ от формы собственности предприятия невелика
Контрольные задания
Вычислить: а) размах вариации; б)среднее линейное отклонение; в) дисперсию; г) среднее квадратическое отклонение; относительные показатели вариации возраста студентов.
2. По данным статистических ежегодников постройте таблицу с рядом показателей и определите показатели вариации: а) размах; б) среднее линейное отклонение; в) среднее квадратическое отклонение; г) коэффициент вариации. Оцените количественную однородность совокупности.
Показатели вариации
Вариация – это различие в значениях какого – либо признака у разных единиц данной совокупности в один и тот же период или момент времени.
Например работники СХПК различаются по доходам, затратам времени на работу, росту, весу, образованию, профессии и т.д.
Размах вариации R –разность между максимальным и минимальным значениями признака
Однако размах вариации показывает лишь крайние отклонения признака и не отражает отклонений всех вариант в ряду. Для более точного анализа вариации необходимы показатели, которые отражают все колебания варьирующего признака и дают обобщенную характеристику. Простейший из показателей такого типа – среднее линейное отклонение 

Среднее линейное отклонение как меру вариации признака применяют в статистической практике в тех случаях, когда суммирование показателей без учета знаков имеет экономический смысл (например, анализ состава работающих, ритмичность производства, оборот внешней торговли).
Дисперсия 

Дисперсия представляет собой средний квадрат отклонений вариантов от их средней величины.
Среднее квадратическое отклонение 
Чем меньше значение дисперсии и среднего квадратического отклонения, тем качественно однороднее совокупность и тем более типичной будет средняя величина.
Для сравнения вариаций различных признаков, а также колеблемости одного и того же признака в нескольких совокупностях используют относительный показатель вариации – коэффициент вариации V.
Коэффициент вариации характеризует, на сколько процентов в среднем отклоняются индивидуальные показатели от их среднего значения.
Коэффициент вариации используют не только для сравнительной оценки вариации единиц совокупности, но и как характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.
Например, имеются данные о сменной выработке рабочих бригады, которые представлены интервальным рядов распределения:
| Группы рабочих по сменной выработке изделий, шт. | Число рабо- чих f | Середина интервала x | Расчетные значения |
| X f | ![]() | ![]() | ![]() |
| 170-190 | -36 | ||
| 190-210 | -16 | ||
| 210-230 | |||
| 230-250 | |||
| Итого | X | X | X |
Исчислим среднюю выработку на одного работника:


Таким образом, индивидуальные выработки рабочих за смену колеблются вокруг средней выработки в среднем на 216 изделий или 8%. Данная бригада рабочих по выработке достаточно однородна, поскольку вариация признака составляет лишь 8%, что меньше 33%.
Вариация признака обусловлена различными факторами. Определить их влияние на колеблемость индивидуальных значений признака можно при помощи трех видов дисперсий:
1) общей дисперсии
2) межгрупповой дисперсии
3) средней из внутригрупповых дисперсий

Общая дисперсия 

Межгрупповая дисперсия 



Внутригрупповая дисперсия 

На основании внутригрупповых дисперсий вычисляют среднюю из внутригрупповых дисперсий:
Согласно правилу сложения дисперсий общая дисперсия равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий, т.е.
Например, при изучении влияния квалификации (тарифного разряда) рабочих на уровень производительности труда в цехе были получены данные, представленные в таблице:
| NN п/п | Рабочие 4-го разряда | N п/п | Рабочие 5-го разряда | ||
Выработка, шт. ![]() | ![]() | ![]() | Выработка, шт. ![]() | ![]() | ![]() |
| -3 | -1 | ||||
| -1 | -1 | ||||
| -1 | |||||
| -2 | |||||
| Итог | X | X |
Результативный признак – выработка рабочего – варьирует под влиянием факторного признака (квалификации), а также под влиянием других неучтенных случайных факторных признаков. Задача заключается в измерении этих вариаций с помощью дисперсий: общей, межгрупповой и внутригрупповых.
1. Для расчета групповых дисперсий исчислим средние выработки по каждой группе и общую среднюю выработку, шт.:
по первой группе
по второй группе
в целом по десяти рабочим
Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию выработки изделий в среднем рабочими цеха.
3. Исчислим межгрупповую дисперсию
Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп рабочих по квалификационному разряду.
4. Данные для расчета внутригрупповых дисперсий представлены в таблице.
— по первой группе
— по второй группе
Средняя из внутригрупповых дисперсий:

5. Проверим правило сложения дисперсий:
Очевидно, чем больше доля межгрупповой дисперсии в общей, тем сильнее влияние группировочного признака (квалификационного разряда) на результативный признак (количество изделий на рабочего).
Для определения этой доли используется эмпирический коэффициент детерминации


ТЕМА: «ВЫБОРОЧНЫЙ МЕТОД»
Выборочное наблюдение представляет собой такое несплошное наблюдение, при котором отбор подлежащих обследованию единиц осуществляется в случайном порядке, далее отобранная часть изучается, а затем результаты распространяются на всю исходную совокупность. Наблюдение осуществляется таким образом, что эта часть отобранных единиц представляет всю совокупность с достаточной для практике степенью точности.
Совокупность, из которой производится отбор, называется генеральной,и все ее обобщающие показатели – генеральными.
Выборочная совокупность –это совокупность единиц, отобранных из генеральной совокупности. Все ее обобщающие показатели называются выборочными.
Основными причинами, по которым во многих случаях выборочному наблюдению отдается предпочтение перед сплошным, являются:
Преимущество выборочного наблюдения по сравнению со сплошным можно реализовать, если оно организовано и приведено в соответствии с научными принципами теории выборочного метода. Это обеспечение случайности, т. е. равной возможности попадания в выборку единиц генеральной совокупности, и достаточного числа единиц отбора.
Основная задача выборочного наблюдения состоит в том, чтобы на основе характеристик выборочной совокупности (т.е. средней и доли) получить достоверные суждения о показателях средней и доли в генеральной совокупности. При этом следует иметь в виду, что при любых статистических исследованиях (сплошных и выборочных) возникают ошибки.
Ошибки регистрации могут возникать и при сплошных, и при выборочных наблюдениях. Они могут иметь случайный (непреднамеренный) и систематический (преднамеренный) характер.
Ошибки репрезентативности (представительности) присущи только выборочному наблюдению и возникают в силу того, что выборочная совокупность не полностью воспроизводит генеральную. Они представляют собой расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенной с одинаковой степенью точности сплошном наблюдении, т.е. между величинами выборочных и генеральных характеристик.
Ошибки репрезентативности возникают вследствие двух причин:
1) из-за нарушения принципа случайности как основного принципа выборки (систематические ошибки)
2) в результате самого отбора (случайные ошибки)
Систематические ошибки выборки устраняются. Случайные ошибки устранить нельзя, но их рассчитывают и учитывают при переносе выборочных характеристик на генеральную совокупность.
Средняя ошибка выборки представляет собой такое расхождение между средними выборочной и генеральной совокупностей, которое не превышает среднеквадратическое отклонение в выборке.
Предельной ошибкой называется максимальное расхождение средних характеристик выборочной и генеральной совокупностей при заданной вероятности появления этой ошибки.
По методу отбора различают повторную и бесповторную выборки.
При повторной выборке ту или иную единицу, попавшую в выборку, после регистрации снова возвращают в генеральную совокупность, и она сохраняет равную возможность со всеми прочими единицами вновь попасть в выборку.
При бесповторной выборке единица совокупности, попавшая в выборку, в генеральную совокупность не возвращается и в дальнейшем в выборке не участвует.
По степени охвата единиц совокупности различают большие и малые (n




























































