Коэффициент вариации больше 100 процентов. Расчет коэффициента вариации

Относительные показатели вариации - раздел Экономика, Данные о деятельности банков одного из регионов РФ 1. Коэффициент Вариации (Vσ) – Относительный Пока...

Совокупность считается качественно однородной, если коэффициент вариации не превышает 0,33 (или 33%).

Таблица 5.1.3.

Шкала оценки однородности совокупности

При этом средняя величина исследуемого признака может считаться типичной, надёжной характеристикой статистической совокупности.

Если же коэффициент вариации больше 0,33 (или 33%) то, следовательно, вариация исследуемого признака велика , и найденная средняя плохо представляет всю статистическую совокупность, не является её типичной, надёжной характеристикой , а сама совокупность является неоднородной по рассматриваемому признаку.

Аналогично коэффициенту вариации рассчитывают другие относительные показатели вариации , которые в практике статистики применяются реже:

2. Показатель осцилляции: ; (5.1.12.)

3. Линейный коэффициент вариации: . (5.1.13)


Рассчитаем показатели вариации для сквозной задачи:

Таблица 5.1.4.

Расчетная таблица для нахождения характеристик ряда распределения

Группы банков по объему кредитных вложений, млн. руб. X Середина интервала Число банков, Произведение вариантов на частоты
гр.4= гр.2*гр.3 гр.6= гр.5*гр.5 гр.7= гр.6*гр.3
375,00 - 459,00 =417 417*4= 417-585= -168 = 28224*4=
459,00 - 543,00 ? ? ? ?
543,00 - 627,00 ? ? ? ?
627,00 - 711,00 ? ? ? ?
711,00 - 795,00 ? ? ? ?
Итого ? Х х ?

Расчет средней арифметической взвешенной:

Расчет дисперсии:

σ2 =

Расчет среднего квадратического отклонения:


Расчет коэффициента вариации:

Вывод. Анализ полученных значений показателей и σ говорит о том, что средний объем кредитных вложений банков составляет _______?млн. руб., отклонение от среднего объема в ту или иную сторону составляет в среднем _________?млн. руб. (или ______?%), наиболее характерные значения объема кредитных вложений находятся в пределах от ______________?млн. руб. до _______________?млн. руб. (диапазон ).(см. табл. 3.2.5 -_____? банков или ______?% входят в этот интервал).

Значение V σ = ______?% _____? превышает 33%, следовательно, вариация кредитных вложений в исследуемой совокупности банков незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно (=585 млн. руб., Мо=593,40 млн. руб., Ме=588,818 млн. руб.), что подтверждает вывод об однородности совокупности банков. Таким образом, найденное среднее значение объема кредитных вложений банков (585 млн. руб.) ______? является типичной, надежной характеристикой исследуемой совокупности банков.

Конец работы -

Эта тема принадлежит разделу:

Данные о деятельности банков одного из регионов РФ

Данные сквозной задачи.. таблица.. данные о деятельности банков одного из регионов РФ номер банка кредитные вложения млн руб прибыль..

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ:

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет, метод и задачи статистики
1.1. Предмет, методы, задачи статистики Термин «статистика» происходит от латинского «status»,которое вошло в употребление в Германии в середине 18 века. Впервые статистику стал преподават

Отдельные объекты или явления, образующие статистическую совокупность, называются единицами совокупности
Например, при проведении переписи торгового оборудования единицей наблюдения является торговое предприятие, а единицей совокупности - их оборудование (прилавки, холодильные агрегаты и т.д.).

Признак - это характерное свойство изучаемого явления, отличающее его от других явлений
В разных отраслях статистики изучаются разные признаки. Так, например, объектом изучения является предприятие, а его признаками - вид продукции, объем выпуска, численность работающих и т.д. Или объ

Понятие стат. наблюдения. Требования к собираемой информации
Статистическое наблюдение - это начальная стадия экономико-статистического наблюдения. Она представляет собой научно организационную работу по собиранию мас

Основные виды, формы и способы наблюдения
Специально организованное статистическое наблюдение представляет собой сбор сведений посредством переписей, единовременных учётов и обследований. Примером специально организованного статистического

Точность наблюдения и контроль данных наблюдения
Всякое статистическое наблюдение ставит задачу получения таких данных, которые точнее бы отражали действительность. Отклонения, или разности между исчисленными показателями и действительными (истин

Абсолютные и относительные величины
Для характеристики массовых явлений статистика использует статистические величины (показатели). Они подразделяются на абсолютные, относительные и

Каждая выделенная группа характеризуется СРЕДНЕЙ величиной (величинами) результативного признака
Таблица 3.2.3. Аналитическая группировка зависимости кредитных вложений и прибыли банков Номер группы Группы банков по величине кредитных вло

По объему кредитных вложений
Для построения интервального вариационного ряда, характеризующего распределение банков по объему кредитных вложений, необходимо вычислить величину и границы интервалов ряда.

Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку
В зависимости от вида признака, рассматриваемого как группировочный ряды могут быть вариационными (количественными) и атрибутивными (качественными).

Табличное и графическое представление статистических данных
Статистические таблицы – своего рода статистическое предложение, которое состоит из статистического подлежащего и статистического сказуемого. Статистические таблицы - э

Или 15 16 17
4.отсутствие данных может быть обусловлено различными причинами и это по-разному должно отражаться в таблицах: а) если данный признак вообще не подлежит заполнению, то ста

Графическое представление статистических данных
Применение графиков в статистике насчитывает более чем двухсотлетнюю историю. Основоположником графического метода в статистике коммерческой деятельности считают английского экономиста У. Плейфейра

Полигон распределения частот
На основе данных табл. 3.4.3. построим полигон частот Таблица 3.4.3. Распределение размеров обуви у мужчин-респондентов опроса № размера Число

Гистограммы
Для изображения интервального ряда распределения используется гистограмма. При ее построении на оси абсцисс откладываются величины интервалов (

Кумулята
Для изображения рядов распределения используется кумулятивная кривая (кривая сумм). При построении кумуляты интервального вариационного ряда по оси абсцисс откладываются варианты ряда (

Сущность средних величин. Две формы средних величин
Средняя величина – показатель, который дает обобщающую характеристику варьирующего признака однородной совокупности. Свойства средней величины: 1. Средняя характеризует всю совок

Средняя гармоническая
Гармоника – подобие, созвучие, средняя гармоническая близка к средней арифметической величине Средняя гармоническая используется в случаях, когда статистическая информация

Понятие вариации. Основные показатели вариации
Вариация – это различия в индивидуальных значениях признака у единиц изучаемой совокупности. Необходимость изучения вариации связана с тем, что

Прочих, неучтенных факторов
Этот показатель вычисляется по формуле, (5.2.1.) где yi

Объема кредитных вложений (наш факторный признак - х)
Показатель вычисляется по формуле

Прочих, неучтенных факторов
(5.2.9.) Средняя из внутригрупповых дисперсий (

Кривая имеет форму колокола
2. Так как функция нормального распределения – чётная, то есть f(-t)=f(t), то кривая нормального распределения симметрична относительно максимальной ординаты, равной

Следовательно ассиметрия левосторонняя
Наиболее точный коэффициент асимметрии – коэффициент, рассчитанный с использованием центрального момента распределения третьего порядка.

Понятие о выборочном наблюдении и ошибках выборки
Выборочным называется такое несплошное наблюдение, при котором признаки регистрируются у отдельных единиц изучаемой статистической совокупности, отобранных с использ

Средняя и предельная ошибки выборки
Применение выборочного метода наблюдения всегда связано с установлением степени достоверности оценок показателей генеральной совокупности, полученных на основе значений пока

Определение ошибки выборки для среднего объема кредитных вложений банков и границ, в которых будет находиться генеральная средняя
По условию сквозной задачи выборочная совокупность насчитывает 30 банков, выборка 20% механическая, следовательно, генеральная совокупность включает (______?)=________? банков.

Доля единиц выборочной совокупности, обладающих тем или иным заданным свойством, выражается формулой
, (6.3.4.) где m – число единиц совокупности, обладающих з

Определение необходимого объема выборки с заданным значением допустимой предельной ошибки выборки, равной 10 млн. руб
Для собственно-случайной и механической выборки с бесповторным способом отбора необходимый объем выборки для средней количественного признака вычисляется по формуле:

Понятие о корреляционной связи. Виды и формы корреляционных связей
Среди многих форм связей, имеющих количественный характер и изучаемых количественными методами, особое место занимают факторные связи, для исследований которых применяются методы кор

Функциональные связи
Связь результативного признака Y с факторным признаком X называется функциональной, если каждому возможному значению xi признака X

Если в модели учитывается зависимость признака Y от ряда факторов, то модель имеет вид
(7.1.5.) Характерной особенностью стохастических связей является

Визуально можно предположить существование корреляционной связи
3. Корреляционная таблица представляет собой комбинацию двух рядов распределения. Строки таблицы соответствуют группировке единиц совокупности по факторному признаку

Метод аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегруп

Регрессионный метод анализа взаимосвязи
Линию, сглаживающую эмпирическую ломаную линию связи, называют теоретической линией регрессии Y на X или просто линией регрессии. Эта линия от

Способ выражения уровней ряда
Таблица 8.1.2 Число квартир, построенных предприятиями и организациями всех форм собственности и их средний размер в РФ Показатели

Средние показатели в рядах динамики
В табл. 8.2.1. представлены данные, характеризующие динамику изменения уровней ряда за отдельные периоды времени. Для обобщающей оценки изменений уровней ряда за весь рассматриваемый период времени

Прогнозирование объемов реализации продукции с использованием среднего темпа роста
Прогнозирование уровня ряда динамики с использованием среднего темпа (коэффициента) роста осуществляется по следующей формуле:

Методы выявления сезонных колебаний
В ряде случаев закономерно повторяются различия в уровнях ряда в зависимости от времени года. Задача заключается в том, чтобы измерить такие различия, чтобы они были не случ

Методы анализа основной тенденции в рядах динамики
Тренд – основная достаточно устойчивая тенденция развития явления в ряду динамики, иначе говоря, плавное и устойчивое изменение уровней (у) во времени. На т

Производство зерна в РФ, млн.тонн
Годы t производство, млн. тн y Сред-няя за 3 года Сколь-зящая сумма за 5 лет, Сколь-зящая средняя за 5 лет, расче

Индивидуальные и общие индексы. Проблемы соизмерения индексируемых величин в агрегатных индексах
Индивидуальный индекс – характеризует динамику уровня изучаемого явления во времени за два сравниваемых периода или выражает соотношение отдельных элементов совокупности.

Формуле Пааше отдается предпочтение, когда индекс цен рассматривается в системе с индексом товарооборота и индексом физического объема
Пример 9.2.2. Таблица 9.2.3. Данные о реализации продукции в магазине «Звездочка» Продукт Ед. изм. Базисный период О

Индексы средние из индивидуальных
Средний индекс – это индекс, исчисленный как средняя величина из индивидуальных индексов. Эти индексы применяются в тех случаях, когда в исходной информации нет данных

Индекс товарооборота есть произведение индекса цен (по Пааше) и физического объема
, проверим это:

Индексы постоянного и переменного состава. Индексы фиксированной структуры
При изучении качественных показателей часто приходится рассматривать изменение во времени (или пространстве) СРЕДНЕЙ величины индексиру

Индекс структурных сдвигов
Все рассмотренные выше индексы рассчитывались по нескольким товарам, реализуемым в одном месте. Рассмотрим теперь случай, когда ОДИН товар реализуется в нескольких местах. Пример 9.5.1.

Практическое занятие
Задача 01 Рассчитать аналитические и средние показателигодовых изменений уровней ряда, сделать соответствующие выводы. Таблица 1. Объем реализации по изд

Средний темп прироста -
Годы (t) Объем реализации, тыс. тонн. Абсолютный прирост, тыс. тонн Темп роста, % Темп прироста, % Абсолютное значе-н

Как доказать, что закономерность, полученная при изучении экспериментальных данных, не является результатом совпадения или ошибки экспериментатора, что она достоверна? С таким вопросом сталкиваются начинающие исследователи.Описательная статистика предоставляет инструменты для решения этих задач. Она имеет два больших раздела – описание данных и их сопоставление в группах или в ряду между собой.

Показатели описательной статистики

Существует несколько показателей, которые использует описательная статистика.

Итак, представим, что перед нами стоит задача описать рост всех студентов в группе из десяти человек. Вооружившись линейкой и проведя измерения, мы получаем маленький ряд из десяти чисел (рост в сантиметрах):

168, 171, 175, 177, 179, 187, 174, 176, 179, 169.

Если внимательно посмотреть на этот линейный ряд, то можно обнаружить несколько закономерностей:

  • Ширина интервала, куда попадает рост всех студентов, – 18 см.
  • В распределении рост наиболее близок к середине этого интервала.
  • Встречаются и исключения, которые наиболее близко расположены к верхней или нижней границе интервала.

Совершенно очевидно, что для выполнения задачи по описанию роста студентов в группе нет необходимости приводить все значения, которые будут измеряться. Для этой цели достаточно привести всего два, которые в статистике называются параметрами распределения. Это среднеарифметическое и стандартное отклонение от среднего арифметического. Если обратиться к росту студентов, то формула будет выглядеть следующим образом:

Среднеарифметическое значение роста студентов = (Сумма всех значений роста студентов) / (Число студентов, участвовавших в измерении)

Если свести все к строгим математическим терминам, то определение среднего арифметического (обозначается греческой буквой – μ («мю»)) будет звучать так:

Среднее арифметическое – это отношение суммы всех значений одного признака для всех членов совокупности (X) к числу всех членов совокупности (N).

Если применить эту формулу к нашим измерениям, то получаем, что μ для роста студентов в группе 175,5 см.

Если присмотреться к росту студентов, который мы измерили в предыдущем примере, то понятно, что рост каждого на сколько-то отличается от вычисленного среднего (175,5 см). Для полноты описания нужно понять, какой является разница между средним ростом каждого студента и средним значением.

На первом этапе вычислим параметр дисперсии. Дисперсия в статистике (обозначается σ 2 (сигма в квадрате)) – это отношение суммы квадратов разности среднего арифметического (μ) и значения члена ряда (Х) к числу всех членов совокупности (N). В виде формулы это рассчитывается понятнее:

Значения, которые мы получим в результате вычислений по этой формуле, мы будем представлять в виде квадрата величины (в нашем случае – квадратные сантиметры). Характеризовать рост в сантиметрах квадратными сантиметрами, согласитесь, нелепо. Поэтому мы можем исправить, точнее, упростить это выражение и получим среднеквадратичное отклонение формулу и расчёт, пример:

Таким образом, мы получили величину стандартного отклонения (или среднего квадратичного отклонения) – квадратный корень из дисперсии. С единицами измерения тоже теперь все в порядке, можем посчитать стандартное отклонение для группы:

Получается, что наша группа студентов исчисляется по росту таким образом: 175,50±5,25 см.

Среднее квадратичное отклонение хорошо работает с рядами, в которых разброс значений не очень велик (это хорошо прослеживалось на примере роста, где интервал был всего 18 см). Если бы ряд наших измерений был значительнее, а варьирование роста было сильнее, то стандартное отклонение стало непоказательным и нам потребовался бы критерий, который может отразить разброс в относительных единицах (т. е. в процентах, относительно средней величины).

Для этих целей предусмотрены абсолютные и относительные показатели вариации в статистике, характеризующие вариационные масштабы:

  • Размах вариации.

Квадратический коэффициент вариации (обозначается как Vσ) – это отношение среднеквадратичного отклонения к среднеарифметическому значению, выраженное в процентах.

Для нашего примера со студентами, определить Vσ несложно - он будет равен 3,18%. Основная закономерность – чем больше будет изменяться значение коэффициента, тем больше разброс вокруг среднего значения и тем менее однородна выборка.

Преимущество коэффициента вариации в том, что он показывает однородность значений (асимметрия) в ряду наших измерений, кроме того, на него не оказывают влияния масштаб и единицы измерения. Эти факторы делают коэффициент вариации особенно популярным в биомедицинских исследованиях. Будет считаться , что эксцесс значения Vσ =33% отделяет однородные выборки от неоднородных.

Если найти в ряду значений роста (первый пример) максимальное и минимальное значения, то получим размах вариации (обозначается как R, иногда ещё называется колеблемостью). В нашем примере – это значение будет равно 18 см. Эта характеристика используется для расчёта коэффициента осцилляции:

Коэффициент осцилляции – показывает как размах вариации будет относиться к среднему арифметическому ряда в процентном отношении.

Расчёты в Microsoft Ecxel 2016

* — в таблице указан диапазон A1:A10 для примера, при расчётах нужно указать требуемый диапазон.

Итак, обобщим информацию :

  1. Среднее арифметическое – это значение, позволяющее найти среднее значение показателя в ряду данных.
  2. Дисперсия – это среднее значение отклонений возведенное в квадрат.
  3. Стандартное отклонение (среднеквадратичное отклонение) – это корень квадратный из дисперсии, для приведения единиц измерения к одинаковым со среднеарифметическим.
  4. Коэффициент вариации – значение отклонений от среднего, выраженное в относительных величинах (%).

Отдельно следует отметить, что все приведённые в статье показатели, как правило, не имеют собственного смысла и используются для того, чтобы составлять более сложную схему анализа данных. Исключение из этого правила — коэффициент вариации, который является мерой однородности данных.

По данным выборочного обследования произведена группировка вкладчиков по размеру вклада в Сбербанке города:

Определите:

1) размах вариации;

2) средний размер вклада;

3) среднее линейное отклонение;

4) дисперсию;

5) среднее квадратическое отклонение;

6) коэффициент вариации вкладов.

Решение:

Данный ряд распределения содержит открытые интервалы. В таких рядах условно принимается величина интервала первой группы равна величине интервала последующей, а величина интервала последней группы равна величине интервала предыдущей.

Величина интервала второй группы равна 200, следовательно, и величина первой группы также равна 200. Величина интервала предпоследней группы равна 200, значит и последний интервал будет иметь величину, равную 200.

1) Определим размах вариации как разность между наибольшим и наименьшим значением признака:

Размах вариации размера вклада равен 1000 рублей.

2) Средний размер вклада определим по формуле средней арифметической взвешенной.

Предварительно определим дискретную величину признака в каждом интервале. Для этого по формуле средней арифметической простой найдём середины интервалов.

Среднее значение первого интервала будет равно:

второго - 500 и т. д.

Занесём результаты вычислений в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х xf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Итого 400 - 312000

Средний размер вклада в Сбербанке города будет равен 780 рублей:

3) Среднее линейное отклонение есть средняя арифметическая из абсолютных отклонений отдельных значений признака от общей средней:

Порядок расчёта среднего линейонго отклонения в интервальном ряду распределения следующий:

1. Вычисляется средняя арифметическая взвешенная, как показано в п. 2).

2. Определяются абсолютные отклонения вариант от средней:

3. Полученные отклонения умножаются на частоты:

4. Находится сумма взвешенных отклонений без учёта знака:

5. Сумма взвешенных отклонений делится на сумму частот:

Удобно пользоваться таблицей расчётных данных:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Итого 400 - - - 81280

Среднее линейное отклонение размера вклада клиентов Сбербанка составляет 203,2 рубля.

4) Дисперсия - это средняя арифметическая квадратов отклонений каждого значения признака от средней арифметической.

Расчёт дисперсии в интервальных рядах распределения производится по формуле:

Порядок расчёта дисперсии в этом случае следующий:

1. Определяют среднюю арифметическую взвешенную, как показано в п. 2).

2. Находят отклонения вариант от средней:

3. Возводят в квадрат отклонения каждой варианты от средней:

4. Умножают квадраты отклонений на веса (частоты):

5. Суммируют полученные произведения:

6. Полученная сумма делится на сумму весов (частот):

Расчёты оформим в таблицу:

Размер вклада, руб. Число вкладчиков, f Середина интервала, х
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Итого 400 - - - 23040000

Часто в статистике при анализе какого-либо явления или процесса необходимо учитывать не только информацию о средних уровнях исследуемых показателей, но и разброс или вариацию значений отдельных единиц , которая является важной характеристикой изучаемой совокупности.

В наибольшей степени вариации подвержены курсы акций, объемы спроса и предложения, процентные ставки в разные периоды времени и в разных местах.

Основными показателями, характеризующими вариацию , являются размах, дисперсия, среднее квадратическое отклонение и коэффициент вариации.

Размах вариации представляет собой разность максимального и минимального значений признака: R = Xmax – Xmin . Недостатком данного показателя является то, что он оценивает только границы варьирования признака и не отражает его колеблемость внутри этих границ.

Дисперсия лишена этого недостатка. Она рассчитывается как средний квадрат отклонений значений признака от их средней величины:

Упрощенный способ расчета дисперсии осуществляется с помощью следующих формул (простой и взвешенной):

Примеры применения данных формул представлены в задачах 1 и 2.

Широко распространенным на практике показателем является среднее квадратическое отклонение :

Среднее квадратическое отклонение определяется как квадратный корень из дисперсии и имеет ту же размеренность, что и изучаемый признак.

Рассмотренные показатели позволяют получить абсолютное значение вариации, т.е. оценивают ее в единицах измерения исследуемого признака. В отличие от них, коэффициент вариации измеряет колеблемость в относительном выражении - относительно среднего уровня, что во многих случаях является предпочтительнее.

Формула для расчета коэффициента вариации.

Примеры решения задач по теме «Показатели вариации в статистике»

Задача 1 . При изучении влияния рекламы на размер среднемесячного вклада в банках района обследовано 2 банка. Получены следующие результаты:

Определить:
1) для каждого банка: а) средний размер вклада за месяц; б) дисперсию вклада;
2) средний размер вклада за месяц для двух банков вместе;
3) Дисперсию вклада для 2-х банков, зависящую от рекламы;
4) Дисперсию вклада для 2-х банков, зависящую от всех факторов, кроме рекламы;
5) Общую дисперсию используя правило сложения;
6) Коэффициент детерминации;
7) Корреляционное отношение.

Решение

1) Составим расчетную таблицу для банка с рекламой . Для определения среднего размера вклада за месяц найдем середины интервалов. При этом величина открытого интервала (первого) условно приравнивается к величине интервала, примыкающего к нему (второго).

Средний размер вклада найдем по формуле средней арифметической взвешенной:

29 000/50 = 580 руб.

Дисперсию вклада найдем по формуле:

23 400/50 = 468

Аналогичные действия произведем для банка без рекламы :

2) Найдем средний размер вклада для двух банков вместе. Хср =(580×50+542,8×50)/100 = 561,4 руб.

3) Дисперсию вклада, для двух банков, зависящую от рекламы найдем по формуле: σ 2 =pq (формула дисперсии альтернативного признака). Здесь р=0,5 – доля факторов, зависящих от рекламы; q=1-0,5, тогда σ 2 =0,5*0,5=0,25.

4) Поскольку доля остальных факторов равна 0,5, то дисперсия вклада для двух банков, зависящая от всех факторов кроме рекламы тоже 0,25.

5) Определим общую дисперсию, используя правило сложения.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 факт + σ 2 ост = 552,08+345,96 = 898,04

6) Коэффициент детерминации η 2 = σ 2 факт / σ 2 = 345,96/898,04 = 0,39 = 39% - размер вклада на 39% зависит от рекламы.

7) Эмпирическое корреляционное отношение η = √η 2 = √0,39 = 0,62 – связь достаточно тесная.

Задача 2 . Имеется группировка предприятий по величине товарной продукции:

Определить: 1) дисперсию величины товарной продукции; 2) среднее квадратическое отклонение; 3) коэффициент вариации.

Решение

1) По условию представлен интервальный ряд распределения. Его необходимо выразить дискретно, то есть найти середину интервала (х"). В группах закрытых интервалов середину найдем по простой средней арифметической. В группах с верхней границей - как разность между этой верхней границей и половиной размера следующего за ним интервала (200-(400-200):2=100).

В группах с нижней границей – суммой этой нижней границы и половины размера предыдущего интервала (800+(800-600):2=900).

Расчет средней величины товарной продукции делаем по формуле:

Хср = k×((Σ((х"-a):k)×f):Σf)+a. Здесь а=500 - размер варианта при наибольшей частоте, k=600-400=200 - размер интервала при наибольшей частоте. Результат поместим в таблицу:

Итак, средняя величина товарной продукции за изучаемый период в целом равна Хср = (-5:37)×200+500=472,97 тыс. руб.

2) Дисперсию найдем по следующей формуле:

σ 2 = (33/37)*2002-(472,97-500)2 = 35 675,67-730,62 = 34 945,05

3) среднее квадратическое отклонение: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 тыс. руб.

4) коэффициент вариации: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Показатели вариации

Понятие вариации

Вариация - это наличие различий у отдельных единиц сово­купности по какому-либо признаку.

Эта категория занимает особое место в статистической науке, ибо именно наличие вариации единиц совокупности предопределяет необходимость статистики. Если бы отдельные единицы сово­купности имели они и те же значения признаков (например, рост, возраст у всех живущих людей был бы одинаковый), то для изу­чения данной совокупности по этим признакам достаточно было бы изучить только одну единицу совокупности. Однако зачастую значения признаков колеблются, изменяются при переходе от од­ной единицы к другой. Как правило, вариация является порожде­нием следующих причин:

Своеобразие условий, в которых происходит развитие от­дельных единиц совокупности;

Неравномерность развития отдельных единиц.

Например, причиной вариации роста у отдельно взятых людей является генетическая особен­ность каждого организма (основная причина), особенности питания, экологическая обстановка и т.д.; вариация урожайности может быть вызвана климатическими, почвенными особенностями зоны про­израстания, режима и возможности полива, качеством посадочного материала и т.д.

Вариация существует во времени и в пространстве.

Под вариаци­ей в пространстве понимается колеблемость значений признака по отдельным территориям (урожайность пшеницы в разных ре­гионах).

Под вариацией во времени подразумевается объективное измене­ние значений признака в разные периоды (или моменты). Напри­мер, со временем изменяется средняя продолжительность пред­стоящей жизни, доходность предприятий отрасли, уровень по­требностей людей и т.д.

Изучение вариации имеет важное значение, так как вариация ха­рактеризует степень однородности совокупности. Однородность совокупности - необходимое условие при расчете большинства статистических показателей, в частности средних величин.

Показатели вариации

Показатели вариации являются необходимым дополнением при расчете средних величин, так как определяют степень однород­ности совокупности.

Система показателей вариации включает следующее:

Размах вариации;

Среднее квадратическое отклонение;

Дисперсия;

Коэффициент вариации.

Значение показателей вариации:

Характеризуются размеры вариации признака;

Показатели вариации дополняют систему средних величин, в которой затушевываются индивидуальные различия;

Показатели вариации позволяют охарактеризовать уровень однородности совокупности;

С помощью показателей вариации, путем сравнения вариа­ции у отдельных признаков (разных), есть возможность измерить взаимосвязь между этими признаками.

Первый показатель, так называемый размах вариации, - наи­более простой из показателей, характеризует абсолютные разме­ры изменения признака и определяется как разница максимально­го и минимального значений признака:

Несмотря на простоту расчета, этот показатель имеет важный не­достаток - учитывает только два приграничных значения. В случае аномальности одного или двух приграничных значений, он может исказить действительную вариацию совокупности.

Для того чтобы избавиться от этого недостатка, рассчитывают отклонение каждой индивидуальной величины от средней по со­вокупности. Таким образом, учитывается значение каждой еди­ницы совокупности. Для того чтобы охарактеризовать это откло­нение одним числом, рассчитывают среднюю из этих значений. Данный показатель носит название среднее абсолютное (линей­ное) отклонение и определяется следующим образом:

Простой вид;

- взвешенный вид (для сгруппированных данных);

где d(L) - среднее абсолютное (линейное) отклонение;

х - индивидуальное значение признака (варианта);

Среднее из значений признака;

п - численность совокупности;

f - частота.

Среднее линейное отклонение характеризует средний размер отклонений индивидуальных значений признака от средней вели­чины. Таким образом, он характеризует абсолютные размеры ва­риации, имеет те же единицы измерения, что и признак, вариа­цию которого характеризует.

Недостаток: ввиду того, что применяется модуль, затруднено проведение математических операций. Поэтому он применяется редко.

Для того чтобы избавиться от недостатка предыдущего показате­ля, разницу между индивидуальным значением и средней возве­дем в квадрат и затем извлечем корень квадратный из полученно­го среднего значения. Полученный показатель будет называться среднее квадратическое отклонение:

- простая.

- взвешенная.

Играет ту же роль, что и среднее абсолютное отклонение, но, имеет перед ним одно преимущество, а именно, с ним проще проводить математические операции. Ввиду этого в 90 случаях из 100 используется этот показатель.

Еще более удобный для математических преобразований показа­тель вариации - дисперсия, который представляет собой сред­нее квадратическое отклонение в квадрате:

- простая,

- взвешенная.

С помощью дисперсии и среднего квадратического отклонения измеряются взаимосвязи между различными признаками. Кроме того, по этим показателям можно сравнивать совокупности в смысле их однородности по одинаковым признакам.

Вывод об однородности совокупности позволяет сделать коэффициент вариации , который может быть рассчитан несколькими способами в зависимости от исходной информации:

Характеризует средний процент отклонений индивидуальных значений признака от средней величины.

,

,

,

где V – коэффициент вариации;

σ – среднее квадратическое отклонение;

d (L) – среднее линейное отклонение;

Х МО – мода (структурная средняя);

Х МЕ – медиана(структурная средняя).

Коэффициент вариации имеет большое значение. Он позволяет сравнивать уровень вариации по различным признакам и используется для характеристики однородности совокупности. Если коэффициент вариации меньше 33%, то совокупность однородна.

Пример расчета показателей вариации.

Распределение студентов вуза по возрасту характеризуются следующими данными (табл. 1):

Таблица 1

Рассчитайте показатели, характеризующие вариацию возраста студентов для каждой формы



обучения. Сравните полученные результаты.

Рассчитаем показатели вариации, характеризующие совокупность студентов очно-заочной формы

обучения.

1. Размах вариации:

R = x max – x min = 31 - 18,5 = 12,5 (лет)

2. Средняя арифметическая:

3. Среднее линейное отклонение:

Возраст отдельно взятого студента отклоняется от среднего по совокупности возраста - 27 лет - на 3 года. То есть можно утверждать, что возраст наибольшего числа студентов не будет выходить за границы интервала: от 24,3 до 30,4 лет.

27,36 - 3,07 < 27,36 < 27,36+ 3,07.

Среднее квадратическое отклонение:

Среднее квадратическое отклонение также характеризует абсолютную величину отклонения индиви­дуального значения от средней. Как правило, значение среднего квадратического отклонения больше среднего линейного отклонения.

Дисперсия:

=13,899

Характеризует квадрат отклонений индивидуального значения от средней величины. Коэффициент вариации:

Средний процент отклонений индивидуальных значений от средней величины составляет 13,6%. Со­вокупность однородна. Сделаем аналогичные расчеты по совокупности студентов дневного отделения. Получаем следующие результаты:

d(L) = 3,40

V = 21,9%

На основании приведенных расчетов можно сделать вывод о том, что совокупность студентов очно-заочного отделения более однородная.

Расчет показателей вариации - достаточно трудоемкий процесс. В некоторых случаях, когда имеется ряд показателей с равноот­стоящими моментами времени или равноинтервальный ряд рас­пределения, расчет может быть упрощен. Сокращенные способы расчета дисперсии базируются на знании свойств дисперсии. Свойства дисперсии:

Если от всех значений варианты х отнять (прибавить) по­стоянное число А, то дисперсия не изменится;

Если каждое значение варианты разделить (умножить) на постоянную величину к, то дисперсия уменьшится (увеличится) в к 2 раз.

Сокращенные способы расчета дисперсии:

2. Способ моментов – применяется только в случае равенства интервалов.



Поделиться