Варіація, коефіцієнт, абсолютні та відносні показники варіації в статистиці, способи розрахунку, як обчислюється розмах варіації

Цей термін веде своє походження від латинського слова «varito». Воно перекладається як «зміна» або «відмінність».

Варіація — це кількісна міра зміни певних даних, яка допомагає досліджувати її випадкові зміни. Для їх аналізу застосовують різні статистичні методи.

Про них буде більш докладно розказано в цій статті.

Показники варіації в статистиці

Статистика широко застосовується в самих різних областях. Вона довела свою користь не тільки в природничих науках, але й у вивченні різних соціологічних явищ, змін цін, а також в інших ситуаціях.

Ця наука має справу з випадковими величинами, зміна яких вимагає для свого опису використання спеціальних характеристик. Найбільш відомою з них є середня. Однак, хоча вона й включає в себе певний обсяг інформації, тим не менш не дає можливості знайти інформацію про розкид випадкових даних, а також дати поняття про динаміку зміни і найбільш ймовірні тенденції в подальшому.

Математичний апарат для вивчення варіаційних процесів використовує характеристики, способи розрахунку яких можна розділити на три групи.

В їх число входять:

  1. Показники розмаху.
  2. Цифри, що дають поняття про величину відхилення.
  3. Відносні показники, які відносяться до варіації.

Показники розмаху змін говорять про те, яка різниця між максимальними відхиленнями досліджуваних чисел:

  • варіаційний розмах;
  • децильный розмах;
  • квартильный розмах.

Дані, що відносяться до другої категорії, можна вважати так:

  • середнє лінійне відхилення;
  • середнє квадратичне;
  • дисперсія.

Для розрахунку відносних показників застосовується:

  • відносний квартильный розмах;
  • лінійний коефіцієнт;
  • коефіцієнт варіації.

Далі буде розказано про найбільш часто застосовуваних математичних характеристики розглянутого поняття.

При проведенні статистичних обчисленнях зручно користуватися електронними таблицями Excel.

Абсолютні показники варіації

Коли говорять про абсолютні показники варіації, мають на увазі наступні методи для проведення статистичного аналізу:

  1. Розмах варіації.
  2. Середнє лінійне відхилення.
  3. Середнє квадратичне відхилення.
  4. Дисперсія.

Розмах варіації

При розгляді зміни досліджуваних даних, однією з важливих характеристик є розмах варіації.

Він дорівнює різниці між максимальною і мінімальною межами. Подивимося, як це характеристика обчислюється.

Формула виглядає так:

РВар = ЗнМакс — ЗнМин,

де:

  • РВар — являє собою шукану характеристику;
  • ЗнМакс — це максимальна цифра за розглянутий період;
  • ЗнМин — величина, що дорівнює мінімальному значенню за цей же період.

Приклад.

Ця формула може бути застосована, наприклад, у наступній ситуації. Припустимо, розглядається зростання відібраних випадковим чином людей. У цій сукупності десять осіб і зростання їх дорівнює: 165, 172, 179, 190, 182, 171, 191, 183, 177 і 178 сантиметрів. Ці цифри становлять сукупність значень випадкових даних.

Як можна побачити в розглянутому випадку, мінімальне зростання в цій групі людей становить 165 см, а максимальний — 191 див. Різниця між ними становить 191 — 165 = 26 див. Таким чином, розглянуте значення для певної таким чином сукупності даних показує 26 див.

Відхилення варіації

Тут розглядається відхилення досліджуваної випадкової величини. Для того, щоб обчислити його, необхідно спочатку визначити її середнє значення.

Щоб порахувати, необхідно підсумувати всі значення випадкових даних і потім поділити на їх кількість. Отримана величина являє собою потрібний результат.

В деяких формулах використовуються значення ваг, надавалося кожному значенню. Коротко кажучи, вони призначаються у відповідності з цілями проведення статистичного дослідження. Ваги зазвичай підбираються таким чином, щоб їх сума дорівнювала одиниці.

Середнє лінійне просте

Оцінка величини відхилення розраховується так:

  1. Спочатку потрібно визначити для кожного випадкового значення різницю з середнім і взяти від неї абсолютну величину.
  2. Потім всі ці цифри підсумовують і ділять отриманий результат на кількість значень величини, яка змінюється.

Формула виглядає таким чином:

СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|) / n,

де:

  • СЛП — шукана величина;
  • x(i) – i-те значення випадкової величини;
  • x0 – середнє значення;
  • n – кількість наявних цифр.

Вертикальні рисочки використовуються для того, щоб показати, що тут обчислюється абсолютна різниця.

Зважене середнє лінійне

Для цього потрібно формула:

СЛВ = (|x(1) – x0|*f(1) + |x(2) – x0|*f(2) + … + |x(n) – x(0)|*f(n)) / n,

де:

  • СЛВ — шукана величина;
  • f(i) — вага, який надається кожному із значень випадкової величини.

Інші позначення розглянуті раніше.

Середнє квадратичне відхилення

У цьому випадку результат визначається за іншим правилом, ніж у попередніх випадках:

СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2) / n),

де:

  • СКО являє собою квадратичне відхилення;
  • x**2 являє собою зведення в квадрат;
  • SQRT() — це операція взяття квадратного кореня.

Дисперсія (проста, зважена)

Проста дисперсія дорівнює СКО, зарахованого у квадрат.

Зважена називається так тому, що кожний доданок множиться на свою вагу.

Тут застосовується формула:

ДВ = (f(1)*(x(1) – x0)**2 + f(2)*(x(2) – x0)**2 + … + f(n)*(x(n) – x(0))**2) / (n*(f(1) + f(2) + … + f(n)),

де: ДВ являє собою дисперсію зважену.

Варіація альтернативної ознаки

Це поняття характеризує ті ситуації, коли частина предметів вибірки володіє певним властивістю, а інша — ні:

СЕРЕДОВИЩ = ((1-p) + (0-p)) / (p+q) = p;

ВАР = (q*(1-p)**2+ q*(0-p)**2) / (p+q) = pq.

Тут СЕРЕДОВИЩ позначає середнє, а p і q являють собою позитивні числа, в сумі дають одиницю.

ВАР позначає шукану величину.

Відносні показники варіації

В даному випадку розглядаються відношення відхилення та середнього конкретної вибірки. Для різних характеристик використовуються різні способи визначення середнього відхилення.

Чим менше отриманий коефіцієнт, тим більше згруповані дані. Цей коефіцієнт не має одиниць вимірювання.

Коефіцієнт осциляції

Ця величина дорівнює частці від ділення розмаху варіації та середнє випадкової величини.

Коефіцієнт варіації

Такий коефіцієнт можна розрахувати шляхом ділення лінійного відхилення на такий же знаменник, як у попередньому випадку.

Відносне лінійне відхилення

В даному випадку шукане значення розраховується як результат ділення середнього квадратичного на цей же знаменник.

Приклади розрахунків

Тут буде наведено приклади розрахунків. Розглядається ситуація, коли п’ять чоловік влаштовуватися на нову роботу. У даній спеціальності вони пропрацювали різну кількість років: 2, 3, 4, 7 і 9 років.

X(0) = (2 + 3 + 4 + 7 + 9) / 5 = 25 / 5 = 5.

СЛП = (|x(1) – x0| + |x(2) – x0| + … + |x(n) – x(0)|)/n = (|2 — 5| + |3 — 5| + |4 — 5| + |7 — 5| + |9 – 5|) / 5 = (3 + 2 + 1 + 2 + 4) / 5 = 12 / 5 = 2,4 року.

СКО = SQRT(((x(1) – x0)**2 + (x(2) – x0)**2 + … + (x(n) – x(0))**2)/n) = SQRT(((2 – 5)**2 + (3 – 5)**2 + (4 – 5)**2 + (7 – 5)**2 + (9 – 5)**2) / 5) = SQRT((3**2 + 2**2 + 1**2 + 2**2 + 4**2)/5) = SQRT ((9 + 4 + 1 + 4 + 16) / 5) = SQRT(34 / 5) = SQRT(6,80) = 2,61 року (приблизне значення).

ДВ = 6,80 років.

Останнє значення СКВ, зарахованого у квадрат.

У більшості випадків розрахунок являє собою набагато більш складну задачу, ніж у наведеному прикладі. Для полегшення процесу обчислень можна використовувати онлайн калькулятор.

Висновок

Вивчення випадкових процесів відіграє важливу роль в науці, економіці та суспільному житті. Для того, щоб отримати максимальну кількість інформації при їх вивченні, потрібно активно використовувати статистичні методи, в тому числі ті, які пов’язані з варіацією.