Розрахунок дисперсії в Excel: посібник із прикладами
Дисперсія – це статистичний показник, який повідомляє нам, наскільки розкиданий набір чисел. Це важлива концепція у фінансах, науці та багатьох інших галузях, яка допомагає нам зрозуміти мінливість або дисперсію в наших наборах даних. Excel пропонує простий спосіб обчислення дисперсії, що робить його доступним як для початківців, так і для досвідчених користувачів. У цій статті ми розглянемо, як це зробити, на наочних прикладах.
Що таке дисперсія?
Знайомство з функціями дисперсії Excel
Як розрахувати дисперсію в Excel?
- VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю
- VAR.S проти VARA – обчисліть дисперсію, включаючи або виключаючи тексти та логічні тексти
Дисперсія проти стандартного відхилення
Що таке дисперсія?
Дисперсія – це статистичний термін, який описує ступінь, до якого числа в наборі даних відрізняються від середнього значення чисел. По суті, він вимірює, наскільки розкидані числа. Ключовим моментом у розумінні дисперсії є визнання того, що вона кількісно визначає ступінь варіації або дисперсії в межах набору значень. Висока дисперсія вказує на те, що числа розкидані; низька дисперсія свідчить про те, що вони тісно згруповані навколо середнього значення.
Простий приклад для ілюстрації дисперсії:
сценарій: Розглянемо клас з п’ятьма учнями та їхні бали в тесті з математики зі 100. Отримані бали 90, 92, 88, 91 і 89.
Обчисліть середнє значення: Спочатку ми знаходимо середній (середній) бал. Середнє значення
Обчислити дисперсію: Потім ми обчислюємо дисперсію. Це передбачає віднімання середнього від кожного балу, зведення результату в квадрат, а потім усереднення цих квадратів різниць.
= [0 + 4 + 4 + 1 + 1] / 5
= 10/5
= 2
На діаграмі показано розкид результатів:
Розуміння результату:
Низька дисперсія: У цьому прикладі дисперсія дорівнює 2. Це відносно мало, що вказує на те, що більшість балів близькі до середнього (90). Чим менша дисперсія, тим ближче окремі числа в наборі до середнього значення.
Нульова дисперсія: якби всі студенти набрали рівно 90 балів, дисперсія дорівнює 0, що вказує на відсутність варіативності. Кожна оцінка була б однаковою.
Висока дисперсія: Навпаки, більша дисперсія вказуватиме на те, що бали більш рознесені від середнього, демонструючи більшу варіативність успішності студентів.
Підсумовуючи, дисперсія дає нам числове значення, яке допомагає кількісно визначити, наскільки бали (або будь-який набір чисел) відхиляються від середнього значення, надаючи розуміння узгодженості чи мінливості даних.
Знайомство з функціями дисперсії Excel
Excel пропонує кілька функцій для обчислення дисперсії, кожна з яких розроблена для різних сценаріїв даних.
Розуміння цих функцій має вирішальне значення для точного статистичного аналізу
VAR.S (Приклад відхилення, включаючи лише числа):
- Обчислює дисперсію на основі вибірки сукупності.
- Найкраще використовувати під час аналізу підмножини даних для висновку про ціле.
ВАР.П (Відхилення населення, включаючи лише числа):
- Обчислює дисперсію для всієї сукупності.
- Ідеальний варіант, коли у вас є повні дані, а не лише вибірка.
ВАРА (Приклад відхилення, включаючи текст і логіку):
- Подібно до VAR.S, але включає в обчислення текст і логічні значення (текст розглядається як 0, TRUE як 1, FALSE як 0).
- Корисно, коли ваш набір даних містить змішані типи (числа, текст і логічні значення).
ВАРПА (Відхилення сукупності, включаючи текст і логіку):
- Версія VARA для дисперсії сукупності.
- Включає всі типи даних у розрахунок дисперсії для всієї сукупності.
VAR (Відхилення застарілої вибірки):
- Старіша версія VAR.S, яка переважно використовується в Excel 2007 і раніших версіях.
- Рекомендується використовувати VAR.S у нових версіях для послідовності та ясності.
VARP (Відхилення старої популяції):
- Старіша версія VAR.P.
- Як і VAR, рекомендовано використовувати VAR.P у новіших версіях Excel.
Відмінності та порівняння:
- Вибірка проти генеральної сукупності: VAR.S і VARA призначені для вибірок, тоді як VAR.P і VARPA призначені для всієї сукупності.
- Розгляд типу даних: VARA і VARPA включають текст і логічні значення в обчислення, на відміну від VAR.S і VAR.P.
- Застарілі та сучасні функції: VAR і VARP є старішими функціями, і їх можна замінити на VAR.S і VAR.P для кращої сумісності з поточними версіями Excel.
Порівняльна таблиця:
функція | Розглянутий тип даних | Популяція або вибірка | Використовуйте Case |
VAR.S | Тільки цифри | Зразок | Дисперсія вибірки для числових даних |
ВАР.П | Тільки цифри | населення | Дисперсія сукупності чисел |
ВАРА | Числа, текст, логіка | Зразок | Дисперсія вибірки для змішаних даних |
ВАРПА | Числа, текст, логіка | населення | Дисперсія генеральної сукупності для змішаних даних |
VAR | Тільки цифри | Зразок | Застаріла функція для дисперсії вибірки |
VARP | Тільки цифри | населення | Застаріла функція для популярних |
Як розрахувати дисперсію в Excel?
У цьому розділі ми надамо два приклади, щоб продемонструвати, як обчислити дисперсію в Excel, і пояснити відмінності між різними функціями дисперсії. У результаті ви побачите, що різні функції дисперсії дають абсолютно різні результати для тих самих прикладів даних.
VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю
сценарій: обчислення дисперсії для невеликої вибірки сукупності проти всієї сукупності.
Приклад: обчисліть дисперсію для значень у стовпці A2:A12.
Formula: Виберіть порожню комірку та введіть одну з наведених нижче формул, а потім натисніть Enter ключ
-
Отримання дисперсій для вибірки великого набору даних (припустимо, що значення в A2:A12 є частинами великого набору даних)
=VAR.S(A2:A12)
-
Отримання дисперсії для всієї сукупності (припустимо, що значення в A2:A12 є повним набором даних)
=VAR.P(A2:A12)
Як бачите, однакові значення, але з використанням різних функцій дисперсії, отримають різні результати.
Чому результати VAR.S і VAR.P відрізняються?
- VAR.S: ця функція використовується, коли ваш набір даних представляє вибірку з більшої сукупності. Він обчислює дисперсію на основі методу «n-1», де «n» — це кількість точок даних у вибірці. Використання «n-1» замість «n» як знаменника коригує зміщення у вибірці, роблячи її неупередженою оцінкою дисперсії сукупності. Він надає оцінку того, як дані у вибірці змінюються навколо середнього вибіркового значення.
- ВАР.П: ця функція використовується, коли ваш набір даних представляє всю генеральну сукупність, а не лише вибірку з неї. Він обчислює дисперсію на основі методу «n», де «n» — це кількість точок даних у сукупності. Припускається, що набір даних охоплює всю сукупність, тому немає потреби коригувати зміщення, як у VAR.S.
- В цілому, ключова відмінність полягає в знаменнику формули. VAR.S використовує «n-1» для врахування характеру вибірки даних, тоді як VAR.P використовує «n» для даних сукупності, де немає вибірки. Залежно від вашого набору даних і того, чи це вибірка чи повна сукупність, вам слід вибрати відповідну функцію для обчислення дисперсії.
VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю
сценарій: прийняття рішення про включення логічних значень і текстів у обчислення дисперсії.
Приклад: обчисліть дисперсію для значень у стовпці A2:A12.
Formula: Виберіть порожню комірку та введіть одну з наведених нижче формул, а потім натисніть Enter ключ
-
Отримання дисперсій для вибірки великого набору даних без урахування текстів і логічних значень.
=VAR.S(A2:A12)
-
Отримання дисперсії для вибірки великого набору даних, включаючи тексти та логічні значення.
=VARA(A2:A12)
Зробіть обчислення дати та часу Fly
Kutools для Excel's Помічник дати та часу це неймовірно ефективний інструмент, призначений для спрощення складних обчислень дати та часу. Спробуйте й подивіться, як це змінить ваш досвід керування даними!
Дисперсія проти стандартного відхилення
Подібності:
-
Міра спреду:
І дисперсія, і стандартне відхилення є статистичними показниками, які використовуються для опису поширення або розсіювання в межах набору даних. Вони кількісно визначають, наскільки окремі числа в наборі відхиляються від середнього (середнього).
-
Аналіз даних:
Обидва зазвичай використовуються в статистичному аналізі для розуміння мінливості даних. Вони необхідні в таких сферах, як фінанси, дослідження, контроль якості тощо.
-
Розраховується із середнього значення:
Обчислення як дисперсії, так і стандартного відхилення починається із середнього значення набору даних. Вони оцінюють мінливість по відношенню до цього центрального значення.
Відмінності:
-
Одиниці виміру:
-
Дисперсія: квадратичні одиниці вихідних даних. Наприклад, якщо дані в метрах, дисперсія буде в квадратних метрах.
-
Стандартне відхилення: ті самі одиниці, що й вихідні дані. Продовжуючи приклад, якщо дані в метрах, стандартне відхилення також буде в метрах.
-
-
Інтерпретація:
-
Дисперсія: надає оцінку в квадраті, яку може бути менш інтуїтивно інтерпретувати, оскільки вона не в такому ж масштабі, як вихідні дані.
-
Стандартне відхилення: краще інтерпретувати, оскільки воно в тих самих одиницях, що й дані. Він вказує на середню відстань точок даних від середнього.
-
-
Математичне визначення:
-
Дисперсія: середнє значення квадратів відмінностей від середнього.
-
Стандартне відхилення: квадратний корінь із дисперсії.
-
-
Чутливість до екстремальних значень:
-
Варіантність: більш чутлива до викидів, оскільки зводить різниці у квадрат.
-
Стандартне відхилення: хоча на нього впливають викиди, воно менш чутливе порівняно з дисперсією через квадратний корінь.
-
-
додатків:
-
Дисперсія:
Використовується, коли фокус зосереджений на квадраті величини дисперсії.
Корисно в статистичних моделях і обчисленнях, де зведення в квадрат необхідне для нульового від’ємного значення.
Часто використовується у фінансових моделях для оцінки ризику, оскільки вимірює волатильність.
-
Стандартне відхилення:
Частіше використовується у звітах і щоденних програмах через його прямий зв’язок із масштабом даних.
Необхідний в емпіричних дослідженнях для розуміння мінливості.
Часто використовується для контролю якості, звітів про погоду та стандартних балів у тестах.
-
Висновок:
Хоча як дисперсія, так і стандартне відхилення служать для вимірювання розповсюдження набору даних, їх застосування відрізняються одиницею вимірювання та можливістю інтерпретації. Стандартне відхилення, з його прямим зв’язком із масштабом даних, має тенденцію бути більш зручним для користувача, особливо в практичному, повсякденному контексті. Дисперсія, з іншого боку, часто більше підходить для математичних і статистичних моделей.
Цей огляд і порівняння повинні забезпечити чітке розуміння того, коли і навіщо використовувати кожну функцію дисперсії в Excel, дозволяючи проводити більш точний і змістовний аналіз даних. Щоб отримати більше кардинальних стратегій Excel, які можуть покращити керування даними, досліджуйте далі тут..
Найкращі інструменти для підвищення продуктивності офісу
Kutools для Excel - допомагає виділитися з натовпу
Kutools для Excel має понад 300 функцій, Переконайтеся, що те, що вам потрібно, знаходиться лише на відстані одного кліка...
Вкладка Office - увімкніть читання та редагування вкладок у Microsoft Office (включаючи Excel)
- Одна секунда для перемикання між десятками відкритих документів!
- Щодня зменшуйте сотні клацань мишею, прощайте руку миші.
- Збільшує вашу продуктивність на 50% під час перегляду та редагування декількох документів.
- Додає ефективні вкладки в Office (включно з Excel), як у Chrome, Edge та Firefox.
Зміст
- Що таке дисперсія?
- Знайомство з функціями дисперсії Excel
- Як розрахувати дисперсію в Excel?
- VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю
- VAR.S проти VARA – обчисліть дисперсію, включаючи або виключаючи тексти та логічні тексти
- Дисперсія проти стандартного відхилення
- Статті по темі
- Найкращі інструменти продуктивності офісу
- Коментарі