Перейти до основного матеріалу

Розрахунок дисперсії в Excel: посібник із прикладами

Дисперсія – це статистичний показник, який повідомляє нам, наскільки розкиданий набір чисел. Це важлива концепція у фінансах, науці та багатьох інших галузях, яка допомагає нам зрозуміти мінливість або дисперсію в наших наборах даних. Excel пропонує простий спосіб обчислення дисперсії, що робить його доступним як для початківців, так і для досвідчених користувачів. У цій статті ми розглянемо, як це зробити, на наочних прикладах.

Що таке дисперсія?
Знайомство з функціями дисперсії Excel
Як розрахувати дисперсію в Excel?


Дисперсія проти стандартного відхилення

Що таке дисперсія?

 

Дисперсія – це статистичний термін, який описує ступінь, до якого числа в наборі даних відрізняються від середнього значення чисел. По суті, він вимірює, наскільки розкидані числа. Ключовим моментом у розумінні дисперсії є визнання того, що вона кількісно визначає ступінь варіації або дисперсії в межах набору значень. Висока дисперсія вказує на те, що числа розкидані; низька дисперсія свідчить про те, що вони тісно згруповані навколо середнього значення.

Простий приклад для ілюстрації дисперсії:

сценарій: Розглянемо клас з п’ятьма учнями та їхні бали в тесті з математики зі 100. Отримані бали 90, 92, 88, 91 і 89.

Обчисліть середнє значення: Спочатку ми знаходимо середній (середній) бал. Середнє значення

(90 + 92 + 88 + 91 + 89) / 5 = 90

Обчислити дисперсію: Потім ми обчислюємо дисперсію. Це передбачає віднімання середнього від кожного балу, зведення результату в квадрат, а потім усереднення цих квадратів різниць.

= [(90-90)² + (92-90)² + (88-90)² + (91-90)² + (89-90)²] / 5
= [0 + 4 + 4 + 1 + 1] / 5
= 10/5
= 2
На діаграмі показано розкид результатів:

Розуміння результату:

Низька дисперсія: У цьому прикладі дисперсія дорівнює 2. Це відносно мало, що вказує на те, що більшість балів близькі до середнього (90). Чим менша дисперсія, тим ближче окремі числа в наборі до середнього значення.

Нульова дисперсія: якби всі студенти набрали рівно 90 балів, дисперсія дорівнює 0, що вказує на відсутність варіативності. Кожна оцінка була б однаковою.

Висока дисперсія: Навпаки, більша дисперсія вказуватиме на те, що бали більш рознесені від середнього, демонструючи більшу варіативність успішності студентів.

Підсумовуючи, дисперсія дає нам числове значення, яке допомагає кількісно визначити, наскільки бали (або будь-який набір чисел) відхиляються від середнього значення, надаючи розуміння узгодженості чи мінливості даних.



Знайомство з функціями дисперсії Excel

 

Excel пропонує кілька функцій для обчислення дисперсії, кожна з яких розроблена для різних сценаріїв даних.

Розуміння цих функцій має вирішальне значення для точного статистичного аналізу

VAR.S (Приклад відхилення, включаючи лише числа):

  • Обчислює дисперсію на основі вибірки сукупності.
  • Найкраще використовувати під час аналізу підмножини даних для висновку про ціле.

ВАР.П (Відхилення населення, включаючи лише числа):

  • Обчислює дисперсію для всієї сукупності.
  • Ідеальний варіант, коли у вас є повні дані, а не лише вибірка.

ВАРА (Приклад відхилення, включаючи текст і логіку):

  • Подібно до VAR.S, але включає в обчислення текст і логічні значення (текст розглядається як 0, TRUE як 1, FALSE як 0).
  • Корисно, коли ваш набір даних містить змішані типи (числа, текст і логічні значення).

ВАРПА (Відхилення сукупності, включаючи текст і логіку):

  • Версія VARA для дисперсії сукупності.
  • Включає всі типи даних у розрахунок дисперсії для всієї сукупності.

VAR (Відхилення застарілої вибірки):

  • Старіша версія VAR.S, яка переважно використовується в Excel 2007 і раніших версіях.
  • Рекомендується використовувати VAR.S у нових версіях для послідовності та ясності.

VARP (Відхилення старої популяції):

  • Старіша версія VAR.P.
  • Як і VAR, рекомендовано використовувати VAR.P у новіших версіях Excel.
Відмінності та порівняння:
  • Вибірка проти генеральної сукупності: VAR.S і VARA призначені для вибірок, тоді як VAR.P і VARPA призначені для всієї сукупності.
  • Розгляд типу даних: VARA і VARPA включають текст і логічні значення в обчислення, на відміну від VAR.S і VAR.P.
  • Застарілі та сучасні функції: VAR і VARP є старішими функціями, і їх можна замінити на VAR.S і VAR.P для кращої сумісності з поточними версіями Excel.
Порівняльна таблиця:
функція Розглянутий тип даних Популяція або вибірка Використовуйте Case
VAR.S Тільки цифри Зразок Дисперсія вибірки для числових даних
ВАР.П Тільки цифри населення Дисперсія сукупності чисел
ВАРА Числа, текст, логіка Зразок Дисперсія вибірки для змішаних даних
ВАРПА Числа, текст, логіка населення Дисперсія генеральної сукупності для змішаних даних
VAR Тільки цифри Зразок Застаріла функція для дисперсії вибірки
VARP Тільки цифри населення Застаріла функція для популярних

Як розрахувати дисперсію в Excel?

 

У цьому розділі ми надамо два приклади, щоб продемонструвати, як обчислити дисперсію в Excel, і пояснити відмінності між різними функціями дисперсії. У результаті ви побачите, що різні функції дисперсії дають абсолютно різні результати для тих самих прикладів даних.


VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю

сценарій: обчислення дисперсії для невеликої вибірки сукупності проти всієї сукупності.

Приклад: обчисліть дисперсію для значень у стовпці A2:A12.

Formula: Виберіть порожню комірку та введіть одну з наведених нижче формул, а потім натисніть Enter ключ

  • Отримання дисперсій для вибірки великого набору даних (припустимо, що значення в A2:A12 є частинами великого набору даних)

    =VAR.S(A2:A12)

  • Отримання дисперсії для всієї сукупності (припустимо, що значення в A2:A12 є повним набором даних)

    =VAR.P(A2:A12)

Як бачите, однакові значення, але з використанням різних функцій дисперсії, отримають різні результати.

Чому результати VAR.S і VAR.P відрізняються?

  • VAR.S: ця функція використовується, коли ваш набір даних представляє вибірку з більшої сукупності. Він обчислює дисперсію на основі методу «n-1», де «n» — це кількість точок даних у вибірці. Використання «n-1» замість «n» як знаменника коригує зміщення у вибірці, роблячи її неупередженою оцінкою дисперсії сукупності. Він надає оцінку того, як дані у вибірці змінюються навколо середнього вибіркового значення.
  • ВАР.П: ця функція використовується, коли ваш набір даних представляє всю генеральну сукупність, а не лише вибірку з неї. Він обчислює дисперсію на основі методу «n», де «n» — це кількість точок даних у сукупності. Припускається, що набір даних охоплює всю сукупність, тому немає потреби коригувати зміщення, як у VAR.S.
  • В цілому, ключова відмінність полягає в знаменнику формули. VAR.S використовує «n-1» для врахування характеру вибірки даних, тоді як VAR.P використовує «n» для даних сукупності, де немає вибірки. Залежно від вашого набору даних і того, чи це вибірка чи повна сукупність, вам слід вибрати відповідну функцію для обчислення дисперсії.

VAR.S проти VAR.P – обчисліть дисперсію за вибіркою чи генеральною сукупністю

сценарій: прийняття рішення про включення логічних значень і текстів у обчислення дисперсії.

Приклад: обчисліть дисперсію для значень у стовпці A2:A12.

Formula: Виберіть порожню комірку та введіть одну з наведених нижче формул, а потім натисніть Enter ключ

  • Отримання дисперсій для вибірки великого набору даних без урахування текстів і логічних значень.

    =VAR.S(A2:A12)

  • Отримання дисперсії для вибірки великого набору даних, включаючи тексти та логічні значення.

    =VARA(A2:A12)


Зробіть обчислення дати та часу Fly

Kutools для Excel's Помічник дати та часу це неймовірно ефективний інструмент, призначений для спрощення складних обчислень дати та часу. Спробуйте й подивіться, як це змінить ваш досвід керування даними!


    Дисперсія проти стандартного відхилення

    Подібності:
    • Міра спреду:

      І дисперсія, і стандартне відхилення є статистичними показниками, які використовуються для опису поширення або розсіювання в межах набору даних. Вони кількісно визначають, наскільки окремі числа в наборі відхиляються від середнього (середнього).

    • Аналіз даних:

      Обидва зазвичай використовуються в статистичному аналізі для розуміння мінливості даних. Вони необхідні в таких сферах, як фінанси, дослідження, контроль якості тощо.

    • Розраховується із середнього значення:

      Обчислення як дисперсії, так і стандартного відхилення починається із середнього значення набору даних. Вони оцінюють мінливість по відношенню до цього центрального значення.

    Відмінності:
    • Одиниці виміру:

      • Дисперсія: квадратичні одиниці вихідних даних. Наприклад, якщо дані в метрах, дисперсія буде в квадратних метрах.

      • Стандартне відхилення: ті самі одиниці, що й вихідні дані. Продовжуючи приклад, якщо дані в метрах, стандартне відхилення також буде в метрах.

    • Інтерпретація:

      • Дисперсія: надає оцінку в квадраті, яку може бути менш інтуїтивно інтерпретувати, оскільки вона не в такому ж масштабі, як вихідні дані.

      • Стандартне відхилення: краще інтерпретувати, оскільки воно в тих самих одиницях, що й дані. Він вказує на середню відстань точок даних від середнього.

    • Математичне визначення:

      • Дисперсія: середнє значення квадратів відмінностей від середнього.

      • Стандартне відхилення: квадратний корінь із дисперсії.

    • Чутливість до екстремальних значень:

      • Варіантність: більш чутлива до викидів, оскільки зводить різниці у квадрат.

      • Стандартне відхилення: хоча на нього впливають викиди, воно менш чутливе порівняно з дисперсією через квадратний корінь.

    • додатків:

      • Дисперсія:

        Використовується, коли фокус зосереджений на квадраті величини дисперсії.

        Корисно в статистичних моделях і обчисленнях, де зведення в квадрат необхідне для нульового від’ємного значення.

        Часто використовується у фінансових моделях для оцінки ризику, оскільки вимірює волатильність.

      • Стандартне відхилення:

        Частіше використовується у звітах і щоденних програмах через його прямий зв’язок із масштабом даних.

        Необхідний в емпіричних дослідженнях для розуміння мінливості.

        Часто використовується для контролю якості, звітів про погоду та стандартних балів у тестах.

    Висновок:

    Хоча як дисперсія, так і стандартне відхилення служать для вимірювання розповсюдження набору даних, їх застосування відрізняються одиницею вимірювання та можливістю інтерпретації. Стандартне відхилення, з його прямим зв’язком із масштабом даних, має тенденцію бути більш зручним для користувача, особливо в практичному, повсякденному контексті. Дисперсія, з іншого боку, часто більше підходить для математичних і статистичних моделей.


    Цей огляд і порівняння повинні забезпечити чітке розуміння того, коли і навіщо використовувати кожну функцію дисперсії в Excel, дозволяючи проводити більш точний і змістовний аналіз даних. Щоб отримати більше кардинальних стратегій Excel, які можуть покращити керування даними, досліджуйте далі тут..


    Найкращі інструменти для підвищення продуктивності офісу

    Kutools для Excel - допомагає виділитися з натовпу

    🤖 Kutools AI Aide: Революціонізуйте аналіз даних на основі: Інтелектуальне виконання   |  Згенерувати код  |  Створення спеціальних формул  |  Аналізуйте дані та створюйте діаграми  |  Викликати функції Kutools...
    Популярні функції: Знайдіть, виділіть або визначте дублікати  |  Видалити порожні рядки  |  Об’єднайте стовпці або клітинки без втрати даних  |  Раунд без Формули ...
    Супер VLookup: Кілька критеріїв  |  Множинне значення  |  На кількох аркушах  |  Нечіткий пошук...
    Adv. Випадаючий список: Легкий спадний список  |  Залежний спадний список  |  Виберіть розкривний список, що вибирається...
    Менеджер колонок: Додайте конкретну кількість стовпців  |  Перемістити стовпці  |  Перемкнути статус видимості прихованих стовпців  Порівняти стовпці з Виберіть однакові та різні клітини ...
    Особливості: Фокус сітки  |  Перегляд дизайну  |  Велика панель формул  |  Диспетчер робочих книг і аркушів | Бібліотека ресурсів (автотекст)  |  Вибір дати  |  Об’єднайте робочі аркуші  |  Шифрування/розшифрування клітинок  |  Надсилайте листи за списком  |  Супер фільтр  |  Спеціальний фільтр (фільтр жирний/курсив/закреслений...) ...
    Топ-15 наборів інструментів12 текст Tools (додати текст, Видалити символи ...)  |  50 + Графік типи (діаграма Ганта ...)  |  40+ Практичний Формули (Розрахуйте вік на основі дня народження ...)  |  19 вставка Tools (Вставте QR-код, Вставити зображення зі шляху ...)  |  12 Перетворення Tools (Числа до слів, Валютна конверсія ...)  |  7 Злиття та розділення Tools (Розширені комбіновані ряди, Розділити клітинки Excel ...)  |  ... і більше

    Kutools для Excel має понад 300 функцій, Переконайтеся, що те, що вам потрібно, знаходиться лише на відстані одного кліка...

    Опис


    Вкладка Office - увімкніть читання та редагування вкладок у Microsoft Office (включаючи Excel)

    • Одна секунда для перемикання між десятками відкритих документів!
    • Щодня зменшуйте сотні клацань мишею, прощайте руку миші.
    • Збільшує вашу продуктивність на 50% під час перегляду та редагування декількох документів.
    • Додає ефективні вкладки в Office (включно з Excel), як у Chrome, Edge та Firefox.
    Comments (0)
    No ratings yet. Be the first to rate!
    There are no comments posted here yet
    Please leave your comments in English
    Posting as Guest
    ×
    Rate this post:
    0   Characters
    Suggested Locations