Jak obliczyć wariancję w statystykach

Spisu treści:

Anonim

Jednym z najbardziej podstawowych pojęć w statystykach jest średnia, lub Średnia arytmetyczna, zbioru liczb. Średnia oznacza centralną wartość zbioru danych. The zmienność zestawu danych mierzy, jak daleko elementy tego zbioru danych są rozłożone od średniej. Zestawy danych, w których liczby są zbliżone do średniej, będą miały małą wariancję. Te zbiory, w których liczby są znacznie wyższe lub niższe od średniej, będą miały dużą zmienność.

Oblicz średnią zbioru danych

Oblicz różnice kwadratów

Następny krok polega na obliczeniu różnicy między każdym elementem w zbiorze danych a średnią. Ponieważ niektóre elementy będą wyższe od średniej, a niektóre będą niższe, obliczenia wariancji wykorzystują kwadrat różnic.

Dzień 1 Sprzedaż - Średnia Sprzedaż: 62 000 USD - 6544,29 USD (- 3 414,29 USD); (-3 134,29)2 = 11,657,346.94

Dzień 2 Sprzedaż - średnia sprzedaż: 64 800 USD - 65414.29 = (- 614,29 USD); (-614.29)2 = 377,346.94

Dzień 3 Sprzedaż - Średnia Sprzedaż: 62.600 USD - 65414.29 = (- 2 1084,29 USD); (-22,14.29)2 = 7,920,204.08

Dzień 4 Sprzedaż - średnia sprzedaż: 69,200 USD - 65414.29 = (+ 3 785,71 USD); (+3,785.71)2 = 14,331,632.65

Dzień 5 Sprzedaż - średnia sprzedaż: 66 000 USD - 65414.29 USD (+855,71 USD); (+585.71)2 = 343,061.22

Dzień 6 Sprzedaż - średnia sprzedaż: 63.900 USD - 65414.29 = (- 1514.29 USD); (-1514.29)2 = 2,293,061.22

Dzień 7 Sprzedaż - średnia sprzedaż: 69,400 USD - 65414.29 = (+39 887,71 USD); (+3 985.71)2 = 15,885,918.37

UWAGA: Kwadratowe różnice nie są mierzone w dolarach. Te liczby są używane w następnym kroku do obliczenia wariancji.

Wariancja i odchylenie standardowe

Wariancję definiuje się jako średnią kwadratów różnic.

11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43

52,808,571.43/7 = 7,544,081.63

Ponieważ wariancja wykorzystuje kwadrat różnicy, pierwiastek kwadratowy wariancji da wyraźniejsze wskazanie rzeczywistego spreadu. W statystykach pierwiastek kwadratowy wariancji nazywany jest odchylenie standardowe.

SQRT (7,544,081,63) = 2 746.65 USD

Zastosowania dla wariancji i odchylenia standardowego

Zarówno wariancja, jak i odchylenie standardowe są bardzo przydatne w analizie statystycznej. Wariancja mierzy ogólny rozkład zbioru danych od średniej. Odchylenie standardowe pomaga w wykrywaniu odstającelub elementy zbioru danych, które zbaczają zbyt daleko od średniej.

W powyższym zestawie danych wariancja jest dość wysoka, a tylko dwie dzienne sumy sprzedaży mieszczą się w granicach 1000 USD średniej. Zestaw danych pokazuje również, że dwie z siedmiu dziennych wartości sprzedaży stanowią więcej niż jedno odchylenie standardowe powyżej średniej, podczas gdy dwie pozostałe to więcej niż jedno odchylenie standardowe poniżej średniej.