Empirické pravidlo - přehled, vzorec pro standardní odchylku, použití

V matematice empirické pravidlo říká, že v normálním souboru dat bude prakticky každá část dat spadat do tří standardních odchylek Standardní odchylka Ze statistického hlediska je standardní odchylka sady dat měřítkem velikosti odchylek mezi hodnotami pozorování obsažených v průměru. Průměr je průměr všech čísel v sadě.

Empirické pravidlo se také označuje jako pravidlo tří sigmat nebo pravidlo 68-95-99,7, protože:

  • V rámci první standardní odchylky od průměru spočívá 68% všech údajů
  • 95% všech údajů spadá do dvou standardních odchylek
  • Téměř všechna data - 99,7% - spadají do tří standardních odchylek (zbývajících 0,3% se používá k zohlednění odlehlých hodnot, které existují téměř v každé datové sadě)

Empirické pravidlo

Normální distribuce

Empirické pravidlo vzniklo proto, že statistikům se stále znovu a znovu objevoval stejný tvar distribučních křivek. Empirické pravidlo platí pro normální rozdělení. Při normálním rozdělení prakticky všechna data spadají do tří standardních odchylek od průměru. Průměrný střední průměr je základním pojmem v matematice a statistice. Průměr obecně označuje průměr nebo nejběžnější hodnotu v kolekci, režim a medián jsou všechny stejné.

  • Průměr je průměr všech čísel v datové sadě.
  • Režim je číslo, které se v rámci datové sady opakuje nejčastěji.
  • Medián je hodnota rozpětí mezi nejvyšším a nejnižším číslem v sadě.

To znamená, že průměr, režim a medián Medián Medián je statistické měřítko, které určuje střední hodnotu datové sady uvedené ve vzestupném pořadí (tj. Od nejmenší po největší hodnotu). Medián by měl spadat do středu datové sady. Polovina dat by měla být na horním konci sady a druhá polovina níže.

Stanovení směrodatné odchylky

Empirické pravidlo je zvláště užitečné pro předpovídání výsledků v rámci souboru dat. Nejprve je třeba vypočítat směrodatnou odchylku. Vzorec je uveden níže:

Směrodatná odchylka - vzorec

Složitý vzorec výše se rozpadá následujícím způsobem:

  1. Určete průměr datové sady, což je součet datové sady vydělený počtem čísel.
  2. U každého čísla v sadě odečtěte průměr a výsledné číslo poté umocněte na druhou.
  3. Pomocí čtvercových hodnot určete průměr pro každou z nich.
  4. Najděte druhou odmocninu průměrů vypočítaných v kroku 3.

To je směrodatná odchylka mezi třemi primárními procenty normálního rozdělení, v rámci kterých by měla klesnout většina dat v sadě, s výjimkou malého procenta pro odlehlé hodnoty.

Použití empirického pravidla

Jak již bylo uvedeno výše, empirické pravidlo je zvláště užitečné pro předpovídání výsledků v rámci souboru dat. Statisticky, jakmile je určena směrodatná odchylka, lze soubor dat snadno podrobit empirickému pravidlu, které ukazuje, kde jsou části dat v distribuci.

Předpovídání Předpovídání Předpovídání se týká praxe předpovídání toho, co se stane v budoucnosti, a to zohledněním událostí v minulosti i současnosti. V zásadě jde o rozhodovací nástroj, který pomáhá podnikům vyrovnat se s dopadem nejistoty budoucnosti zkoumáním historických údajů a trendů. je možné, protože i bez znalosti všech datových specifik lze provést projekce o tom, kde budou data spadat do množiny, na základě 68%, 95% a 99,7% diktátu, který ukazuje, kde by měla všechna data spočívat.

Ve většině případů je empirické pravidlo primárně používáno k určení výsledků, pokud nejsou k dispozici všechna data. Umožňuje statistikům - nebo těm, kteří studují data - získat přehled o tom, kam data spadnou, jakmile budou k dispozici. Empirické pravidlo také pomáhá otestovat, jak normální je soubor dat. Pokud data neodpovídají empirickému pravidlu, nejedná se o normální rozdělení a musí se podle toho vypočítat.

Související čtení

Finance je oficiálním poskytovatelem globálního certifikátu Financial Modeling & Valuation Analyst (FMVA) ™ Certifikace FMVA® Připojte se k více než 350 600 studentům, kteří pracují pro společnosti jako Amazon, JP Morgan a Ferrari certifikační program, jehož cílem je pomoci komukoli stát se finančním analytikem světové úrovně . Chcete-li se dále vzdělávat a rozvíjet svou kariéru, budou užitečné další finanční zdroje uvedené níže:

  • Centrální tendence Centrální tendence Centrální tendence je popisný souhrn datové sady prostřednictvím jediné hodnoty, která odráží střed distribuce dat. Spolu s variabilitou
  • Nominální data Nominální data Ve statistikách jsou nominální data (označovaná také jako nominální stupnice) typ dat, který se používá k označení proměnných bez poskytnutí jakékoli kvantitativní hodnoty
  • Neparametrické testy Neparametrické testy Ve statistice jsou neparametrické testy metody statistické analýzy, které nevyžadují rozdělení, aby splňovaly požadované předpoklady, které mají být analyzovány
  • Volatilita Volatilita Volatilita je měřítkem míry kolísání ceny cenného papíru v průběhu času. Udává úroveň rizika spojeného se změnami ceny cenného papíru. Investoři a obchodníci vypočítávají volatilitu cenného papíru za účelem posouzení minulých výkyvů cen

Poslední příspěvky