Statistika - definice, historie a použití ve financích

Statistika je termín, který je odvozen z latinského slova „status“, což znamená skupinu čísel, které se používají k vyjádření informací o lidském zájmu. Odkazuje na techniku, která je vyvinuta za účelem shromažďování, revize, analýzy a vyvozování závěrů z kvantifikovaných dat. Získaná data se poté použijí v rozhodovacím procesu.

Finanční analytici Finanční analytici - Co dělají, používají statistické metody k analýze, hodnocení a sumarizaci velkých objemů dat do matematické formy, která je užitečná. Statistiky se používají v mnoha oborech, jako je obchod, společenské vědy, výroba, psychologie atd.

Statistika - Obrázek grafů a grafů

Druhy statistik

Studium statistiky je rozděleno do dvou hlavních kategorií. Zahrnují popisné a inferenční statistiky.

1. Popisná statistika

Popisné statistiky popisují základní rysy populace a způsob organizace dat. To umožňuje analytikům vidět charakteristiky dat a dát jim smysl. Předpokládejme například, že počítačový obchod prodává elektronická zařízení a z 1 000 prodaných elektronických zařízení je 300 notebooků. S těmito daty by jeden popis dat představoval 30% vzorku, který představuje notebooky.

Vědci používají dva hlavní typy popisných statistik, které zahrnují:

Opatření centrální tendence

Centrální tendence Centrální tendence Centrální tendence je popisný souhrn datové sady prostřednictvím jediné hodnoty, která odráží střed distribuce dat. Spolu s opatřeními variability zahrnují průměr, medián a režim. Používají se k zobrazení obecných trendů s údaji. Průměr se používá k zobrazení průměru všech složek souboru dat, zatímco medián představuje střed dat, jako je střední věk studentů, kteří chodí na vysokou školu. Režim se používá k zobrazení nejběžnějších údajů v populaci, jako je nejběžnější věk studentů v prvním ročníku vysoké školy.

Míra šíření

Míry rozpětí ukazují, jak podobné nebo odlišné jsou sady hodnot a jak spolu souvisejí. Některé ze statistik používaných k popisu toho, jak jsou data rozložena, zahrnují rozsah, kvartily, odchylky, absolutní odchylku, distribuci frekvence a směrodatnou odchylku Standardní odchylka Z hlediska statistik je standardní odchylka souboru dat měřítkem velikosti odchylek mezi hodnotami obsažených pozorování.

Například ve třídě 20 studentů může být průměrné skóre u matematické práce 70 ze 100 známek. Přestože je průměr 70 bodů, neznamená to, že všichni studenti skórují 70. Spíše to znamená, že skóre bude rozloženo pod a nad průměrné skóre. V tomto případě se míry šíření použijí k zobrazení distribuce skóre.

2. Inferenční statistiky

Inferenční statistika používá složité matematické výpočty k odvození trendů velké populace. Při analýze velké populace je obtížné analyzovat každého člena této populace jeden po druhém. Vědci spíše používají inferenční statistiku k určení vztahů mezi proměnnými ve vzorové populaci a poté pomocí těchto informací vytvářejí předpovědi o vztahu proměnných k obecné populaci.

Pokud například vědci analyzují počet ženatých mužů v populaci jednoho milionu mužů, shromáždí vzorek z populace jednoho milionu mužů a poté na základě informací získaných ze vzorku provedou zevšeobecnění celé populace.

Dvě hlavní klasifikace inferenční statistiky zahrnují následující:

Interval spolehlivosti

Interval spolehlivosti Interval spolehlivosti Interval spolehlivosti je odhad intervalu ve statistice, který může obsahovat parametr populace. Neznámý parametr populace je nalezen prostřednictvím parametru vzorku vypočítaného ze vzorkovaných dat. Například průměr populace μ se zjistí pomocí průměru vzorku x̅. se počítá ze statistik pozorovaných dat, která mohou obsahovat skutečnou hodnotu neznámého parametru populace.

Testování hypotéz

Testování hypotéz Testování hypotéz Testování hypotéz je metoda statistické inference. Slouží k testování, zda je prohlášení týkající se parametru populace správné. Testování hypotéz nastává, když vědci analyzují vzorek populace a poté tyto informace použijí k tvrzení o velké populaci, kam vzorek patří.

Vlastnosti statistiky

Některé z potenciálních charakteristik, které by statistika měla zahrnovat:

1. Úplnost

Úplnost označuje údaj o tom, zda jsou v datovém zdroji k dispozici údaje potřebné ke splnění poptávky po informacích. K zajištění přesnosti pozorovaných údajů je nutná úplnost údajů.

2. Konzistence

Na konzistenci se nahlíží z hlediska jednotnosti nebo stability údajů. Některé ze statistik používaných k měření konzistence zahrnují směrodatnou odchylku, rozsah a rozptyl. Při měření konzistence dat ze vzorku, který je reprezentativní pro velkou populaci, se obvykle zkoumá standardní chyba průměru.

Při použití nástrojů ke sběru dat lze také konzistenci měřit odhadem spolehlivosti získaných skóre.

3. Dostatečnost

Statistika se považuje za dostatečnou, pokud ze vzorku nelze vypočítat žádnou jinou statistiku. Koncept dostatečnosti je v popisné statistice běžný kvůli jeho silné závislosti na předpokladu formy distribuce dat.

4. Nestrannost

Předpětí statistik je určeno rozdílem mezi skutečnou hodnotou měřeného parametru a očekávanou hodnotou odhadce. Pokud je průměr distribuce vzorkování a očekávaná hodnota parametru stejná, považuje se statistika za nezaujatou.

Související čtení

Finance je oficiálním poskytovatelem globálního certifikátu Financial Modeling & Valuation Analyst (FMVA) ™ Certifikace FMVA® Připojte se k více než 350 600 studentům, kteří pracují pro společnosti jako Amazon, JP Morgan a Ferrari certifikační program, jehož cílem je pomoci komukoli stát se finančním analytikem světové úrovně . Chcete-li se dále vzdělávat a rozvíjet svou kariéru, budou užitečné další finanční zdroje uvedené níže:

  • Bayesova věta Bayesova věta Ve statistice a teorii pravděpodobnosti je Bayesova věta (známá také jako Bayesovo pravidlo) matematický vzorec používaný k určení podmíněné
  • Korelační matice Korelační matice Korelační matice je jednoduše tabulka, která zobrazuje korelační koeficienty pro různé proměnné. Matice zobrazuje korelaci mezi všemi možnými páry hodnot v tabulce. Je to mocný nástroj pro shrnutí velké datové sady a pro identifikaci a vizualizaci vzorů v daných datech.
  • Zákon velkých čísel Zákon velkých čísel Ve statistice a teorii pravděpodobnosti je zákon velkých čísel teorém, který popisuje výsledek opakování stejného experimentu velkého počtu
  • Pravidlo celkové pravděpodobnosti Pravidlo celkové pravděpodobnosti Pravidlo celkové pravděpodobnosti (známé také jako zákon o celkové pravděpodobnosti) je základním pravidlem ve statistice týkající se podmíněných a mezních

Poslední příspěvky