Neparametrická statistika - přehled, typy, příklady

Neparametrická statistika je metoda, která umožňuje statistické odvození bez ohledu na jakoukoli podkladovou distribuci. Metoda odpovídá normálnímu rozdělení za žádných předpokladů. Obvykle se v přístupu používají data, která jsou často ordinálními ordinálními daty Ve statistikách jsou ordinální data typem dat, ve kterých se hodnoty řídí přirozeným řádem. Jednou z nejpozoruhodnějších vlastností ordinálních dat je to, že se spoléhá spíše na hodnocení než na čísla.

Neparametrická statistika

Neparametrické statistiky lze porovnat s parametrickými statistikami. Druhý přístup vytváří explicitní předpoklady o distribuci pozorovaných dat a odhaduje parametry distribuce pomocí stejných dat.

souhrn

  • Neparametrická statistika je metoda, která při provádění statistických závěrů ignoruje jakékoli základní rozdělení.
  • Neparametrické statistické metody mají za cíl objevit neznámé podkladové rozdělení pozorovaných dat a také provést statistický závěr v nepřítomnosti podkladového rozdělení.
  • Výzkumníkům se doporučuje, aby zvážili slabosti, silné stránky a možná úskalí neparametrických statistik.

Porozumění neparametrické statistice

Vezměte v úvahu data s neznámými parametry µ (průměr) a σ2 (rozptyl). Zatímco parametrické statistiky předpokládají, že data byla čerpána z normálního rozdělení Normální rozdělení Normální rozdělení se také označuje jako Gaussovo nebo Gaussovo rozdělení. Tento typ distribuce je široce používán v přírodních a společenských vědách. Neparametrická statistika nepředpokládá, že data jsou normálně distribuovaná nebo kvantitativní. V tomto ohledu by neparametrické statistiky odhadovaly tvar samotného rozdělení, místo toho, aby odhadovaly jednotlivé µ a σ2.

Na druhou stranu by parametrická statistika používala průměr vzorku a směrodatnou odchylku vzorku k odhadu hodnot µ, respektive σ2. Modelová struktura neparametrických statistik je odvozena z pozorovaných dat, na rozdíl od zadaného a priori. Samotný termín neparametrický znamená, že počet a povaha parametrů jsou flexibilní, a nikoli že jim zcela chybí parametry.

Druhy neparametrické statistiky

Existují dva hlavní typy neparametrických statistických metod. První metoda se snaží objevit neznámé podkladové rozdělení pozorovaných dat, zatímco druhá metoda se pokusí provést statistickou inferenci bez ohledu na podkladovou distribuci.

Metody jádra a histogramy Histogram Histogram se používá ke shrnutí diskrétních nebo spojitých dat. Jinými slovy, histogram poskytuje vizuální interpretaci číselných dat tím, že ukazuje počet datových bodů, které spadají do zadaného rozsahu hodnot (nazývaných „koše“). Histogram je podobný svislému sloupcovému grafu. Pro odhad hodnot parametrů v prvním přístupu se však běžně používá histogram. Naproti tomu druhá metoda zahrnuje testování hypotéz bez skutečných hodnot dat, ale spíše na základě pořadí dat.

Neparametrické statistické testy mají tendenci být snáze použitelné než parametrické statistiky, vzhledem k nedostatku předpokladů o populačních parametrech. Standardní matematické postupy pro testování hypotéz nevytvářejí žádné předpoklady o rozdělení pravděpodobnosti - včetně distribučních t-testů, testů znaménka a odvození jedné populace.

Například při testování hypotézy, že „existuje rozdíl v mediánu“, dvě náhodné proměnné, X a Y, definují dvě spojitá rozdělení mezi místem, kde je hypotéza prováděna, a jsou odebrány spárované vzorky. Kromě obecné použitelnosti postrádá test také statistickou sílu jiných testů, protože funguje za několika předpokladů.

Příklady neparametrické statistiky

Předpokládejme, že výzkumný pracovník má zájem o odhad počtu dětí narozených se žloutenkou ve státě Kalifornie. Analýza souboru dat může být provedena odebráním vzorku 5 000 dětí. Odhad celé populace kojenců s žloutenkou narozených v následujícím roce je odvozené měření.

U druhého případu zvažte dvě skupiny různých výzkumníků. Zajímají se o to, zda je hromadný marketing nebo komerční marketing spojen s tím, jak rychle si společnost získá pozici značky. Za předpokladu, že velikost vzorku je vybrána náhodně, jeho distribuce týkající se toho, jak rychle společnost realizuje pozici značky Pozice trhu Pozice trhu označuje schopnost ovlivňovat vnímání spotřebitele ohledně značky nebo produktu ve srovnání s konkurencí. Lze předpokládat, že cíl trhu je normální. Nelze však předpokládat, že experiment, který měří strategické cíle společnosti zaměřené na dynamiku trhu (který také určuje umístění značky), přebírá normální distribuci.

Hlavní myšlenkou tohoto jevu je, že náhodně vybraná data mohou obsahovat faktory, jako je dynamika trhu. Na druhé straně, pokud se hrají faktory jako segment trhu a konkurence, strategické cíle společnosti pravděpodobně nebudou mít vliv na velikost vzorku. Takový přístup je účinný, pokud v datech chybí jasná numerická interpretace.

Například testy, zda zákazníci preferují konkrétní produkt kvůli jeho nutriční hodnotě, mohou zahrnovat hodnocení jeho metrik podle toho, jak silně souhlasím, souhlasím, lhostejný, nesouhlasím a rozhodně nesouhlasím. V takovém scénáři se hodí neparametrická metoda.

Klíčové jídlo

Používání neparametrických statistických přístupů ve výzkumu vyžaduje náležitou péči o jeho slabostech, silných stránkách a potenciálních úskalích. Je pravda, že pro distribuci dat, která má nadměrnou špičatost nebo šikmost; neparametrické testy založené na hodnocení se ukáží jako účinnější než parametrické testy.

Přesto ne všechny případy, kdy, pokud nejsou splněny parametrické předpoklady, přijmeme neparametrické statistiky jako náhradní metody kvůli relativně nízké míře spolehlivosti získané z dřívějších statistik.

Neparametrické statistiky se cení, protože je lze snadno použít. Údaje se stávají použitelnějšími pro různé testy, protože parametry nejsou povinné. Ještě důležitější je, že statistiky lze použít při absenci důležitých informací, jako je průměr, směrodatná odchylka nebo velikost vzorku. Díky vlastnostem mají neparametrické statistiky širší rozsah použití ve srovnání s parametrickými statistikami.

Dodatečné zdroje

Finance je oficiálním poskytovatelem globálního Certified Banking & Credit Analyst (CBCA) ™ Certifikace CBCA ™ Certifikace Certified Banking & Credit Analyst (CBCA) ™ je celosvětovým standardem pro úvěrové analytiky, který zahrnuje finance, účetnictví, kreditní analýzu, analýzu peněžních toků , modelování smluv, splácení půjček atd. certifikační program, jehož cílem je pomoci komukoli stát se finančním analytikem světové úrovně. K dalšímu rozvoji vaší kariéry budou užitečné další finanční zdroje uvedené níže:

  • Základní pojmy statistiky v oblasti financí Základní pojmy statistiky v oblasti financí Pro lepší porozumění financím je zásadně důležité důkladné pochopení statistik. Statistické koncepty mohou navíc pomoci investorům sledovat
  • Testování hypotéz Testování hypotéz Testování hypotéz je metoda statistické inference. Slouží k testování, zda je prohlášení týkající se parametru populace správné. Testování hypotéz
  • Nominální data Nominální data Ve statistikách jsou nominální data (označovaná také jako nominální stupnice) typ dat, který se používá k označení proměnných bez poskytnutí jakékoli kvantitativní hodnoty
  • Neparametrické testy Neparametrické testy Ve statistice jsou neparametrické testy metody statistické analýzy, které nevyžadují rozdělení, aby splňovaly požadované předpoklady, které mají být analyzovány

Poslední příspěvky

$config[zx-auto] not found$config[zx-overlay] not found