Vícenásobná lineární regrese - přehled, vzorec, jak to funguje

Vícenásobná lineární regrese odkazuje na statistickou techniku, která se používá k předpovědi výsledku proměnné na základě hodnoty dvou nebo více proměnných. Někdy je známá jednoduše jako vícenásobná regrese a je rozšířením lineární regrese. Proměnná, kterou chceme předpovědět, je známá jako závislá proměnná, zatímco proměnné, které používáme k predikci hodnoty závislé proměnné Závislá proměnná Závislá proměnná, se bude měnit v závislosti na hodnotě jiné proměnné, která se nazývá nezávislá proměnná. jsou známé jako nezávislé nebo vysvětlující proměnné.

Vícenásobná lineární regreseObrázek 1: Vícenásobné předpovědi modelu lineární regrese pro jednotlivá pozorování (zdroj)

souhrn

  • Vícenásobná lineární regrese odkazuje na statistickou techniku, která používá dvě nebo více nezávislých proměnných k předpovědi výsledku závislé proměnné.
  • Tato technika umožňuje analytikům určit variaci modelu a relativní příspěvek každé nezávislé proměnné k celkovému rozptylu.
  • Vícenásobná regrese může mít dvě formy, tj. Lineární regrese a nelineární regrese.

Vzorec vícenásobné lineární regrese

Vícenásobná lineární regrese - vzorec

Kde:

  • yi je závislá nebo předpokládaná proměnná
  • β0 je průsečík y, tj. hodnota y, když xi i x2 jsou 0.
  • β1 a β2 jsou regresní koeficienty, které představují změnu y vzhledem ke změně jedné jednotky v xi1 a xi2, resp.
  • βp je koeficient sklonu pro každou nezávislou proměnnou
  • ϵ je náhodný (zbytkový) termín modelu.

Pochopení vícenásobné lineární regrese

Jednoduchá lineární regrese umožňuje statistikům předpovědět hodnotu jedné proměnné pomocí dostupných informací o jiné proměnné. Lineární regrese se pokouší navázat vztah mezi dvěma proměnnými podél přímky.

Vícenásobná regrese je typ regrese, kde závislá proměnná ukazuje a lineární vztah se dvěma nebo více nezávislými proměnnými. Může to být také nelineární, kde závislé a nezávislé proměnné Nezávislá proměnná Nezávislá proměnná je vstup, předpoklad nebo ovladač, který je změněn za účelem posouzení jejího dopadu na závislou proměnnou (výsledek). nenásledujte přímku.

Lineární i nelineární regrese sleduje konkrétní odezvu pomocí dvou nebo více proměnných graficky. Nelineární regrese je však obvykle obtížné provést, protože je vytvořena z předpokladů odvozených z pokusu a omylu.

Předpoklady vícenásobné lineární regrese

Vícenásobná lineární regrese je založena na následujících předpokladech:

1. Lineární vztah mezi závislou a nezávislou proměnnou

Prvním předpokladem vícenásobné lineární regrese je, že mezi závislou proměnnou a každou z nezávislých proměnných existuje lineární vztah. Nejlepší způsob, jak zkontrolovat lineární vztahy, je vytvořit scatterplots a poté vizuálně zkontrolovat scatterplots na linearitu. Pokud vztah zobrazený v bodovém grafu není lineární, bude analytik muset provést nelineární regresi nebo transformovat data pomocí statistického softwaru, jako je SPSS.

2. Nezávislé proměnné spolu navzájem velmi nekorelují

Data by neměla ukazovat multicollinearitu, ke které dochází, když jsou nezávislé proměnné (vysvětlující proměnné) vzájemně vysoce korelované. Když nezávislé proměnné ukáží multicollinearitu, nastanou problémy při zjišťování konkrétní proměnné, která přispívá k odchylce v závislé proměnné. Nejlepší metodou pro testování předpokladu je metoda faktoru rozptylu odchylky.

3. Rozptyl reziduí je konstantní

Vícenásobná lineární regrese předpokládá, že množství chyb ve zbytcích je podobné v každém bodě lineárního modelu. Tento scénář se nazývá homoscedasticita. Při analýze dat by analytik měl vykreslit standardizované rezidua proti předpokládaným hodnotám, aby určil, zda jsou body rozloženy spravedlivě mezi všechny hodnoty nezávislých proměnných. Chcete-li otestovat předpoklad, lze data vykreslit na bodovém grafu nebo pomocí statistického softwaru k vytvoření bodového grafu, který zahrnuje celý model.

4. Nezávislost pozorování

Model předpokládá, že pozorování by měla být na sobě nezávislá. Jednoduše řečeno, model předpokládá, že hodnoty reziduí jsou nezávislé. K otestování tohoto předpokladu použijeme statistiku Durbin Watson.

Test zobrazí hodnoty od 0 do 4, kde hodnota od 0 do 2 zobrazuje pozitivní autokorelaci a hodnoty od 2 do 4 ukazují negativní autokorelaci. Střední bod, tj. Hodnota 2, ukazuje, že neexistuje autokorelace.

5. Vícerozměrná normalita

K vícerozměrné normálnosti dochází, když jsou zbytky normálně distribuovány. Chcete-li tento předpoklad otestovat, podívejte se, jak jsou hodnoty reziduí distribuovány. Lze jej také otestovat pomocí dvou hlavních metod, tj. Histogramu se superponovanou normální křivkou nebo metodou Normal Probability Plot.

Další zdroje

Finance nabízí Certified Banking & Credit Analyst (CBCA) ™ Certifikace CBCA ™ Certifikace Certified Banking & Credit Analyst (CBCA) ™ je celosvětovým standardem pro úvěrové analytiky, který zahrnuje finance, účetnictví, kreditní analýzu, analýzu peněžních toků, modelování smluv, půjčky splátky a další. certifikační program pro ty, kteří chtějí posunout svou kariéru na vyšší úroveň. Chcete-li se dál učit a rozvíjet svou znalostní základnu, prozkoumejte prosím další relevantní finanční zdroje níže:

  • Metody předpovědi Metody předpovědi Nejlepší metody předpovědi. V tomto článku vysvětlíme čtyři typy metod předpovídání výnosů, které finanční analytici používají k předpovídání budoucích výnosů.
  • Poissonova distribuce Poissonova distribuce Poissonova distribuce je nástroj používaný ve statistikách teorie pravděpodobnosti k predikci množství variací ze známé průměrné rychlosti výskytu v rámci
  • Náhodná proměnná Náhodná proměnná Náhodná proměnná (stochastická proměnná) je typ proměnné ve statistice, jejíž možné hodnoty závisí na výsledcích určitého náhodného jevu
  • Regresní analýza Regresní analýza Regresní analýza je sada statistických metod používaných k odhadu vztahů mezi závislou proměnnou a jednou nebo více nezávislými proměnnými. Lze jej použít k posouzení síly vztahu mezi proměnnými a k ​​modelování budoucího vztahu mezi nimi.

Poslední příspěvky

$config[zx-auto] not found$config[zx-overlay] not found