Elastická síť - přehled, geometrie a regularizace

Elastická čistá lineární regrese využívá k regulaci regresních modelů tresty jak z lasových, tak z hřebenových technik. Tato technika kombinuje laso LASSO LASSO, zkratka pro Least Absolute Shrinkage and Selection Operator, je statistický vzorec, jehož hlavním účelem je výběr a regularizace metod a hřebenová regresní metoda tím, že se poučí z jejich nedostatků a zlepšuje regularizaci statistických modelů.

Elastická síť

Metoda elastické sítě zlepšuje omezení lasa, tj. Kde laso bere několik vzorků pro vysoce dimenzionální data, postup elastické sítě poskytuje zahrnutí „n“ počtu proměnných až do nasycení. V případě, že proměnné jsou vysoce korelované skupiny, má laso tendenci vybírat jednu proměnnou z těchto skupin a zbytek zcela ignorovat.

Aby se vyloučila omezení nalezená v lasu, zahrnuje elastická síť do trestu kvadratický výraz (|| β || 2), který se při izolovaném použití stává hřebenovou regresí. Kvadratický výraz v trestu zvyšuje funkci ztráty směrem k konvexnosti. Elastická síť čerpá z toho nejlepšího z obou světů - tj. Laso a hřebenová regrese.

V postupu pro nalezení odhadu metody elastické sítě existují dvě fáze, které zahrnují jak laso, tak regresní techniky. Nejprve najde hřebenové regresní koeficienty a poté provede druhý krok pomocí lasového druhu zmenšení koeficientů.

Tato metoda proto podrobuje koeficienty dvěma typům smrštění. Dvojité smrštění z naivní verze elastické sítě způsobuje nízkou účinnost předvídatelnosti a vysoké zkreslení. Pro korekci těchto efektů jsou koeficienty změněny tak, že je vynásobíme (1 + λ2).

Rychlé shrnutí

  • Metoda elastické sítě provádí výběr proměnných a regularizaci současně.
  • Technika elastické sítě je nejvhodnější tam, kde jsou rozměrová data větší než počet použitých vzorků.
  • Seskupení a výběr proměnných jsou klíčové role techniky elastické sítě.

Elastická geometrie sítě

Při vykreslování na kartézské rovině spadá elastická síť mezi hřebenové a lasso regresní grafy, protože se jedná o kombinaci těchto dvou regresních metod. Děj pro elastickou síť také vykazuje singularitu ve vrcholech, které jsou důležité pro řídkost. Vykazuje také přísné konvexní hrany, kde konvexita závisí na hodnotě α.

Konvexita je také závislá na seskupovacím efektu závislém na korelaci Korelace Korelace je statistickým měřítkem vztahu mezi dvěma proměnnými. Míra se nejlépe používá v proměnných, které mezi sebou prokazují lineární vztah. Přizpůsobení dat lze vizuálně znázornit bodovým grafem. vybraných proměnných. Čím vyšší je korelace proměnných, tím vyšší je efekt seskupení, a tím je tedy vyšší počet proměnných zahrnutých do vzorku.

Výběr proměnných

Vytváření modelů vyžaduje výběr proměnných k vytvoření podmnožiny prediktorů. Elastická síť používá p >> n problémový přístup, což znamená, že počet čísel prediktorů je vyšší než počet vzorků použitých v modelu. Elastická síť je vhodná, když proměnné tvoří skupiny, které obsahují vysoce korelované nezávislé proměnné Nezávislá proměnná Nezávislá proměnná je vstup, předpoklad nebo ovladač, který je změněn za účelem posouzení jejího dopadu na závislou proměnnou (výsledek). .

Variabilní výběr je začleněn do postupu vytváření modelu, který pomáhá zvýšit přesnost. V případě, že skupina proměnných je vysoce korelována a jedna z proměnných je vybrána do vzorku, je do vzorku automaticky zahrnuta celá skupina.

Založení CATREG

CATREG je algoritmus, který usnadňuje transformaci proměnných, lineárních i nelineárních. Algoritmus využívá funkce krokování a splajnu při transformaci proměnných buď ne monotónně, nebo monotónně v nelineárních transformacích. CATREG může simultánně transformovat a regulovat proměnné nemonoticky, aniž by bylo nutné nejprve rozšiřovat proměnné na základní funkce nebo fiktivní proměnné.

Elastické funkce ztráty sítě lze také označit jako omezený typ běžné funkce ztráty regresí nejmenších čtverců. Algoritmus CATREG je začleněn do elastické sítě, což zvyšuje účinnost a jednoduchost výsledného algoritmu. Ve srovnání s tím elastická síť překonává laso, což samo o sobě překonává hřebenovou regresi, pokud jde o účinnost a jednoduchost.

Elastická regularizace sítě

Během procesu regularizace l1 část trestu tvoří řídký model. Na druhou stranu kvadratická část trestu činí l1 část stabilnější na cestě k regularizaci, eliminuje kvantitativní limit proměnných, které mají být vybrány, a podporuje seskupovací efekt.

Efekt seskupení pomáhá snadno identifikovat proměnné pomocí korelace. To zvyšuje postup odběru vzorků. Také zvyšuje počet vybraných proměnných, protože když je jedna proměnná vzorkována ve vysoce korelované skupině, všechny ostatní proměnné v této skupině jsou automaticky přidány do vzorku.

Efektivní stupně svobody

Efektivní stupně volnosti měří složitost modelu. Stupně volnosti jsou důležité během odhadu nebo přesné předpovědi přizpůsobení modelu. Stupně volnosti jsou také začleněny do učení lineárních vyhlazovačů. V jakékoli metodě související s l1 pokuta, nelineární povaha modelů představuje výzvu v analýze.

Elastickou síť lze také použít v jiných aplikacích, například v řídkém PCA, kde získává hlavní součásti, které jsou upraveny řídkým načítáním. Druhá aplikace je v elastické síti jádra, kde probíhá generování strojů jádra třídy s podpůrnými vektory.

Dodatečné zdroje

Finance nabízí Certified Banking & Credit Analyst (CBCA) ™ Certifikace CBCA ™ Certifikace Certified Banking & Credit Analyst (CBCA) ™ je celosvětovým standardem pro úvěrové analytiky, který zahrnuje finance, účetnictví, kreditní analýzu, analýzu peněžních toků, modelování smluv, půjčky splátky a další. certifikační program pro ty, kteří chtějí posunout svou kariéru na vyšší úroveň. Chcete-li se dál učit a rozvíjet svou znalostní základnu, prozkoumejte prosím další relevantní finanční zdroje níže:

  • Rozhodovací strom Rozhodovací strom Rozhodovací strom je podpůrný nástroj se stromovou strukturou, který modeluje pravděpodobné výsledky, náklady na zdroje, nástroje a možné důsledky.
  • Závislá proměnná Závislá proměnná Závislá proměnná je proměnná, která se bude měnit v závislosti na hodnotě jiné proměnné, která se nazývá nezávislá proměnná.
  • Vícenásobná lineární regrese Vícenásobná lineární regrese Vícenásobná lineární regrese odkazuje na statistickou techniku ​​používanou k předpovědi výsledku závislé proměnné na základě hodnoty nezávislých proměnných
  • Overfitting Overfitting Overfitting je termín používaný ve statistikách, který odkazuje na chybu modelování, ke které dochází, když funkce příliš úzce odpovídá konkrétní sadě dat

Poslední příspěvky

$config[zx-auto] not found$config[zx-overlay] not found