Uvod u Kernel gustoće Procjena

Kernel Gustoća Procjena jestatistička metoda predstavlja niz podataka . Povezano uz histograma , Kernel Gustoća Procjena nudi način za procjenu distribuciju varijable u populaciji . Metoda je relativno sofisticiran , ali rezultativizualna interpretacija varijabla je vjerojatni gustoće , drugim riječima , učestalost kojom sevarijabla pojavljuje u populaciji . Koristi

Kernel procjene gustoće Procjena oblik funkcije gustoće . Učestalost kojomvarijabla pojavljuje u slučajni uzorak od stanovnikafunkcija gustoće pokazuje . Kernel Gustoća Procjena smatraneparametarsko metoda . U statistici , postoje parametarske te neparamterijskih metode . Parametarske metode čine više od pretpostavke neparametarskim one . Nema pretpostavke o raspodjeli sredstava , ili standardne devijacije su potrebni u neparametarskim statistike . Na primjer , ako ste htjeli znati hoće lideseti test u razredu će imati višu ocjenu nego u prvih devet mjeseci , u parametarskom razmišljanju što bi trebala znati srednju vrijednost i standardnu ​​devijaciju izvući odgovor . U neparametrijskog zaključivanja , jednostavno znati broj testa je dovoljno znatizadnji test ima 10 posto šanse da bude iznad prethodne rezultate .
Kernel

Kernel Gustoća Procjena ima dvije ključne komponente:kernela ipropusnost . Kernel jefunkcija gustoće . Postoji šest uobičajene vrste funkcija gustoće u neparametarskim statistike : normalne , jedinstvene , trokutaste , Epanechnikov , quartic , triweight i kosinus . Svaki od tih funkcija se koristi za procjenu učestalosti slučajnih varijabla u populaciji .
Propusnost

Druga komponenta ,propusnost , zaglađuje Dobiveni podaci iz funkcije gustoće kernela . Propusnost , dakle , ima snažno utjecajevizualni prikaz podataka . Nazubljene linije može postati postupno izgladiti dopodataka je tako parafrazirati da to više nije korisno . U formuli Kernel procjene gustoće ,propusnost je predstavljen slovom h . To mora biti pozitivan i dovesti u distribuciji koje sažima u jednu .
Prednosti

Kernel Gustoća Procjena ima prednosti na druge neparametarskim metode procjenjivanja , posebno histograma . Histogrami predstavljaju distribuciju varijable u smeće uz horizontalnom rasponu . Složeni otpatke predstavljati veću gustoću varijable u sektoru podataka . Zbog histogrami simboliziraju podatke kroz smeće ,varijabla je kategorizirana i različitih distribucija razvedeno i diskretni , pogrešno raspodjelu tekućine varijable koja stvarno postoji u populaciji . Kernel Gustoća Procjena bolje predstavlja ovu fluidnost s glatkih linija , čiji glatkoću određuje propusnost izabrao u formuli gustoće kernela .

Odgovori