Formacija, Nauka
Logistička regresija: modeli i metode
и дискриминантного анализа используются тогда, когда необходимо четко дифференцировать респондентов по целевым категориям. Logistička regresija i diskriminativne analize se koriste kada je potrebno da se jasno razlikovati ispitanika ciljane kategorije. Osim toga, ove grupe su jedan nivo univarijatnih parametar. а также выясним, для чего она нужна. Razmotrimo detaljnije logističke regresije modela, kao i saznati šta je to bilo.
pregled
, может выступать классификация респондентов по группам покупающих и не покупающих горчицу. Primjer problema, u otopini koja se koristi logističke regresije, može biti klasifikaciju ispitanika kupovinom grupa, a ne kupuju senf. Razlika se vrši u skladu sa socio-demografske karakteristike. To uključuje, posebno, uključuju dob, spol, broj članova porodice, prihoda i tako dalje. Postoje kriteriji za razlikovanje i varijable u operaciji. Potonji kodira ciljne kategorije za koje, u stvari, potrebno je podijeliti ispitanika.
nijanse
, значительно уже, чем для дискриминантного анализа. Mora se reći da je niz slučajeva u kojima su primenjene regresija logistike, mnogo uža od diskriminativne analize. U tom smislu, korišćenje ove druge kao univerzalni metod za razlikovanje smatra se više preferira. Osim toga, eksperti preporučuju počevši sa studijom klasifikacije diskriminativna analiza. I samo u slučaju nesigurnosti za rezultate se može koristiti logistička regresija. Ova nužnost je uzrokovana nekoliko faktora. используется при наличии четкого представления о типе независимых и зависимых переменных. Logistička regresija se koristi kada postoji jasna ideja o vrsti nezavisnih i zavisnih varijabli. U skladu s tim, izabrani jedan od 3 moguća procedura. Kada se diskriminativne analize, istraživač se uvijek bavi statičkoj operaciju. To su uključeni jedan zavisne i nekoliko nezavisnih kategoričke varijable sa skali od bilo koje vrste.
vrste
, состоит в определении вероятности того, что определенный респондент будет отнесен к той или иной группе. Cilj statističkih istraživanja, koja koristi logističku regresiju, je da se odredi vjerojatnost da će određeni ispitanik biti dodijeljen određenoj grupi. Diferencijacija se obavlja prema određenim parametrima. U praksi, u skladu s vrijednostima jedne ili više nezavisnih faktora mogu se svrstati u dvije grupe ispitanika. . U ovom slučaju, postoji binarna logistička regresija. Također je navedeno parametri mogu se koristiti u raspodjeli grupi veći od dva. U takvoj situaciji postoji MULTINOMIAL logistička regresija. Rezultirajući grupa izrazila nivoa bilo koje varijable.
primjer
Pretpostavimo da postoje odgovora ispitanika na pitanje da li su zainteresovani za ponudu za preuzimanje zemljišta u predgrađu Moskve. U ovom slučaju, opcije su "ne" i "da". Moramo da saznamo šta faktori imaju dominantan uticaj na odluku potencijalnih kupaca. Za ovaj ispitanik pitanja koja se postavljaju o infrastrukturi teritorije, udaljenost do glavnog grada, površine zemljišta, prisustvo / odsustvo stambenih zgrada i tako dalje. Koristeći binarne regresija, može distribuirati u dvije grupe ispitanika. Prvi će uključivati one koji su zainteresirani za kupnju - potencijalnih kupaca, a drugi, odnosno, oni koji nisu zainteresirani za takvu ponudu. Za svakog ispitanika, pored toga, ona će se izračunati vjerojatnost zadatak da jednu kategoriju ili drugi.
komparativne karakteristike
Za razliku od dva oličenja iznad sastoji se u drugom broju i vrsti zavisnih grupa i nezavisnih varijabli. U binarnom regresije, na primjer, proučavali ovisnost dihotomna faktor od jedne ili više nezavisnih uvjetima. U ovom slučaju, a drugi može biti bilo koje vrste obima. Multinomial regresija se smatra nekom vrstom verziju klasifikacije. To se odnosi na zavisne varijable za više od 2 grupe. Nezavisni faktori moraju imati ili redni ili nominalno razmjera.
Logističke regresije u SPSS
Paket 11-12 statistički, predstavio novu verziju analize - sekvence. Ova metoda se koristi kada zavisni faktor se odnosi na isto ime (redni) skale. U ovom slučaju nezavisne varijable izabrane jedan određeni tip. Oni moraju biti ili redni ili nominalno. Klasifikacija u nekoliko kategorija se smatra najviše svestran. Ova metoda se može koristiti u svim studijama koje koriste logistička regresija. , однако, можно только с помощью всех трех приемов. Poboljšati kvalitet modela, međutim, moguće je samo pomoću sve tri metode.
redni klasifikacije
Kaže se da je ranije u statističkog paketa nije pružena prilika da izvrši tipične specijaliziranih analiza za zavisne faktora s rednim skale. Za sve varijable, sa brojem grupa više od 2 koristi MULTINOMIAL opciju. Uveden relativno nedavno analiza sekvenci ima brojne karakteristike. Uzimaju u obzir specifičnosti to skale. часто не рассматривается как отдельный прием. U međuvremenu, u metodološkom priručnike redni logistička regresija se često ne tretira kao poseban prijem. Razlog je kako slijedi: serijski analiza nema nikakve značajne prednosti nad MULTINOMIAL. Istraživač može dobro koristiti drugi u prisustvu i redni, a nominalna zavisna varijabla. Pri tome, proces klasifikacije su gotovo ne razlikuju jedni od drugih. To znači da je analiza holdinga kako neće uzrokovati nikakve probleme.
analiza opcija
Razmotrimo jednostavan slučaj - binarni regresije. Na primjer, u procesu istraživanja tržišta procjenjuje se potražnja za diplomiranim određenih Metropolitan University. U upitniku, ispitanici su postavljali pitanja, uključujući:
- Radiš li? (Ql).
- Navedite godina mature (21 q).
- Koja je prosječnu ocjenu izlaza (prosječno).
- Spol (Q22).
позволит оценить воздействие независимых факторов aver, q 21 и q 22 на переменную ql. Logističke regresije će procijeniti utjecaj nezavisnih faktora prosječno, 21 q i 22 q na varijablu ql. Jednostavno rečeno, u svrhu analize je da se utvrdi vjerovatno zapošljavanje diplomiranih studenata na temelju informacija na terenu, do kraja godine, a prosječna ocjena.
logističke regresije
Da biste postavili parametre pomoću binarnih regresije, koristite Analyze►Regression►Binary Logistic izbornika. U logističke regresije da izabere u lijevom listu dostupnih varijabli zavisne faktor. Oni je ql. Ta varijabla mora biti postavljen u Ovisna terenu. Nakon toga, morate da unesete stranice kovarijable nezavisni faktori - 21 q, 22 q, Pros. Onda morate izabrati način, uključujući ih u analizi. Ako je broj nezavisnih faktora više od 2, ne koristite metodu istovremene primjene svih varijabli, koji je postavljen po defaultu, i korak po korak. Najpopularniji način smatra se unatrag: LR. Koristeći Select dugme, ne možete uključiti u proučavanju svih ispitanika, a samo određeni cilj kategoriju.
Definirati Kategorički varijable
Kategoričan dugme za korištenje u slučaju kada je jedna od varijabli ocijenjen na broj kategorija više od 2. U ovoj situaciji, Define prozor Kategorijalna varijable u stanici Kategorički kovarijable stavljen upravo takvu opciju. U ovom primjeru, kao varijabla nedostaje. Nakon toga padajuće liste, izaberite stavku Contrast devijacija i kliknite na dugme Change. Kao rezultat toga, neke od zavisne varijable će biti generiran iz svake od nazivne faktor. Njihov broj odgovara broju od originala uslovima kategorija.
Spasiti nove varijable
Koristite dugme Save u glavnom studiju je postavljen za stvaranje nove postavke dijalog. Oni će sadržavati brojeve obračunava u procesu regresije. Konkretno, moguće je da se stvori varijable koje određuju:
- Pripadnosti određenoj kategoriji klasifikacije (Groupmembership).
- Vjerovatnoća klasifikaciju ispitanika u svakoj studijskoj grupi (Probabilities).
Kada koristite istraživač na dugme Opcije ne prima značajne mogućnosti. U skladu s tim, može se zanemariti. Nakon pritiska na dugme "OK" u glavnom prozoru će biti prikazani rezultati analize.
Kontrola kvalitete logističke adekvatnosti regresije
Uzmite u obzir sto Omnibus Testsof koeficijenata modela. Ona prikazuje rezultate analize kvaliteta modela aproksimacije. S obzirom na činjenicu da je inkrementalni opciju, morate gledati rezultate posljednjoj fazi (Korak 2) je postavljen. Će se smatrati pozitivan rezultat, u kojoj je otkrivena rast indeksa Chi-kvadrat u prelasku na sljedeći korak na visok stupanj značaja (Sig. <0,05). Kvalitet modela procjenjuje se na liniju modela. Ako dobijete negativnu vrijednost, ali to se ne smatra značajnim ako je ukupni model visoke materijalnosti, posljednje može se smatrati praktično upotrebljiv.
stolovi
Model Rezime procjenu ukupne indeksa disperzije, koji opisuje izgrađeni model (slika R Square). Preporučuje se da se primjenjuju vrijednosti Nagelker. Pozitivan pokazatelj može se smatrati kao parametar Nagelkerke R Square, ako je veći od 0,50. Nakon toga je ocenio rezultate klasifikacije u koje su stvarni pokazatelji koji pripadaju jednoj ili drugoj kategoriji studija u poređenju sa onima model predviđa i regresije. U tu svrhu, sto klasifikacija Tabela. Takođe vam omogućava da izvući zaključke o ispravnosti diferencijacije za svaku od grupa u pitanju.
Prva tabela, koja sadrži važne pokazatelje za istraživača, - Model ugradnje informacije. Visok nivo statističke značajnosti će ukazuju na visoku kvalitetu i prikladnost upotrebe modela za rješavanje praktičnih problema. Još jedan važan sto je Pseudo R-kvadrat. To vam omogućuje da se procijeni udio ukupne varijance zavisne faktor, što je uzrokovano nezavisne varijable odabrane za analizu. Prema tabeli Vjerojatnost Odnos testovi mogu izvući zaključke o statističku značajnost ovog drugog. Parametar procjene odražavaju nestandardizovanih koeficijentima. Oni se koriste u izgradnji jednadžbe. Osim toga, za svaku kombinaciju varijabli određuje statističke značajnosti njihovog uticaja na zavisne faktor. U međuvremenu, istraživanje tržišta često je potrebno razlikovati kategorije ispitanika ne odvojeno, već kao dio ciljne grupe. U tu svrhu, sto Observedand predviđenog frekvencija.
praktičnu primjenu
Smatra metoda analize je naširoko koristi u radu trgovaca. Godine 1991., indikator sigmoidna logistička regresija je razvijen. On je jednostavan za korištenje i efikasan alat koji se može koristiti za predviđanje vjerojatno cijene za svoje "pregrijavanja". Indikator je predstavljen na grafikonu u obliku kanala formirana od dvije linije proteže paralelno. Oni su uklonjeni na jednakoj udaljenosti od trenda. Širina koridora ovisit će isključivo o rokovima. Indikator se koristi kada se radi s gotovo svim sredstvo - od valutnih parova u plemenite metale.
U praksi, to je proizvelo 2 ključne strategije za korištenje instrumenta: slom i preokret. U drugom slučaju, trgovac će se fokusirati na dinamiku promjene cijena unutar kanala. Na je vjerovatnoća da pokret počinje u suprotnom pravcu kako se približava trošak stopi linije podrške ili otpora. Ako cijena je usko sposoban za gornju granicu, onda se imovina može biti eliminirana. Ako je na donjoj granici, trebalo bi razmisliti o kupovini. Strategija slom uključuje upotrebu naloga. Oni su instalirani izvan granica relativno maloj udaljenosti. Uzimajući u obzir da im je cijena u nekim slučajevima krše za kratko vrijeme, ne bi trebalo igrati na sigurno i postaviti stop-loss. U isto vrijeme, naravno, bez obzira na izabrane strategije zahtijeva trgovac kako bi se povećala hladno sagledati i procijeniti situaciju koja je nastala na tržištu.
zaključak
Prema tome, upotreba logističke regresije vam omogućava da brzo i lako kategorizirati ispitanika u kategorije u skladu s navedenim parametrima. Kada se analizira mogućnost korištenja na određeni način. Konkretno, svestranost različitih MULTINOMIAL regresije. Međutim, stručnjaci preporučuju korištenje sve metode gore opisane u kompleksu. To je zbog činjenice da je u ovom slučaju kvalitet model će biti znatno veći. To je, pak, proširiti opseg njegove primjene.
Similar articles
Trending Now