Lineaarne regressioon - kursus 4900 hõõruda. alates Avatud õpe, koolitus 5 nädalat, ca 2 tundi nädalas, Kuupäev 29.11.2023.
Varia / / November 29, 2023
Kui korrelatsioonianalüüs võimaldab kvantifitseerida kahe suuruse vahelise seose tugevust ja suunda, siis regressioonimudelite konstrueerimine annab suuremad võimalused. Regressioonanalüüsi kasutades on võimalik kvantitatiivselt kirjeldada uuritavate suuruste käitumist sõltuvalt ennustaja muutujatest ja saada prognoose uute andmete põhjal. Õpid, kuidas koostada lihtsaid ja mitmekordseid lineaarseid mudeleid kasutades R-keelt. Igal meetodil on oma piirangud, seega aitame teil mõista, millistes olukordades Lineaarset regressiooni saab ja ei saa kasutada ning me õpetame teile meetodeid valitud diagnoosimiseks mudelid. Eriline koht kursusel on regressioonanalüüsi süvaanatoomial: valdad tehteid maatriksitega, mis on lineaarse regressiooni aluseks, et oleks võimalik mõista keerukamaid lineaarseid sorte mudelid.
Kui seisate silmitsi vajadusega otsida ja kirjeldada seoseid teatud nähtuste vahel, mida saab kvantitatiivselt mõõta, siis see kursus on hea võimalus mõista lihtsa ja mitmekordse lineaarse regressiooni toimimist, õppida tundma nende võimalusi ja piiranguid meetodid.
Kursus on mõeldud neile, kes on juba tuttavad R-keele andmeanalüüsi põhitehnikatega ja lihtsate .html-dokumentide loomisega, kasutades rmarkdowni ja knitr.
Teaduslikud huvid: merepõhjaelustiku koosluste struktuur ja dünaamika, ruumilised mastaabid, suktsessioon, liikidevaheline ja liigisisene biootilised vastasmõjud, mereselgrootute kasv ja paljunemine, populatsioonide demograafiline struktuur, mikroevolutsioon, biostatistika.
Kursus koosneb 5 moodulist:
1. Korrelatsioonianalüüs. Lihtne lineaarne regressioon
Alustame oma vestlust meetoditest kvantitatiivsete suuruste vaheliste seoste arvuliseks kirjeldamiseks kovariatsiooni- ja korrelatsioonikordajatega, mis võimaldavad hinnata seose tugevust ja suunda. Seejärel saate teada, millist lisateavet seoste kohta saab, kui koostate suurustevahelise seose lineaarse mudeli. Õpid tõlgendama regressioonikordajaid ja teada, millal ja kuidas saab lineaarseid mudeleid kasutada uute andmete prognoosimiseks. Selle mooduli lõpuks saate teada, kuidas sobitada lineaarse mudeli võrrandit ja joonistada see usalduspiirkonnaga.
2. Lineaarmudelite olulisuse ja kehtivuse testimine
Lineaarse mudeli koostamine ja selle võrrandi üleskirjutamine on alles analüüsi algus. Selles moodulis saate teada, kuidas kirjeldada regressioonanalüüsi tulemusi: kuidas testida üldmudeli või selle koefitsientide statistilist olulisust ja hinnata sobivuse kvaliteeti. Lineaarsetel mudelitel (õigemini nende jaoks kasutatavatel statistilistel testidel), nagu igal meetodil, on oma piirangud. Saate teada, mis need piirangud on ja kust need tulevad. Graafilised diagnostikameetodid, mida kasutame, on erinevate lineaarsete mudelite jaoks universaalsed – rohkem harjutamist aitab teil otsuseid kindlamalt teha. Kui olete sellest kõigest aru saanud, saate kirjutada R-s täieliku skripti, et sobitada, diagnoosida ja esitada lihtsa lineaarse regressiooni tulemused.
3. Lühike sissejuhatus lineaaralgebra maailma
Selles moodulis sukeldume lineaarsete mudelite südamesse. Selleks peate õppima või meeles pidama lineaaralgebra põhitõdesid. Arutame erinevaid maatriksitüüpe, nende loomist R-is ja põhitoiminguid nendega. Seda kõike vajame, et mõista, kuidas lineaarne regressioon seestpoolt toimib. Õpid, mis on mudelmaatriks, õpid kirjutama lineaarse regressiooni võrrandit maatriksite kujul ja leidma selle koefitsiente. Näete oma silmaga kübara maatriksit, mis võimaldab teil saada ennustatud väärtusi, ja saate seda isegi käsitsi arvutada. Lõpuks õpite arvutama jääkvariatsiooni, dispersiooni-kovariantsi maatriksit ja kasutama seda kõike regressiooni usaldusvööndi koostamiseks. Siis aitavad need teadmised sul mõista keerukamate mudelite struktuuri: diskreetsete ennustajatega, jääkide erineva jaotusega, variatsiooni-kovariatsiooni maatriksi erineva struktuuriga.
4. Mitmekordne lineaarne regressioon
Enamasti on suurustevahelised seosed keerukamad, kui lihtsa lineaarse regressiooni abil kirjeldada saab. Mitut lineaarset regressiooni kasutatakse selleks, et kirjeldada, kuidas vastuse muutuja sõltub mitmest ennustajast. Mitme ennustaja ilmumisega mudelisse on lineaarsel regressioonil uus rakendatavustingimus – multikollineaarsuse puudumise nõue. Selles moodulis saate teada, kuidas tuvastada ja vältida multikollineaarsust. Lõpuks on mitmes mudelis sageli rohkem muutujaid, kui neid saab tasapinnal kujutada, Seetõttu õpetame teile lihtsaid võtteid, mis aitavad teil luua informatiivset graafikat isegi selles juhtum.
5. Lineaarsete mudelite võrdlus
Mitu lineaarset mudelit on nagu konstruktsioonikomplekt: keerukamaid mudeleid saab lahti võtta ja lihtsustada. Saate teada, kuidas osalise F-testi abil pesastatud mudelite võrdlusi kasutatakse üksikute ennustajate või ennustajate rühmade olulisuse testimiseks. Keerulisemad mudelid kirjeldavad paremini algandmeid, kuid liigne komplikatsioon on ohtlik, sest sellised mudelid hakkavad uute andmete põhjal halba ennustama. Kasutades osalisi F-teste, saate mudeleid lihtsustada, kõrvaldades järk-järgult ebaolulised ennustajad. Lihtsustatud mudeleid on lihtsam kasutada tulemuste tõlgendamiseks ja esitamiseks. Kõik, mida olete seni lineaarse regressiooni kohta õppinud, saab rakendada, kui lõpetate andmeanalüüsi projekti, kus peate koostage õigesti optimaalne mitme lineaarne mudel ja esitage selle tulemused kasutades kirjutatud aruanne rmarkdown ja kududa.