Üldised lineaarsed mudelid - kursus 3600 hõõruda. alates Avatud õpe, koolitus 3 nädalat, ca 6 tundi nädalas, Kuupäev 29.11.2023.
Varia / / December 01, 2023
Tavaliste lineaarmudelite rakendatavuse üheks tingimuseks on vaatluste sõltumatus üksteisest, mille alusel mudel valitakse. Praktikas tuleb aga sageli ette olukordi, kus materjalikogumise kujundus on selline, et selle tingimuse rikkumine on vältimatu. Kujutage ette, et otsustasite luua mudeli, mis kirjeldab seost kehalise kasvatuse tulemuslikkuse ja õpilaste IQ testi tulemuste vahel. Selle probleemi lahendamiseks tegite mitmes asutuses arvukalt näidiseid. Kas selliseid andmeid on võimalik ühendada üheks traditsioonilise skeemi järgi üles ehitatud analüüsiks? Muidugi mitte. Iga ülikooli üliõpilased võivad mõnes mõttes üksteisega sarnased olla. Isegi uuritavate suuruste vahelise seose olemus võib olla mõnevõrra erinev. Seda tüüpi andmeid, milles esineb rühmasiseseid korrelatsioone, tuleks analüüsida lineaarsete segamudelite abil. Näitame, et mõned ennustajad tuleks mudelisse kaasata nn juhuslike teguritena. Saate teada, et juhuslikud tegurid võivad olla hierarhiliselt allutatud. Arutleme, kuidas saab selliseid segamudeleid luua sõltuvate muutujate jaoks, mis järgivad erinevat tüüpi jaotusi. Lisaks näitame, et mudeli juhuslik osa võib olla veelgi keerulisem – sellel võib olla komponent, mis modelleerib dispersiooni käitumist vastusena ühismuutuja mõjule. Kursuse lõpust leiate projekti, mille käigus saate harjutada segamudelite ehitamist, valides ühe mitmest andmekogumist. Nende andmete analüüsi põhjal saate koostada reprodutseeritava uurimistöö traditsiooni kohaselt aruande.
Peterburi Riikliku Ülikooli bioloogiateaduskonna selgrootute zooloogia osakonna dotsent, Ph.D.
Teaduslikud huvid: merepõhjaelustiku koosluste struktuur ja dünaamika, ruumilised mastaabid, suktsessioon, liikidevaheline ja liigisisene biootilised vastasmõjud, mereselgrootute kasv ja paljunemine, populatsioonide demograafiline struktuur, mikroevolutsioon, biostatistika.
Kursus koosneb 4 moodulist:
1) Sissejuhatus üldistatud lineaarsetesse mudelitesse
Üldised lineaarsed mudelid (GLM-id) võimaldavad modelleerida suuruste käitumist, mis ei järgi normaaljaotust. Et teha teie esimesi samme GLM-i maailmas lihtsamaks, analüüsime nende struktuuri GLM-i näitel normaaljaotusega suuruste puhul – nii saate tõmmata paralleele lihtsate lineaarmudelitega. Saate teada, mis on linkfunktsioon, kuidas maksimaalne tõenäosus töötab ja kuidas testida GLM-i hüpoteese, kasutades Waldi teste ja tõenäosussuhte teste.
2) Mudeli valiku probleem
Selles moodulis räägime ehitusmudelitega seotud metoodilistest küsimustest. Mudel on reaalsuse lihtsustatud esitus ja sellise lihtsustamise erinevate konkureerivate meetodite vahel valimine on analüütiku sagedane ülesanne. Selles moodulis õpid võrdlema mudeleid teabekriteeriumide abil. Käsitleme peamisi analüüsivõimalusi mudelite valikul ning räägime raskustest, mis tekivad seoses mudelite varjatud paljususega. Lõpuks õpetame teid ära tundma peamised mudelivaliku kuritarvitamise tüübid (andmete püüdmine, p-häkkimine).
3) Üldised lineaarsed mudelid andmete loendamiseks
Selles moodulis käsitleme loendatavate suuruste modelleerimise põhimeetodeid. Esiteks arutleme, miks tavapärased lineaarsed mudelid andmete loendamiseks ei sobi. Loendatavate jaotuste omadused aitavad teil mõista GLM-i tüüpide erinevusi loendatavate andmete ja nende diagnostika funktsioonide vahel. Näete lingifunktsiooni töös, kui visualiseerite GLM-i ennustusi lingifunktsiooni skaalal ja vastuse muutuja skaalal.
4) Binaarse vastusega üldistatud lineaarsed mudelid
Mõnikord on vaja simuleerida, kas mõni sündmus on toimunud või mitte, kas jalgpallimeeskond või kaotatud, olenemata sellest, kas patsient paranes pärast ravi või mitte, kas klient on pühendunud osta või mitte. Tavalised lineaarmudelid ei sobi selliste binaarandmete (kahe tulemusega sündmused) modelleerimiseks, kuid seda saab hõlpsasti teha üldistatud lineaarsete mudelite abil. Selles moodulis õpid modelleerima sündmuste toimumise tõenäosusi, esitades need koefitsientidena. Vaatame, kuidas logit linki funktsioon töötab ja kuidas GLM-i koefitsiente tõlgendatakse selle kasutamisel. Lõpuks saate andmeanalüüsi projekti läbides harjutada erinevate jaotustega üldistatud lineaarsete mudelite analüüsimist. Selle analüüsi tulemused tuleb esitada aruandena html-vormingus, mis on kirjutatud kasutades rmarkdown/knitr.
• Saate teada, milliseid oskusi on vaja analüütika ja andmeteadusega alustamiseks.• Õppige kasutama Exceli, SQL-i, Power BI-d ja Google Data Studiot. andmed ja kirjutage oma esimene kood Pythonis• Hankige samm-sammult juhend ja õppige, kuidas siseneda andmeteaduse valdkonda ja valida roll andmeteaduses
4,4
1 490 ₽