Masinaõpe suurandmetel – Open Educationi tasuta kursus, koolitus 5 nädalat, 5–14 tundi nädalas, kuupäev: 3. detsember 2023.
Varia / / December 08, 2023
Ametikoht: Crowd Solutioni arhitekt, Neatsy, Inc.
Asus tööle Kõrgemasse Majanduskooli 2017. aastal. Ta õpetab digitaalse kirjaoskuse, tekstianalüüsi ning suure hulga tekstilise teabega töötamise tööriistu ja tehnikaid käsitlevaid kursusi. Erialased huvid: suurandmete analüüs Haridus 2018 Bakalaureusekraad: Riigi Teadusülikooli Majanduskõrgkool, eriala "Rakendusmatemaatika ja arvutiteadus"
1. Andmete ettevalmistamine koolituseks
Tänapäeval töötab masinõpe tõhusalt, kui meil on palju märgistatud andmeid. Sel nädalal vaatame, millised andmevormingud ja märgistus on olemas ning kuidas seda märgistust koguda
2. Suurandmete klassikaliste mudelite koolitamine
Sel nädalal õpime, kuidas treenida klassikalisi algoritme (lineaarsed mudelid ja otsustuspuud) suurandmetel.
3. Soovitussüsteemide ehitamine
Vaatleme, kuidas saame paralleelstada soovitussüsteemides kasutatavaid klassikalisi algoritme.
4. Suurte tekstiteabe mahtude analüüs
Vaatleme tekstide masinõppe probleeme. Räägime teksti eeltöötlusest ja sellest, kuidas saada tekstiandmete struktureeritud esitus, kasutades selliseid mudeleid nagu word2vec ja BERT.
5. Sügavate närvivõrkude treenimine
Õpime, kuidas paralleelstada kaasaegsete närvivõrkude koolitust, kuidas Horovod ja Parameter Server sees töötavad ning räägime Transfer Learningust.