Masinõpe praktikas - kursus 41 500 hõõruda. IBS Koolituskeskusest, koolitus 24 tundi, kuupäev 26.11.2023.
Varia / / December 02, 2023
Kursus on üles ehitatud mitmele praktilisele juhtumile, mis sisaldavad lähteandmetega tabeleid.
Iga juhtumi puhul läbime masinõppeprojekti kogu elutsükli:
andmete uurimine, puhastamine ja ettevalmistamine,
ülesandele sobiva treeningmeetodi valimine (lineaarne regressioon regressiooniks, juhuslik mets klassifitseerimiseks, K-keskmised ja DBSCAN rühmitamiseks),
koolitus valitud meetodil,
tulemuste hindamine,
mudeli optimeerimine,
tulemuse esitlemine kliendile.
Kursuse aruteluosas arutame õpilaste ees seisvaid praktilisi probleeme, mida saab käsitletud meetoditega lahendada.
Käsitletavad teemad:
1. Ülesande ülevaade (teooria – 1 tund)
Milliseid probleeme lahendab masinõpe hästi ja milliseid probleeme püütakse lahendada?
Mis juhtub, kui palkate andmeteadlase asemel selle valdkonna mittespetsialisti (ainult arendaja/analüütiku/halduri) ootusega, et nad õpivad selle käigus.
2. Ettevalmistus, koristamine, andmete uurimine (teooria – 1 tund, praktika – 1 tund)
Kuidas mõista äritegevuse lähteandmeid (ja üldiselt tuvastada nende järjekorda).
Töötlemise järjekord.
Mida saab ja peaks delegeerima domeenianalüütikutele ning mida on kõige parem teha andmeteadlasel endal.
Prioriteedid konkreetse probleemi lahendamisel.
3. Klassifikaatorid ja regressorid (teooria – 2 tundi, praktika – 2 tundi)
Praktiline osa – hästi vormistatud ülesanded koos ettevalmistatud andmetega.
Ülesannete erinevus (binaarne/mittebinaarne/tõenäosuslik klassifikatsioon, regressioon), ülesannete ümberjaotus klasside vahel.
Näited praktiliste probleemide klassifitseerimisest.
4. Klasterdamine (teooria – 1 tund, praktika – 2 tundi)
Kus ja kuidas klasterdamist läbi viia: andmete uurimine, probleemipüstituse kontrollimine, tulemuste kontrollimine.
Milliseid juhtumeid saab taandada klastriteks.
5. Mudeli hindamine (teooria – 1 tund, praktika – 1 tund)
Ärimõõdikud ja tehnilised mõõdikud.
Klassifitseerimis- ja regressiooniprobleemide mõõdikud, veamaatriks.
Klastrite kvaliteedi sisemised ja välised mõõdikud.
Ristvalideerimine.
Ümberõppe hindamine.
6. Optimeerimine (teooria – 5 tundi, praktika – 3 tundi)
Mis teeb ühe mudeli teisest paremaks: parameetrid, funktsioonid, komplektid.
Seadete haldamine.
Funktsioonide valiku praktika.
Tööriistade ülevaade parimate parameetrite, funktsioonide ja meetodite leidmiseks.
7. Diagrammid, aruanded, töö reaalajas ülesannetega (teooria – 2 tundi, praktika – 2 tundi)
Kuidas toimuvat selgelt selgitada: endale, meeskonnale, kliendile.
Rohkem ilusaid vastuseid mõttetutele küsimustele.
Kuidas esitada kolm terabaiti tulemusi ühel slaidil.
Poolautomaatsed testid, mille protsessi juhtpunkte on tõesti vaja.
Reaalajas ülesannetest täieliku uurimis- ja arendusprotsessini (“R&D in praktika”) – auditooriumi ülesannete analüüs ja analüüs.