Data Scientist nullist PRO - kursus 233 640 RUB. SkillFactoryst, koolitus 24 kuud, kuupäev 15. august 2023.
Varia / / November 29, 2023
Pärast baaskursust on sul võimalik valida kitsam andmeteaduse eriala – ML insener, CV insener või NLP insener
M.L. Insener — masinõppe arendaja
Töötage välja krediidireitingu ennustusmudel
Lahendage rämpsposti SMS-sõnumite klassifitseerimise probleem
Töötada välja süsteem, mis võimaldab ostmisel soovitada sobivaid tooteid
Ehitage mudel müügi suurendamiseks jaekaubanduses
Looge DALL-E närvivõrgu abil tekstikirjelduse põhjal pilte
CV insener — Arvutinägemise spetsialist
Õppige lahendama kõiki arvutinägemise valdkonna põhiprobleeme
Saate teadmisi CV mudelitega töötamise tegelikust kulgemisest, praegustest lähenemisviisidest ja täiustatud töövahenditest, mis on vajalikud CV teenuste loomiseks
Lõputöös looge virtuaalne treener, kes suudab videol harjutuste õigsust hinnata
NLP insener — Loomuliku keele töötlemise spetsialist
Õpi tundma loomulikku keeletöötlust
Saate aru NLP ülesannetest – klassifitseerimisest, kokkuvõtete tegemisest ja teksti genereerimisest, masintõlkesüsteemide loomisest ja küsimustele vastamissüsteemidest
Lõputöös töötate iseseisvalt välja tööriistad etteantud teemade kontekstide automatiseeritud otsimiseks.
ALUS
Selles etapis õpid selgeks Pythonis programmeerimise põhitõed, õpid andmeid eeltöötlema ja analüüsima ning tutvud ka andmeteadlase põhiülesannetega.
Sissejuhatus - 1 nädal
Oskad sõnastada enda jaoks reaalseid õpieesmärke, teada saada, mis on DS-i väärtus ettevõtlusele, tutvuda andmeteadlase põhiülesannetega ja mõista, kuidas areneb mis tahes DS projekt.
SISSEJUHATUS-1. Kuidas tõhusalt õppida – koolitusel kaasamine
SISSEJUHATUS-2. Elukutse ülevaade. Andmeteaduse probleemide tüübid. Andmeteaduse projekti arendamise etapid ja lähenemisviisid
Arendusprojekt - 5 nädalat
Õpid Pythoni abil töötama põhiliste andmetüüpidega ning oskad kasutada oma igapäevatöös silmuskonstruktsioone, tingimuslauseid ja funktsioone.
PYTHON-1. Pythoni põhitõed
PYTHON-2. Sukeldumine andmetüüpidesse
PYTHON-3. Tingimuslikud väited
PYTHON-4. Tsüklid
PYTHON-5. Funktsioonid ja funktsionaalne programmeerimine
PYTHON-6. Harjuta
PYTHON-7. Pythoni stiilijuhend (boonus)
Baasmatemaatika – 7 nädalat
MATEMAATIKA-1. Arvud ja avaldised
MATEMAATIKA-2. Võrrandid ja võrratused
MATEMAATIKA-3. Funktsiooniteooria põhimõisted
MATEMAATIKA-4. Geomeetria alused: planimeetria, trigonomeetria ja stereomeetria
MATEMAATIKA-5. Statistika hulgad, loogika ja elemendid
MATEMAATIKA-6. Kombinatoorika ja tõenäosusteooria alused
MATEMAATIKA-7. Probleemi lahendamine
Andmetega töötamine - 8 nädalat
Selles etapis omandate põhilised andmeoskused: kuidas andmeid ette valmistada, puhastada ja analüüsimiseks sobivaks teisendada. Analüüsist rääkides: analüüsite andmeid populaarsete raamatukogude Matplotlib, Seaborn, Plotly abil.
PYTHON-8. Andmeteaduse tööriistad
PYTHON-9. NumPy raamatukogu
PYTHON-10. Pandade tutvustus
PYTHON-11. Põhitehnikad Pandas andmetega töötamiseks
PYTHON-12. Täiustatud andmetehnikad Pandades
PYTHON-13. Andmete puhastamine
PYTHON-14. Andmete visualiseerimine
PYTHON-15. OOP-i põhimõtted Pythonis ja silumiskoodis (valikuline moodul)
Projekt 1. Andmekogumi analüüs suletud probleemide kohta
Andmete laadimine - 6 nädalat
Saate alla laadida andmeid erinevatest vormingutest ja allikatest. Ja SQL, struktureeritud päringukeel, aitab teid selles. Õpid kasutama koondfunktsioone, tabeliühendusi ja kompleksliiteid.
PYTHON-16. Kuidas erinevas vormingus failidest andmeid alla laadida
PYTHON-17. Andmete hankimine veebiallikatest ja API-dest
SQL-0. Tere SQL!
SQL-1. SQL-i põhitõed
SQL-2. Koondfunktsioonid
SQL-3. Laudade ühendamine
SQL-4. Komplekssed ühendused
Projekt 2. Uute andmete laadimine. Analüüsi täpsustamine
Statistiliste andmete analüüs - 7 nädalat
Teie tähelepanu keskmes on luureandmete analüüs (EDA). Saate tutvuda sellise analüüsi kõigi etappidega ja õppida seda läbi viima, kasutades teeke Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Lisaks saate töötada võistlustel osalemise populaarse teenuse Kaggle kallal.
EDA-1. Sissejuhatus luureandmete analüüsi. EDA algoritmid ja meetodid
EDA-2. Matemaatiline statistika EDA kontekstis. Funktsioonide tüübid
EDA-3. Funktsioonitehnika
EDA-4. Statistiliste andmete analüüs Pythonis
EDA-5. Statistiliste andmete analüüs Pythonis. 2. osa
EDA-6. Katsete kavandamine
EDA-7. Kaggle platvorm
Projekt 2
Sissejuhatus masinõppesse – 9 nädalat
Saate tuttavaks ML-teekidega andmete sõltuvuste modelleerimiseks. Oskad koolitada ML mudelite põhitüüpe, teostada valideerimist, tõlgendada töö tulemusi ja valida olulisi tunnuseid (funktsiooni tähtsus).
ML-1. Masinõppe teooria
ML-2. Juhendatud õpe: regressioon
ML-3. Juhendatud õpe: klassifikatsioon
ML-4. Juhendajata õpe: rühmitamise ja dimensioonide vähendamise tehnikad
ML-5. Andmete valideerimine ja mudeli hindamine
ML-6. Tunnuste valik ja valik
ML-7. Mudeli hüperparameetrite optimeerimine
ML-8. ML kokaraamat
Projekt 3. Klassifikatsiooni probleem
PÕHIÜKSUS
Lineaaralgebra, matemaatiline analüüs, diskreetne matemaatika – see kõlab hirmutavalt, kuid ärge kartke: me analüüsime kõiki neid aineid ja õpetame teile, kuidas nendega töötada! Teises etapis sukeldute matemaatikasse ja masinõppe põhitõdedesse, saate lisateavet DS-i kutsealade kohta ning karjäärinõustamise kaudu valite teise aasta õppesuuna.
Matemaatika ja masinõpe. 1. osa - 6 nädalat
Oskad lahendada praktilisi ülesandeid kasutades käsitsi arvutamist ja Pythonit (vektori- ja maatriksarvutused, hulktega töötamine, funktsioonide uurimine diferentsiaalanalüüsi abil).
MATEMAATIKA&ML-1. Lineaaralgebra lineaarsete meetodite kontekstis. 1. osa
MATH&ML-2. Lineaaralgebra lineaarsete meetodite kontekstis. 2. osa
MATH&ML-3. Matemaatiline analüüs optimeerimisülesande kontekstis 1. osa
MATH&ML-4. Matemaatiline analüüs optimeerimisülesande kontekstis. 2. osa
MATH&ML-5. Matemaatiline analüüs optimeerimisülesande kontekstis. 3. osa
Projekt 4. Regressiooni probleem
Matemaatika ja masinõpe. 2. osa - 6 nädalat
Õpid tundma tõenäosusteooria ja matemaatilise statistika põhimõisteid, algoritme rühmitamist, samuti õppida hindama läbiviidud klastrite kvaliteeti ja tulemusi esitama graafiline vorm.
MATH&ML-6. Tõenäosusteooria naiivse Bayesi klassifikaatori kontekstis
MATH&ML-7. Otsustuspuudel põhinevad algoritmid
MATH&ML-8. Tugevdamine ja virnastamine
MATH&ML-9. Klasterdamise ja mõõtmete vähendamise tehnikad. 1. osa
MATH&ML-10. Klasterdamise ja mõõtmete vähendamise tehnikad. 2. osa
Projekt 5. Ansambli meetodid
Diskreetne matemaatika - 4 nädalat
MATH&MGU-1 Komplektid ja kombinatoorika
MATH&MGU-2 loogika
MATH&MGU-3 graafikud. 1. osa
MATH&MGU-4 graafikud. 2. osa
ML äritegevuses - 8 nädalat
Õpid kasutama ML teeke aegridade probleemide ja soovitussüsteemide lahendamiseks. Saate koolitada ML-mudelit ja seda valideerida, samuti luua töötavat prototüüpi ja käivitada mudelit veebiliideses. Ja omandage ka A/B testimise oskused, et saaksite mudelit hinnata.
MATH&ML-11. Aegrida. 1. osa
MATH&ML-12. Aegrida. 2. osa
MATH&ML-13. Soovitussüsteemid. 1. osa
MATH&ML-14. Soovitussüsteemid. 2. osa
TOOTE-1. Mudeli ettevalmistamine tootmiseks
TOOTE-2. PrototüüpStreamlit+Heroku
TOOTE-3. Äri mõistmine. Juhtum
Projekt 6. Teema, mille vahel valida: Aegridad või Recommender süsteemid
PRO TASE
Kolmandas etapis saate tuttavaks ühe masinõppemeetodiga – süvaõppega (DL). Samuti ootab teid täisväärtuslik valitud eriala plokk: saate omandada masinõppeoskusi (ML), tutvu CV (arvutinägemise) rutiiniga või täienda end NLP*-s, loomulikus töötluses keel.
Teine õppeaasta – valida 3 eriala vahel
Karjäärinõustamine
ML, CV või NLP: selles etapis peate lõpuks tegema valiku, millist teed edasi minna. Räägime teile igast erialast ja pakume mitme praktilise probleemi lahendamiseks, et teil oleks lihtsam otsustada.
Raja ML – insener
ML-rajal õpid lahendama süvendatud masinõppe probleeme, omandad andmeinseneri pädevusi ning lihvid oma oskusi Pythoni raamatukogudega töötamisel. Samuti saate teada, kuidas luua MVP-d (toote minimaalne elujõuline versioon), õppida kõiki ML-mudeli tootmisse väljastamise nõtkusi ja õppida, kuidas ML-i insenerid reaalses elus töötavad.
Sissejuhatus süvaõppesse
Andmetehnoloogia põhitõed
Täiendavad Pythoni ja ML-i peatükid
Mõjude majanduslik hindamine ja MVP areng
ML tootmisse
ML arendus- ja lõpuprojekti süvendatud õpe valitud teemal
Raja CV - insener
CV rajal õpid lahendama arvutinägemisega seotud probleeme nagu pildi klassifitseerimine, segmenteerimine ja tuvastamine, kujutise genereerimine ja stiliseerimine, taastamine ja kvaliteedi parandamine fotod. Lisaks saate teada, kuidas närvivõrke tootmisse juurutada.
Sissejuhatus süvaõppesse
Andmetehnoloogia põhitõed
Täiendavad Pythoni ja ML-i peatükid
Mõjude majanduslik hindamine ja MVP areng
ML tootmisse
ML arendus- ja lõpuprojekti süvendatud õpe valitud teemal
Raja NLP - insener
NLP rajal treenides õpid lahendama loomuliku keele töötlemise põhiprobleeme, sisse sealhulgas klassifitseerimine, kokkuvõte ja teksti genereerimine, masintõlge ja dialoogi loomine süsteemid
Sissejuhatus süvaõppesse
Närvivõrgu matemaatika NLP jaoks
Riist ja tarkvara NLP probleemide lahendamiseks
NLP ülesanded ja algoritmid
Neuraalvõrgud tootmises
NLP arenduse ja lõpuprojekti süvendatud õpe valitud teemal
Kui valite CV või ML spetsialiseerumise, saate NLP kursuse läbida tasuta ilma mentori toeta.
Süvaõpe ja närvivõrgud
Kus kasutatakse närvivõrke? Kuidas treenida närvivõrku? Mis on süvaõpe? Nendele küsimustele saad vastused DL-i boonuste rubriigist.
Sissejuhatus andmetehnoloogiasse
Saate teada, mis vahe on andmeteadlase ja andmeinseneri rollidel, milliseid tööriistu viimane oma töös kasutab ning milliseid ülesandeid igapäevaselt lahendab. Sõnad "lumehelves", "täht" ja "järv" saavad uue tähenduse :)