A Junior Data Scientist Akadémia (JDS) kurzus anyaga
Cheat Sheet-ek:
1. HÉT
# 1. Modul: Bevezetés a Data Science világába
- Mi az a Data Science? Esettanulmány.
- AI, ML, big data, deep learning fogalmak tisztázása.
# 2. Modul: How to Become a Data Scientist
- Soft skills, mindset, időráfordítás, roadmap, tanulási görbe.
# 3. Modul: SQL Bevezetés - European accidents dataset
- SQL Workbench és pgAdmin bemutatása, telepítés.
- SQL szerver konfigurálás
- Adatok importálása SQL-be, adatelemzés.
# 4. Modul: SQL Alapok + Egyszerű Lekérdezések
- Alapvető SQL gyakorlatok.
# 5. Modul: SQL WHERE Több Szűrőfeltétellel - European accidents dataset
- Haladó szűrési technikák.
# 6. Modul: SQL WHERE + ORDER BY - European accidents dataset
- Rendezés és szűrés kombinációja.
# 7. Modul: SQL Függvények (COUNT, SUM, AVG, MIN, MAX)
- Alapvető aggregáló függvények.
2. HÉT
# 1. Modul: SQL Függvények + GROUP BY
- Csoportosítás és aggregálás.
# 2. Modul: SQL Táblák Összekapcsolása (JOIN)
- Táblák összekapcsolási technikái.
# 3. Modul: SQL Subquery-k + HAVING
- Beágyazott lekérdezések és feltételes szűrés.
# 4. Modul: Extra Feladat (Esettanulmány) - Mobil app User és üzleti adatelemzés
- Adatvezérelt feladatok.
# 5. Modul: Adatelemző módszertanok
# VAULT: SQL Gyakorlatok
- Interjúra készítő SQL feladatok.
A/B test adatok, Napelem gyár gyártási adatelemzés, Utazó blog User és üzleti elemzés
3. HÉT
# 0. Modul: Saját Szerver Beállítása
- Adatbázis-szerver telepítése és konfigurálása.
# 1. Modul: Bash Alapok
- Bash parancsok és szkriptek alapjai. ETL bash-sel
# 2. Modul: Bash Alapok Folytatás
- További gyakorlati feladatok. ETL bash-sel
# 3. Modul: Script-ek és automatizálás Bash-ben
- Automatizálási technikák.
# 4. Modul: Adatgyűjtés
4. HÉT
# 1. Modul: Python Bevezetés, Változók, Adatszerkezetek
- Jupyter Notebook kezelése, változók és struktúrák.
# 2. Modul: Python Függvények, If elágazások, For Loop-ok
- Alapvető Python programozási technikák.
# 3. Modul: Python Gyakorlás
- Különböző python gyakorlófeladatok, alap műveleti/logikai függvények.
# 4. Modul: Statisztika
5. HÉT
# 1. Modul: Python + Analitika: Pandas Alapok
- Adatkezelés Pandas-szal.
# 2. Modul: Pandas GroupBy, Függvények, Sorting
- Haladó adatkezelési technikák.
# 3. Modul: Adatvizualizáció Python-nal + Pandas-szal
- Grafikonok és vizualizációk készítése.
# 4. Modul: Prediktív Analitika
6. HÉT
# 1. Modul: Machine Learning Példák Python-ban
- Lineáris és Polinomiális Regresszió, Random Forest, Deep Learning.
# 2. Modul: Adatok Prezentálása
BÓNUSZ
- A/B tesztelős kurzus hozzáférés.