Online course of pure Data Science

timing: March 2020 - June 2020
website: https://data36.com/
useful: Yes! Worth to complete.
pay-service: yes

Linux based webserver (in the cloud, Linode.com) was used to store (SQL server), prepare (ETL processes in bash and Python), analyze (SQL, Python, Google Data Studio, Tableau) data to derive conclusions and to create plots and figures to be involved in presentation files discussed with the tutor of the 6+6 weeks Real life data based DataScience online (video) course. (see details or join the course @ https://data36.com/).
This was a quite robust and well organized course including a large number of lessons, with several datasets to analyze from different aspects. It keeps you every day buzy and excited, which is a benefit that you do not have time to forget what you have just learnt.
Here are the major tools used while the datasets were prepared, analyzed and then discussed:



Large datasets (10000+ data rows in several subsets) were used to make User statistics (e.g. churn) and business analysis (costs, income, cashflow, funnel analysis) of a webpage, or an online app. Some of the results of my work can be checked as a presentation file (Google slides, shared).

See further details in the file. If you are still missing something, please get in contact with me or with the tutor! I highly recommend him and his course (without any benefit for me).

Online Data Science kurzus

időtartam: 2020 március - június
webhely: https://data36.com/
oklevél: igen
hasznosság: Igen! Nagyon megéri.
fizetős: igen

OKLEVÉL

Linux alapú webszervert (felhőben, Linode.com) használtam adat-tárolásra (SQL szerver), előkészítésre (ETL folyamatok: bash és Python), elemzésre (SQL, Python, Google Data Studio) következtetések levonására, valamint diagramok és ábrák készítésére (rendszerkörnyezet telepítési lista). Nagyszerű volt részt venni ebben a 6 + 6 hetes, valós adatokon alapuló DataScience online (video) tanfolyamban, ami során készült prezentációs fájlokat bemutattuk a kurzus oktatójának. (Részletek, vagy a tanfolyamhoz csatlakozás miatt keresd fel a https://data36.com/ oldalt).

Ez egy meglehetősen összetett tanfolyam volt, amely sokféle tananyagból állt, több elemzendő adatkészlettel, különböző vizsgálati szempontokkal. Szinte minden nap adott elfoglaltságot, ami igazából előny, mert így nem felejted el könnyen az épp megtanult dolgokat.

A főbb eszközök, amelyeket az adatkészletek feldolgozása (előkészítés, tisztítás, ...), elemzése, majd megbeszélése során használtam:



A legutolsó feladatban egy üzleti elemzést (business analysis) kellett végezni (10 000+ adatból álló) több részletben megadott adatbázison, ami egy kitalált weboldal működését tükrözte. Ennek az elemzésnek a részleteit és eredményeit megtaláljátok itt egy prezentációs fájlban.

További részletek a fájlban találhatók. Ha úgy érzed hiányzik valamilyen információ, kérlek, lépj kapcsolatba velem vagy az oktatóval! Nagyon ajánlom őt és a tanfolyamát (mindenféle ellenszolgáltatás nélküli az ajánlás)!

JDS Academy - course material #2

JDS Academy - course material #2


Supplementary material: Cheat Sheets

  • SQL,
  • Python,
  • Bash



Additional JDS course material:
table of content of A/B testing.

WEEK 0

Installation of a Linux webserver  on Linode cloud + I made a Linux workstation, both with Ubuntu.

WEEK 1

# Module 1: Introduction to Data Science

  • What is Data Science? Case study.
  • Clarification of AI, ML, big data, deep learning concepts.

# Module 2: How to become a Data Scientist

  • Soft skills, mindset, time commitment, roadmap, learning curve.

# Module 3: SQL Introduction - European accidents dataset

  • Introduction to SQL Workbench and pgAdmin, installation.
  • SQL server configuration
  • Importing data into SQL, data analysis.

# Module 4: SQL Basics + Simple Queries

  • Basic SQL exercises.

# Module 5: SQL WHERE with Multiple Filter Conditions - European accidents dataset

  • Advanced filtering techniques.

# Module 6: SQL WHERE + ORDER BY - European accidents dataset

  • Combination of sorting and filtering.

# Module 7: SQL Functions (COUNT, SUM, AVG, MIN, MAX) - European accidents dataset

  • Basic Aggregation Functions.

WEEK 2

# Module 1: SQL Functions + GROUP BY

  • Grouping and Aggregation.

# Module 2: SQL Table Joining (JOIN)

  • Table Joining Techniques.

# Module 3: SQL Subqueries + HAVING

  • Nested Queries and Conditional Filtering.

# Module 4: Extra Task (Case Study) - Mobile App User and Business Data Analysis

  • Data-Driven Tasks.

# Module 5: Data Analysis Methodologies

# Vault: SQL Exercises

  • Interview-Preparing SQL Tasks.
    • A/B test data, 
    • Solar panel factory production data analysis, 
    • Travel blog User and business analysis.

WEEK 3

# 0. Module: Setting up your own server

  • Installing and configuring a database server.
    Note: I have done on the 0th week. Linode webserver + Linux workstation, Ubuntu

# 1. Module: Bash Basics

  • Basics of Bash commands and scripts. ETL with bash

# 2. Module: Bash Basics continued

  • Additional practical tasks. ETL with bash

# 3. Module: Scripts and automation in Bash

  • Automation techniques.

# 4. Module: Data collection

WEEK 4

# 1. Module: Python Introduction, Variables, Data structures

  • Jupyter Notebook management, variables and structures.

# 2. Module: Python Functions, If Branches, For Loops

  • Basic Python programming techniques.

# Module 3: Python Practice

  • Various python practice tasks, basic operations/logical functions.

# Module 4: Statistics

WEEK 5

# Module 1: Python + Analytics: Pandas basics

  • Data Management with Pandas.

# Module 2: Pandas GroupBy, Functions, Sorting

  • Advanced data management techniques.

# Module 3: Data Visualization with Python + Pandas

  • Creating graphs and visualizations.

# Module 4: Predictive Analytics

WEEK 6

# Module 1: Machine Learning Examples in Python

  • Linear and Polynomial Regression, 
  • Random Forest, 
  • Deep Learning.

# Module 2: Data Presentation


JDS Académia 2

A Junior Data Scientist Akadémia (JDS) kurzus anyaga

 

 Cheat Sheet-ek:

  • SQL,
  • Python,
  • Bash


 1. HÉT

# 1. Modul: Bevezetés a Data Science világába

- Mi az a Data Science? Esettanulmány.

- AI, ML, big data, deep learning fogalmak tisztázása.

# 2. Modul: How to Become a Data Scientist

- Soft skills, mindset, időráfordítás, roadmap, tanulási görbe.

# 3. Modul: SQL Bevezetés - European accidents dataset

- SQL Workbench és pgAdmin bemutatása, telepítés.

- SQL szerver konfigurálás

- Adatok importálása SQL-be, adatelemzés.

# 4. Modul: SQL Alapok + Egyszerű Lekérdezések

- Alapvető SQL gyakorlatok.

# 5. Modul: SQL WHERE Több Szűrőfeltétellel - European accidents dataset

- Haladó szűrési technikák.

# 6. Modul: SQL WHERE + ORDER BY - European accidents dataset

- Rendezés és szűrés kombinációja.

# 7. Modul: SQL Függvények (COUNT, SUM, AVG, MIN, MAX)

- Alapvető aggregáló függvények.


 2. HÉT

# 1. Modul: SQL Függvények + GROUP BY

- Csoportosítás és aggregálás.

# 2. Modul: SQL Táblák Összekapcsolása (JOIN)

- Táblák összekapcsolási technikái.

# 3. Modul: SQL Subquery-k + HAVING

- Beágyazott lekérdezések és feltételes szűrés.

# 4. Modul: Extra Feladat (Esettanulmány) - Mobil app User és üzleti adatelemzés

- Adatvezérelt feladatok.

# 5. Modul: Adatelemző módszertanok

# VAULT: SQL Gyakorlatok

- Interjúra készítő SQL feladatok.

A/B test adatok, Napelem gyár gyártási adatelemzés, Utazó blog User és üzleti elemzés


 3. HÉT

# 0. Modul: Saját Szerver Beállítása

- Adatbázis-szerver telepítése és konfigurálása.

# 1. Modul: Bash Alapok

- Bash parancsok és szkriptek alapjai. ETL bash-sel

# 2. Modul: Bash Alapok Folytatás

- További gyakorlati feladatok. ETL bash-sel

# 3. Modul: Script-ek és automatizálás Bash-ben

- Automatizálási technikák.

# 4. Modul: Adatgyűjtés


 4. HÉT

# 1. Modul: Python Bevezetés, Változók, Adatszerkezetek

- Jupyter Notebook kezelése, változók és struktúrák.

# 2. Modul: Python Függvények, If elágazások, For Loop-ok

- Alapvető Python programozási technikák.

# 3. Modul: Python Gyakorlás

- Különböző python gyakorlófeladatok, alap műveleti/logikai függvények.

# 4. Modul: Statisztika


 5. HÉT

# 1. Modul: Python + Analitika: Pandas Alapok

- Adatkezelés Pandas-szal.

# 2. Modul: Pandas GroupBy, Függvények, Sorting

- Haladó adatkezelési technikák.

# 3. Modul: Adatvizualizáció Python-nal + Pandas-szal

- Grafikonok és vizualizációk készítése.

# 4. Modul: Prediktív Analitika


 6. HÉT

# 1. Modul: Machine Learning Példák Python-ban

- Lineáris és Polinomiális Regresszió, Random Forest, Deep Learning.

# 2. Modul: Adatok Prezentálása


 BÓNUSZ

- A/B tesztelős kurzus hozzáférés.

Snowflake universe, part #6 - Forecasting2

Forecasting with built-in ML module Further posts in  Snowflake  topic SnowFlake universe, part#1 SnowFlake, part#2 SnowPark Notebook Snow...