Final Challenges — Fase 5
Quiz
- Apa beda supervised dan unsupervised? 3 contoh masing-masing.
- Beda classification dan regression?
- Bagaimana cara memilih K di K-Means? 2 metode.
- Apa beda Random Forest dan Gradient Boosting?
- Kapan pakai precision vs recall vs F1?
- Apa itu data leakage? 2 contoh.
- Beda Grid Search dan Random Search?
- Apa fungsi cross-validation?
- Apa itu pipeline di sklearn? Kenapa wajib pakai?
- Apa itu feature engineering? Sebut 5 teknik.
Mega Project
Ambil 1 dataset Kaggle yang menantang (bukan Titanic):
- House Prices, Spaceship Titanic, atau Tabular Playground
Kerjakan end-to-end:
- EDA notebook
- Feature engineering
- Compare 5+ models
- Hyperparameter tuning
- Final submission
- Detailed README
- Posting LinkedIn
Anki Update
Tambah 30 cards. Total 150+ cards.
Checklist Akhir Fase 5
- Paham 5+ algoritma classification
- Paham 3+ algoritma regression
- Bisa K-Means dan PCA
- Lancar feature engineering
- Bisa pakai pipeline + grid search
- Setidaknya 1 submission Kaggle
- EDA + ML notebook di GitHub
Refleksi
Tulis di learning-journal/refleksi-fase-5.md:
- Algoritma mana yang paling membingungkan? Sekarang sudah paham?
- Apakah feature engineering atau model tuning yang lebih impactful?
- Plan untuk Fase 6 (Deep Learning)?
Selanjutnya: Fase 6 — Deep Learning