Final Challenges — Fase 5

2 min baca

Final Challenges — Fase 5

Quiz

  1. Apa beda supervised dan unsupervised? 3 contoh masing-masing.
  2. Beda classification dan regression?
  3. Bagaimana cara memilih K di K-Means? 2 metode.
  4. Apa beda Random Forest dan Gradient Boosting?
  5. Kapan pakai precision vs recall vs F1?
  6. Apa itu data leakage? 2 contoh.
  7. Beda Grid Search dan Random Search?
  8. Apa fungsi cross-validation?
  9. Apa itu pipeline di sklearn? Kenapa wajib pakai?
  10. Apa itu feature engineering? Sebut 5 teknik.

Mega Project

Ambil 1 dataset Kaggle yang menantang (bukan Titanic):

  • House Prices, Spaceship Titanic, atau Tabular Playground

Kerjakan end-to-end:

  • EDA notebook
  • Feature engineering
  • Compare 5+ models
  • Hyperparameter tuning
  • Final submission
  • Detailed README
  • Posting LinkedIn

Anki Update

Tambah 30 cards. Total 150+ cards.

Checklist Akhir Fase 5

  • Paham 5+ algoritma classification
  • Paham 3+ algoritma regression
  • Bisa K-Means dan PCA
  • Lancar feature engineering
  • Bisa pakai pipeline + grid search
  • Setidaknya 1 submission Kaggle
  • EDA + ML notebook di GitHub

Refleksi

Tulis di learning-journal/refleksi-fase-5.md:

  • Algoritma mana yang paling membingungkan? Sekarang sudah paham?
  • Apakah feature engineering atau model tuning yang lebih impactful?
  • Plan untuk Fase 6 (Deep Learning)?

Selanjutnya: Fase 6 — Deep Learning