Final Challenges — Fase 4

2 min baca

Final Challenges — Fase 4

Challenge 1 — Quiz

  1. Beda & dan and di NumPy/Pandas?
  2. Beda iloc dan loc?
  3. Apa itu broadcasting?
  4. Kenapa df.copy() penting saat slice?
  5. Beda merge inner vs outer?
  6. Kapan pakai pivot vs pivot_table?
  7. Beda rolling vs expanding window?
  8. Beda apply dan vectorized op? Mana lebih cepat?
  9. Beda histogram dan KDE plot?
  10. Kapan pakai box vs violin plot?

Challenge 2 — Speed Comparison

import numpy as np
import pandas as pd
import time

n = 1_000_000
df = pd.DataFrame({"x": np.random.randn(n), "y": np.random.randn(n)})

# Compare 3 cara hitung x + y
# Method 1: iterrows
# Method 2: apply
# Method 3: vectorized

# Hitung waktu masing-masing

Challenge 3 — Real Project

Bikin kompletkan project EDA dengan:

  • 1 dataset besar (>10k rows)
  • 20+ visualisasi
  • 10+ insight detailed
  • Cleaning + feature engineering
  • Save processed data
  • README + LinkedIn post

Push to GitHub. Ini akan jadi portfolio piece pertama yang serius.

Challenge 4 — Anki Update

Tambah 30 cards baru. Total 120+ cards.

Checklist

  • NumPy lancar untuk array manipulation
  • Pandas lancar (groupby, merge, pivot)
  • Bisa visualisasi dengan matplotlib + seaborn
  • Selesai 1 EDA project end-to-end
  • Notebook published di GitHub

Selanjutnya: Fase 5 — Machine Learning