Glossary — Kamus Istilah AI/ML
Daftar istilah teknis yang akan kamu temui sepanjang perjalanan belajar. Bookmark halaman ini sebagai referensi cepat.
A
Activation Function — Fungsi non-linear yang diterapkan pada output neuron. Membuat neural network bisa memodelkan pola kompleks. Contoh: ReLU, Sigmoid, Softmax. → Fase 1, Lesson 03
Agent (AI Agent) — Sistem AI yang bisa mengambil tindakan secara mandiri untuk mencapai tujuan. Bisa memanggil tools, browsing, menulis kode. → Fase 7
Attention Mechanism — Mekanisme yang memungkinkan model "memperhatikan" bagian input yang relevan saat memproses setiap elemen. Inti dari arsitektur Transformer. → Fase 1 Lesson 04, Fase 6 Lesson 05
Autoencoder — Neural network yang belajar mengkompresi data ke representasi lebih kecil, lalu merekonstruksinya. Dipakai untuk dimensionality reduction dan anomaly detection. → Fase 5
B
Backpropagation — Algoritma untuk menghitung gradient (turunan) loss terhadap setiap weight di neural network. Memungkinkan network "belajar" dengan menyebarkan error dari output ke input. → Fase 1 Lesson 03
Batch — Sub-grup data yang diproses bersama dalam satu iterasi training. Misal: batch size 32 = proses 32 sample sekaligus. → Fase 1 Lesson 03
Bias (dalam neuron) — Nilai tambahan di neuron yang menggeser output. Seperti "kecenderungan default". → Fase 1 Lesson 03
Bias (dalam data/model) — Kecenderungan model untuk menghasilkan output yang tidak adil karena data training yang tidak seimbang. → Fase 1 Lesson 04
C
Chain-of-Thought (CoT) — Teknik prompting yang meminta model "berpikir langkah demi langkah". Meningkatkan akurasi untuk soal logika/matematika. → Fase 3 Lesson 02
Chunking — Memecah dokumen panjang menjadi potongan-potongan kecil untuk diproses oleh embedding model. Langkah penting dalam RAG. → Fase 7
Classification — Tugas ML untuk memprediksi kategori/kelas. Contoh: spam vs bukan spam. → Fase 1 Lesson 02, Fase 5
Clustering — Teknik unsupervised learning untuk mengelompokkan data berdasarkan kemiripan tanpa label. Contoh: K-Means. → Fase 1 Lesson 02, Fase 5
CNN (Convolutional Neural Network) — Arsitektur neural network khusus untuk data spasial (gambar). Menggunakan operasi convolution. → Fase 6 Lesson 03
Context Window — Jumlah maksimum token yang bisa diproses LLM sekaligus. GPT-4: 128k, Claude: 200k. → Fase 1 Lesson 04
Cosine Similarity — Ukuran kemiripan antara dua vektor berdasarkan sudut di antara mereka. Dipakai untuk membandingkan embedding. → Fase 7
Cross-entropy — Loss function populer untuk klasifikasi. Mengukur perbedaan antara distribusi prediksi dan distribusi sebenarnya. → Fase 1 Lesson 03
D
DataFrame — Struktur data 2D (tabel) di Pandas. Kolom = fitur, baris = sample. → Fase 4
Deep Learning — Sub-bidang ML yang menggunakan neural network dengan banyak lapisan (deep). → Fase 1 Lesson 03
Diffusion Model — Arsitektur generative AI untuk gambar. Belajar "membersihkan" noise bertahap dari gambar acak. Contoh: DALL-E, Stable Diffusion. → Fase 1 Lesson 04
Dimensionality Reduction — Teknik untuk mengurangi jumlah fitur/dimensi data sambil mempertahankan informasi penting. Contoh: PCA, t-SNE. → Fase 5
Dropout — Teknik regularisasi: sengaja matikan sebagian neuron secara random saat training untuk mencegah overfitting. → Fase 1 Lesson 03
E
Embedding — Representasi vektor dari data (kata, kalimat, dokumen) dalam ruang berdimensi tinggi. Vektor mirip = makna mirip. → Fase 1 Lesson 04, Fase 7
Epoch — Satu putaran lengkap melalui seluruh dataset training. Model biasanya dilatih banyak epoch. → Fase 1 Lesson 03
Emergent Abilities — Kemampuan yang muncul di LLM saat skala melewati threshold tertentu, tanpa diprogram eksplisit. → Fase 1 Lesson 04
F
Feature — Variabel input yang dipakai model untuk membuat prediksi. Kolom di dataset. Contoh: luas rumah, jumlah kamar. → Fase 5
Feature Engineering — Proses membuat/memilih fitur yang paling informatif untuk model. Sering lebih penting dari pilihan algoritma. → Fase 5 Lesson 05
Few-shot Prompting — Teknik prompting dengan memberikan beberapa contoh sebelum pertanyaan utama. Biasanya lebih akurat dari zero-shot. → Fase 3
Fine-tuning — Melatih ulang model pretrained pada data spesifik yang lebih kecil untuk task tertentu. → Fase 6
Forward Pass — Proses data mengalir dari input ke output melalui neural network. Menghasilkan prediksi. → Fase 1 Lesson 03
G
Generative AI (GenAI) — Model AI yang menciptakan konten baru (teks, gambar, audio, video). → Fase 1 Lesson 04
Gradient — Turunan loss terhadap weight. Menunjukkan arah dan besarnya perubahan yang dibutuhkan. → Fase 1 Lesson 03
Gradient Descent — Algoritma optimisasi: update weight ke arah yang mengurangi loss, berulang kali. Analogi: turun gunung berkabut. → Fase 1 Lesson 03
GPU — Graphics Processing Unit. Hardware yang sangat cocok untuk komputasi paralel neural network. NVIDIA dominan. → Fase 1 Lesson 03
H
Hallucination — Ketika LLM mengarang fakta dengan percaya diri. Tidak ada mekanisme internal "saya tidak tahu". → Fase 1 Lesson 04
Hyperparameter — Parameter yang di-set sebelum training (bukan dipelajari dari data). Contoh: learning rate, batch size, jumlah layer. → Fase 5
K
K-Means — Algoritma clustering paling klasik. Membagi data ke K kelompok berdasarkan jarak ke centroid. → Fase 5 Lesson 04
Knowledge Cutoff — Tanggal terakhir data training LLM. Model tidak tahu kejadian setelah tanggal ini. → Fase 1 Lesson 04
L
Label — "Jawaban benar" di supervised learning. Contoh: kolom "harga" di dataset rumah. → Fase 1 Lesson 02
LangChain — Framework Python untuk membangun aplikasi LLM. Menyediakan abstraksi untuk chains, agents, memory. → Fase 7
Large Language Model (LLM) — Model bahasa raksasa berbasis Transformer. Dilatih dengan prediksi kata berikutnya pada miliaran teks. Contoh: GPT-4, Claude, Gemini. → Fase 1 Lesson 04
Learning Rate — Seberapa besar langkah update weight per iterasi. Terlalu besar = tidak konvergen. Terlalu kecil = lambat. → Fase 1 Lesson 03
Linear Regression — Algoritma ML paling dasar untuk regresi. Mencari garis lurus terbaik yang fit data. → Fase 5
LlamaIndex — Framework untuk membangun aplikasi RAG. Fokus pada data ingestion dan retrieval. → Fase 7
Loss Function — Fungsi yang mengukur seberapa salah prediksi model. Tujuan training: minimalisasi loss. → Fase 1 Lesson 03
M
Machine Learning (ML) — Cabang AI dimana komputer belajar dari data, bukan dari aturan yang ditulis manusia. → Fase 1 Lesson 01
Model — Hasil training ML. Berisi weight/parameter yang sudah dioptimasi. Bisa dipakai untuk prediksi data baru. → Fase 1
MSE (Mean Squared Error) — Loss function untuk regresi. Rata-rata kuadrat selisih prediksi dan aktual. → Fase 1 Lesson 03
N
Neural Network — Model ML yang terinspirasi dari otak. Terdiri dari neuron-neuron yang terhubung dalam lapisan-lapisan. → Fase 1 Lesson 03
NLP (Natural Language Processing) — Bidang AI yang fokus pada pemrosesan bahasa manusia. → Fase 6 Lesson 04
NumPy — Library Python untuk komputasi numerik. Basis dari hampir semua library data science. → Fase 4
O
Optimizer — Algoritma yang menentukan cara update weight. Contoh: SGD, Adam, AdamW. → Fase 1 Lesson 03
Overfitting — Model menghafal data training tapi gagal di data baru. Akurasi training tinggi, test rendah. → Fase 1 Lesson 03, Fase 5
P
Pandas — Library Python untuk manipulasi data tabular. DataFrame adalah struktur utamanya. → Fase 4
Parameter — Weight dan bias di neural network yang dipelajari selama training. GPT-3 punya 175 miliar parameter. → Fase 1
PCA (Principal Component Analysis) — Teknik dimensionality reduction paling klasik. Mencari arah variasi terbesar di data. → Fase 5
Pretrained Model — Model yang sudah dilatih pada data besar oleh orang lain. Bisa langsung dipakai atau di-fine-tune. → Fase 6
Prompt Engineering — Seni dan teknik menulis instruksi yang efektif untuk LLM. → Fase 3
Prompt Injection — Serangan keamanan dimana input user membajak instruksi asli prompt. Penting untuk aplikasi LLM publik. → Fase 3
R
RAG (Retrieval-Augmented Generation) — Teknik menggabungkan retrieval (pencarian dokumen) dengan LLM generation. Mengurangi hallucination. → Fase 7
Random Forest — Ensemble dari banyak decision tree. Robust dan sering menang di data tabular. → Fase 5
Regression — Tugas ML untuk memprediksi angka kontinu. Contoh: prediksi harga rumah. → Fase 1 Lesson 02, Fase 5
Reinforcement Learning (RL) — Jenis ML dimana agent belajar dari reward/punishment melalui trial & error. → Fase 1 Lesson 02
ReLU (Rectified Linear Unit) — Activation function paling populer. Output = max(0, input). Sederhana tapi efektif. → Fase 1 Lesson 03
RLHF (Reinforcement Learning from Human Feedback) — Teknik melatih LLM berdasarkan preferensi manusia. Yang membuat ChatGPT/Claude terasa "ramah". → Fase 1 Lesson 02, 04
RNN (Recurrent Neural Network) — Neural network untuk data berurutan. Punya "memori". Sebagian besar digantikan Transformer. → Fase 6 Lesson 03
S
Scikit-learn — Library Python untuk ML klasik. API konsisten: fit(), predict(), score(). → Fase 5
Self-Supervised Learning — Teknik training dimana label dibuat otomatis dari data. Cara LLM dilatih (tebak kata yang dihilangkan). → Fase 1 Lesson 02
Softmax — Activation function yang mengubah vektor angka jadi probabilitas (total = 1). Dipakai di output layer klasifikasi. → Fase 1 Lesson 03
Supervised Learning — ML dengan data berlabel. Model belajar memetakan input ke label. → Fase 1 Lesson 02
T
Temperature — Parameter inference LLM yang mengontrol "kreativitas". 0 = deterministik, 1+ = kreatif/random. → Fase 1 Lesson 04
Token — Unit terkecil yang dipahami LLM. Bisa kata, bagian kata, atau tanda baca. Pricing API dihitung per token. → Fase 1 Lesson 04
Tokenizer — Algoritma yang memecah teks menjadi token. Contoh: BPE, WordPiece, SentencePiece. → Fase 1 Lesson 04
Transfer Learning — Mengambil model pretrained dan menyesuaikannya untuk task baru dengan data lebih sedikit. → Fase 6
Transformer — Arsitektur neural network yang mendasari semua LLM modern. Inovasi kunci: attention mechanism. Paper: "Attention Is All You Need" (2017). → Fase 6 Lesson 05
U
Underfitting — Model terlalu sederhana, tidak bisa menangkap pola. Akurasi training dan test sama-sama rendah. → Fase 1 Lesson 03
Unsupervised Learning — ML tanpa label. Tujuan: menemukan pola/struktur tersembunyi di data. → Fase 1 Lesson 02
V
Vector Database — Database khusus untuk menyimpan dan mencari embedding vektor secara efisien. Contoh: Chroma, Pinecone, FAISS. → Fase 7
Vektor (Vector) — Deret angka yang merepresentasikan sesuatu di ruang berdimensi tinggi. Basis dari embedding. → Fase 3 Lesson 04
W
Weight — Parameter di neural network yang menentukan kekuatan koneksi antar neuron. Dipelajari selama training. → Fase 1 Lesson 03
Z
Zero-shot Prompting — Teknik prompting tanpa memberikan contoh. Langsung tanya/instruksi. → Fase 3