Glossary — Kamus Istilah AI/ML

Daftar istilah teknis yang akan kamu temui sepanjang perjalanan belajar. Bookmark halaman ini sebagai referensi cepat.

A

Activation Function — Fungsi non-linear yang diterapkan pada output neuron. Membuat neural network bisa memodelkan pola kompleks. Contoh: ReLU, Sigmoid, Softmax. → Fase 1, Lesson 03

Agent (AI Agent) — Sistem AI yang bisa mengambil tindakan secara mandiri untuk mencapai tujuan. Bisa memanggil tools, browsing, menulis kode. → Fase 7

Attention Mechanism — Mekanisme yang memungkinkan model "memperhatikan" bagian input yang relevan saat memproses setiap elemen. Inti dari arsitektur Transformer. → Fase 1 Lesson 04, Fase 6 Lesson 05

Autoencoder — Neural network yang belajar mengkompresi data ke representasi lebih kecil, lalu merekonstruksinya. Dipakai untuk dimensionality reduction dan anomaly detection. → Fase 5

B

Backpropagation — Algoritma untuk menghitung gradient (turunan) loss terhadap setiap weight di neural network. Memungkinkan network "belajar" dengan menyebarkan error dari output ke input. → Fase 1 Lesson 03

Batch — Sub-grup data yang diproses bersama dalam satu iterasi training. Misal: batch size 32 = proses 32 sample sekaligus. → Fase 1 Lesson 03

Bias (dalam neuron) — Nilai tambahan di neuron yang menggeser output. Seperti "kecenderungan default". → Fase 1 Lesson 03

Bias (dalam data/model) — Kecenderungan model untuk menghasilkan output yang tidak adil karena data training yang tidak seimbang. → Fase 1 Lesson 04

C

Chain-of-Thought (CoT) — Teknik prompting yang meminta model "berpikir langkah demi langkah". Meningkatkan akurasi untuk soal logika/matematika. → Fase 3 Lesson 02

Chunking — Memecah dokumen panjang menjadi potongan-potongan kecil untuk diproses oleh embedding model. Langkah penting dalam RAG. → Fase 7

Classification — Tugas ML untuk memprediksi kategori/kelas. Contoh: spam vs bukan spam. → Fase 1 Lesson 02, Fase 5

Clustering — Teknik unsupervised learning untuk mengelompokkan data berdasarkan kemiripan tanpa label. Contoh: K-Means. → Fase 1 Lesson 02, Fase 5

CNN (Convolutional Neural Network) — Arsitektur neural network khusus untuk data spasial (gambar). Menggunakan operasi convolution. → Fase 6 Lesson 03

Context Window — Jumlah maksimum token yang bisa diproses LLM sekaligus. GPT-4: 128k, Claude: 200k. → Fase 1 Lesson 04

Cosine Similarity — Ukuran kemiripan antara dua vektor berdasarkan sudut di antara mereka. Dipakai untuk membandingkan embedding. → Fase 7

Cross-entropy — Loss function populer untuk klasifikasi. Mengukur perbedaan antara distribusi prediksi dan distribusi sebenarnya. → Fase 1 Lesson 03

D

DataFrame — Struktur data 2D (tabel) di Pandas. Kolom = fitur, baris = sample. → Fase 4

Deep Learning — Sub-bidang ML yang menggunakan neural network dengan banyak lapisan (deep). → Fase 1 Lesson 03

Diffusion Model — Arsitektur generative AI untuk gambar. Belajar "membersihkan" noise bertahap dari gambar acak. Contoh: DALL-E, Stable Diffusion. → Fase 1 Lesson 04

Dimensionality Reduction — Teknik untuk mengurangi jumlah fitur/dimensi data sambil mempertahankan informasi penting. Contoh: PCA, t-SNE. → Fase 5

Dropout — Teknik regularisasi: sengaja matikan sebagian neuron secara random saat training untuk mencegah overfitting. → Fase 1 Lesson 03

E

Embedding — Representasi vektor dari data (kata, kalimat, dokumen) dalam ruang berdimensi tinggi. Vektor mirip = makna mirip. → Fase 1 Lesson 04, Fase 7

Epoch — Satu putaran lengkap melalui seluruh dataset training. Model biasanya dilatih banyak epoch. → Fase 1 Lesson 03

Emergent Abilities — Kemampuan yang muncul di LLM saat skala melewati threshold tertentu, tanpa diprogram eksplisit. → Fase 1 Lesson 04

F

Feature — Variabel input yang dipakai model untuk membuat prediksi. Kolom di dataset. Contoh: luas rumah, jumlah kamar. → Fase 5

Feature Engineering — Proses membuat/memilih fitur yang paling informatif untuk model. Sering lebih penting dari pilihan algoritma. → Fase 5 Lesson 05

Few-shot Prompting — Teknik prompting dengan memberikan beberapa contoh sebelum pertanyaan utama. Biasanya lebih akurat dari zero-shot. → Fase 3

Fine-tuning — Melatih ulang model pretrained pada data spesifik yang lebih kecil untuk task tertentu. → Fase 6

Forward Pass — Proses data mengalir dari input ke output melalui neural network. Menghasilkan prediksi. → Fase 1 Lesson 03

G

Generative AI (GenAI) — Model AI yang menciptakan konten baru (teks, gambar, audio, video). → Fase 1 Lesson 04

Gradient — Turunan loss terhadap weight. Menunjukkan arah dan besarnya perubahan yang dibutuhkan. → Fase 1 Lesson 03

Gradient Descent — Algoritma optimisasi: update weight ke arah yang mengurangi loss, berulang kali. Analogi: turun gunung berkabut. → Fase 1 Lesson 03

GPU — Graphics Processing Unit. Hardware yang sangat cocok untuk komputasi paralel neural network. NVIDIA dominan. → Fase 1 Lesson 03

H

Hallucination — Ketika LLM mengarang fakta dengan percaya diri. Tidak ada mekanisme internal "saya tidak tahu". → Fase 1 Lesson 04

Hyperparameter — Parameter yang di-set sebelum training (bukan dipelajari dari data). Contoh: learning rate, batch size, jumlah layer. → Fase 5

K

K-Means — Algoritma clustering paling klasik. Membagi data ke K kelompok berdasarkan jarak ke centroid. → Fase 5 Lesson 04

Knowledge Cutoff — Tanggal terakhir data training LLM. Model tidak tahu kejadian setelah tanggal ini. → Fase 1 Lesson 04

L

Label — "Jawaban benar" di supervised learning. Contoh: kolom "harga" di dataset rumah. → Fase 1 Lesson 02

LangChain — Framework Python untuk membangun aplikasi LLM. Menyediakan abstraksi untuk chains, agents, memory. → Fase 7

Large Language Model (LLM) — Model bahasa raksasa berbasis Transformer. Dilatih dengan prediksi kata berikutnya pada miliaran teks. Contoh: GPT-4, Claude, Gemini. → Fase 1 Lesson 04

Learning Rate — Seberapa besar langkah update weight per iterasi. Terlalu besar = tidak konvergen. Terlalu kecil = lambat. → Fase 1 Lesson 03

Linear Regression — Algoritma ML paling dasar untuk regresi. Mencari garis lurus terbaik yang fit data. → Fase 5

LlamaIndex — Framework untuk membangun aplikasi RAG. Fokus pada data ingestion dan retrieval. → Fase 7

Loss Function — Fungsi yang mengukur seberapa salah prediksi model. Tujuan training: minimalisasi loss. → Fase 1 Lesson 03

M

Machine Learning (ML) — Cabang AI dimana komputer belajar dari data, bukan dari aturan yang ditulis manusia. → Fase 1 Lesson 01

Model — Hasil training ML. Berisi weight/parameter yang sudah dioptimasi. Bisa dipakai untuk prediksi data baru. → Fase 1

MSE (Mean Squared Error) — Loss function untuk regresi. Rata-rata kuadrat selisih prediksi dan aktual. → Fase 1 Lesson 03

N

Neural Network — Model ML yang terinspirasi dari otak. Terdiri dari neuron-neuron yang terhubung dalam lapisan-lapisan. → Fase 1 Lesson 03

NLP (Natural Language Processing) — Bidang AI yang fokus pada pemrosesan bahasa manusia. → Fase 6 Lesson 04

NumPy — Library Python untuk komputasi numerik. Basis dari hampir semua library data science. → Fase 4

O

Optimizer — Algoritma yang menentukan cara update weight. Contoh: SGD, Adam, AdamW. → Fase 1 Lesson 03

Overfitting — Model menghafal data training tapi gagal di data baru. Akurasi training tinggi, test rendah. → Fase 1 Lesson 03, Fase 5

P

Pandas — Library Python untuk manipulasi data tabular. DataFrame adalah struktur utamanya. → Fase 4

Parameter — Weight dan bias di neural network yang dipelajari selama training. GPT-3 punya 175 miliar parameter. → Fase 1

PCA (Principal Component Analysis) — Teknik dimensionality reduction paling klasik. Mencari arah variasi terbesar di data. → Fase 5

Pretrained Model — Model yang sudah dilatih pada data besar oleh orang lain. Bisa langsung dipakai atau di-fine-tune. → Fase 6

Prompt Engineering — Seni dan teknik menulis instruksi yang efektif untuk LLM. → Fase 3

Prompt Injection — Serangan keamanan dimana input user membajak instruksi asli prompt. Penting untuk aplikasi LLM publik. → Fase 3

R

RAG (Retrieval-Augmented Generation) — Teknik menggabungkan retrieval (pencarian dokumen) dengan LLM generation. Mengurangi hallucination. → Fase 7

Random Forest — Ensemble dari banyak decision tree. Robust dan sering menang di data tabular. → Fase 5

Regression — Tugas ML untuk memprediksi angka kontinu. Contoh: prediksi harga rumah. → Fase 1 Lesson 02, Fase 5

Reinforcement Learning (RL) — Jenis ML dimana agent belajar dari reward/punishment melalui trial & error. → Fase 1 Lesson 02

ReLU (Rectified Linear Unit) — Activation function paling populer. Output = max(0, input). Sederhana tapi efektif. → Fase 1 Lesson 03

RLHF (Reinforcement Learning from Human Feedback) — Teknik melatih LLM berdasarkan preferensi manusia. Yang membuat ChatGPT/Claude terasa "ramah". → Fase 1 Lesson 02, 04

RNN (Recurrent Neural Network) — Neural network untuk data berurutan. Punya "memori". Sebagian besar digantikan Transformer. → Fase 6 Lesson 03

S

Scikit-learn — Library Python untuk ML klasik. API konsisten: fit(), predict(), score(). → Fase 5

Self-Supervised Learning — Teknik training dimana label dibuat otomatis dari data. Cara LLM dilatih (tebak kata yang dihilangkan). → Fase 1 Lesson 02

Softmax — Activation function yang mengubah vektor angka jadi probabilitas (total = 1). Dipakai di output layer klasifikasi. → Fase 1 Lesson 03

Supervised Learning — ML dengan data berlabel. Model belajar memetakan input ke label. → Fase 1 Lesson 02

T

Temperature — Parameter inference LLM yang mengontrol "kreativitas". 0 = deterministik, 1+ = kreatif/random. → Fase 1 Lesson 04

Token — Unit terkecil yang dipahami LLM. Bisa kata, bagian kata, atau tanda baca. Pricing API dihitung per token. → Fase 1 Lesson 04

Tokenizer — Algoritma yang memecah teks menjadi token. Contoh: BPE, WordPiece, SentencePiece. → Fase 1 Lesson 04

Transfer Learning — Mengambil model pretrained dan menyesuaikannya untuk task baru dengan data lebih sedikit. → Fase 6

Transformer — Arsitektur neural network yang mendasari semua LLM modern. Inovasi kunci: attention mechanism. Paper: "Attention Is All You Need" (2017). → Fase 6 Lesson 05

U

Underfitting — Model terlalu sederhana, tidak bisa menangkap pola. Akurasi training dan test sama-sama rendah. → Fase 1 Lesson 03

Unsupervised Learning — ML tanpa label. Tujuan: menemukan pola/struktur tersembunyi di data. → Fase 1 Lesson 02

V

Vector Database — Database khusus untuk menyimpan dan mencari embedding vektor secara efisien. Contoh: Chroma, Pinecone, FAISS. → Fase 7

Vektor (Vector) — Deret angka yang merepresentasikan sesuatu di ruang berdimensi tinggi. Basis dari embedding. → Fase 3 Lesson 04

W

Weight — Parameter di neural network yang menentukan kekuatan koneksi antar neuron. Dipelajari selama training. → Fase 1 Lesson 03

Z

Zero-shot Prompting — Teknik prompting tanpa memberikan contoh. Langsung tanya/instruksi. → Fase 3