1/5
Teori + Koding theory
Name | Mastery | Learn | Test | Matching | Spaced |
---|
No study sessions yet.
Sebut kan step - step train model
# 1. Import Libraries
# 2. Load Data
# 3. EDA
# 4. Preprocessing
# 5. Split + Train (Modeling)
Apa saja yang dilakukan saat Load Data ?
Baca file dataset
Show file dataset
Pindahkan kolom output / target menjadi kolom paling kanan
Hapus kolom yang tidak penting / tidak dibutuhkan (NIM, UserID, SSN, Kolom redundant [2 kolom berisi data sama hanya beda satuan, hapus salah satu], kolom yang konstant [valuenya sama untuk setiap row], Kolom Deskripsi)
Ganti spasi pada nama kolom menjadi ‘_’
Apa saja yang dilakukan saat EDA ?
Buat histplot (untuk menunjukan frekuensi distribusi)
Buat boxplot (untuk melihat outlier)
Buat Scatterplot (untuk melihat korelasi antar suatu kolom dengan target/output)
Mengecek apakah data terdistribusi normal (skewness + kurtosis)
Apa saja yang dilakukan saat Preprocessing ?
Handle Missing values (> 50% hapus, sisanya pakai median / mean tergantung normal atau tidak untuk numerik, dan object pakai mode)
Encoding (Label Encoder, atau OneHot Encoder)
Apa saja yang dilakukan saat split + train
Split data (train-test split)
Print correlation (dan hapus salah satu kolom jika melebihi threshold)
Scalling (Min-Max Scaller → 0-1)
Train Model
Print Accuration Metrics
Jelaskan tentang Recommendation System