Garis Besar Machine Learning

0.0(0)
studied byStudied by 0 people
learnLearn
examPractice Test
spaced repetitionSpaced Repetition
heart puzzleMatch
flashcardsFlashcards
Card Sorting

1/5

flashcard set

Earn XP

Description and Tags

Teori + Koding theory

Study Analytics
Name
Mastery
Learn
Test
Matching
Spaced

No study sessions yet.

6 Terms

1
New cards

Sebut kan step - step train model

# 1. Import Libraries
# 2. Load Data
# 3. EDA
# 4. Preprocessing
# 5. Split + Train (Modeling)

2
New cards

Apa saja yang dilakukan saat Load Data ?

  1. Baca file dataset

  2. Show file dataset

  3. Pindahkan kolom output / target menjadi kolom paling kanan

  4. Hapus kolom yang tidak penting / tidak dibutuhkan (NIM, UserID, SSN, Kolom redundant [2 kolom berisi data sama hanya beda satuan, hapus salah satu], kolom yang konstant [valuenya sama untuk setiap row], Kolom Deskripsi)

  5. Ganti spasi pada nama kolom menjadi ‘_’

3
New cards

Apa saja yang dilakukan saat EDA ?

  1. Buat histplot (untuk menunjukan frekuensi distribusi)

  2. Buat boxplot (untuk melihat outlier)

  3. Buat Scatterplot (untuk melihat korelasi antar suatu kolom dengan target/output)

  4. Mengecek apakah data terdistribusi normal (skewness + kurtosis)

4
New cards

Apa saja yang dilakukan saat Preprocessing ?

  1. Handle Missing values (> 50% hapus, sisanya pakai median / mean tergantung normal atau tidak untuk numerik, dan object pakai mode)

  2. Encoding (Label Encoder, atau OneHot Encoder)

5
New cards

Apa saja yang dilakukan saat split + train

  1. Split data (train-test split)

  2. Print correlation (dan hapus salah satu kolom jika melebihi threshold)

  3. Scalling (Min-Max Scaller → 0-1)

  4. Train Model

  5. Print Accuration Metrics

6
New cards

Jelaskan tentang Recommendation System

knowt flashcard image