Pada halaman panduan untuk LibreOffice umum Anda dapat menemukan petunjuk yang berlaku untuk semua modul, seperti bekerja dengan jendela dan menu, memodifikasi LibreOffice, sumber data, Galeri, dan drag and drop
Jika Anda ingin membantu modul lain, alihkan ke bantuan untuk modul tersebut dengan kotak kombo di bidang navigasi
Memformat Tabel dan Sel
Memasukkan Nilai dan Rumus
Memasukkan Referensi
Rentang Database dalam Tabel
Enumerasi Lanjutan
Pencetakan dan Pratinjau Halaman
Mengimpor dan Mengekspor Dokumen
Yang lain
Pengambilan keputusan (kondisi jika elif) adalah perluasan/percabangan logis dari "kondisi jika". Dengan elif kita bisa membuat kode program yang akan menyeleksi beberapa kemungkinan yang bisa terjadi. Hampir sama dengan kondisi “else” bedanya kondisi “elif” bisa banyak dan tidak hanya satu
Missing value umumnya selalu terjadi pada dataset. Nilai yang hilang harus diatasi sebelum kumpulan data diproses dengan pembelajaran mesin
Ada beberapa cara untuk mengatasi missing value seperti menghapusnya atau menggantinya dengan nilai lain
Isi
Menemukan Nilai yang Hilang
Jika data terdiri dari ratusan, ribuan bahkan jutaan baris, tentu akan sulit untuk menemukan nilai field yang kosong
Python Panda memungkinkan kita menemukan nilai yang hilang dengan cepat dengan fungsi isnull(), isna()
fungsi isna() mengembalikan nilai boolean sedangkan fungsi sebaliknya adalah notna()
Disini kita akan langsung mencoba menggunakan dataset terkenal yaitu dataset titanic untuk mencari nilai kosong dan cara penanganannya
Download dulu datasetnya
Baca dataset dan gunakan fungsi isna() dan notna()
Hasil dari fungsi di atas akan kurang dimengerti karena banyaknya baris dan kolom data
Agregat data agar mudah dipahami dengan fungsi sum()
Dengan bantuan fungsi isna() dan sum(), kita tahu bahwa dalam dataset tidak ada nilai kosong kecuali kolom Age dengan 177 missing value, kolom Cabin 687 dan kolom Embarked 2
Berurusan dengan Nilai-Nilai yang Hilang
Secara umum ada 2 cara untuk mengatasi missing value yaitu dengan menghapusnya atau menggantinya dengan nilai lain
Kita dapat menggunakan fungsi dropna() untuk menghapus data yang tidak memiliki nilai dan fungsi fillna() untuk mengisi nilai yang kosong
Pada dataset titanic terdapat 3 kolom yang memiliki missing value yaitu Age, Cabin dan Embarked
Kami akan memperlakukan setiap kolom secara berbeda (ini hanyalah sebuah contoh. d)
- Missing value pada kolom Age akan diisi dengan rata-rata semua umur penumpang (menggunakan mean)
- Nilai yang hilang di kolom Kabin akan dihapus
- Nilai yang hilang pada kolom Embarked akan diisi dengan nilai Embarked yang paling banyak muncul di dataset (menggunakan mode)
Usia Kolom Nilai Hilang
Pertama, kami menduplikasi kerangka data
kedua, cari nilai rata-rata dari kolom Umur
Ketiga, Isi nilai kosong pada kolom Umur dengan nilai rata-rata yang diperoleh
Keempat, cek kembali apakah masih ada missing value pada kolom Age
# Langkah 1 rata_umur = df['Age'].mean() # Langkah 2 df['Age'] = df['Age'].fillna(rata_umur) # Langkah 3 df['Age'].isna().sum()
Kolom Kabin Nilai Hilang
Untuk kolom Cabin kita akan hapus nilai yang kosong
Perhatian, Jika kita menghapus missing value pada kolom maka baris tersebut akan terhapus juga
Jadi misal kolom Cabin ada missing value 687 dan jika kita hapus maka 687 baris dari dataset akan terhapus
Karena ini hanya contoh penanganan jadi abaikan saja 😀
Ada baiknya kolom Cabin saja yang dihapus karena terlalu banyak missing value
Oke, pertama kita duplikasikan dan gunakan fungsi dropna() untuk menghilangkan missing value
df.drop('Cabin', axis=1, inplace=True)_
Nilai Hilang Kolom Memulai
Untuk kolom Memulai ada 2 nilai yang hilang
2 nilai tersebut akan kita isi dengan nilai yang paling banyak muncul mengingat tipe data dari kolom ini adalah data kategori berupa string S, C dan Q
Pertama, kami menduplikasi kerangka data
kedua, temukan nilai terbanyak yang muncul dari kolom Memulai
Ketiga, Isi nilai yang kosong pada kolom Embarked dengan nilai modus yang didapatkan
Keempat, periksa kembali apakah masih ada missing value pada kolom Embarked
# Langkah 1 modus = df['Embarked'].mode()[0] # Langkah 2 df['Embarked'] = df['Embarked'].fillna(modus) # Langkah 3 df['Embarked'].isna().sum()
Selamat, Anda telah berhasil menemukan cara menemukan missing value pada dataset dan cara mengatasinya
Untuk mengatasi missing value tentunya perlu dilakukan identifikasi terlebih dahulu apakah data tersebut akan dihapus atau diganti