Cara menggunakan IFISNA di Python

Pada halaman panduan untuk LibreOffice umum Anda dapat menemukan petunjuk yang berlaku untuk semua modul, seperti bekerja dengan jendela dan menu, memodifikasi LibreOffice, sumber data, Galeri, dan drag and drop

Jika Anda ingin membantu modul lain, alihkan ke bantuan untuk modul tersebut dengan kotak kombo di bidang navigasi

Memformat Tabel dan Sel

Memasukkan Nilai dan Rumus

Memasukkan Referensi

Rentang Database dalam Tabel

Enumerasi Lanjutan

Pencetakan dan Pratinjau Halaman

Mengimpor dan Mengekspor Dokumen

Yang lain

Pengambilan keputusan (kondisi jika elif) adalah perluasan/percabangan logis dari "kondisi jika". Dengan elif kita bisa membuat kode program yang akan menyeleksi beberapa kemungkinan yang bisa terjadi. Hampir sama dengan kondisi “else” bedanya kondisi “elif” bisa banyak dan tidak hanya satu

Missing value umumnya selalu terjadi pada dataset. Nilai yang hilang harus diatasi sebelum kumpulan data diproses dengan pembelajaran mesin

Ada beberapa cara untuk mengatasi missing value seperti menghapusnya atau menggantinya dengan nilai lain

Isi

Menemukan Nilai yang Hilang

Jika data terdiri dari ratusan, ribuan bahkan jutaan baris, tentu akan sulit untuk menemukan nilai field yang kosong

Python Panda memungkinkan kita menemukan nilai yang hilang dengan cepat dengan fungsi isnull(), isna()

fungsi isna() mengembalikan nilai boolean sedangkan fungsi sebaliknya adalah notna()

Disini kita akan langsung mencoba menggunakan dataset terkenal yaitu dataset titanic untuk mencari nilai kosong dan cara penanganannya

Download dulu datasetnya

Baca dataset dan gunakan fungsi isna() dan notna()

Cara menggunakan IFISNA di Python
Cara menggunakan IFISNA di Python

Hasil dari fungsi di atas akan kurang dimengerti karena banyaknya baris dan kolom data

Agregat data agar mudah dipahami dengan fungsi sum()

Cara menggunakan IFISNA di Python

Dengan bantuan fungsi isna() dan sum(), kita tahu bahwa dalam dataset tidak ada nilai kosong kecuali kolom Age dengan 177 missing value, kolom Cabin 687 dan kolom Embarked 2

Berurusan dengan Nilai-Nilai yang Hilang

Secara umum ada 2 cara untuk mengatasi missing value yaitu dengan menghapusnya atau menggantinya dengan nilai lain

Kita dapat menggunakan fungsi dropna() untuk menghapus data yang tidak memiliki nilai dan fungsi fillna() untuk mengisi nilai yang kosong

Pada dataset titanic terdapat 3 kolom yang memiliki missing value yaitu Age, Cabin dan Embarked

Kami akan memperlakukan setiap kolom secara berbeda (ini hanyalah sebuah contoh. d)

  1. Missing value pada kolom Age akan diisi dengan rata-rata semua umur penumpang (menggunakan mean)
  2. Nilai yang hilang di kolom Kabin akan dihapus
  3. Nilai yang hilang pada kolom Embarked akan diisi dengan nilai Embarked yang paling banyak muncul di dataset (menggunakan mode)

Usia Kolom Nilai Hilang

Pertama, kami menduplikasi kerangka data

kedua, cari nilai rata-rata dari kolom Umur

Ketiga, Isi nilai kosong pada kolom Umur dengan nilai rata-rata yang diperoleh

Keempat, cek kembali apakah masih ada missing value pada kolom Age

# Langkah 1
rata_umur = df['Age'].mean()
# Langkah 2
df['Age'] = df['Age'].fillna(rata_umur)
# Langkah 3
df['Age'].isna().sum()

Kolom Kabin Nilai Hilang

Untuk kolom Cabin kita akan hapus nilai yang kosong

Perhatian, Jika kita menghapus missing value pada kolom maka baris tersebut akan terhapus juga

Jadi misal kolom Cabin ada missing value 687 dan jika kita hapus maka 687 baris dari dataset akan terhapus

Karena ini hanya contoh penanganan jadi abaikan saja 😀

Ada baiknya kolom Cabin saja yang dihapus karena terlalu banyak missing value

Oke, pertama kita duplikasikan dan gunakan fungsi dropna() untuk menghilangkan missing value

df.drop('Cabin', axis=1, inplace=True)
_

Nilai Hilang Kolom Memulai

Untuk kolom Memulai ada 2 nilai yang hilang

2 nilai tersebut akan kita isi dengan nilai yang paling banyak muncul mengingat tipe data dari kolom ini adalah data kategori berupa string S, C dan Q

Pertama, kami menduplikasi kerangka data

kedua, temukan nilai terbanyak yang muncul dari kolom Memulai

Ketiga, Isi nilai yang kosong pada kolom Embarked dengan nilai modus yang didapatkan

Keempat, periksa kembali apakah masih ada missing value pada kolom Embarked

# Langkah 1
modus = df['Embarked'].mode()[0]
# Langkah 2
df['Embarked'] = df['Embarked'].fillna(modus)
# Langkah 3
df['Embarked'].isna().sum()

Selamat, Anda telah berhasil menemukan cara menemukan missing value pada dataset dan cara mengatasinya

Untuk mengatasi missing value tentunya perlu dilakukan identifikasi terlebih dahulu apakah data tersebut akan dihapus atau diganti

Apa itu Nested IF di Python?

Jika Bersarang ( jika bersarang) berarti dalam jika ada lagi jika .

Kapan perintah if else dapat digunakan?

Pengambilan keputusan dengan kondisi IF ELSE tidak hanya digunakan untuk menentukan tindakan apa yang akan dilakukan sesuai kondisi, tetapi juga digunakan untuk menentukan tindakan apa yang akan dilakukan/dijalankan jika kondisi tidak sesuai .

Apa yang dimaksud dengan kerangka data?

Dataframe adalah tabel atau data tabular dengan susunan baris dan kolom dua dimensi . Struktur data ini adalah cara paling standar untuk menyimpan data. Setiap kolom dalam kerangka data adalah objek dari Seri, dan baris tersebut terdiri dari elemen-elemen dalam Seri.

Apa itu bercabang Python?

Percabangan adalah penjelasan alur program bercabang, logika "jika. kemudian. " . Dan istilah ini juga bisa disebut IF conditional structure. Percabangan Python dapat membuat program berpikir untuk melakukan sesuatu sesuai dengan kondisi yang diberikan.