Cara menggunakan DF.ILOC pada Python

Cara menggunakan DF.ILOC pada Python

Photo by Dušan Smetana on Unsplash

Saat kita mengeksplorasi data atau menganalisa data menggunakan Python, tentunya akan ada momen dimana kita ingin melihat atau memilih-milih data sesuai dengan apa yang kita ingini. Dan metode yang paling sederhana dan sering saya gunakan saat memilih data adalah dengan menggunakan dua atribut Pandas yaitu .ilocdan .loc.

Namun jika saya ingin memilih data berdasarkan kriteria, syarat atau kondisi, umumnya saya tidak menggunakan kedua atribut di atas. Melainkan saya menggunakan metode lain, yang banyak orang sebut Conditional Selection (atau ada juga yang menyebutnya Boolean Selection atau Boolean Indexing). Dan saya akan menjelaskannya satu per satu di bawah:

Memilih data menggunakan .iloc dan .loc

Mari kita memulainya dengan dua atribut Pandas yang telah disinggung sebelumnya, yaitu .iloc dan .loc. Singkatnya begini, .iloc memilih data berdasarkan posisinya, sedangkan .loc memilih data sesuai dengan labelnya. Agar lebih jelas, biar saya tunjukkan bagaimana cara melakukannya di bawah:

Dataset yang saya gunakan data tips bawaan dari library Seaborn. Dan kalian dapat mengakses (seingat saya, kalau tidak salah, jika ini pertama kalinya kalian menggunakan load_dataset pada Seaborn. Arinya dia membutuhkan koneksi internet untuk mengakses datanya) datanya dengan:

# pip install seaborn
import seaborn as sns
tips = sns.load_dataset('tips')
tips.head() # menunjukkan lima data teratas pada DataFrame

Cara menggunakan DF.ILOC pada Python

Dapat dilihat di atas, hasilnya adalah sebuah pandas.DataFrame. Dalam kasus ini, menggunakan .iloc atau .loc punya output yang sama. Dapat dilihat di bawah:

Cara menggunakan DF.ILOC pada Python

Ini terjadi dikarenakan data punya posisi dan label yang sama. Tapi misalnya, jika saya menyetel indeks datanya dengan feature yang dipunyai DataFrame. Ambil saja, indeks yang kita gunakan feature (kolom) tip. Memang ini tidaklah suatu yang wajar, ada baiknya jika indeks yang digunakan suatu yang unik (misalnya nama orang atau ID). Tapi memang, pada akhirnya urusan menyetel indeks adalah kebebasan analisnya. Jadi mari biarkan tetap begitu.

tips = tips.set_index('tip') 
tips.head()

Cara menggunakan DF.ILOC pada Python

Maka kalau kita ingin mengambil data pertama, tentunya kita tidak dapat menggunakan tips.loc[0] lagi, itu akan menimbulkan error. Kita harus mengikuti labelnya, seperti ini:

tips.loc[1.01]

Lengkapnya dapat dilihat di bawah:

Cara menggunakan DF.ILOC pada Python

Tapi bagaimana jika kalian ingin mengambil data berdasarkan label yang kalian ingini? Begini caranya:

Cara menggunakan DF.ILOC pada Python

Kita harus memasukkan indeks yang kita ingini dalam bentuk sebuah list.

Saya harap, untuk penggunan .loc dan .iloc, kalian sudah mendapatkan idenya. Jadi mari kita lanjut ke Conditional Selection.

Memilih data berdasarkan sebuah kondisi (Conditional Selection)

Beberapa orang menyebutnya Boolean Selection atau Boolean Indexing, tapi kenapa? Kenapa mereka menggunakan kata Boolean di dalamnya? Untuk kalian yang baru pertama kali mendengar istilah Boolean, Boolean adalah sebuah tipe data yang berisinya hanya True atau False (basisnya logic sama seperti ketika kita ingin membuat kondisi pada if else).

Cara menggunakan DF.ILOC pada Python

Itu kenapa menjadi masuk akal, dimana kita membuat suatu kondisi data yang kita ingini. Dan mesin akan menunjukkan data yang memenuhi kondisinya. Secara umum seperti ini:

df[kondisi data yang kita inginkan]

Jika kita merujuk ke data tips di atas, ambil saja, saya ingin menunjukkan data-data perokok.

Cara menggunakan DF.ILOC pada Python

Tapi bagaimana kalau kita punya dua kondisi? Misalnya, perokok dan waktunya saat makan malam?

tips[(tips['smoker'] == 'Yes') & (tips['time'] == 'Dinner')]

Cara menggunakan DF.ILOC pada Python

Untuk logika dan menggunakan simbol ‘&’ sedangkan atau mengunakan simbol ‘|’. Tapi kalau misalnya, kalian ingin melihat operasinya kalian bisa lihat di geeksforgeeks.

Saya harap tulisan ini dapat membantu dan terimakasih telah membacanya sampai selesai…

Apa itu ILOC pada python?

Iloc merupakan kependekan dari index location. Sama seperti loc, digunakan untuk menyeleksi data pada lokasi tertentu saja.

Apa itu Pandas DataFrame?

Pandas DataFrame adalah struktur data 2 Dimensi. Data distrukturisasi seperti tabel yang berisi baris dan kolom, sehingga mudah untuk melakukan queri atau mengakses data tersebut. Baris merepresentasikan record dan kolom merepresentasikan field.

Function apa yang digunakan untuk melihat jumlah baris dan kolom dari suatu data frame?

info() info() digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.

Apa yang dimaksud dengan data frame?

Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.