Cara menggunakan PAANDAS pada Python

Halo pembaca setia Codekey! Selamat datang di tutorial ke 15 bahasa pemrograman python yang akan membahas manipulasi data dengan menggunakan python pandas dataframe. Pandas dataframe adalah salah satu alat manipulasi data yang biasa digunakan dalam bahasa pemrograman python. Agar dapat memahami dan mengikuti materi kali ini jangan lewatkan tutorial-tutorial sebelumnya. Jika sudah, yuk simak penjelasan lengkapnya!

Pandas Data Frames pada Bahasa Pemrograman Python

Cara menggunakan PAANDAS pada Python

Dalam bahasa pemrograman python Pandas adalah packages pada python yang berfungsi untuk manipulasi data tingkat tinggi, dikembangkan oleh Wes McKinney. python pandas dibangun di atas paket Numpy dan struktur data kuncinya disebut dengan DataFrame. DataFrames memungkinkan Anda untuk menyimpan dan memanipulasi data tabular dalam baris observasi dan kolom variabel.

Ada beberapa cara untuk membuat Pandas DataFrame. Salah satu caranya adalah dengan menggunakan kamus. Contohnya dapat Anda lihat pada contoh di bawah ini:

dict = {"Negara": ["Brazil", "Russia", "India", "China", "South Africa"],
       "Ibukota": ["Brasilia", "Moscow", "New Dehli", "Beijing", "Pretoria"],
       "Luas": [8.516, 17.10, 3.286, 9.597, 1.221],
       "Populasi": [200.4, 143.5, 1252, 1357, 52.98] }

import pandas as pd
daftar = pd.DataFrame(dict)
print(daftar)

Seperti yang Anda lihat pada contoh di atas, dengan daftar Pandas DataFrame baru , Panda telah menetapkan kunci untuk setiap negara sebagai nilai numerik 0 hingga 4. Jika Anda ingin memiliki nilai indeks yang berbeda, misalnya, kode negara dua huruf, Anda juga dapat melakukannya dengan mudah dengan cara seperti sintaks di bawah ini:

# membuat index terbaru didalam index
daftar.index = ["BR", "RU", "IN", "CH", "SA"]

# Mencetak daftar dengan Penambahan index terbaru
print(daftar)

Selain cara di atas, Anda juga dapat membuatnya dengan cara berbeda. Cara lain untuk membuat DataFrame adalah dengan mengimpor file csv menggunakan Pandas. Sekarang, csv cars.csv disimpan dan dapat diimpor menggunakan pd.read_csv seperti sintaks di bawah ini:

# Import pandas as pd
import pandas as pd

# Import the cars.csv data: cars
cars = pd.read_csv('cars.csv')

# Print out cars
print(cars)

Cara Mengindeks Pandas dataFrames

Ada beberapa cara yang dapat Anda lakukan untuk mengindeks Pandas DataFrame. Salah satu cara termudah untuk melakukannya adalah dengan menggunakan notasi kurung siku.

Pada contoh di bawah ini, Anda dapat menggunakan tanda kurung siku untuk memilih satu kolom cars DataFrame. Anda dapat menggunakan braket tunggal atau braket ganda. Braket tunggal akan mengeluarkan Seri Pandas, sedangkan braket ganda akan mengeluarkan Pandas DataFrame. Perhatikan sintaks di bawah ini:

Artikel Terkait  Tutorial Python 9 : Cara Membuat Looping Python

# import packages pandas dan dokumen dengan nama cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak kolom country pada pandas series 
print(cars['cars_per_cap'])

# mencetak kolom country menggunakan pandas dataframe
print(cars[['cars_per_cap']])

# mencetak dataframe country dan kolom drives_right
print(cars[['cars_per_cap', 'country']])

Tanda kurung siku juga dapat digunakan untuk mengakses observasi (baris) dari DataFrame. Sebagai contoh dapat Anda lihat pada sintaks berikut:

# Import data cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak 4 observations pertama dalam data
print(cars[0:4])

# mencetal 5 dan 6 observations
print(cars[5:6])

Anda juga dapat menggunakan loc dan iloc untuk melakukan hampir semua operasi pemilihan data. Loc berbasis label, yang berarti Anda harus menentukan baris dan kolom berdasarkan label baris dan kolomnya. Iloc adalah berbasis indeks integer, jadi Anda harus menentukan baris dan kolom dengan indeks integernya seperti yang Anda lakukan pada latihan sebelumnya. Coba Anda perhatikan sintaks di bawah ini:

# mencetak data cars
import pandas as pd
cars = pd.read_csv('cars.csv', index_col = 0)

# mencetak observations pada jepang
print(cars.iloc[2])

# mencetak observations pada Australia dan mesir
print(cars.loc[['AUS', 'EG']]

Nah itulah tutorial bahasa pemrograman python ke 15 khusus untuk Anda. Pada tutorial ini Anda telah mempelajari cara melakukan manipulasi data dengan python pandas dataframe. Tutorial ini akan memudahkan Anda dalam menyimpan dan memanipulasi data, baik tabular maupun baris dan kolom observasi.

Diera VUCA ini kebutuhan tenaga ahli yang mahir dalam pengolahan data kian meningkat, bagi perusahaan yang memiliki trafic data yang besar, pengolahan data menjadi problem tersendiri.

Menjawab hal ini Pandas hadir sebagai library pengolahan data yang powerfull. Pada artikel kali ini kita akan membahas basic tutorial pandas.

1) Apa kegunaan pandas ?


Pandas memiliki banyak kegunaan, pandas mampu menyajikan solusi pengolahan data yang rumit menjadi sederhana, membantu mempercepat proses penyajian data dan analasis data.

2) Bagaimana pandas dijadikan sebagai data science toolkit ?


Pandas dibangun di atas paket NumPy, yang berarti banyak struktur NumPy digunakan atau direplikasi di Pandas.

Data dalam pandas sering digunakan sebagai sumber data analisis statistik dalam SciPy, merencanakan fungsi dari Matplotlib, dan algoritma pembelajaran mesin di Scikit-learning.

3) Kapan anda harus mulai menggunakan pandas ?


Jika Anda tidak memiliki pengalaman pengkodean dalam Python, maka Anda harus mempelajari basic python.

Anda tidak harus berada pada level insinyur perangkat lunak, tetapi Anda harus mahir dalam hal dasar, seperti daftar, tupel, librari, fungsi, dan iterasi.

Selain itu, saya juga merekomendasikan untuk membiasakan diri dengan NumPy karena kesamaan yang disebutkan di atas.

Pandas pada Python untuk apa?

Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.

Apa itu DataFrame Pandas?

Pandas DataFrame adalah struktur data 2 Dimensi. Data distrukturisasi seperti tabel yang berisi baris dan kolom, sehingga mudah untuk melakukan queri atau mengakses data tersebut. Baris merepresentasikan record dan kolom merepresentasikan field.

Library Numpy untuk apa?

NumPy (Numerical Python) adalah library Python yang fokus pada scientific computing. Simpelnya: Numpy menyediakan fungsi yang siap pakai untuk memudahkan kita melakukan perhitungan saintifik seperti matriks, aljabar, statistik, dan sebagainya.

Apa perbedaan Series dengan DataFrame?

Series diibaratkan sebagai array satu dimensi sama halnya dengan numpy array, hanya bedanya mempunyai index dan kita dapat mengontrol index dari setiap elemen tersebut. Sedangkan data frame merupakan array dua dimensi dengan baris dan kolom.