Indonesian (Bahasa Indonesia) translation by Yosef Andreas (you can also view the original English article) Show Dalam tutorial ini saya akan memberikan pengenalan mendasar tentang pandas. Oh, yang saya maksudkan bukan hewan panda, namun sebuah librari Python! Seperti yang disebutkan dalam website pandas: pandas adalah sebuah librari berlisensi BSD dan open source yang menyediakan struktur data dan analisis data yang mudah digunakan dan berkinerja tinggi untuk bahasa pemrograman Python. Dengan demikian, Struktur data dasar Jadi, garis bawahnya adalah bahwa librari Menginstal PandasMari lihat bagaimana kita dapat menginstal Anaconda merupakan distribusi Python yang benar-benar gratis (termasuk untuk penggunaan komersial dan redistribusi). Itu berisi lebih dari 400 paket Python paling populer untuk sains, matematika, tehnik, dan analisis data Distribusi Anaconda merupakan cross-platform, yang berarti bahwa itu dapat diinstal pada mesin OS X, Windows, dan Linux. Saya akan menggunakan installer OS X karena saya berkerja menggunakan mesin OS X El Capitan, namun tentu saja kamu dapat memilih installer yang cocok dengan sistem operasimu. Saya akan melanjutkan dengan installer grafikal (hati-hati, ukurannya 339 MB). Installer Grafikal Anaconda Untuk Mac OS XSetelah mendownload installer, cukup ikuti tahap instalasi dan kamu sudah siap! Semua yang perlu kita lakukan sekarang untuk menggunakan import pandas as pd Struktur Data PandasSaya telah menyebutkan salah satu struktur data DataFrame
import pandas as pd import numpy as np name_age = {'Name' : ['Ali', 'Bill', 'David', 'Hany', 'Ibtisam'], 'Age' : [32, 55, 20, 43, 30]} data_frame = pd.DataFrame(name_age) print data_frame Jika kamu menjalankan script di atas, kamu harusnya mendapatkan sebuah input mirip dengan di bawah ini: Perhatikan bahwa
constructor data_frame_2 = pd.DataFrame(name_age, columns = ['Name', 'Age']) Untuk melihat hasilnya, cukup ketik: Katakan kamu tidak ingin menggunakan label default 0,1,2..., dan ingin menggunakan a, b, c,... sebagai gantinya. Dalam kasus itu, kamu dapat menggunakan data_frame_2 = pd.DataFrame(name_age, columns = ['Name', 'Age'], index = ['a', 'b', 'c', 'd', 'e']) Itu sangat bagus, bukan? Dengan menggunakan Series
series = pd.Series(['Ali', 'Bill', 'David', 'Hany', 'Ibtisam'], index = [1, 2, 3, 4, 5]) print series Output script ini akan berupa sebagai berikut: Perhatikan bahwa kita menggunakan Function PandasDalam section ini, saya akan
menunjukkan contoh beberapa function yang dapat kita gunakan dengan Head dan TailFunction Mari katakan kita memiliki sebuah import pandas as pd import numpy as np series = pd.Series(np.random.randn(20000)) Dengan menggunakan method
print series.head() print series.tail() Output script ini harusnya serupa dengan di bawah (perhatikan bahwa kamu mungkin memiliki nilai yang berbeda karena kita membentuk nilai acak): AddMari ambil contoh function import pandas as pd dictionary_1 = {'A' : [5, 8, 10, 3, 9], 'B' : [6, 1, 4, 8, 7]} dictionary_2 = {'A' : [4, 3, 7, 6, 1], 'B' : [9, 10, 10, 1, 2]} data_frame_1 = pd.DataFrame(dictionary_1) data_frame_2 = pd.DataFrame(dictionary_2) data_frame_3 = data_frame_1.add(data_frame_2) print data_frame_1 print data_frame_2 print data_frame_3 Output dari script di atas adalah: Kamu dapat
juga melakukan proses penambahan ini dengan cukup menggunakan operator DescribeSebuah function print data_frame_3.describe() Output dari operasi ini akan berupa: Sumber Lebih LanjutIni hanyalah sebuah goresan pada permukaan KesimpulanIlmuwan terkadang perlu melakukan beberapa operasi statistik dan menampilkan beberapa grafik rapi yang menuntut mereka untuk menggunakan sebuah bahasa pemrograman. Namun, pada saat yang sama, mereka tidak ingin menghabiskan terlalu banyak waktu atau dihadapkan dengan kurva pembelajaran yang serius dalam melakukan tugas semacam itu. Seperti yang kita lihat dalam tutorial ini, Dengan demikian,
Apa itu ILOC pada Python?Iloc merupakan kependekan dari index location. Sama seperti loc, digunakan untuk menyeleksi data pada lokasi tertentu saja.
Apa kegunaan Panda's?Salah satu tools yang mungkin paling sering digunakan oleh data scientist adalah Pandas. Dalam bahasa pemrograman Python, Pandas adalah alat yang sangat berguna sebagai library yang mengatur tata letak data sehingga mudah dicari secara intuitif.
Apa itu DataFrame pada Pandas?Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.
Astype untuk apa?astype() digunakan untuk mengubah tipe data dari sebuah kolom di dataframe. Misalnya disini kita mengubah tipe data kolom 'Jumlah Mahasiswa' dari yang tadinya 'float' menjadi 'int'.
|