Cara menggunakan DATAFRAME.COLUMNS pada Python
Mengubah nama column. Parameter yang digunakan adalah columns dengan argument Python Dictionary yang berisi nama kolom lama dan nama kolom baru. Show Contoh mengganti nama kolom Year menjadi Tahun dan Actor menjadi Aktor. df.rename(columns = {"Year": "Tahun", "Actor": "Aktor"}) # df.rename(columns = {"Year": "Tahun", "Actor": "Aktor"}, inplace=True) Gunakan parameter inplace=True untuk mengaplikasikan permanent pada dataframe. Cara kedua menggunakan perintah columns. Kita harus memasukan semua kolom termasuk yang tidak akan diubah. #perintah ini akan error df.columns = ["Tahun", "Aktor"] #perintah ini akan mengubah kolom Year dan Actor, dan yang lainnya tetap. df.columns = ["Tahun", "Aktor", "Director", "Box Office", "Budget", "Bond Actor Salary"] Kekurangan dari cara diatas, kita kehilangan informasi nama kolom originalnya. Sementara dengan method rename, nama kolom sebelumnya masih bisa diketahui. Dalam analisis data terkadang kita perlu membuat kolom baru untuk menampung informasi yang lebih detail yang dapat membantu kita melihat lebih jauh tentang data yang sedang kita observasi. Untuk itu, pada tulisan ini, saya akan membahas cara menambahkan kolom baru pada dataframe pandas. Setidaknya ada 3 cara yang dapat kita lakukan untuk menambahkan kolom baru, baik itu menambahkan kolom baru di akhir dataframe ataupun menyisipkannya di antara kolom-kolom yang sudah ada. Disini, contoh yang akan digunakan adalah bagaimana membuat kolom baru dari data pada kolom yang sudah ada. Misalnya dalam contoh kali ini, kita akan membuat dataframe import pandas as pd Baca Juga: Manipulasi Series Pandas dengan map() Python Output: Seperti yang dapat kita lihat, ada 4 kolom yaitu Sekarang kita coba aplikasikan menggunakan cara-cara di bawah ini. Cara sederhana, tanpa menggunakan methodCara pertama yang akan kita bahas untuk menambahkan kolom baru pada dataframe Pandas adalah dengan langsung mendefiniskan kolom baru tanpa menggunakan method apapun. Perhatikan kode berikut. import pandas as pd Baca Juga: Cara Membuat Bar Plot dengan Matplotlib Python Output: Dari kode di atas, kita hanya perlu mendefinisikan import pandas as pd3 yang diberikan nilai perhitungan yang diinginkan. Setelah itu, saat kita menampilkan dataframe df , kolom Nilai Akhir sudah otomatis terbentuk dengan posisi paling akhir pada dataframe.Menggunakan assign()Cara kedua untuk menambahkan kolom baru pada dataframe adalah dengan menggunakan method import pandas as pd6. Penulisan kodenya seperti di bawah ini. import pandas as pd Baca Juga: 2 Teknik Reduksi Dimensi Populer dengan Python Output: Seperti yang dapat kita lihat, outputnya tidak jauh berbeda dengan menggunakan cara sederhana. Hanya saja penamaan kolomnya tidak boleh mengandung spasi, jadi disini saya beri nama kolomnya import pandas as pd7. Menggunakan insert()Nah, jika kita ingin menyisipkan kolom baru di antara kolom-kolom yang sudah ada, maka kita dapat menggunakan method import pandas as pd8. Setidaknya kita harus memberikan tiga argumen pada method import pandas as pd9 untuk membuat kolom baru, yaitu posisi kolom akan ditempatkan (pada indeks ke berapa), nama kolom, dan nilai yang akan diisi pada kolom tersebut. Langsung saja kita lihat contoh kodenya. import pandas as pd Output: Dapat dilihat dari output di atas, kolom Itulah 3 cara yang dapat dilakukan untuk menambahkan kolom baru pada dataframe Pandas yang dihasilkan dari data pada kolom-kolom yang sudah ada. Apa itu DataFrame pada Python?Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.
Apa fungsi yang digunakan untuk menampilkan jumlah baris dan kolom pada sebuah data frame?Info() Function yang ketiga adalah info(). digunakan untuk menampilkan informasi detail tentang dataframe, seperti jumlah baris data, nama-nama kolom berserta jumlah data dan tipe datanya, dan sebagainya.
Apa yang dimaksud dengan Pandas?Nah dalam hal ini Library Pandas berarti sebuah library open source yang ada pada bahasa pemrograman Python yang sering digunakan untuk memproses data, mulai pembersihan data, manipulasi data, hingga melakukan analisis data.
Apa bentuk data yang ada dalam Pandas?Pada dasarnya ada tiga jenis struktur data di library Pandas ini, yaitu Series (satu dimensi dan merupakan array homogen), DataFrame (dua dimensi dengan kolom yang bersifat heterogen), serta Panel (tiga dimensi, array size mutable). Untuk menggunakan library ini, kita perlu mengimport nya terlebih dahulu.
|