Membaca file CSV menggunakan Python 3 adalah apa yang akan Anda pelajari di artikel ini. Data file berisi nilai yang dipisahkan koma (csv). Koma dikenal sebagai pembatas, mungkin karakter lain seperti titik koma
File CSV adalah tabel nilai, dipisahkan dengan koma. Untuk membaca file CSV dari Python, Anda perlu mengimpor modul csv atau modul pandas
Kursus terkait
Bootcamp Pemrograman Python. Mulai dari nol menjadi pahlawan
Baca CSV
csv adalah singkatan dari "nilai yang dipisahkan koma". mereka adalah format file umum untuk pertukaran data, penyimpanan, dan pengeditan. sebenarnya, the. file csv yang dapat Anda buka di aplikasi spreadsheet (seperti excel) hanyalah file teks biasa, dengan satu aturan yang sangat sederhana
semua bidang dalam catatan Anda harus dipisahkan dengan koma
Misalnya, berikut ini mungkin merupakan bagian kecil dari contoh spreadsheet dalam format csv
"charlie","davidson","[email protected]","123 main street, akron, ohio","akron, ohio","23678"
"tanya","jones","[email protected]", "734 main street", "ny", "new york", "nyc", "12354"
Contoh lain file csv
01/01/2016, 4
02/01/2016, 2
03/01/2016, 10
04/01/2016, 8
_
Prosesnya akan
Baca file CSV
Salah satu hal pertama yang perlu Anda lakukan saat membuat aplikasi Python berbasis data adalah membaca data Anda dari file CSV ke dalam kumpulan data. Jika Anda terbiasa dengan Excel, membaca data dari file CSV itu mudah, tetapi jika Anda baru mengenal CSV, izinkan saya menunjukkan betapa mudahnya
Metode paling dasar untuk membaca file csv adalah
# load csv moduleimport csv
# open file for reading
with open('file.csv') as csvDataFile:
# read file as csv file
csvReader = csv.reader(csvDataFile)
# for every row, print the row
for row in csvReader:
print(row)
Kami mengimpor modul csv. Ini adalah modul sederhana untuk membaca/menulis file csv dengan python
import csv
Anda dapat membaca setiap baris dalam file. Setiap baris dikembalikan sebagai array dan dapat diakses seperti itu, untuk mencetak sel pertama kita cukup menulis
print(row[0])
_
Untuk sel kedua, Anda akan menggunakan
print(row[1])
Lebih baik memiliki data dalam array, karena lebih mudah dipahami daripada indeks seperti [0], [1], [2] dll
Anda dapat melakukannya dengan menambahkan sel ke daftar saat memuat. Contoh di bawah ini menunjukkan hal ini
# load moduleimport csv
# first cell data
dates = []
# second cell data
scores = []
# open file for reading
with open('file.csv') as csvDataFile:
# open file as csv file
csvReader = csv.reader(csvDataFile)
# loop over rows
for row in csvReader:
# add cell [0] to list of dates
dates.append(row[0])
# add cell [1] to list of scores
scores.append(row[1])
# output data
print(dates)
print(scores)
_
Kami membuat dua array. tanggal dan skor. Kami menggunakan metode append untuk menambahkan sel ke array
Jika Anda ingin menggunakan pembatas yang berbeda cukup ubah panggilan pembaca
csvReader = csv.reader(delimiter=';')
Muat fungsi CSV
Jika Anda memiliki banyak file csv dalam format yang sama, Anda dapat membuat fungsi untuk memuat data. Dengan begitu Anda tidak perlu menulis kode duplikat
Misalnya, jika file csv Anda memiliki format (tanggal, skor) maka Anda dapat menulis kode ini
import csv
def readMyFile(filename):
dates = []
scores = []
with open(filename) as csvDataFile:
csvReader = csv.reader(csvDataFile)
for row in csvReader:
dates.append(row[0])
scores.append(row[1])
return dates, scores
dates,scores = readMyFile('file.csv')
print(dates)
print(scores)
_
Diberi nama file csv, fungsi akan membaca dan mengurai data csv. Ini ditambahkan ke tanggal dan skor array dan dikembalikan
Baca csv dengan panda
File CSV dapat dibaca oleh pustaka Pandas dengan Python. Fungsi read_csv() di Pandas digunakan untuk membaca file CSV. Anda harus memberikannya objek seperti file yang berisi data Anda
Panda bukan bagian dari pustaka standar Python, jadi Anda harus menginstalnya dengan pengelola paket pip. Fungsi read_csv Panda dapat membaca beberapa kolom
import pandas as pddf = pd.read_csv('data.csv')
print(df.to_string())
_
Panda menggunakan struktur datanya sendiri yang disebut DataFrame (df), ini berbeda dari daftar Python yang Anda gunakan dengan modul csv. Setelah dataset dibaca maka banyak fungsi manipulasi data menjadi tersedia