Python membaca file teks yang dipisahkan koma ke dalam array

Membaca file CSV menggunakan Python 3 adalah apa yang akan Anda pelajari di artikel ini. Data file berisi nilai yang dipisahkan koma (csv). Koma dikenal sebagai pembatas, mungkin karakter lain seperti titik koma

File CSV adalah tabel nilai, dipisahkan dengan koma. Untuk membaca file CSV dari Python, Anda perlu mengimpor modul csv atau modul pandas

Kursus terkait
Bootcamp Pemrograman Python. Mulai dari nol menjadi pahlawan

Baca CSV

csv adalah singkatan dari "nilai yang dipisahkan koma". mereka adalah format file umum untuk pertukaran data, penyimpanan, dan pengeditan. sebenarnya, the. file csv yang dapat Anda buka di aplikasi spreadsheet (seperti excel) hanyalah file teks biasa, dengan satu aturan yang sangat sederhana

semua bidang dalam catatan Anda harus dipisahkan dengan koma

Misalnya, berikut ini mungkin merupakan bagian kecil dari contoh spreadsheet dalam format csv

"first_name","last_name","email","address","city","state","zip","phone"
"charlie","davidson","[email protected]","123 main street, akron, ohio","akron, ohio","23678"
"tanya","jones","[email protected]", "734 main street", "ny", "new york", "nyc", "12354"

Contoh lain file csv


01/01/2016, 4
02/01/2016, 2
03/01/2016, 10
04/01/2016, 8

_

Prosesnya akan

Python membaca file teks yang dipisahkan koma ke dalam array
Baca file csv (langkah pertama opsional)

Baca file CSV

Salah satu hal pertama yang perlu Anda lakukan saat membuat aplikasi Python berbasis data adalah membaca data Anda dari file CSV ke dalam kumpulan data. Jika Anda terbiasa dengan Excel, membaca data dari file CSV itu mudah, tetapi jika Anda baru mengenal CSV, izinkan saya menunjukkan betapa mudahnya

Metode paling dasar untuk membaca file csv adalah

# load csv module
import csv

# open file for reading
with open('file.csv') as csvDataFile:

# read file as csv file
csvReader = csv.reader(csvDataFile)

# for every row, print the row
for row in csvReader:
print(row)

Kami mengimpor modul csv. Ini adalah modul sederhana untuk membaca/menulis file csv dengan python


import csv

Anda dapat membaca setiap baris dalam file. Setiap baris dikembalikan sebagai array dan dapat diakses seperti itu, untuk mencetak sel pertama kita cukup menulis


print(row[0])

_

Untuk sel kedua, Anda akan menggunakan


print(row[1])

Lebih baik memiliki data dalam array, karena lebih mudah dipahami daripada indeks seperti [0], [1], [2] dll

Anda dapat melakukannya dengan menambahkan sel ke daftar saat memuat. Contoh di bawah ini menunjukkan hal ini

# load module
import csv

# first cell data
dates = []

# second cell data
scores = []

# open file for reading
with open('file.csv') as csvDataFile:

# open file as csv file
csvReader = csv.reader(csvDataFile)

# loop over rows
for row in csvReader:

# add cell [0] to list of dates
dates.append(row[0])

# add cell [1] to list of scores
scores.append(row[1])

# output data
print(dates)
print(scores)

_

Kami membuat dua array. tanggal dan skor. Kami menggunakan metode append untuk menambahkan sel ke array

Jika Anda ingin menggunakan pembatas yang berbeda cukup ubah panggilan pembaca


csvReader = csv.reader(delimiter=';')

Muat fungsi CSV

Jika Anda memiliki banyak file csv dalam format yang sama, Anda dapat membuat fungsi untuk memuat data. Dengan begitu Anda tidak perlu menulis kode duplikat

Misalnya, jika file csv Anda memiliki format (tanggal, skor) maka Anda dapat menulis kode ini


import csv

def readMyFile(filename):
dates = []
scores = []

with open(filename) as csvDataFile:
csvReader = csv.reader(csvDataFile)
for row in csvReader:
dates.append(row[0])
scores.append(row[1])

return dates, scores


dates,scores = readMyFile('file.csv')

print(dates)
print(scores)

_

Diberi nama file csv, fungsi akan membaca dan mengurai data csv. Ini ditambahkan ke tanggal dan skor array dan dikembalikan

Baca csv dengan panda

File CSV dapat dibaca oleh pustaka Pandas dengan Python. Fungsi read_csv() di Pandas digunakan untuk membaca file CSV. Anda harus memberikannya objek seperti file yang berisi data Anda

Panda bukan bagian dari pustaka standar Python, jadi Anda harus menginstalnya dengan pengelola paket pip. Fungsi read_csv Panda dapat membaca beberapa kolom

import pandas as pd

df = pd.read_csv('data.csv')

print(df.to_string())
_

Panda menggunakan struktur datanya sendiri yang disebut DataFrame (df), ini berbeda dari daftar Python yang Anda gunakan dengan modul csv. Setelah dataset dibaca maka banyak fungsi manipulasi data menjadi tersedia

Bagaimana cara membaca file teks yang dipisahkan koma dengan Python?

Bagaimana Cara Membaca File CSV dengan Python? .
Impor perpustakaan csv
Buka file CSV
Gunakan csv. objek pembaca untuk membaca file CSV
Ekstrak nama bidang

Bagaimana cara mengonversi file teks ke array dengan Python?

Untuk mengimpor file Teks ke Numpy Arrays, kami memiliki dua fungsi di Numpy. .
numpy. loadtxt( ) – Digunakan untuk memuat data file teks
numpy. genfromtxt( ) – Digunakan untuk memuat data dari file teks, dengan nilai yang hilang ditangani seperti yang ditentukan

Bagaimana Anda membaca file teks ke dalam daftar atau larik dengan Python?

Anda dapat membaca file teks menggunakan metode open() dan readlines(). Untuk membaca file teks ke dalam daftar, gunakan metode split() . Metode ini membagi string ke dalam daftar pada karakter tertentu. Pada contoh di atas, kita membagi sebuah string menjadi sebuah list berdasarkan posisi koma dan spasi (“, ”).

Bagaimana cara membaca file teks ke dalam array?

Di Java, kita dapat menyimpan konten file ke dalam array baik dengan membaca file menggunakan scanner atau bufferedReader atau FileReader atau dengan menggunakan metode readAllLines.