Menggunakan paket openpyxl untuk mengabaikan baris dan kolom tersembunyi saat membaca file Excel sebagai Pandas DataFrames Show
Saya mempelajari sesuatu yang baru baru-baru ini — bahwa mungkin untuk mengecualikan baris dan/atau kolom tersembunyi saat membaca file Excel sebagai Pandas DataFrames, semuanya berkat paket Tidak jarang baris atau kolom file Excel disembunyikan. Kolom yang kurang relevan mungkin disembunyikan untuk membuat spreadsheet lebih rapi; Apa pun alasannya, menyembunyikannya saat memuat file sebagai Pandas DataFrame mungkin bermanfaat, karena dapat memengaruhi perselisihan dan eksplorasi data selanjutnya Sayangnya, cara tradisional membaca file Excel sebagai Pandas DataFrames — menggunakan metode Dalam posting ini, kami akan mengeksplorasi bagaimana kami dapat mengidentifikasi baris dan kolom tersembunyi dari file Excel menggunakan paket Kami akan menggunakan sebagian kecil dari kumpulan data pelatihan titanic yang tersedia untuk umum di Kaggle. Untuk kesederhanaan, saya membatasi jumlah baris data menjadi 20. Saya juga sengaja menyembunyikan Kolom F ("Umur"), I ("Tiket") dan K ("Kabin"), serta Baris 6, 11, 16, dan 21 Pratinjau kumpulan data di Excel (Gambar oleh Penulis)Mengapa `pandas. read_excel()` tidak berfungsi?Biasanya, kami menggunakan metode >>> pip install openpyxl _1 Pandas untuk memuat dataset di Excel sebagai Pandas DataFrame. Mari kita lihat apa yang terjadi ketika kita melakukan itu untuk kumpulan data titanic kita yang berisi baris dan kolom tersembunyi>>> import pandas as pd>>> df = pd.read_excel("data/titanic.xlsx")>>> df_ Secara default, metode >>> pip install openpyxl _1 membaca data dari semua baris dan kolom dari file Excel yang ditentukan. Dengan kata lain, itu tidak mengecualikan baris dan kolom yang tersembunyiInstalasi openpyxlUntuk memuat sebagai Pandas DataFrames tanpa baris dan kolom tersembunyi, kita dapat menggunakan paket openpyxl, pustaka Python untuk "membaca/menulis file xlsx/xlsm/xltx/xltm Excel 2010" Karena openpyxl bukan pustaka bawaan Python standar, Anda harus menginstalnya terlebih dahulu. Buka jendela baris perintah dan ketik perintah berikut >>> pip install openpyxl Memuat file Excel dan lembar kerja menggunakan openpyxlUntuk membuka file Excel yang ada menggunakan paket >>> pip install openpyxl 4, dengan menentukan nama jalur tempat file Excel disimpan>>> import openpyxl# Open an Excel workbook Ini membuat objek >>> pip install openpyxl 5 yang, menurut dokumentasi, adalah "wadah tingkat atas untuk semua informasi dokumen". Objek ini berisi banyak atribut yang berkaitan dengan file input, termasuk atribut >>> pip install openpyxl 6 yang mengembalikan daftar nama semua lembar kerja di buku kerja# Create a list of names of all worksheets in `workbook`_ Dalam file >>> pip install openpyxl _7 kami, kami hanya memiliki satu lembar kerja bernama "train", jadi kami mendapatkan nama sheet dengan mengambil elemen pertama dari daftar >>> pip install openpyxl 8. Selanjutnya, kita membuat objek >>> pip install openpyxl _9 dari objek >>> pip install openpyxl 5Menemukan indeks baris tersembunyiDemikian pula, objek >>> pip install openpyxl _9 berisi atribut yang berkaitan dengan lembar kerja yang ditentukan. Untuk menemukan indeks dari semua baris tersembunyi, kami menggunakan atribut >>> import openpyxl# Open an Excel workbook2 dari objek >>> pip install openpyxl 9, seperti ini# List of indices corresponding to all hidden rows Perhatikan bahwa kita perlu mengambil >>> import openpyxl# Open an Excel workbook_4 alih-alih hanya >>> import openpyxl# Open an Excel workbook5 karena kita ingin menemukan indeks yang sesuai dengan Pandas DataFrame, bukan file Excel Untuk menemukan nama semua kolom tersembunyi, pertama-tama kita menggunakan atribut >>> import openpyxl# Open an Excel workbook6 dari objek >>> pip install openpyxl 9# List of indices corresponding to all hidden columns Ini menghasilkan daftar yang terdiri dari huruf besar yang sesuai dengan kolom tersembunyi dari lembar kerja Excel. Jadi, kita perlu mengonversi daftar >>> import openpyxl# Open an Excel workbook8 menjadi daftar nama kolom tersembunyi. Untuk melakukannya, kami menggunakan pustaka bawaan Python, >>> import openpyxl# Open an Excel workbook9, dan atribut # Create a list of names of all worksheets in `workbook`0 # List of indices corresponding to all hidden columns Penafian. Perhatikan bahwa menggunakan # Create a list of names of all worksheets in `workbook`_1 mengasumsikan bahwa paling banyak ada 26 kolom. Jika ada lebih dari 26 kolom, kode perlu diubah Terakhir, setelah kita memiliki indeks untuk baris tersembunyi dan nama untuk kolom tersembunyi, sisanya sederhana. Untuk mengecualikan baris dan kolom tersembunyi tersebut, kami cukup menggunakan metode # Create a list of names of all worksheets in `workbook`2 Pandas # Drop the hidden columnsDataset sebagai Pandas DataFrame tanpa baris dan kolom tersembunyi (Gambar oleh Penulis) Menyatukan semuanya Berikut cuplikan kode yang menyatukan kode-kode di atas dengan beberapa pemfaktoran ulang sederhana Jadi, begitulah — kode Python yang memungkinkan Anda membaca file Excel yang berisi baris dan/atau kolom tersembunyi sebagaimana adanya, seperti Pandas DataFrames Kasus penggunaan khusus ini hanya menggores permukaan dari apa yang ditawarkan paket Kode yang ditampilkan di postingan ini juga dapat ditemukan sebagai notebook di repo GitHub ini Halo. Saya Zeya. Terima kasih telah membaca postingan ini. Jika Anda merasa ini berguna, beri tahu saya di komentar. Saya juga menerima diskusi, pertanyaan, dan umpan balik yang konstruktif. Jangan ragu untuk mengikuti saya di Medium atau hubungi saya melalui LinkedIn atau Twitter. Semoga hari mu menyenangkan Bagaimana Anda menyembunyikan kolom dengan Python?Developer dapat menyembunyikan baris atau kolom dengan memanggil metode HideRow dan HideColumn dari kumpulan Cells secara berurutan. Kedua metode menggunakan indeks baris/kolom sebagai parameter untuk menyembunyikan baris atau kolom tertentu.
Bagaimana cara menyembunyikan kolom data di Excel?Sembunyikan kolom . Pilih satu atau beberapa kolom, lalu tekan Ctrl untuk memilih kolom tambahan yang tidak berdekatan Klik kanan kolom yang dipilih, lalu pilih Sembunyikan Bagaimana cara menyembunyikan kolom berdasarkan nilai?Jika Anda ingin menyembunyikan kolom berdasarkan nilai sel di Excel, ada beberapa cara untuk melakukannya. Salah satu caranya adalah dengan menggunakan fitur pemformatan bersyarat . Ini akan memungkinkan Anda untuk membuat aturan yang akan menyembunyikan kolom jika nilai sel memenuhi kriteria tertentu. Cara lain adalah dengan menggunakan makro.
Bagaimana cara membuat satu kolom hanya bisa dibaca di Excel dengan Python?Baca data kolom mana saja di excel . buat lembar Excel dengan header bernama Header1, Header2, Header1, Header2 di bawah kolom A, B, C, D df. read_excel(namafile, usecols='C. D') |