kode python Drop column Pandas

Cara menggunakan DF.DROP_DUPLICATES pada Python

Fungsi pandas drop_duplicates() digunakan dalam menganalisis data duplikat dan menghapusnya. Fungsi pada dasarnya membantu dalam menghapus duplikat dari DataFrame. Ini adalah salah satu fungsi umum di perpustakaan Pandas yang merupakan fungsi penting ketika kami mengerjakan kumpulan data dan menganalisis data.

kursus kilat ruby on rails

Pahami Pandas DataFrame drop_duplicates()

Fungsi panda drop_duplicates() mengembalikan DataFrame dengan menghapus baris duplikat.

Untuk menghapus baris duplikat dari DataFrame, gunakan Pandas DataFrame drop_duplicates().

Sintaksis

DataFrame.drop_duplicates(subset=None, keep=’first’, inplace=False)

Parameter

Ini memiliki parameter berikut:

himpunan bagian : Dibutuhkan kolom atau daftar kolom. Secara default, tidak ada. Setelah melewati kolom, itu akan mempertimbangkan hanya mereka untuk duplikat.
menyimpan : Ini untuk mengontrol bagaimana mempertimbangkan nilai duplikat. Ini dapat memiliki 3 nilai. Secara default, ini adalah 'pertama'. Arti dari ketiga nilai tersebut adalah:
1 – 'pertama' – Ini menganggap nilai pertama sebagai unik dan sisanya dari nilai yang sama sebagai duplikat.
2 - 'terakhir' - Ini menganggap nilai terakhir sebagai unik dan sisanya dari nilai yang sama dengan duplikat.
3 – Salah – Jika salah menganggap semua nilai yang sama sebagai duplikat.
di tempat: Dibutuhkan nilai boolean dan menghapus baris dengan duplikat jika Benar.

Nilai Kembali

Fungsi drop_duplicates() mengembalikan DataFrame dengan baris duplikat yang dihapus atau Tidak ada jika di tempat = Benar.

Contoh program pada drop_duplicates()

Tulis sebuah program untuk menunjukkan cara kerja drop_duplicates().

kunci api td ameritrade

Adobe Creative Cloud untuk Tim mulai dari ,99 per bulan.

IKLAN MELALUI KARBON

import pandas as pd data_dict = {'Name': ['Rohit', 'Karan', 'Shivam', 'Karan'], 'Age': [21, 23, 31, 23],'City':['Patna','Kolkata','Mumbai','Kolkata']} df = pd.DataFrame(data_dict) print(df) df2 = df.drop_duplicates() print(' After removal of duplicate rows: ') print(df2)

Keluaran

Name Age City 0 Rohit 21 Patna 1 Karan 23 Kolkata 2 Shivam 31 Mumbai 3 Karan 23 Kolkata After removal of duplicate rows: Name Age City 0 Rohit 21 Patna 1 Karan 23 Kolkata 2 Shivam 31 Mumbai

Pada contoh di atas, kita dapat melihat bahwa kita memiliki 2 baris berulang dengan nama siswa sebagai Karan. Karenanya setelah menggunakan drop_duplicates() kami dapat menghapus baris duplikat.

Contoh 2: Tulis program untuk menghapus duplikat dari kolom tertentu menggunakan drop_duplicates().

Lihat kode berikut.

Bisakah kamu melihat twitter tanpa akun?

import pandas as pd data_dict = {'Name': ['Rohit', 'Karan', 'Shivam', 'Ajit'], 'Age': [21, 23, 31, 23], 'City': ['Patna', 'Kolkata', 'Mumbai', 'Kolkata']} df = pd.DataFrame(data_dict) print(df) df.drop_duplicates(subset='City', keep=False, inplace=True) print(' DataFrame after removing students belonging to same city: ', df)

Keluaran

Name Age City 0 Rohit 21 Patna 1 Karan 23 Kolkata 2 Shivam 31 Mumbai 3 Ajit 23 Kolkata DataFrame after removing students belonging to same city: Name Age City 0 Rohit 21 Patna 2 Shivam 31 Mumbai

Di sini, dalam contoh di atas, kita dapat melihat bahwa Karan dan Ajit berasal dari kota yang sama Kolkata.

Oleh karena itu kami telah menghapus duplikat dengan mempertimbangkan satu kolom yaitu Kota dan mengabaikan semua fakta lainnya. Setelah itu, kami mencetak DataFrame yang dihasilkan.

#python #fungsi

setel ulang kata sandi email at&t saya

appdividend.com

Untuk menghapus baris duplikat dari DataFrame, gunakan Pandas DataFrame drop_duplicates(). drop_duplicates() mengembalikan df dengan menghapus baris duplikat.

View Discussion

Improve Article

Save Article

Read

Discuss

View Discussion

Improve Article

Save Article

Pandas drop_duplicates() method helps in removing duplicates from the Pandas Dataframe In Python.

Syntax of df.drop_duplicates()

Syntax: DataFrame.drop_duplicates(subset=None, keep=’first’, inplace=False)
Parameters:
subset: Subset takes a column or list of column label. It’s default value is none. After passing columns, it will consider them only for duplicates.
keep: keep is to control how to consider duplicate value. It has only three distinct value and default is ‘first’.
If ‘first‘, it considers first value as unique and rest of the same values as duplicate.
If ‘last‘, it considers last value as unique and rest of the same values as duplicate.
If False, it consider all of the same values as duplicates
inplace: Boolean values, removes rows with duplicates if True.
Return type: DataFrame with removed duplicate rows depending on Arguments passed.

Example:

As we can see one of the TeamA and team has been dropped due to duplicate value.

Python3

import pandas as pd

data = {

"A": ["TeamA", "TeamB", "TeamB", "TeamC", "TeamA"],

"B": [50, 40, 40, 30, 50],

"C": [True, False, False, False, True]

}

df = pd.DataFrame(data)

display(df.drop_duplicates())

Output:

A B C 0 TeamA 50 True 1 TeamB 40 False 3 TeamC 30 False

To download the CSV file used, Click Here.

Example 1: Removing rows with the same First Name

In the following example, rows having the same First Name are removed and a new data frame is returned.

Python3

import pandas as pd

data = pd.read_csv("employees.csv")

data.sort_values("First Name", inplace=True)

data.drop_duplicates(subset="First Name",

keep=False, inplace=True)

data

Output:

As shown in the image, the rows with the same names were removed from a data frame.

Example 2: Removing rows with all duplicate values

In this example, rows having all values will be removed. Since the CSV file isn’t having such a row, a random row is duplicated and inserted into the data frame first.

Python3

length2 = len(data)

data.loc[1001] = [data["First Name"][440],

data["Gender"][440],

data["Start Date"][440],

data["Last Login Time"][440],

data["Salary"][440],

data["Bonus %"][440],

data["Senior Management"][440],

data["Team"][440]]

length2 = len(data)

data.sort_values("First Name", inplace=True)

data.drop_duplicates(keep=False, inplace=True)

length3 = len(data)

print(length2, length2, length3)

Output:

As shown in the output image, the length after removing duplicates is 999. Since the keep parameter was set to False, all of the duplicate rows were removed.

Cara menggunakan DF.DROP_DUPLICATES pada Python

Sintaksis

Parameter

Nilai Kembali

Contoh program pada drop_duplicates()

Keluaran

Contoh 2: Tulis program untuk menghapus duplikat dari kolom tertentu menggunakan drop_duplicates().

Keluaran

appdividend.com

Syntax of df.drop_duplicates()

Example:

Python3

Example 1: Removing rows with the same First Name

Python3

Example 2: Removing rows with all duplicate values

Python3

Pos Terkait

Cara mengetahui password database mysql

Ambil data mysql dari file

Cara menggunakan LEN pada Python

Cara melihat versi php di cpanel

Cara menggunakan fungsi n pada php

Cara menggunakan DATAFORMAT pada JavaScript

Php ini memory limit

Cara menggunakan .TRANSLATE pada Python

Penggunaan fungsi STRIPTIME pada PHP

Cara menggunakan OBJECT.ASSIGN pada JavaScript

Toplist

Top 10 berikut ini yang bukan merupakan penetapan tujuan visi perusahaan adalah 2022

Top 10 sebuah bak air berbentuk balok dengan ukuran panjang 40 cm, lebar 30 cm, dan tinggi 35 cm 2022

Top 9 banjir bukan sekadar bencana alam paragraf 3 gagasan utama 2022

Top 10 diketahui himpunan himpunan sebagai berikut p bilangan ganjil yang kurang dari 15 2022

Top 10 penyelesaian dari persamaan 3x 2 y 9 dan 2x y 3 adalah 2022

Top 10 bagaimana cara memberi salam kepada orang tua dan guru yang benar brainly 2022

Top 10 semakin tinggi nilai toleransi semakin tinggi nilai integrasi nasional 2022

Top 10 benda kerajinan tidak boleh membahayakan pemakainya maka benda kerajinan memiliki prinsip 2022

Top 9 bagian tutup sumbat termos biasanya terbuat dari benda berjenis brainly 2022

Postingan terbaru

LIHAT SEMUA