Apa maksud punctuations pada python

Video ini menunjukkan cara mencocokkan dan menghapus tanda baca dari string teks menggunakan paket ekspresi reguler dengan Python. Data teks sering kali berisi tanda baca yang mungkin ingin Anda hapus dari teks sebagai langkah prapemrosesan sebelum memisahkan teks menjadi kata-kata penyusunnya untuk analisis data. Paket ekspresi reguler Python memudahkan untuk mencocokkan dan mengganti tanda baca dengan string kosong, secara efektif menghapus semua tanda baca.



Kode yang digunakan dalam Klip Kode Python ini:

impor ulang

garis = '''' Nappa @ Vegeta: Apa yang dikatakan scouter tentang level kekuatannya? Vegeta @ Nappga: Sudah berakhir (9000!)

Nappa @ Vegeta: [Apa 9000?] Itu tidak benar… Bisakah?'''



Cocokkan dan hapus tanda baca dengan re.sub() re.sub(pola = [^ws], rep = ,

tali = garis)

naskah dalam 5 menit

Cocokkan dan hapus tanda baca dan spasi dengan re.sub() re.sub(pola = W, rep = ,

tali = garis)



  • Perhatikan bahwa Anda dapat mengakses beberapa karakter tanda baca umum menggunakan:

impor string
string.tanda baca

#python

setoran langsung pengangguran gagal

www.youtube.com

Python Regex: Cara Menghapus Tanda Baca

Video ini menunjukkan cara mencocokkan dan menghapus tanda baca dari string teks menggunakan paket ekspresi reguler dengan Python. Data teks sering kali berisi tanda baca yang mungkin ingin Anda hapus dari teks sebagai langkah prapemrosesan sebelum memisahkan teks menjadi kata-kata penyusunnya untuk analisis data. Paket ekspresi reguler Python memudahkan untuk mencocokkan dan mengganti tanda baca dengan string kosong, secara efektif menghapus semua tanda baca.

Sometimes, we may wish to break a sentence into a list of words.

In such cases, we may first want to clean up the string and remove all the punctuation marks. Here is an example of how it is done.

Source Code

# define punctuation punctuations = '''!()-[]{};:'"\,<>./?@#$%^&*_~''' my_str = "Hello!!!, he said ---and went." # To take input from the user # my_str = input("Enter a string: ") # remove punctuation from the string no_punct = "" for char in my_str: if char not in punctuations: no_punct = no_punct + char # display the unpunctuated string print(no_punct)

Output

Hello he said and went

In this program, we first define a string of punctuations. Then, we iterate over the provided string using a for loop.

In each iteration, we check if the character is a punctuation mark or not using the membership test. We have an empty string to which we add (concatenate) the character if it is not punctuation. Finally, we display the cleaned up string.

Estimasi Waktu Baca: 4 menit

Tipe data String, List, Tuple, Set, dan Dictionary termasuk ke dalam tipe data rangkaian. Tipe data rangkaian di sini maksudnya adalah tipe data yang dapat menyimpan atau menampung lebih dari satu anggota di dalamnya yang mana setiap anggota tersebut masing-masing dapat kita akses.

Meskipun mereka bisa dibilang satu keluarga, tapi pada nyatanya mereka memiliki ciri khas atau perbedaan masing-masing, seperti perbedaan bagaimana membuatnya hingga bagaimana cara mengakses setiap isinya.

Pengertian dan Cara Mendeklarasikannya

  • String merupakan tipe data yang mewakili teks dan merupakan salah satu anggota tipe data berurut. Untuk membuat string diperlukan tanda kutip, baik kutip satu (‘….’) atau kutip dua (“….”).
<span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># String dengan kutip dua</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> nama <span class="token operator">=</span> <span class="token string">"Budi Ganteng"</span> <span class="token operator">>></span><span class="token operator">></span> nama <span class="token string">'Budi Ganteng'</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>nama<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'str'</span><span class="token operator">></span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># String dengan kutip satu </span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> nama <span class="token operator">=</span> <span class="token string">'Budi Ganteng'</span> <span class="token operator">>></span><span class="token operator">></span> nama <span class="token string">'Budi Ganteng'</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>nama<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'str'</span><span class="token operator">></span>
  • List merupakan tipe data berurut yang anggotanya dapat berasal dari berbagai tipe data, cara membuatnya dengan diawali dan diakhiri tanda kurung siku. Selain itu list juga masuk dalam kategori struktur data.
<span class="token operator">>></span><span class="token operator">></span> daftar <span class="token operator">=</span> <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">"1"</span><span class="token punctuation">,</span> <span class="token boolean">True</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> daftar <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">'1'</span><span class="token punctuation">,</span> <span class="token boolean">True</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>daftar<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'list'</span><span class="token operator">></span>
  • Tuple sama seperti string dan list, merupakan anggota tipe data berurut, cara membuatnya dengan menggunakan kurung biasa atau tanpa tanda kurung.
<span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Tupel dengan tanda kurung</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> tupel <span class="token operator">=</span> <span class="token punctuation">(</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">"1"</span><span class="token punctuation">,</span> <span class="token boolean">True</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> tupel <span class="token punctuation">(</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">'1'</span><span class="token punctuation">,</span> <span class="token boolean">True</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>tupel<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'tuple'</span><span class="token operator">></span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Tupel tanpa tanda kurung</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> tupel <span class="token operator">=</span> <span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">"1"</span><span class="token punctuation">,</span> <span class="token boolean">True</span> <span class="token operator">>></span><span class="token operator">></span> tupel <span class="token punctuation">(</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">1.0</span><span class="token punctuation">,</span> <span class="token number">1j</span><span class="token punctuation">,</span> <span class="token string">'1'</span><span class="token punctuation">,</span> <span class="token boolean">True</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>tupel<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'tuple'</span><span class="token operator">></span>
  • Set. satu-satunya anggota tipe data tak berurut dikarenakan set tidak mengenal indeks, membuat posisi tiap anggotanya tak jelas. Selain itu set punya sifat anggota yang unik artinya anggota satu dan yang lain tidak akan ada yang sama. Jika ada yang sama (duplikasi) maka akan dihapus salah satu. Cara membuatnya dengan menggunakan kurung kurawal.
<span class="token operator">>></span><span class="token operator">></span> himpunan <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> himpunan <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>himpunan<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'set'</span><span class="token operator">></span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Sifat unik pada set</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> himpunan <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">,</span> <span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> himpunan <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span>
  • Dictionary. tipe data yang cara membuatnya sama seperti set membutuhkan tanda kurung kurawal, bedanya dalam dictionary anggotanya tersusun atas dua atribut key dan value yang keduanya ini dipisahkan denga tanda titik dua (key:value). Key dapat bertindak sebagai indeks jadi nilainya harus bersifat unik.
<span class="token operator">>></span><span class="token operator">></span> kamus <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span><span class="token string">"A"</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span><span class="token string">"B"</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span><span class="token string">"C"</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span><span class="token string">"D"</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span><span class="token string">"E"</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> kamus <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span> <span class="token string">'A'</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span> <span class="token string">'B'</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span> <span class="token string">'C'</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span> <span class="token string">'D'</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span> <span class="token string">'E'</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> type<span class="token punctuation">(</span>kamus<span class="token punctuation">)</span> <span class="token operator"><</span><span class="token keyword">class</span> <span class="token string">'dict'</span><span class="token operator">></span>

Tentang Sifat

Berdasarkan sifat, terbagi atas dua, yaitu mutable yang berarti isi atau data di dalamnya bisa dirubah. Sedangkan lawannya adalah immutable yang berarti tidak bisa diubah.

List, Set dan Dictionary merupakan tipe data yang bersifat mutable. Khusus untuk set karena ia tidak mengenal indeks maka untuk mengubah isi di dalamnya membutuhkan sebuah fungsi. Contoh di sini perubahan seperti menambahkan data dalam set menggunakan fungsi add().

<span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># List </span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> daftar <span class="token operator">=</span> <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> daftar<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> <span class="token operator">>></span><span class="token operator">></span> daftar <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">7</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Dictionary</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> kamus <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span><span class="token string">"A"</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span><span class="token string">"B"</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span><span class="token string">"C"</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span><span class="token string">"D"</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span><span class="token string">"E"</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> kamus<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token string">"Z"</span> <span class="token operator">>></span><span class="token operator">></span> kamus <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span> <span class="token string">'Z'</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span> <span class="token string">'B'</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span> <span class="token string">'C'</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span> <span class="token string">'D'</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span> <span class="token string">'E'</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Set </span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> himpunan <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> himpunan<span class="token punctuation">.</span>add<span class="token punctuation">(</span><span class="token number">0</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> himpunan <span class="token punctuation">{</span><span class="token number">0</span><span class="token punctuation">,</span> <span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span>

Sedangkan yang termasuk anggota imutable adalah string dan tuple.

<span class="token operator">>></span><span class="token operator">></span> teks <span class="token operator">=</span> <span class="token string">"12345"</span> <span class="token operator">>></span><span class="token operator">></span> teks<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> Traceback <span class="token punctuation">(</span>most recent call last<span class="token punctuation">)</span><span class="token punctuation">:</span> File <span class="token string">""</span><span class="token punctuation">,</span> line <span class="token number">1</span><span class="token punctuation">,</span> <span class="token keyword">in</span> TypeError<span class="token punctuation">:</span> <span class="token string">'str'</span> object does <span class="token operator">not</span> support item assignment <span class="token operator">>></span><span class="token operator">></span> tupel <span class="token operator">=</span> <span class="token punctuation">(</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> tupel<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> Traceback <span class="token punctuation">(</span>most recent call last<span class="token punctuation">)</span><span class="token punctuation">:</span> File <span class="token string">""</span><span class="token punctuation">,</span> line <span class="token number">1</span><span class="token punctuation">,</span> <span class="token keyword">in</span> TypeError<span class="token punctuation">:</span> <span class="token string">'tuple'</span> object does <span class="token operator">not</span> support item assignment

Cara Mengakses Anggota

Ada tiga cara umum untuk mengakses isi dari kelima tipe data rangkaian, antara lain

  • Pengindeksan secara manual
  • Teknik Slicing atau pemotongan
  • Menggunakan perulangan

Namun tidak semua tipe data rangkaian bisa diakses dengan semua ketiga cara di atas, karena ada yang hanya bisa menggunakan perulangan.

Pengindeksan

Pengindeksan merupakan cara kita mengakses secara individu anggota dari suatu tipe data rangkaian dengan menggunakan indeks tiap anggota. Rumus praktiknya dalam kode seperti berikut.

>>> nama_variabel[indeks]

Jadi tipe data yang dapat diakses dengan cara ini adalah tipe data yang mengenal indeks seperti string, list, dan tuple.

>>> # String ... teks = "12345" >>> teks[1] '2' >>> # List ... daftar = [1, 2, 3, 4, 5] >>> daftar[2] 3 >>> # Tuple ... tupel = (1, 2, 3, 4, 5) >>> tupel[3] 4

Selain itu tipe data dictionary juga dapat diakses dengan cara ini, karena tipe data dictionary memiliki key yang dapat berperan sebagai indeks.

>>> kamus = {1:"A", 2:"B", 3:"C", 4:"D", 5:"E"} >>> kamus[5] 'E'

Sedangkan untuk set karena tidak mengenal indeks maka tidak dapat menggunakan cara ini.

>>> himpunan = {1, 2, 3, 4, 5} >>> himpunan[5] Traceback (most recent call last): File "", line 1, in TypeError: 'set' object does not support indexing

Teknik Slicing Atau Pemotongan

Merupakan teknik atau cara untuk menampilkan anggota dengan rentang yang kita tentukan sendiri. Dengan cara ini memungkinkan kita untuk menampilkan seluruh isi atau hanya beberapa potongan deret anggota suatu tipe data rangkaian. Makanya disebut teknik slicing atau pemotongan.

Sama seperti sebelumnya teknik ini hanya dapat digunakan oleh tipe data berurut atau tipe data rangkaian yang mengenal indeks.

>>> # Slicing di String ... teks = "12345" >>> teks[1:3] '23' >>> # Slicing di List ... daftar = [1, 2, 3, 4, 5] >>> daftar[:3] [1, 2, 3] >>> # Slicing di Tuple ... tupel = (1, 2, 3, 4, 5) >>> tupel[1:] (2, 3, 4, 5)

Namun meskipun dictionary memiliki key yang dapat bertindak sebagai indeks, nyatanya ketika diterapkan teknik slicing hal itu menyebabkan error, jadi teknik ini tidak dapat dipakai pada dictionary.

>>> kamus = {1:"A", 2:"B", 3:"C", 4:"D", 5:"E"} >>> kamus[2:] Traceback (most recent call last): File "", line 1, in TypeError: unhashable type: 'slice'

Set masih tetap tidak bisa menggunakan cara ini.

>>> himpunan = {1, 2, 3, 4, 5} >>> himpunan[1:3] Traceback (most recent call last): File "", line 1, in TypeError: 'set' object is not subscriptable

Perulangan

Terakhir dengan menggunakan perulangan. Perulangan merupakan cara yang terbaik untuk mengakses suatu tipe data rangkaian. Karena dengan menggunakan perulangan semua tipe data rangkaian tak terkecuali set dapat diakses dengan cara ini.

>>> # Perulangan pada String ... teks = "12345" >>> for i in teks: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada List ... daftar = [1, 2, 3, 4, 5] >>> for i in daftar: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Tuple ... tupel = (1, 2, 3, 4, 5) >>> for i in tupel: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Set ... himpunan = {1, 2, 3, 4, 5} >>> for i in himpunan: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Dictionary ... kamus = {1:"A", 2:"B", 3:"C", 4:"D", 5:"E"} >>> for i in kamus: ... print(kamus[i]) ... A B C D E