Show
Video ini menunjukkan cara mencocokkan dan menghapus tanda baca dari string teks menggunakan paket ekspresi reguler dengan Python. Data teks sering kali berisi tanda baca yang mungkin ingin Anda hapus dari teks sebagai langkah prapemrosesan sebelum memisahkan teks menjadi kata-kata penyusunnya untuk analisis data. Paket ekspresi reguler Python memudahkan untuk mencocokkan dan mengganti tanda baca dengan string kosong, secara efektif menghapus semua tanda baca. impor ulang garis = '''' Nappa @ Vegeta: Apa yang dikatakan scouter tentang level kekuatannya? Vegeta @ Nappga: Sudah berakhir (9000!) Nappa @ Vegeta: [Apa 9000?] Itu tidak benar… Bisakah?''' Cocokkan dan hapus tanda baca dengan re.sub() re.sub(pola = [^ws], rep = , tali = garis) naskah dalam 5 menit Cocokkan dan hapus tanda baca dan spasi dengan re.sub() re.sub(pola = W, rep = , tali = garis)
impor string #python setoran langsung pengangguran gagal www.youtube.comPython Regex: Cara Menghapus Tanda BacaVideo ini menunjukkan cara mencocokkan dan menghapus tanda baca dari string teks menggunakan paket ekspresi reguler dengan Python. Data teks sering kali berisi tanda baca yang mungkin ingin Anda hapus dari teks sebagai langkah prapemrosesan sebelum memisahkan teks menjadi kata-kata penyusunnya untuk analisis data. Paket ekspresi reguler Python memudahkan untuk mencocokkan dan mengganti tanda baca dengan string kosong, secara efektif menghapus semua tanda baca.
Sometimes, we may wish to break a sentence into a list of words. In such cases, we may first want to clean up the string and remove all the punctuation marks. Here is an example of how it is done. Source Code# define punctuation punctuations = '''!()-[]{};:'"\,<>./?@#$%^&*_~''' my_str = "Hello!!!, he said ---and went." # To take input from the user # my_str = input("Enter a string: ") # remove punctuation from the string no_punct = "" for char in my_str: if char not in punctuations: no_punct = no_punct + char # display the unpunctuated string print(no_punct)Output Hello he said and wentIn this program, we first define a string of punctuations. Then, we iterate over the provided string using a for loop. In each iteration, we check if the character is a punctuation mark or not using the membership test. We have an empty string to which we add (concatenate) the character if it is not punctuation. Finally, we display the cleaned up string. Estimasi Waktu Baca: 4 menit Tipe data String, List, Tuple, Set, dan Dictionary termasuk ke dalam tipe data rangkaian. Tipe data rangkaian di sini maksudnya adalah tipe data yang dapat menyimpan atau menampung lebih dari satu anggota di dalamnya yang mana setiap anggota tersebut masing-masing dapat kita akses. Meskipun mereka bisa dibilang satu keluarga, tapi pada nyatanya mereka memiliki ciri khas atau perbedaan masing-masing, seperti perbedaan bagaimana membuatnya hingga bagaimana cara mengakses setiap isinya. Pengertian dan Cara Mendeklarasikannya
Tentang SifatBerdasarkan sifat, terbagi atas dua, yaitu mutable yang berarti isi atau data di dalamnya bisa dirubah. Sedangkan lawannya adalah immutable yang berarti tidak bisa diubah. List, Set dan Dictionary merupakan tipe data yang bersifat mutable. Khusus untuk set karena ia tidak mengenal indeks maka untuk mengubah isi di dalamnya membutuhkan sebuah fungsi. Contoh di sini perubahan seperti menambahkan data dalam set menggunakan fungsi add(). <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># List </span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> daftar <span class="token operator">=</span> <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> daftar<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> <span class="token operator">>></span><span class="token operator">></span> daftar <span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">7</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">]</span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Dictionary</span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> kamus <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span><span class="token string">"A"</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span><span class="token string">"B"</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span><span class="token string">"C"</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span><span class="token string">"D"</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span><span class="token string">"E"</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> kamus<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token string">"Z"</span> <span class="token operator">>></span><span class="token operator">></span> kamus <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">:</span> <span class="token string">'Z'</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">:</span> <span class="token string">'B'</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">:</span> <span class="token string">'C'</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">:</span> <span class="token string">'D'</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">:</span> <span class="token string">'E'</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> <span class="token comment"># Set </span> <span class="token punctuation">.</span><span class="token punctuation">.</span><span class="token punctuation">.</span> himpunan <span class="token operator">=</span> <span class="token punctuation">{</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span> <span class="token operator">>></span><span class="token operator">></span> himpunan<span class="token punctuation">.</span>add<span class="token punctuation">(</span><span class="token number">0</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> himpunan <span class="token punctuation">{</span><span class="token number">0</span><span class="token punctuation">,</span> <span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">}</span>Sedangkan yang termasuk anggota imutable adalah string dan tuple. <span class="token operator">>></span><span class="token operator">></span> teks <span class="token operator">=</span> <span class="token string">"12345"</span> <span class="token operator">>></span><span class="token operator">></span> teks<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> Traceback <span class="token punctuation">(</span>most recent call last<span class="token punctuation">)</span><span class="token punctuation">:</span> File <span class="token string">""</span><span class="token punctuation">,</span> line <span class="token number">1</span><span class="token punctuation">,</span> <span class="token keyword">in</span> TypeError<span class="token punctuation">:</span> <span class="token string">'str'</span> object does <span class="token operator">not</span> support item assignment <span class="token operator">>></span><span class="token operator">></span> tupel <span class="token operator">=</span> <span class="token punctuation">(</span><span class="token number">1</span><span class="token punctuation">,</span> <span class="token number">2</span><span class="token punctuation">,</span> <span class="token number">3</span><span class="token punctuation">,</span> <span class="token number">4</span><span class="token punctuation">,</span> <span class="token number">5</span><span class="token punctuation">)</span> <span class="token operator">>></span><span class="token operator">></span> tupel<span class="token punctuation">[</span><span class="token number">1</span><span class="token punctuation">]</span> <span class="token operator">=</span> <span class="token number">7</span> Traceback <span class="token punctuation">(</span>most recent call last<span class="token punctuation">)</span><span class="token punctuation">:</span> File <span class="token string">""</span><span class="token punctuation">,</span> line <span class="token number">1</span><span class="token punctuation">,</span> <span class="token keyword">in</span> TypeError<span class="token punctuation">:</span> <span class="token string">'tuple'</span> object does <span class="token operator">not</span> support item assignmentCara Mengakses AnggotaAda tiga cara umum untuk mengakses isi dari kelima tipe data rangkaian, antara lain
Namun tidak semua tipe data rangkaian bisa diakses dengan semua ketiga cara di atas, karena ada yang hanya bisa menggunakan perulangan. PengindeksanPengindeksan merupakan cara kita mengakses secara individu anggota dari suatu tipe data rangkaian dengan menggunakan indeks tiap anggota. Rumus praktiknya dalam kode seperti berikut. >>> nama_variabel[indeks]Jadi tipe data yang dapat diakses dengan cara ini adalah tipe data yang mengenal indeks seperti string, list, dan tuple. >>> # String ... teks = "12345" >>> teks[1] '2' >>> # List ... daftar = [1, 2, 3, 4, 5] >>> daftar[2] 3 >>> # Tuple ... tupel = (1, 2, 3, 4, 5) >>> tupel[3] 4Selain itu tipe data dictionary juga dapat diakses dengan cara ini, karena tipe data dictionary memiliki key yang dapat berperan sebagai indeks. Sedangkan untuk set karena tidak mengenal indeks maka tidak dapat menggunakan cara ini. >>> himpunan = {1, 2, 3, 4, 5} >>> himpunan[5] Traceback (most recent call last): File "", line 1, in TypeError: 'set' object does not support indexingTeknik Slicing Atau PemotonganMerupakan teknik atau cara untuk menampilkan anggota dengan rentang yang kita tentukan sendiri. Dengan cara ini memungkinkan kita untuk menampilkan seluruh isi atau hanya beberapa potongan deret anggota suatu tipe data rangkaian. Makanya disebut teknik slicing atau pemotongan. Sama seperti sebelumnya teknik ini hanya dapat digunakan oleh tipe data berurut atau tipe data rangkaian yang mengenal indeks. >>> # Slicing di String ... teks = "12345" >>> teks[1:3] '23' >>> # Slicing di List ... daftar = [1, 2, 3, 4, 5] >>> daftar[:3] [1, 2, 3] >>> # Slicing di Tuple ... tupel = (1, 2, 3, 4, 5) >>> tupel[1:] (2, 3, 4, 5)Namun meskipun dictionary memiliki key yang dapat bertindak sebagai indeks, nyatanya ketika diterapkan teknik slicing hal itu menyebabkan error, jadi teknik ini tidak dapat dipakai pada dictionary. >>> kamus = {1:"A", 2:"B", 3:"C", 4:"D", 5:"E"} >>> kamus[2:] Traceback (most recent call last): File "", line 1, in TypeError: unhashable type: 'slice'Set masih tetap tidak bisa menggunakan cara ini. >>> himpunan = {1, 2, 3, 4, 5} >>> himpunan[1:3] Traceback (most recent call last): File "", line 1, in TypeError: 'set' object is not subscriptablePerulanganTerakhir dengan menggunakan perulangan. Perulangan merupakan cara yang terbaik untuk mengakses suatu tipe data rangkaian. Karena dengan menggunakan perulangan semua tipe data rangkaian tak terkecuali set dapat diakses dengan cara ini. >>> # Perulangan pada String ... teks = "12345" >>> for i in teks: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada List ... daftar = [1, 2, 3, 4, 5] >>> for i in daftar: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Tuple ... tupel = (1, 2, 3, 4, 5) >>> for i in tupel: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Set ... himpunan = {1, 2, 3, 4, 5} >>> for i in himpunan: ... print(i) ... 1 2 3 4 5 >>> # Perulangan pada Dictionary ... kamus = {1:"A", 2:"B", 3:"C", 4:"D", 5:"E"} >>> for i in kamus: ... print(kamus[i]) ... A B C D E |