Jelaskan apa yang dimaksud dengan distribusi normal dalam statistika?

Ilmu data atau yang mungkin kita dengar dengan data science dibangun oleh 3 pilar. Ketiga pilar tersebut adalah statistik, programming dan domain knowledge atau pengetahuan tentang bidang dimana ilmu data akan diterapkan.

Banyak literatur yang berkata demikian. Statistik sebagai salah satu pilar ilmu data tentunya bukan tanpa alasan. Statistik menjadi alat untuk mengukur sebagus apa model yang kita bangun. Apakah model ini valid dalam mengambil keputusan, dan sebagainya.

Statistik menjadi salah momok bagi banyak orang. Di Kampus, mata kuliah yang berhubungan dengan statistik akan selalu dianggap œmerusak IPK. Namun dalam mempelajari ilmu data, statistik menjadi hal tidak bisa dihindari, sekaligus harus dikuasai. Tentunya tidak perlu menguasai seluruh materi tentang statistik. Cukup mengetahui dasar-dasarnya terlebih dahulu. Adapun statistik tingkat lanjutnya bisa dipelajari sesuai kebutuhan atau dipelajari sambil mengerjakan project data science.

Salah satu materi yang perlu diketahui dalam statistik adalah distribusi normal. Nah, pada modul baru DQLab dengan judul œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Melalui modul ini, kita akan memperoleh materi diantaranya variabel acak, fungsi kepadatan peluang hingga teori limit pusat. Sebelum masuk ke ringkasan mengenai modul ini, yuk simak video singkatnya dibawah ini!

Video Part I


Video Part II 


1. Pengambilan Sampel

Data merupakan hal yang fundamental dalam data science. Tentu kita sepakat, tak akan ada hasil analisis tanpa data yang valid. Hampir selalu mustahil untuk mengambil seluruh data pada suatu pengamatan, dalam hal ini kita menyebutnya sebagai populasi.

Untuk itu diperlukan sampel yang dapat mewakili populasi tadi. Keluaran untuk setiap penarikan sampel dari suatu populasi yang dilakukan baik secara kualitatif maupun kuantitatif pasti akan berpusat pada aspek numerik sampel data. Aspek numerik sampel data ini diantaranya adalah rata-rata, varians, standar deviasi, kuartil, persentil, kuartil, dan yang lainnya.

2. Beberapa Konsep

Variabel acak adalah nilai keluaran untuk setiap data dari sampel yang ditarik disebut dengan variabel acak. Dengan menggunakan konsep variabel acak, modul ini akan mengajarkan bagaimana menemukan jumlah maupun peluang kemunculan suatu nilai.

Contoh bagaimana menjawab pertanyaan œberapa jumlah peluang kemunculan berat badan 66 kg? Selain itu tentunya ada pula konsep probability density function dan cumulative density function. Baik dalam konsep umumnya hingga ke pdf dan cdf distribusi normal.

Baca juga : Empat Jenis Data Statistik Hasil Pengukuran

3. Visualisasi Data Distribusi Normal

Apakah materi hanya berisi teks yang mungkin membuat bosan dan kurang menarik? Tentu tidak. Disini akan ada konsep menghitung frekuensi, frekuensi relatif dan lainnya menggunakan tabel. 

Jelaskan apa yang dimaksud dengan distribusi normal dalam statistika?

Tak lupa pula bagaimana ciri-ciri grafik dari data yang berdistribusi normal. Baik itu menggunakan histogram, boxplot dan grafik lainnya.

Jelaskan apa yang dimaksud dengan distribusi normal dalam statistika?

4. Pengenalan Python dalam Distribusi Normal

Setelah mempelajari teorinya, tidak ketinggalan bagaimana penerapan python dalam distribusi normal. Sebagai contoh kita akan membangkitkan data berdistribusi normal dengan mean dan standar deviasi yang kita tentukan sendiri. Lalu di akhir, akan divisualisasikan menggunakan histogram.

```
import numpy as np
import matplotlib.pyplot as plt
sampel = 20000
rerata = 5
deviasi = 1
data = np.random.normal(rerata, deviasi, sampel)
data
plt.hist(data, 20)
plt.show()
```

Jelaskan apa yang dimaksud dengan distribusi normal dalam statistika?

Dengan menggunakan sintaks di atas, kita sudah membangkitkan 20rb data yang berdistribusi normal. Dibuktikan dengan bentuk histogram seperti di bawah.

Jelaskan apa yang dimaksud dengan distribusi normal dalam statistika?

Baca juga : Belajar Statistika, Kenali Lebih Jauh Penerapannya dalam Data Science

5. Upskill Kompetensi Statistik Melalui Module Baru DQLab

Module œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python tentunya tidak hanya mempelajari pengambilan sampel hingga visualisasi datanya. Tapi kamu akan menguasai beberapa skill lainnya, diantaranya sebagai berikut :

  • Mampu mengetahui dan mengenal apa itu distribusi probabilitas pada statistik sebagai suatu fungsi yang menunjukkan kemungkinan nilai (probabilitas) yang ada pada suatu variabel dan frekuensi kemunculannya

  • Mampu mengetahui apa itu distribusi normal sebagai distribusi probabilitas, dan bagaimana pemanfaatannya secara umum

  • Mampu memahami Central Limit Theorem (CLT) dan kaitannya dengan distribusi normal

  • Mampu menghitung nilai probabilitas berdasarkan distribusi normal dengan mengetahui pada satu nilai dengan fungsi pdf (probability density function) dengan mengetahui nilai rata-rata dan standar deviasi.

Mampu menghitung nilai probabilitas berdasarkan distribusi normal dengan mengetahui pada rentang nilai dengan fungsi cdf (cumulative distribution function) dengan mengetahui nilai rata-rata dan standar deviasi

Ingin belajar lebih dalam mengenai distribusi normal menggunakan python? Kunjungi DQLab sekarang! Mulai karir mu menjadi seorang data scientist hari ini.

Cara akses modulenya gampang, mulai dengan sigup di DQLab.id dan masuk ke Academy DQLab untuk pilih menu module dan kamu bisa langsung mengerjakan module baru œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Yuk, tunggu apa lagi? Buruan gabung dan nikmati semua fasilitasnya hanya di DQLab!

Penulis: Ashari Ramadhan

Postingan Terkait

Apa yang dimaksud dengan distribusi normal dalam statistik?

Distribusi normal adalah salah satu jenis distribusi variabel acak kontinu, terdapat kurva berbentuk lonceng atau grafik. Distribusi ini dengan fungsi probabilitas kemudian menunjukkan variasi atau penyebaran distribusi, fungsi yang nantinya juga akan dibuktikan dengan menggunakan suatu grafik simetris atau bell curve.

Apa pentingnya distribusi normal dalam statistik?

Distribusi normal juga akan membantu menentukan tingkat normalitas dengan kecenderungan sentral. Dalam statistika, khususnya statistika peluang, normalitas suatu data merupakan hal penting yang tidak boleh diabaikan.

Apa yang dimaksud dengan data normal?

Data yang berdistribusi normal adalah data yang pola distribusinya berbentuk lonceng dan simetris, artinya pola data tersebut tidak menceng ke kiri atau pun ke kanan.