Ilmu data atau yang mungkin kita dengar dengan data science dibangun oleh 3 pilar. Ketiga pilar tersebut adalah statistik, programming dan domain knowledge atau pengetahuan tentang bidang dimana ilmu data akan diterapkan. Show
Banyak literatur yang berkata demikian. Statistik sebagai salah satu pilar ilmu data tentunya bukan tanpa alasan. Statistik menjadi alat untuk mengukur sebagus apa model yang kita bangun. Apakah model ini valid dalam mengambil keputusan, dan sebagainya. Statistik menjadi salah momok bagi banyak orang. Di Kampus, mata kuliah yang berhubungan dengan statistik akan selalu dianggap œmerusak IPK. Namun dalam mempelajari ilmu data, statistik menjadi hal tidak bisa dihindari, sekaligus harus dikuasai. Tentunya tidak perlu menguasai seluruh materi tentang statistik. Cukup mengetahui dasar-dasarnya terlebih dahulu. Adapun statistik tingkat lanjutnya bisa dipelajari sesuai kebutuhan atau dipelajari sambil mengerjakan project data science. Salah satu materi yang perlu diketahui dalam statistik adalah distribusi normal. Nah, pada modul baru DQLab dengan judul œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Melalui modul ini, kita akan memperoleh materi diantaranya variabel acak, fungsi kepadatan peluang hingga teori limit pusat. Sebelum masuk ke ringkasan mengenai modul ini, yuk simak video singkatnya dibawah ini! Video Part I Video Part II 1. Pengambilan SampelData merupakan hal yang fundamental dalam data science. Tentu kita sepakat, tak akan ada hasil analisis tanpa data yang valid. Hampir selalu mustahil untuk mengambil seluruh data pada suatu pengamatan, dalam hal ini kita menyebutnya sebagai populasi. Untuk itu diperlukan sampel yang dapat mewakili populasi tadi. Keluaran untuk setiap penarikan sampel dari suatu populasi yang dilakukan baik secara kualitatif maupun kuantitatif pasti akan berpusat pada aspek numerik sampel data. Aspek numerik sampel data ini diantaranya adalah rata-rata, varians, standar deviasi, kuartil, persentil, kuartil, dan yang lainnya. 2. Beberapa KonsepVariabel acak adalah nilai keluaran untuk setiap data dari sampel yang ditarik disebut dengan variabel acak. Dengan menggunakan konsep variabel acak, modul ini akan mengajarkan bagaimana menemukan jumlah maupun peluang kemunculan suatu nilai. Contoh bagaimana menjawab pertanyaan œberapa jumlah peluang kemunculan berat badan 66 kg? Selain itu tentunya ada pula konsep probability density function dan cumulative density function. Baik dalam konsep umumnya hingga ke pdf dan cdf distribusi normal. Baca juga : Empat Jenis Data Statistik Hasil Pengukuran 3. Visualisasi Data Distribusi NormalApakah materi hanya berisi teks yang mungkin membuat bosan dan kurang menarik? Tentu tidak. Disini akan ada konsep menghitung frekuensi, frekuensi relatif dan lainnya menggunakan tabel. Tak lupa pula bagaimana ciri-ciri grafik dari data yang berdistribusi normal. Baik itu menggunakan histogram, boxplot dan grafik lainnya. 4. Pengenalan Python dalam Distribusi NormalSetelah mempelajari teorinya, tidak ketinggalan bagaimana penerapan python dalam distribusi normal. Sebagai contoh kita akan membangkitkan data berdistribusi normal dengan mean dan standar deviasi yang kita tentukan sendiri. Lalu di akhir, akan divisualisasikan menggunakan histogram. ``` sampel = 20000 data = np.random.normal(rerata, deviasi, sampel) plt.hist(data, 20) Dengan menggunakan sintaks di atas, kita sudah membangkitkan 20rb data yang berdistribusi normal. Dibuktikan dengan bentuk histogram seperti di bawah. Baca juga : Belajar Statistika, Kenali Lebih Jauh Penerapannya dalam Data Science 5. Upskill Kompetensi Statistik Melalui Module Baru DQLabModule œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python tentunya tidak hanya mempelajari pengambilan sampel hingga visualisasi datanya. Tapi kamu akan menguasai beberapa skill lainnya, diantaranya sebagai berikut :
Mampu menghitung nilai probabilitas berdasarkan distribusi normal dengan mengetahui pada rentang nilai dengan fungsi cdf (cumulative distribution function) dengan mengetahui nilai rata-rata dan standar deviasi Ingin belajar lebih dalam mengenai distribusi normal menggunakan python? Kunjungi DQLab sekarang! Mulai karir mu menjadi seorang data scientist hari ini. Cara akses modulenya gampang, mulai dengan sigup di DQLab.id dan masuk ke Academy DQLab untuk pilih menu module dan kamu bisa langsung mengerjakan module baru œStatistik Dasar untuk Data Science dengan Python & Scikit - Mengenal Distribusi Normal dengan Python. Yuk, tunggu apa lagi? Buruan gabung dan nikmati semua fasilitasnya hanya di DQLab! Penulis: Ashari Ramadhan Postingan TerkaitApa yang dimaksud dengan distribusi normal dalam statistik?Distribusi normal adalah salah satu jenis distribusi variabel acak kontinu, terdapat kurva berbentuk lonceng atau grafik. Distribusi ini dengan fungsi probabilitas kemudian menunjukkan variasi atau penyebaran distribusi, fungsi yang nantinya juga akan dibuktikan dengan menggunakan suatu grafik simetris atau bell curve.
Apa pentingnya distribusi normal dalam statistik?Distribusi normal juga akan membantu menentukan tingkat normalitas dengan kecenderungan sentral. Dalam statistika, khususnya statistika peluang, normalitas suatu data merupakan hal penting yang tidak boleh diabaikan.
Apa yang dimaksud dengan data normal?Data yang berdistribusi normal adalah data yang pola distribusinya berbentuk lonceng dan simetris, artinya pola data tersebut tidak menceng ke kiri atau pun ke kanan.
|