Histogram adalah grafik yang menunjukkan distribusi frekuensi. Show Histogram adalah grafik yang menunjukkan jumlah pengamatan dalam setiap interval tertentu. Contoh: Misalkan kita megamati tinggi 250 orang, kita mungkin akan menghasilkan histogram seperti ini Kita bisa membaca dari histogram yang diatas, kira-kira seperti ini: 2 orang dari 140 hingga 145cm Membuat HistogramPada Matplotlib, kita menggunakan fungsi hist() untuk membuat histogram. Fungsi hist() akan menggunakan array angka untuk membuat histogram, array tersebut dikirim ke fungsi sebagai argumen. Agar lebih sederhana, kita akan menggunakan NumPy untuk membuat array secara acak dengan 250 nilai, di mana nilai akan terkonsentrasi sekitar 170, dan deviasi standarnya adalah 10. Contoh import numpy as np x = np.random.normal(170, 10, 250) print(x) Ini akan menghasilkan hasil acak. Fungsi hist() akan membaca array dan menghasilkan histogram. Contoh: import sys import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt import numpy as np x = np.random.normal(170, 10, 250) plt.hist(x) plt.show() plt.savefig(sys.stdout.buffer) sys.stdout.flush() Hasil: Histogram adalah grafik yang menunjukkan distribusi frekuensi. Histogram adalah grafik yang menunjukkan jumlah pengamatan dalam setiap interval tertentu. Contoh: Misalkan kita megamati tinggi 250 orang, kita mungkin akan menghasilkan histogram seperti ini Kita bisa membaca dari histogram yang diatas, kira-kira seperti ini: 2 orang dari 140 hingga 145cm Membuat HistogramPada Matplotlib, kita menggunakan fungsi hist() untuk membuat histogram. Fungsi hist() akan menggunakan array angka untuk membuat histogram, array tersebut dikirim ke fungsi sebagai argumen. Agar lebih sederhana, kita akan menggunakan NumPy untuk membuat array secara acak dengan 250 nilai, di mana nilai akan terkonsentrasi sekitar 170, dan deviasi standarnya adalah 10. Contoh import numpy as np x = np.random.normal(170, 10, 250) print(x) Ini akan menghasilkan hasil acak. Fungsi hist() akan membaca array dan menghasilkan histogram. Contoh: import sys import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt import numpy as np x = np.random.normal(170, 10, 250) plt.hist(x) plt.show() plt.savefig(sys.stdout.buffer) sys.stdout.flush() Hasil: Saya membuat plot histogram menggunakan data dari file dan tidak ada masalah. Sekarang saya ingin menempatkan data dari file lain dalam histogram yang sama, jadi saya melakukan sesuatu seperti
tetapi masalahnya adalah bahwa untuk setiap interval, hanya bilah dengan nilai tertinggi yang muncul, dan yang lainnya disembunyikan. Saya bertanya-tanya bagaimana saya bisa memetakan kedua histogram secara bersamaan dengan warna yang berbeda. Di sini Anda memiliki contoh yang berfungsi:
Jawaban yang diterima memberikan kode untuk histogram dengan bilah yang tumpang tindih, tetapi jika Anda ingin setiap bilah saling berdampingan (seperti yang saya lakukan), coba variasi di bawah ini:
Referensi: http://matplotlib.org/examples/statistics/histogram_demo_multihist.html EDIT [2018/03/16]: Diperbarui untuk memungkinkan plot array dengan ukuran berbeda, seperti yang disarankan oleh @stochastic_zeitgeist Jika Anda memiliki ukuran sampel yang berbeda, mungkin sulit untuk membandingkan distribusi dengan sumbu y tunggal. Sebagai contoh:
Dalam hal ini, Anda dapat memplot dua set data Anda pada sumbu yang berbeda. Untuk melakukannya, Anda bisa mendapatkan data histogram Anda menggunakan matplotlib, bersihkan porosnya, dan kemudian plot ulang pada dua sumbu terpisah (menggeser tepi nampan sehingga tidak tumpang tindih):
Berikut adalah metode sederhana untuk memplot dua histogram, dengan bilah mereka berdampingan, pada plot yang sama ketika data memiliki ukuran yang berbeda:
Sebagai penyelesaian untuk jawaban Gustavo Bezerra : Jika Anda ingin setiap histogram dinormalisasi (
Sebagai perbandingan, vektor Anda harus menggunakan
Untuk berjaga-jaga jika Anda memiliki pandas (
Pertanyaan ini telah dijawab sebelumnya, tetapi ingin menambahkan solusi cepat/mudah lain yang mungkin membantu pengunjung lain ke pertanyaan ini.
Beberapa contoh bermanfaat adalah di sini untuk perbandingan kde vs histogram. Terinspirasi oleh jawaban Solomon, tetapi untuk tetap dengan pertanyaan, yang terkait dengan histogram, solusi bersih adalah:
Pastikan untuk memplot yang lebih tinggi terlebih dahulu, jika tidak Anda perlu mengatur plt.ylim (0,0.45) agar histogram yang lebih tinggi tidak dipotong. Apa itu matplotlib pada Python?Arti dari Matplotlib adalah Library berbasis Python untuk kepentingan visualisasti data yang dapat berjalan di multi-flatfrom(Windows, MacOs, Linux) dengan menggunakan Numpy. Dengan matplotlib kita dapat membuat plot, histogram, diagram batang dan jenis diagram lainnya hanya dengan beberapa baris kode. %Matplotlib inline untuk apa?“%matplotlib inline” digunakan untuk meng-embed gambar plot statis di dalam notebook. Apa itu visualisasi data Python?Visualisasi data adalah teknik mengambil informasi dari data ke dalam bentuk visual yang bisa dilihat oleh mata, seperti bagan, grafik, dan peta. Visualisasi data dibuat untuk memahami data yang besar atau kecil dengan mudah. R dan Python merupakan platform yang hampir bisa menganalisis semua jenis grafik. |