Metode Statistika II » Uji Normalitas › Uji Normalitas Shapiro WilksNormalitas
Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak mengikuti distribusi normal. Uji ini sering diaplikasikan dalam analisis regresi untuk pemeriksaan asumsi normalitas.
Oleh Tju Ji Long · Statistisi
Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak (random variable) berdistribusi normal atau tidak. Uji ini sering diaplikasikan dalam analisis regresi untuk pemeriksaan asumsi normalitas dari galat atau kesalahan acak (random error). Uji normalitas shapiro-wilks dapat digunakan untuk sampel berukuran kecil.
Berikut ini adalah prosedur dalam melakukan uji shapiro-wilks untuk mengidentifikasi kenormalan data.
- Tentukan hipotesis nol dan hipotesis alternatif.
- Menentukan tingkat signifikansi \( (\alpha) \)
- Data diurutkan dari terkecil hingga terbesar dan dibagi menjadi dua kelompok untuk di konversi dalam shapiro wilks.
- Menghitung statistik uji shapiro-wilks.
- Menentukan signifikansi uji.
- Kita dapat juga melakukan transformasi dalam nilai \(Z\) untuk dapat dihitung luasan kurva normal. Signifikansi uji kemudian ditentukan berdasarkan nilai kritis dari kurva normal tersebut. Berikut adalah transformasi yang digunakan:
\(H_0\): Populasi mengikuti distribusi normal
\(H_1\): Populasi tidak mengikuti distribusi normal
di mana:
\(D = \sum_\limits{i=1}^n (x_i-\bar{x})^2 \).
\(a_i\) = koefisien test shapiro wilk.
\(x_{n-i+1}\) = data ke \(n-i+1\).
\(x_i\) = data ke-\(i\).
\(\bar{x}\) = rata-rata data.
Untuk menentukan signifikansi uji kita gunakan tabel shapiro wilk untuk dilihat posisi nilai probabilitasnya (p). Jika \(ρ≥α\) maka terima hipotesis nol \(H_0\). Sebaliknya, jika \(ρ≤α\) maka tolak hipotesis nol \(H_0\).
di mana:
\(G\) = identik dengan nilai \(Z\) distribusi normal.
\(b_n,c_n,d_n \) = konversi statistik shapiro wilk pendekatan distribusi normal.
Contoh 1:
Berikut adalah data sampel usia 24 balita yang diambil secara random di Posyandu Mekar Sari Wetan.
58 | 23 | 58 | 56 | 46 | 37 | 18 | 32 |
36 | 19 | 34 | 33 | 41 | 36 | 55 | 30 |
24 | 36 | 33 | 26 | 40 | 35 | 48 | 27 |
Selidikilah apakah data usia balita tersebut diambil dari populasi yang berdistribusi normal pada alpha 5%?
Pembahasan:
Pertama, tentukanlah hipotesis nol dan hipotesis alternatifnya, yakni
\(H_0\): Populasi mengikuti distribusi normal
\(H_1\): Populasi tidak mengikuti distribusi normal
Berikutnya adalah menentukan tingkat signifikansi. Dari soal telah ditentukan bahwa tingkat signifikansinya adalah \( \alpha = 5 \)%.
Selanjutnya, cari statistik hitung uji shapiro-wilks.
1 | 18 | -18,71 | 350,00 |
2 | 19 | -17,71 | 313,59 |
3 | 23 | -13,71 | 187,92 |
4 | 24 | -12,71 | 161,50 |
5 | 26 | -10,71 | 114,67 |
6 | 27 | -9,71 | 94,25 |
7 | 30 | -6,71 | 45,00 |
. | . | . | . |
. | . | . | . |
. | . | . | . |
19 | 46 | 9,29 | 86,34 |
20 | 48 | 11.29 | 127,50 |
21 | 55 | 18,29 | 334,59 |
22 | 56 | 19,29 | 372,50 |
23 | 58 | 21,29 | 453,34 |
24 | 58 | 21,29 | 453,34 |
Jumlah | 881 | ||
Rata-rata | 36,7083 |
1 | 0,4493 | 58-18=40 | 17,97 |
2 | 0,3098 | 58-19=39 | 12,08 |
3 | 0,2554 | 56-23=33 | 8,43 |
4 | 0,2145 | 55-24=31 | 6,65 |
5 | 0,1807 | 48-26=22 | 3,98 |
6 | 0,1512 | 46-27=19 | 2,87 |
7 | 0,1245 | 41-30=11 | 1,37 |
8 | 0,0997 | 40-32=8 | 0,80 |
9 | 0,0764 | 37-33=4 | 0,31 |
10 | 0,0539 | 36-33=3 | 0,16 |
11 | 0,0321 | 36-34=2 | 0,06 |
12 | 0,0107 | 36-35=1 | 0,01 |
Jumlah | 54,69 |
Nilai \(a_i\) diperoleh dari tabel Shapiro Wilk (Coefisient test shapiro) dengan \(n = 24\). Karena nilai \(T_3 = 0,9391\) terletak antara nilai \(α(0,10) = 0, 930\) dan \(α (0,50) = 0,963\) (lihat tabel percentage point of W test), ini berarti bahwa nilai \(p\) terletak antara 0,10 dan 0,50.
Dengan demikian, karena nilai \(ρ>α=0,05\) maka terima hipotesis nol, \(H_0\), dan kita simpulkan bahwa data usia 24 balita tersebut berdistribusi normal.
Cara lain dengan menghitung nilai \(G\).
Berdasarkan nilai \(G = -1,2617\), maka diperoleh nilai luas di bawah kurva normal sebesar 0,1038 \((P(Z < -1,2617))\). Karena nilai luas tersebut di atas alpha = 0,05 maka hipotesis nol \(H_0\) diterima. Dengan demikian, data sampel usia 24 balita tersebut adalah berdistribusi normal.