Berapa jumlah sampel untuk uji Shapiro Wilk?

Metode Statistika II » Uji Normalitas › Uji Normalitas Shapiro WilksNormalitas

Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak mengikuti distribusi normal. Uji ini sering diaplikasikan dalam analisis regresi untuk pemeriksaan asumsi normalitas.


Oleh Tju Ji Long · Statistisi

Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak (random variable) berdistribusi normal atau tidak. Uji ini sering diaplikasikan dalam analisis regresi untuk pemeriksaan asumsi normalitas dari galat atau kesalahan acak (random error). Uji normalitas shapiro-wilks dapat digunakan untuk sampel berukuran kecil.

Berikut ini adalah prosedur dalam melakukan uji shapiro-wilks untuk mengidentifikasi kenormalan data.

  1. Tentukan hipotesis nol dan hipotesis alternatif.
  2. \(H_0\): Populasi mengikuti distribusi normal

    \(H_1\): Populasi tidak mengikuti distribusi normal

  3. Menentukan tingkat signifikansi \( (\alpha) \)
  4. Data diurutkan dari terkecil hingga terbesar dan dibagi menjadi dua kelompok untuk di konversi dalam shapiro wilks.
  5. Menghitung statistik uji shapiro-wilks.
  6. di mana:

    \(D = \sum_\limits{i=1}^n (x_i-\bar{x})^2 \).

    \(a_i\) = koefisien test shapiro wilk.

    \(x_{n-i+1}\) = data ke \(n-i+1\).

    \(x_i\) = data ke-\(i\).

    \(\bar{x}\) = rata-rata data.

  7. Menentukan signifikansi uji.
  8. Untuk menentukan signifikansi uji kita gunakan tabel shapiro wilk untuk dilihat posisi nilai probabilitasnya (p). Jika \(ρ≥α\) maka terima hipotesis nol \(H_0\). Sebaliknya, jika \(ρ≤α\) maka tolak hipotesis nol \(H_0\).

  9. Kita dapat juga melakukan transformasi dalam nilai \(Z\) untuk dapat dihitung luasan kurva normal. Signifikansi uji kemudian ditentukan berdasarkan nilai kritis dari kurva normal tersebut. Berikut adalah transformasi yang digunakan:
  10. Berapa jumlah sampel untuk uji Shapiro Wilk?

    di mana:

    \(G\) = identik dengan nilai \(Z\) distribusi normal.

    \(b_n,c_n,d_n \) = konversi statistik shapiro wilk pendekatan distribusi normal.

Contoh 1:

Berikut adalah data sampel usia 24 balita yang diambil secara random di Posyandu Mekar Sari Wetan.

58 23 58 56 46 37 18 32
36 19 34 33 41 36 55 30
24 36 33 26 40 35 48 27

Selidikilah apakah data usia balita tersebut diambil dari populasi yang berdistribusi normal pada alpha 5%?

Pembahasan:

Pertama, tentukanlah hipotesis nol dan hipotesis alternatifnya, yakni

\(H_0\): Populasi mengikuti distribusi normal

\(H_1\): Populasi tidak mengikuti distribusi normal

Berikutnya adalah menentukan tingkat signifikansi. Dari soal telah ditentukan bahwa tingkat signifikansinya adalah \( \alpha = 5 \)%.

Selanjutnya, cari statistik hitung uji shapiro-wilks.

No\(x_i\)\(x_i-\bar{x}\)\((x_i-\bar{x})^2\)
1 18 -18,71 350,00
2 19 -17,71 313,59
3 23 -13,71 187,92
4 24 -12,71 161,50
5 26 -10,71 114,67
6 27 -9,71 94,25
7 30 -6,71 45,00
. . . .
. . . .
. . . .
19 46 9,29 86,34
20 48 11.29 127,50
21 55 18,29 334,59
22 56 19,29 372,50
23 58 21,29 453,34
24 58 21,29 453,34
Jumlah 881
Rata-rata 36,7083

No\(a_i\)\((x_{n-i+1}-x_i)\)\(a_i (x_{n-i+1})\)
1 0,4493 58-18=40 17,97
2 0,3098 58-19=39 12,08
3 0,2554 56-23=33 8,43
4 0,2145 55-24=31 6,65
5 0,1807 48-26=22 3,98
6 0,1512 46-27=19 2,87
7 0,1245 41-30=11 1,37
8 0,0997 40-32=8 0,80
9 0,0764 37-33=4 0,31
10 0,0539 36-33=3 0,16
11 0,0321 36-34=2 0,06
12 0,0107 36-35=1 0,01
Jumlah 54,69

Nilai \(a_i\) diperoleh dari tabel Shapiro Wilk (Coefisient test shapiro) dengan \(n = 24\). Karena nilai \(T_3 = 0,9391\) terletak antara nilai \(α(0,10) = 0, 930\) dan \(α (0,50) = 0,963\) (lihat tabel percentage point of W test), ini berarti bahwa nilai \(p\) terletak antara 0,10 dan 0,50.

Dengan demikian, karena nilai \(ρ>α=0,05\) maka terima hipotesis nol, \(H_0\), dan kita simpulkan bahwa data usia 24 balita tersebut berdistribusi normal.

Cara lain dengan menghitung nilai \(G\).

Berdasarkan nilai \(G = -1,2617\), maka diperoleh nilai luas di bawah kurva normal sebesar 0,1038 \((P(Z < -1,2617))\). Karena nilai luas tersebut di atas alpha = 0,05 maka hipotesis nol \(H_0\) diterima. Dengan demikian, data sampel usia 24 balita tersebut adalah berdistribusi normal.

Uji Shapiro

Uji shapiro wilk dan ryan joiner hanya valid sampai 2000 sampel, sedangkan uji shapiro francia valid hingga 5000 sampel.

Jika sampel kurang dari 30 menggunakan uji apa?

Karena sampel kecil (<30) maka menggunakan uji Parametric dengan uji Independent Sampel T Test, namun apabila data tidak berdistribusi normal atau tidak homogen maka menggunakan uji non-parametric dengan uji Mann Whitney U.

Kapan harus menggunakan uji Shapiro

Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak mengikuti distribusi normal. Uji ini sering diaplikasikan dalam analisis regresi untuk pemeriksaan asumsi normalitas. Uji Shapiro Wilks digunakan untuk mengidentifikasi apakah suatu peubah acak (random variable) berdistribusi normal atau tidak.

Berapakah sampel yang dibutuhkan untuk menghitung uji normalitas?

C. Berapa nilai yang dibutuhkan untuk menghitung uji normalitas ? Uji KolmogorovSmirnov membutuhkan minimal 5 sampel, Uji ShapiroWilk membutuhkan minimal 7 sampel dan Uji D'Agostino membutuhkan lebih dari 8.