Distribusi Normal, Distribusi T, Uji Chi Kuadrat, Regresi Linier

1. Distribusi Normal

Salah satu distribusi frekuensi yang paling penting dalam statistika adalah distribusi normal. Distribusi normal berupa kurva berbentuk lonceng setangkup yang melebar tak berhingga pada kedua arah positif dan negatifnya. Penggunaanya sama dengan penggunaan kurva distribusi lainnya. Frekuensi relatif suatu variabel yang mengambil nilai antara dua titik pada sumbu datar. Tidak semua distribusi berbentuk lonceng setangkup merupakan distribusi normal.

Pada tahun 1733 DeMoivre menemukan persamaan matematika kurva normal yang menjadi dasar banyak teori statistika induktif. Distribusi normal sering pula disebut Distribusi Gauss untuk menghormati Gauss (1777 – 1855), yang juga menemukan persamaannya waktu meneliti galat dalam pengukuran yang berulang-ulang mengenai bahan yang sama.

Sifat dari variabel kontinu berbeda dengan variabel diskrit. Variabel kontinu mencakup semua bilangan, baik utuh maupun pecahan. Oleh karenanya tidak bisadipisahkan satu nilai dengan nilai yang lain. Itulah sebabnya fungsi variabel random kontinu sering disebut fungsi kepadatan, karena tidak ada ruang kosong diantara dua nilai tertentu. Dengan kata lain sesungguhnya keberadaan satu buah angka dalam variabel kontinu jika ditinjau dari seluruh nilai adalah sangat kecil, bahkan mendekati nol. Karena itu tidak bisa dicari probabilitas satu buah nilai dalam variabel kontinu, tetapi yang dapat dilakukan adalah mencari probabilitas diantara dua buah nilai. Distribusi kontinu mempunyai fungsi matematis tertentu. Jika fungsi matematis tersebut digambar, maka akan terbentuk kurva kepadatan dengan sifat sebagai berikut:

1. Probabilitas nilai x dalam variabel tersebut terletak dalam rentang antara 0 dan 1

2. Probabilitas total dari semua nilai x adalah sama dengan satu (sama dengan luas daerah

di bawah kurva)

Fungsi kepadatan merupakan dasar untuk mencari nilai probabilitas di antara dua nilai variabel. Probabilitas di antara dua nilai adalah luas daerah di bawah kurva di antara dua nilai dibandingkan dengan luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dengan menggunakan integral tertentu (definit integral).

Persamaan matematika distribusi peluang peubah normal kontinu bergantung pada dua parameter μ dan σ yaitu rataan dan simpangan baku. Jadi fungsi padat x akan dinyatakan dengan n (x; μ, σ).

Begitu μ dan σ diketahui maka seluruh kurva normal diketahui. Sebagai contoh, bila μ = 50 dan σ = 5, maka ordinat n(x ; 50, 5) dapat dengan mudah dihitung untuk berbagai harga x dan kurvanya dapat digambarkan. Kedua kurva bentuknya persis sama tapi titik tengahnya terletak di tempat yang berbeda di sepanjang sumbu datar.

Dengan memeriksa turunan pertama dan kedua dari n(x ; μ, σ) dapat diperoleh lima sifat kurva normal berikut :

1. Modus, titik pada sumbu datar yang memberikan maksimum kurva, terdapat pada x=μ

2. Kurva setangkup terhadap garis tegak yang melalui rataan μ

3. Kurva mempunyai titik belok pada x = μ σ, cekung dari bawah bila μ – σ < x < μ + σ,

dan cekung dari atas untuk harga x lainnya

4. Kedua ujung kurva normal mendekati asimtot sumbu datar bila harga x bergerak

menjauhi μ baik ke kiri maupun ke kanan

5. Seluruh luas di bawah kurva diatas sumbu datar sama dengan 1

Bila x menyatakan peubah acak distribusi maka P(x1 < x < x2) diberikan oleh daerah yang diarsir dengan garis yang turun dari kiri ke kanan. Jelas bahwa kedua daerah yang diarsir berlainan luasnya. Jadi, peluang yang berpadanan dengan masing-masing distribusi akan berlainan pula.

Contoh soal :

Contoh Soal : Mawar adalah seorang peragawati yang akan diseleksi dengan tinggi badan 173 cm. Standar tinggi badan rata-rata peragawati adalah 171,8 dan standar deviasinya adalah 12. Berapakah standar normalnya (Z) ?
Penyelesaian :
Dik : x = 173, µ = 171,8, σ = 12
Dit : Z ?
Jawab : Z = x - µ
σ = 173 – 171.8 = 0.1
12

2. ANALYSIS OF VARIANCE (ANOVA)

n ANOVA dapat digunakan untuk menguji kesaman 3 (tiga) atau lebih rata-rata populasi menggunakan data yang diperoleh dari pengamatan maupun percobaan.

n Menggunakan hasil sampel untuk menguji hipotesis berikut:

H₀: m₁ = m₂ = … = m_k

H_a: minimal ada m_i ¹ m_j

n Jika H₀ ditolak berarti minimal ada 2 rata-rata populasi yang memiliki nilai berbeda.

ASUMSI-ASUMSI PADA ANOVA

n Untuk setiap populasi, variabel respons-nya terdistribusi normal.

n Varian dari variabel respons, dinotasikan s ², adalah sama untuk semua populasi.

n Unit observasi harus saling bebas (independent).

ANOVA: PENGUJIAN RATA-RATA POPULASI

ESTIMASI VARIAN POPULASI ANTAR SAMPEL

Estimasi s²antar-sampel (between-samples) disebut mean square between (MSB).

n Pembilang dari MSB merupakan sum of squares between (SSB).

n Penyebut dari MSB menyatakan derajat bebas (degrees of freedom)yang terkait dengan SSB.

n ANOVA: PENGUJIAN RATA-RATA POPULASI

ESTIMASI VARIAN POPULASI DALAM SAMPEL

Estimasi s² yang didasarkan pada variasi observasi dalam masing-masing sampel disebut mean square within (MSW).

n Pembilang dari MSW disebut sum of squares within (SSW).

n Penyebut dari MSW menunjukkan derajat bebas (degrees of freedom) yang bersesuaian dengan SSW.

n ANOVA: PENGUJIAN RATA-RATA POPULASI

PERBANDINGAN ESTIMASI VARIAN: UJI F

Jika H₀ benar dan asumsi pada ANOVA terpenuhi, maka distribusi

n Jika rata-rata k populasi tidak sama, nilai MSB/MSW akan meningkat karena MSB overestimate.

n Oleh karena itu, kita akan menolak H₀.

n PROSEDUR PENGUJIAN RATA-RATA POPULASIHipotesis

H₀: m₁ = m₂ = … = m_k

H_a: minimal ada m_i ¹ m_j

n Uji Statistik

F = MSB/MSW

n Aturan Penolakan

Tolak H₀ jika F > F_a

dimana nilai F_a didasarkan pada distribusi F dg derajat bebas k - 1 dan n_T - 1.

CONTOH SOAL:
REED MANUFACTURING

n Analysis of Variance (ANOVA)

J. R. Reed ingin mengetahui apakah rata-rata jumlah jam kerja per minggu para manajer sama pada tiga perusahaan yang ada (Buffalo, Pittsburgh, and Detroit).

Sampel acak sederhana yang terdiri dari 5 orang manajer pada masing-masing perusahaan diambil dan jumlah jam kerja minggu yang lalu masing-masing manajer tersebut dicatat. Hasilnya seperti pada slide berikut.

n Analysis of Variance (ANOVA)

Prshn 1 Prshn 2 Prshn 3

Observasi Buffalo Pittsburgh Detroit

1 48 73 51

2 54 63 63

3 57 66 61

4 54 64 54

5 62 74 56

Rata-rata Sampel 55 68 57

Varian Sampel 26,0 26,5 24,5

n Analysis of Variance (ANOVA)

Hipotesis

H₀: m₁ = m₂ = m₃

H_a: minimal ada m_i ¹ m_j ; i, j = 1,2,3

dimana:

m₁= rata-rata jumlah jam kerja perminggu manajer pada perusahaan 1

m₂= rata-rata jumlah jam kerja perminggu manajer pada perusahaan 2

m₃= rata-rata jumlah jam kerja perminggu manajer pada perusahaan 3

n Analysis of Variance (ANOVA)

Mean Square Between (MSB)

Karena ukuran sampelnya sama, maka

x = (55 + 68 + 57)/3 = 60

SSB = 5(55 - 60)² + 5(68 - 60)² + 5(57 - 60)² = 490

MSB = 490/(3 - 1) = 245

Mean Square Within (MSW)

SSW = 4(26,0) + 4(26,5) + 4(24,5) = 308

MSW = 308/(15 - 3) = 25,667

n Analysis of Variance (ANOVA)

Source of Variation	Degrees of Freedom	Sum of Squares	Mean Squares	F
Treatment	2	490	245	9,55
Error	12	308	25,667
Total	14	798

Uji Statistik

F = MSB/MSW = 245/25,667 = 9,55

n Analysis of Variance (ANOVA)

Aturan Penolakan

Misalkan a = 0,05, maka F_0,05;2;12 = 3,89

Tolak H₀ jika F > 3,89

Kesimpulan : Karena F = 9,55 > F_0,05;2;12 = 3,89, maka H₀ ditolak. Rata-rata jumlah jam kerja para manajer perminggu pada tiga perusahaan (Buffalo, Pittsburgh, and Detroit) tidak sama.

2. DISTRIBUSI T

Adalah pengujian hipotesis yang menggunakan distribusi T sebagai uji statsistik, table pengujiannya disebut table T student. Distribusi T pertama kali diterbitkan tahu 1908 dalam suatu makalah oleh W.S. Gosset. Hasil uji statistiknya kemudian dibandingkan dengan nilai yang ada pada tabel kemudian menerima atau menolak hipotesis nol (Ho) yang dikemukakan. Cirinya : sample yang di uji berukuran kurang dari 30

Tabel Nilai t

df		α
	0.05	0.025	0.01	0.005
1	6.314	12.706	31.821	63.657
2	2.920	4.303	6.965	9.925
3	2.353	3.182	4.541	5.841
4	2.132	2.776	3.747	4.604
5	2.015	2.571	3.365	4.032
6	1.943	2.447	3.143	3.707
7	1.895	2.365	2.998	3.499
8	1.860	2.306	2.896	3.355
9	1.833	2.262	2.821	3.250
10	1.812	2.228	2.764	3.169
11	1.796	2.201	2.718	3.106
12	1.782	2.179	2.681	3.055
13	1.771	2.160	2.650	3.012
14	1.761	2.145	2.624	2.977
15	1.753	2.131	2.602	2.947
16	1.746	2.120	2.583	2.921
17	1.740	2.110	2.567	2.898
18	1.734	2.101	2.552	2.878
19	1.729	2.093	2.539	2.861
20	1.725	2.086	2.528	2.845
21	1.721	2.080	2.518	2.831
22	1.717	2.074	2.508	2.819
23	1.714	2.069	2.500	2.807
24	1.711	2.064	2.492	2.797
25	1.708	2.060	2.485	2.787
26	1.706	2.056	2.479	2.779
27	1.703	2.052	2.473	2.771
28	1.701	2.048	2.467	2.763
29	1.699	2.045	2.462	2.756
30	1.697	2.042	2.457	2.750
40	1.684	2.021	2.423	2.704
50	1.676	2.009	2.403	2.678
100	1.660	1.984	2.364	2.626
10000	1.645	1.960	2.327	2.576

Uji t Tidak Berpasangan

Uji t dikembangkan oleh William Sealy Gosset. Dalam artikel publikasinya, ia menggunakan nama samaran Student, sehingga kemudian metode pengujiannya dikenal dengan uji t-student. William Sealy Gosset menganggap bahwa untuk sampel kecil, nilai Z dari distribusi normal tidak begitu cocok. Oleh karenanya, ia kemudian mengembangkan distribusi lain yang mirip dengan distribusi normal, yang dikenal dengan distribusi t-student. Distribusi student ini berlaku baik untuk sampel kecil maupun sampel besar. Pada n ≥ 30, distribusi t ini mendekati distribusi normal dan pada n yang sangat besar, misalnya n=10000, nilai distribusi t sama persis dengan nilai distribusi normal (lihat tabel t pada df 10000 dan bandingkan dengan nilai Z).

Pemakaian uji t ini bervariasi. Uji ini bisa digunakan untuk objek studi yang berpasangan dan juga bisa untuk objek studi yang tidak berpasangan. Berikut contoh penggunaan uji t.

Uji t tidak berpasangan

Contoh kasus :

Kita ingin menguji dua jenis pupuk nitrogen terhadap hasil padi

1. Hipotesis

Ho :

1 =

₂

H_A :

1 ≠

₂

2. Hasil penelitian tertera pada Tabel 1.

Tabel 1. Data hasil penelitian dua jenis pupuk nitrogen terhadap hasil padi (t/h)

Plot	Pupuk A Y₁	Pupuk B Y₂
1	7	8
2	6	6
3	5	7
4	6	8
5	5	6
6	4	6
7	4	7
8	6	7
9	6	8
10	7	7
11	6	6
12	5	7

3. Data analisis adalah sebagai berikut

Hitunglah

₁= 5.58

_Y₂= 6.92

S₁= 0.996

S₂= 0.793

t_hit =(

₁ –

₂)/√(S₁²/n₁) +(S₂²/n₂)

=( 5.58 – 6.92)/√(0.996²/12)+(0.793²/12)

= -1.34/0.367522 = -3.67

Setelah itu, kita lihat nilai t table, sebagai nilai pembanding. Cara melihatnya adalah sebagai berikut. Pertama kita lihat kolom α = 0.025 pada Tabel 2. Nilai α ini berasal dari α 0.05 dibagi 2, karena hipotesis H_A kita adalah hipotesis 2 arah (lihat hipotesis). Kemudian, kita lihat baris ke 22. Nilai 22 ini adalah nilai df, yaitu n1+n2-2. Nilai n adalah jumlah ulangan, yaitu masing 12 ulangan. Akhirnya, kita peroleh nilai t_table = 2.074.

t _table = t _{α/2 (df)} = t_{0.05/2 (n1+n2-2)}=t_{0.025(12+12-2)}= t_0.025(22)= 2.074

4. Kriteria Pengambilan Kesimpulan

Terima H₀, jika

t_hit| < t _table, sebaliknya

Tolak H₀, alias terima H_A, jika

t_hit| > t _table

5. Kesimpulan

Karena nila

t_hit|= 3.67 (tanda minus diabaikan) dan nilai t_table=2.074, maka kita tolak H₀, alias kita terima H_A. Dengan demikian,

₁ ≠

₂, yaitu hasil padi yang dipupuk dengan pupuk A tidak sama dengan hasil padi yang dipupuk dengan pupuk B. Lebih lanjut, kita lihat bahwa rata-rata hasil padi yang dipupuk dengan pupuk B lebih tinggi daripada yang dipupuk dengan pupuk A. Dengan demikian, kita dapat menyimpulkan bahwa pupuk B nyata lebih baik daripada pupuk A untuk meningkatkan hasil pa

3. UJI CHI KUADRAT (χ²)

1. Pendahuluan

Uji Chi Kuadrat adalah pengujian hipotesis mengenai perbandingan antara :

�� frekuensi observasi/yg benar-benar terjadi/aktual dengan

�� frekuensi harapan/ekspektasi

1.1. Pengertian Frekuensi Observasi dan Frekuensi Harapan

�� frekuensi observasi → nilainya didapat dari hasil percobaan (o)

�� frekuensi harapan → nilainya dapat dihitung secara teoritis (e)

1.2. Bentuk Distribusi Chi Kuadrat (χ²)

Nilai χ² adalah nilai kuadrat karena itu nilai χ² selalu positif.

Bentuk distribusi χ² tergantung dari derajat bebas(db)/degree of freedom.

Perhatikan Tabel hal 178 dan 179 (Buku Statistika-2, Gunadarma).

Anda bisa membacanya?

Contoh : Berapa nilai χ² untuk db = 5 dengan α = 0.010? (15.0863)

Berapa nilai χ² untuk db = 17 dengan α = 0.005? (35.7185)

Pengertian α pada Uji χ² sama dengan pengujian hipotesis yang lain, yaitu luas daerah penolakan H0 atau taraf nyata pengujian

Perhatikan gambar berikut :

α : luas daerah penolakan H0 = taraf nyata pengujian

0 + ∞

1.3. Pengunaan Uji χ²

Uji χ² dapat digunakan untuk :

a. Uji Kecocokan = Uji kebaikan-suai = Goodness of fit test

b. Uji Kebebasan

c. Uji beberapa proporsi

Prinsip pengerjaan (b) dan (c) sama saja

2. Uji Kecocokan (Goodness of fit test)

2.1 Penetapan Hipotesis Awal dan Hipotesis Alternatif

H0: frekuensi setiap kategori memenuhi suatu nilai/perbandingan.

H1 : Ada kategori yang tidak memenuhi nilai/perbandingan tersebut.

k : banyaknya kategori/sel, 1,2 ... k

o : frekuensi observasi untuk kategori ke-i i

e : frekuensi ekspektasi untuk kategori ke-i i

kaitkan dengan frekuensi ekspektasi dengan nilai/perbandingan dalam H0

Derajat Bebas (db) = k - 1

2.3 Perhitungan χ²

Contoh 3 :

Pelemparan dadu sebanyak 120 kali menghasilkan data sebagai berikut :

kategori :	sisi-1	sisi-2	sisi-3	sisi-4	sisi-5	sisi-6
frekuensi observasi	20 20	20 22	20 17	20 18	20 19	20 24

*) Nilai dalam kotak kecil adalah frekuensi ekspektasi

Apakah dadu itu dapat dikatakan setimbang?

Lakukan pengujian dengan taraf nyata = 5 %

Solusi :

1. H0 : Dadu setimbang → semua sisi akan muncul = 20 kali.

H1 : Dadu tidak setimbang → ada sisi yang muncul ≠20 kali.

2. Statistik Uji χ²

3. Nilai α = 5 % = 0.05

k = 6 ; db = k - 1 = 6-1 = 5

4. Nilai Tabel χ²

k = 6 ; db = k - 1 = 6-1 = 5

db = 5;α = 0.05 → χ² tabel = 11.0705

5. Wilayah Kritis = Penolakan H0 jika χ² hitung > χ² tabel (db; α) χ² hitung > 11.0705

(catatan : Gunakan tabel seperti ini agar pengerjaan lebih sistematik)

kategori :	oi	ei	(o-e) ii	(o-e)² ii	(o-e)²/e iii
sisi-1	20	20	0	0	0
sisi-2	22	20	2	4	0.20
sisi-3	17	20	-3	9	0.45
sisi-4	18	20	-2	4	0.20
sisi-5	19	20	-1	1	0.05
sisi-6	24	20	4	16	0.80
Σ	120	120	---------	--------------	1.70

χ² hitung = 1.70

7. Kesimpulan :

χ² hitung = 1.70 < χ² tabel

Nilai χ² hitung ada di daerah penerimaan H0

H0 diterima; pernyataan dadu setimbang dapat diterima.

4. Regresi linier

Untuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Gujarati (2006) mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung.

Sumber : destidirnaeni.blogspot.com