Rabu, 25 November 2009

ANOVA (Analisis of varians)

Analisis Varians (ANOVA)

Dalam statistik, analisis varians (ANOVA) adalah sebuah koleksi model-model statistik, dan prosedur yang terkait, di mana varians yang diamati dibagi menjadi komponen-komponen karena variabel penjelas yang berbeda. Dalam bentuk yang paling sederhana ANOVA memberikan ujian statistik apakah berarti dari beberapa kelompok semua sederajat, dan karenanya Student generalizes dua-sampel t-tes untuk lebih dari dua kelompok.
Ada tiga kelas konseptual model seperti:

   1. Model efek tetap berasumsi bahwa data berasal dari populasi normal yang mungkin berbeda hanya dalam kemampuan mereka. (Model 1)
   2. Model efek acak berasumsi bahwa data yang menggambarkan hierarki populasi yang berbeda yang perbedaan dibatasi oleh hirarki. (Model 2)
   3. Model efek campuran menggambarkan situasi di mana baik tetap dan efek acak hadir. (Model 3)

Dalam prakteknya, ada beberapa tipe ANOVA tergantung pada jumlah perawatan dan cara mereka diterapkan pada mata pelajaran dalam percobaan:

    * Satu-way ANOVA digunakan untuk menguji perbedaan antara dua atau lebih kelompok-kelompok independen. Biasanya Namun, satu-arah ANOVA digunakan untuk menguji perbedaan di antara sekurang-kurangnya tiga kelompok, karena kedua-kasus kelompok dapat ditutup oleh t-test (Gosset, 1908). Ketika hanya ada dua cara untuk membandingkan, t-test dan F-tes yang setara; hubungan antara ANOVA dan t diberikan oleh F = t2.
    * Dua-cara ANOVA untuk mengulangi langkah-langkah yang digunakan ketika subyek dikenai mengulangi langkah-langkah; ini berarti bahwa subjek yang sama digunakan untuk setiap perawatan. Perhatikan bahwa metode ini dapat terganggu efek carryover.
    * Faktorial ANOVA digunakan ketika eksperimen ingin mempelajari efek dari dua atau lebih perlakuan variabel. Yang paling sering digunakan ANOVA jenis faktorial adalah 22 (dibaca "berdua-dua") desain, di mana terdapat dua variabel independen dan masing-masing variabel memiliki dua tingkat atau nilai-nilai yang berbeda. Namun demikian, penggunaan untuk analisis Anova faktorial 2k desain dan desain faktorial pecahan adalah "membingungkan dan tidak masuk akal"; melainkan disarankan untuk merujuk nilai efek dibagi dengan standard error ke sebuah t-tabel. [1] ANOVA faktorial juga dapat multi-level seperti 33, dll atau lebih tinggi seperti 2 × 2 × 2, dll tapi analisis dengan jumlah yang lebih banyak faktor yang jarang dilakukan dengan tangan karena perhitungan panjang. Namun, sejak diperkenalkannya perangkat lunak analisis data, pemanfaatan tatanan yang lebih tinggi desain dan analisis telah menjadi sangat umum.
    * Campuran-design ANOVA. Ketika seseorang ingin menguji dua atau lebih kelompok-kelompok independen menundukkan subjek untuk mengulangi langkah-langkah, seseorang dapat melakukan desain faktorial campuran ANOVA, di mana salah satu faktor adalah antara variabel-subjek dan yang lain-subjek dalam variabel. Ini adalah jenis efek campuran model.
    * Analisis varians multivariat (MANOVA) digunakan ketika ada lebih dari satu variabel dependen.

Efek tetap model analisis varians berlaku untuk situasi di mana berlaku eksperimen beberapa kali perawatan dengan subyek percobaan untuk melihat apakah perubahan nilai-nilai variabel respon. Hal ini memungkinkan eksperimen untuk memperkirakan kisaran nilai-nilai variabel respon bahwa pengobatan akan menghasilkan dalam populasi secara keseluruhan.

Model efek acak digunakan bila pengobatan tidak tetap. Hal ini terjadi ketika berbagai perawatan (juga dikenal sebagai tingkat faktor) adalah sampel dari populasi yang lebih besar. Karena pengobatan sendiri variabel-variabel acak, beberapa asumsi dan metode perawatan kontras berbeda dari ANOVA model 1.

Kebanyakan acak-efek-efek atau dicampur model tidak peduli dengan membuat kesimpulan mengenai faktor-faktor sampel tertentu. Sebagai contoh, pertimbangkan sebuah pabrik besar di mana banyak mesin menghasilkan produk yang sama. Para ahli statistik mempelajari tanaman ini akan sangat sedikit minat dalam membandingkan tiga mesin khusus satu sama lain. Sebaliknya, kesimpulan yang dapat dibuat untuk semua mesin yang menarik, seperti variabilitas dan mereka rata-rata.

Asumsi

    * Kemerdekaan kasus - ini adalah persyaratan desain.
    * Normality - distribusi residu normal.
    * Kesetaraan (atau "homogenitas") varians, disebut homoscedasticity - varians data dalam kelompok harus sama.

Levene's test untuk homogenitas varians biasanya digunakan untuk memeriksa hal masuk akal dari homoscedasticity. The Kolmogorov-Smirnov atau uji Shapiro-Wilk dapat digunakan untuk memeriksa normalitas.

Ketika digunakan untuk menguji kesamaan varians dua populasi, F-tes ini tidak dapat dipercaya jika ada penyimpangan dari normalitas (Lindman, 1974). Di sisi lain, ketika digunakan dalam analisis varians untuk menguji hipotesis bahwa semua perlakuan mempunyai efek yang sama, F-test adalah kuat (Ferguson & Takane, 2005, pp.261-2).

The Kruskal-Wallis test adalah alternatif nonparametrik yang tidak mengandalkan pada asumsi normalitas.

Ini bersama-sama membentuk asumsi umum bahwa kesalahan yang independen, identik, dan biasanya didistribusikan untuk model efek tetap, atau:

    \ varepsilon \ thicksim N (0, \ sigma ^ 2). \,

Teknik fundamental adalah partisi dari total jumlah kuadrat (disingkat SS) menjadi komponen-komponen yang berkaitan dengan efek yang digunakan dalam model. Sebagai contoh, kami tunjukkan model untuk ANOVA sederhana dengan satu jenis pengobatan di tingkat yang berbeda.


    SS_ (\ hbox (Total)) = SS_ (\ hbox (Error)) + SS_ (\ hbox (Perawatan)) \, \!


Jadi, jumlah derajat kebebasan (disingkat df) dapat dipartisi dengan cara yang sama dan menentukan distribusi chi-kuadrat yang menggambarkan jumlah kuadrat terkait.


    df_ (\ hbox (Total)) = df_ (\ hbox (Error)) + df_ (\ hbox (Perawatan)) \, \!


Lihat juga Kurangnya-of-fit jumlah kuadrat. F-test
Artikel utama: F-test

F-test digunakan untuk perbandingan antara komponen-komponen dari total deviasi. Sebagai contoh, dalam satu-arah, atau faktor tunggal ANOVA, signifikansi statistik diuji untuk dengan membandingkan uji F statistik

    F = \ dfrac (\ mbox (varians dari kelompok berarti)) (\ mbox (mean dari kelompok dalam varians))

    F ^ * = \ frac (\ mbox (MStr)) (\ mbox (MSE)) \,

mana:

    \ mbox (MStr) = \ frac (\ mbox (SSTR)) (I-1), aku = jumlah perawatan

dan

    \ mbox (MSE) = \ frac (\ mbox (SSE)) (n_T-I), nT = jumlah kasus

ke F-distribusi dengan I-1, nT-aku derajat kebebasan. Menggunakan F-distribusi adalah calon alami karena uji statistik adalah hasil bagi dua berarti jumlah kuadrat yang mempunyai distribusi chi-kuadrat.
[sunting] ANOVA pada peringkat
Lihat juga: Kruskal-Wallis analisis satu arah varians

Seperti yang pertama kali diusulkan oleh Conover dan Iman pada tahun 1981, dalam banyak kasus ketika data tidak memenuhi asumsi ANOVA, kita dapat mengganti setiap nilai data asli oleh peringkat dari 1 untuk terkecil ke N untuk yang terbesar, kemudian menjalankan standar ANOVA perhitungan pada peringkat-data yang berubah. "Dimana tidak ada metode nonparametrik setara belum dikembangkan seperti untuk dua arah desain, peringkat hasil tes transformasi yang lebih kuat untuk non-normal, dan tahan terhadap outliers dan non-varians konstan, daripada ANOVA tanpa transformasi. " (Helsel & Hirsch, 2002, halaman 177). Namun Seaman et al. (1994) melihat bahwa perubahan peringkat Conover dan Iman (1981) tidak sesuai untuk menguji interaksi antara efek dalam rancangan faktorial karena dapat menyebabkan peningkatan kesalahan Tipe I (alpha error). Lebih jauh lagi, jika kedua faktor utama yang signifikan ada sedikit kekuatan untuk mendeteksi interaksi.

Sebuah varian dari peringkat-transformasi adalah 'quantile normalisasi' di mana transformasi lebih lanjut diterapkan pada jajaran sedemikian rupa sehingga nilai-nilai yang dihasilkan memiliki beberapa didefinisikan distribusi (sering merupakan distribusi normal dengan mean dan varians tertentu). Analisis lebih lanjut dinormalkan quantile-data tersebut kemudian berasumsi bahwa distribusi untuk menghitung nilai-nilai penting.

    * Conover, W. J. & Iman, R. L. (1981). Peringkat transformasi sebagai jembatan antara parametrik dan statistik nonparametrik. American Statistician, 35, 124-129.

    * Helsel, D. R., & Hirsch, R. M. (2002). Statistical Methods in Water Resources: Techniques of Water Resourses Investigations, Book 4, bab A3. U. S. Geological Survey. Halaman 522. [4]

    * Seaman, JW, Walls, SC, Wide, SE, & Jaeger, RG (1994). Caveat Emptor: Rank mengubah metode dan interaksi. Trends Ecol. Evol., 9, 261-263.



Beberapa efek ukuran standar yang digunakan dalam konteks ANOVA untuk menggambarkan derajat hubungan antara prediksi atau serangkaian prediksi dan variabel dependen. Perkiraan ukuran efek dilaporkan untuk memungkinkan peneliti untuk membandingkan temuan-temuan dalam studi dan lintas disiplin ilmu. Perkiraan ukuran efek common dilaporkan dalam bivariat (misalnya ANOVA) dan multivariat (MONOVA, CANOVA, Multiple Analisis Diskriminan) analisis statistik meliputi: Eta-squared, parsial eta-kuadrat, omega dan intercorrelation (Strang, 2009).

η2 (eta-squared): Eta-squared menggambarkan rasio varians yang dijelaskan dalam variabel dependen oleh prediksi sementara mengontrol prediksi lainnya. Eta kuadrat adalah bias penduga dari varians dijelaskan oleh model dalam populasi (hanya perkiraan ukuran efek dalam sampel). Secara rata-rata varians overestimates dijelaskan dalam populasi. Sebagai ukuran sampel semakin besar jumlah bias semakin kecil. Akan tetapi, yang mudah dihitung penduga dari proporsi varians dalam suatu populasi dijelaskan oleh perawatan. Perhatikan bahwa versi sebelumnya perangkat lunak statistik (seperti SPSS) Partial laporan salah eta menyesatkan kuadrat di bawah judul "Eta kuadrat".

(\ eta) ^ 2 = \ frac (SS_ (pengobatan)) (SS_ (total))

Η2 parsial (Partial eta-squared): Partial eta-squared menggambarkan "proporsi dari total variasi disebabkan oleh faktor, partialling keluar (tidak termasuk) faktor-faktor lain dari total nonerror variasi" (Pierce, Blok & Aguinis, 2004, hal 918 ). Partial eta squared biasanya lebih tinggi dari eta squared (kecuali dalam satu-faktor sederhana model).

(Partial \ eta) ^ 2 = \ frac (SS_ (pengobatan)) (SS_ (pengobatan) + SS_ (error))

Beberapa variasi tolok ukur ada.

Yang diterima secara umum regresi tolok ukur untuk ukuran efek berasal dari (Cohen, 1992; 1988): 0.20 adalah solusi minimal (tetapi penting dalam penelitian ilmu sosial); 0,50 adalah efek medium; apa pun sama dengan atau lebih besar dari 0,80 adalah efek besar ukuran (Keppel & Wickens, 2004; Cohen, 1992).

Karena ini penafsiran umum ukuran akibat telah berulang-ulang dari Cohen (1988) selama bertahun-tahun tanpa perubahan atau komentar untuk validitas untuk penelitian eksperimental kontemporer, maka dipertanyakan di luar psikologis / perilaku studi, dan lebih lagi dipertanyakan bahkan saat itu tanpa pemahaman penuh keterbatasan dinisbahkan oleh Cohen. Catatan: Penggunaan sebagian spesifik eta-nilai persegi besar atau kecil menengah sebagai "rule of thumb" harus dihindari.

Namun demikian, aturan alternatif praktis telah muncul dalam disiplin ilmu tertentu: Kecil = 0,01; medium = 0.06; besar = 0,14 (Kittler, Menard & Phillips, 2007).

Omega Omega Squared kuadrat yang relatif tidak bias memberikan estimasi varians yang dijelaskan dalam populasi oleh variabel prediktor. Dibutuhkan kesalahan acak memperhitungkan lebih dari eta kuadrat, yang sangat bias terlalu besar. Perhitungan bagi omega kuadrat berbeda tergantung pada desain eksperimental. Untuk desain eksperimental yang tetap (di mana kategori secara eksplisit diatur), omega kuadrat dihitung sebagai berikut: [2]

(\ hat \ omega) ^ 2 = \ frac (SS_ (memperlakukan)-df_ (memperlakukan) MS_ (error)) (SS_ (total) + MS_ (error))


Cohen's f ini mengukur ukuran akibat sering dihadapi saat melakukan perhitungan analisis kekuasaan. Konseptual itu merupakan akar kuadrat dari varians varians dijelaskan di atas tidak dijelaskan.
[sunting] Follow up tes

Sebuah efek yang signifikan secara statistik ANOVA sering diikuti dengan satu atau lebih yang berbeda pengujian lanjutan. Hal ini dapat dilakukan untuk menilai kelompok mana yang berbeda dari kelompok lain atau untuk menguji berbagai hipotesis terfokus. Menindaklanjuti tes sering dibedakan dalam hal apakah mereka direncanakan (apriori) atau post hoc. Direncanakan tes ditentukan sebelum melihat data dan uji post hoc dilakukan setelah melihat data. Post hoc tes seperti tes Tukey paling umum berarti membandingkan setiap kelompok dengan setiap kelompok lain berarti dan biasanya menggabungkan beberapa metode pengendalian Tipe I kesalahan. Perbandingan, yang paling sering direncanakan, dapat bersifat sederhana atau kompleks. Perbandingan sederhana berarti membandingkan satu kelompok dengan satu kelompok lain berarti. Perbandingan senyawa biasanya membandingkan dua set kelompok berarti di mana satu set memiliki dua atau lebih kelompok (misalnya, membandingkan kelompok rata-rata sarana grup A, B dan C dengan grup D). Perbandingan juga dapat melihat tren tes, seperti hubungan linear dan kuadrat, ketika melibatkan variabel independen tingkat memerintahkan.
[sunting] Power analisis

Analisis daya sering diterapkan dalam konteks ANOVA untuk menilai probabilitas berhasil menolak hipotesis nol jika kita asumsikan ANOVA tertentu desain, ukuran efek dalam populasi, ukuran sampel dan tingkat alpha. Analisis daya dapat membantu dalam mempelajari desain dengan menentukan ukuran sampel apa yang akan diperlukan dalam rangka untuk memiliki kesempatan yang masuk akal menolak hipotesis nol.
[sunting] Contoh

Dalam percobaan pertama, Grup A diberikan vodka, Grup B diberikan gin, dan Grup C diberi plasebo. Semua kelompok ini kemudian diuji dengan tugas memori. Sebuah ANOVA satu arah dapat digunakan untuk menilai efek dari berbagai perawatan (yaitu, vodka, gin, dan plasebo).

Dalam percobaan kedua, Grup A diberikan vodka dan diuji pada tugas memori. Kelompok yang sama diperbolehkan untuk memberi waktu istirahat lima hari dan kemudian percobaan diulang dengan gin. Prosedur diulang menggunakan plasebo. Sebuah ANOVA satu arah dengan mengulangi langkah-langkah yang dapat digunakan untuk menilai efek vodka versus dampak dari plasebo.

Dalam percobaan ketiga menguji efek harapan, subjek secara acak ditugaskan untuk empat kelompok:

1. mengharapkan vodka vodka-menerima
2. mengharapkan vodka-menerima plasebo
3. mengharapkan plasebo-menerima vodka
4. mengharapkan plasebo-menerima plasebo (kelompok terakhir digunakan sebagai kelompok kontrol)

Setiap kelompok kemudian diuji pada tugas memori. Keuntungan dari desain ini adalah beberapa variabel yang dapat diuji pada waktu yang sama, bukannya berjalan dua eksperimen yang berbeda. Selain itu, percobaan dapat menentukan apakah satu variabel mempengaruhi variabel lainnya (dikenal sebagai efek interaksi). Sebuah faktorial ANOVA (2 × 2) dapat digunakan untuk menilai efek mengharapkan vodka atau plasebo dan penerimaan yang sebenarnya baik.
[sunting] Sejarah

Analisis varians informal digunakan oleh para peneliti di tahun 1800-an menggunakan kuadrat. Dalam fisika dan psikologi, peneliti, yaitu sebuah istilah untuk operator-efek, pengaruh orang tertentu pada pengukuran, menurut Stephen Stigler's sejarah.

Dalam bentuk modern, analisis varians adalah salah satu dari sekian banyak inovasi statistik penting Ronald A. Fisher. Fisher mengusulkan varians analisis formal dalam karya tulis 1918 Korelasi Antara Kerabat pada perkiraan Pewarisan Mendel [3]. Pertamanya penerapan analisis varians diterbitkan pada tahun 1921 [4]. Analisis varians menjadi dikenal secara luas setelah dimasukkan dalam buku 1925 Fisher Metode Statistik untuk Penelitian Pekerja

Tujuan

Alasan untuk melakukan suatu ANOVA adalah untuk melihat apakah ada perbedaan antara kelompok-kelompok pada beberapa variabel.

Sebagai contoh, Anda mungkin memiliki data mengenai kinerja murid dinilai non-tutorial latihan serta penilaian akhir mereka. Anda tertarik untuk melihat apakah kinerja tutorial terkait dengan kelas akhir. ANOVA memungkinkan Anda untuk memecah kelompok sesuai dengan kelas dan kemudian melihat apakah kinerja yang berbeda di kelas ini.

ANOVA tersedia untuk kedua parametrik (skor data) dan non-parametric (peringkat / memesan) data.



Jenis ANOVA

Satu arah antara kelompok-kelompok

Contoh yang diberikan di atas disebut satu-arah antara kelompok model.

Anda sedang melihat perbedaan antara kelompok.

Hanya ada satu pengelompokan (final grade) yang Anda gunakan untuk menentukan kelompok.

Ini adalah versi sederhana ANOVA.

ANOVA jenis ini juga dapat digunakan untuk membandingkan variabel antara kelompok yang berbeda - tutorial kinerja dari intake yang berbeda.

Satu-cara mengulangi langkah-langkah

Sebuah satu cara mengulangi langkah-langkah ANOVA digunakan ketika anda memiliki sebuah kelompok di mana Anda telah mengukur sesuatu yang beberapa kali.

Sebagai contoh, Anda mungkin memiliki pemahaman uji Kelas. Anda memberikan tes ini pada awal topik, pada akhir topik dan kemudian di akhir subjek.

Anda akan menggunakan satu cara mengulangi langkah-langkah ANOVA untuk melihat apakah kinerja siswa pada tes berubah dari waktu ke waktu.

Dua arah antara kelompok-kelompok

Seorang dua arah antara kelompok-kelompok ANOVA digunakan untuk melihat pengelompokan kompleks.

Sebagai contoh, nilai-nilai oleh analisis tutorial dapat diperpanjang untuk melihat apakah siswa luar negeri dilakukan secara berbeda untuk siswa lokal. Apa yang akan Anda peroleh dari bentuk ini ANOVA adalah:

Efek dari kelas terakhir

Efek lokal versus luar negeri

Interaksi antara kelas terakhir dan luar negeri / lokal

Masing-masing efek utama adalah satu-arah tes. Efek interaksi hanya bertanya "apakah ada perbedaan yang signifikan dalam performa ketika anda mengambil kelas terakhir dan luar negeri / lokal yang bekerja bersama-sama".


Dua arah mengulangi langkah

Versi sederhana ANOVA menggunakan langkah-langkah ulang struktur dan mencakup efek interaksi.

Dalam contoh yang diberikan untuk satu arah antara kelompok-kelompok, anda bisa menambahkan Jender dan melihat apakah ada efek gabungan gender dan waktu pengujian - yaitu melakukan laki-laki dan perempuan berbeda dalam jumlah yang mereka ingat / menyerap dari waktu ke waktu.



Non-parametrik dan Parametric

ANOVA tersedia untuk skor atau data interval ANOVA parametrik. Ini adalah jenis ANOVA Anda lakukan dari pilihan menu standar dalam paket statistik.

Non-parametric versi biasanya ditemukan di bawah judul "nonparametrik test". Hal ini digunakan ketika Anda memiliki pangkat atau data terstruktur.

Anda tidak dapat menggunakan ANOVA parametrik ketika data Anda di bawah ini interval pengukuran.

Kategoris di mana Anda memiliki data yang anda tidak memiliki metode ANOVA - Anda harus menggunakan Chi-kuadrat yang tentang interaksi bukan tentang perbedaan antar kelompok.

Bagaimana yang dilakukan

Apa ANOVA terlihat pada kelompok adalah cara berbeda internal versus apa perbedaan di antara keduanya. Untuk mengambil contoh di atas:

ANOVA menghitung rata-rata untuk masing-masing kelompok penilaian akhir (HD, D, Cr, P, N) pada latihan tutorial tokoh - Grup Mean.
Ini menghitung mean untuk semua kelompok gabungan - yang Keseluruhan Mean.
Kemudian menghitung, dalam setiap kelompok, deviasi total skor masing-masing individu dari Grup Mean - Dalam Group Variasi.
Selanjutnya, ia menghitung deviasi dari masing-masing Group Mean dari Mean Keseluruhan - Antara Group Variasi.
Akhirnya, ANOVA F menghasilkan statistik yang merupakan rasio antara Group Variasi kepada Grup Dalam Variasi.
Jika Grup Antara Variasi secara signifikan lebih besar daripada Kelompok Dalam Variasi, maka kemungkinan bahwa ada perbedaan yang signifikan secara statistik antara kelompok.

Paket statistik akan memberitahu Anda jika rasio F signifikan atau tidak.

Semua versi ANOVA mengikuti prinsip-prinsip dasar ini tetapi sumber Variasi mendapatkan lebih kompleks karena jumlah kelompok dan efek interaksi meningkat.