P Januari 2013 ~ Mas Yudi ..!!!
Assalamu'alaikum ..... Selamat Datang di Blog Anak Desa ...

Beranda

Jumat, 11 Januari 2013

POPULASI DAN SAMPEL PENELITIAN UKURAN SAMPEL RUMUS SLOVIN

Melakukan penelitian (jenis survai) itu pasti yang terbaik adalah dengan “studi populasi,” yaitu seluruh anggota populasi (seluruh subjek penelitian) diteliti (dihimpun data darinya). Nah, agar pembaca yang “langsung” membaca tulisan ini (belum baca tulisan lainnya)  sambung dengan istilah populasi, terlebih dahulu perlu penjelasan mengenainya.
Jika kita akan meneliti karyawan sebuah perusahaan yang banyaknya 1.000 orang, maka seluruh karyawan yang seribu orang itu disebut sebagai populasi penelitian kita. Tiap-tiap karyawan dari seluruh karyawan yang seribu orang itu disebut sebagai subjek penelitian, sekaligus kita sebut sebagai anggota populasi penelitian kita. Jadi, dengan demikian, dapat disimpulkan pula bahwa populasi penelitian itu adalah keseluruhan subjek penelitian.
Ada kalanya, karena berbagai keterbatasan, kita tidak mungkin meneliti (“menanyai”  atau mengumpulkan data — bisa dengan wawancara, observasi, angket, tes dsb. — dari) seluruh anggota populasi. Jadi, kita tidak bisa melakukan studi populasi. Kita mau tidak mau harus mengambil sebagian daripada seluruh anggota populasi tersebut. Sebagian subjek penelitian yang kita teliti (“tanyai”) langsung itu kita sebut sebagai sampel. Cara-cara bagaimana mengambil sampel dari populasi penelitian disebut dengan sampling.
Pertanyaan yang sering muncul berkaitan dengan pengambilan sampel (sampling) itu adalah mengenai seberapa besar (banyak) jumlah sampel (“sample size”) yang patut diambil agar hasil penelitian yang dilakukan bisa diyakini benar. Apa makna bisa diyakini benar itu?
Pertama, karena tidak semua anggota populasi diteliti, diyakini benar itu artinya seberapa tinggi hasil penelitian dari sampel itu taraf  “kebisadipercayaannya” akan mencerminkan seluruh anggota populasi. Maksudnya, data yang dihasilkan dari sampel itu benar-benar akan relatif  sama dengan data yang diperoleh jika penelitian dilakukan terhadap seluruh anggota populasi. “Nyicipi” rasa sayur setengah sendok dari sepanci itu yakinkah akan  sama persis dengan jika “makan” seluruh sayur itu? Tentu tidak. Sebab ada kalanya tidak “galoh” (merata rasanya di seluruh bagian).
Terjadinya hasil penelitian yang tidak bisa diyakini bahwa betul-betul benar itu akan diperbesar apabila sampel yang diambil “terlampau kecil” berbanding jumlah keseluruhan anggota populasi.
Kedua, walau bagaimanapun, hasil penelitian itu tidak selalu bisa diharapkan betul-betul benar (yakin 100% benar). Karena berbagai faktor, hasil penelitian itu dapat mengandung kesalahan (error, galat/”ghalat”). Salah satu kesalahan itu terjadi karena ada yang “secara kebetulan benar.” Murid yang sebenarnya “tidak tahu” bisa saja menjawab soal ujian “cekpoin” benar, karena kebetulan memilih pilihan jawaban yang merupakan jawaban yang benar.
Kesalahan (error/galat) yang terjadi karena kebetulan itu lazim dilambangkan (direpresentasikan) dengan “taraf signifikansi.” Jelasnya, taraf seberapa besar kemungkinan terjadinya kebenaran karena kebetulan saja benar. Dalam bahasa lain seberapa besar taraf  “toleransi” akan terjadinya kesalahan karena faktor kebetulan benar.
Untuk ilmu kealaman taraf signifikansi itu disepakati para ahli (dalam berbagai literatur umumnya menyatakan sama) yang “terbaik” sebesar 0,01. Maksudnya hanya ada 0,01 atau 1% saja kesalahan karena kebetulan itu terjadi. Jadi, dengan kata lain, yakin sebesar 99% bahwa hasil penelitian itu benar. Itu artinya, karena tetap berhati-hati, tidak ada yang “patut” diyakini 100% benar.
Untuk ilmu-ilmu sosial disepakati yang “terbaik” itu sebesar 0,05 .  Maksudnya hanya ada 0,05  atau 5% saja kesalahan karena kebetulan itu terjadi. Jadi, yakin 95% bahwa hasil penelitian itu benar. Ini karena tingkat kepastian (keajegan) “orang-orang” (sosial) itu relatif tidak seajeg seperti gejala kealaman.
Dalam pengambilan sampel, kedua aspek tersebut di atas menjadi salah satu perhatian utama. Jika hasil penelitian diharapkan mencapai taraf signifikansi tinggi (taraf kesalahan karena faktor kebetulan kecil), maka jumlah sampel dituntut lebih banyak dibandingkan harapan taraf signifikansi lebih rendah (banyak kesalahan yang disebabkan ada yang “karena kebetulan benar” lebih besar).
Salah satu cara menentukan besaran sampel yang memenuhi hitungan itu adalah yang dirumuskan oleh Slovin (Steph Ellen, eHow Blog, 2010; dengan rujukan Principles and Methods of Research; Ariola et al. (eds.); 2006) sebagai berikut.
n = N/(1 + Ne^2)
n = Number of samples (jumlah sampel)
N = Total population
(jumlah seluruh anggota populasi)
e = Error tolerance
(toleransi terjadinya galat; taraf signifikansi; untuk sosial dan pendidikan lazimnya 0,05) –> (^2 = pangkat dua)

Untuk menggunakan rumus tersebut, pertama-tama tetapkan terlebih dahulu taraf keyakinan atau confidence level (…%) akan kebenaran hasil penelitian (yakin berapa persen?),  atau taraf signifikansi toleransi kesalahan (0,..) terjadi.
Misalnya kita ambil taraf keyakinan 95%, yaitu yakin bahwa 95% hasil penelitian benar, atau taraf signifikansi 0,05 (hanya akan ada 5% saja kesalahan karena “kebetulan benar” terjadi).
Nah, jika yang akan kita teliti itu sebanyak 1.000 orang karyawan, seperti dicontohkan di muka, dan taraf signifikansinya 0,05, maka besarnya sampel menurut rumus Slovin ini akan menjadi:
n = N/(1 + Ne^2)  = 1000/(1 + 1000 x 0,05 x 0,05) = 286 orang.
Cobalah gunakan rumus tersebut jika taraf keyakinan (kepercayaan) hanya 90% (taraf signifikansi 0,10)! Berapa banyak sampel harus diambil? Jawabnya:
n = N/(1 + Ne^2) = 1000/(1 + 1000 x 0,10 x 0,10) = . . . orang.
Jumlah sampel yang terambil lebih kecil daripada taraf signifikansi 0,05 (taraf keyakinan 95%), atau lebih besar?
Jawabnya: 1000/(1+10) =1000:11 = 90,9 = 91.
Nah coba pula, agar tidak keliru t.s. 0,10 (taraf kepercayaan 90%) dengan t.s. 0,01 (taraf kepercayaan 99%), hitung juga dengan populasi 1000 orang. Jadinya:
n = N/(1 + Ne^2) = 1000/(1 + 1000 x 0,01 x 0,01) = . . . orang.
Ada berapa orang sampel yang harus diambil?
Jawabnya: 1000/(1+0,1) = 1000/1,1 = 909,09 = 910
STOP!
Rumus Slovin ini tentu mempersyaratkan anggota populasi (populasi) itu diketahui jumlahnya (simbulnya N). Dalam bahasa saya disebut populasi terhingga. Jika populasi tidak diketahui jumlah anggotanya (populasi tak terhingga), maka rumus ini tak bisa digunakan. Lebih-lebih jika populasinya tak jelas (tidak diketahui keberadaannya, apalagi jumlahnya, misalnya orang yang korupsi atau nikah siri). Teknik sampling yang digunakan pun tentu tak bisa teknik yang bersifat random (“probability sampling”), harus menggunakan teknik yang sesuai (quota, purposive, snowball, accidental dsb.)
(18 Oktober 2011)
Apakah rumus Slovin bisa digunakan untuk mengambil sampel dengan taraf keyakinan selain 95% (taraf signifikansi 0,05)? Jawabannya: YA! Oleh karena itu dalam rumus Slovin disebutkan taraf signifikansinya (toleransi error atau galat) berapa. Ini uraian asli mengenainya.

Slovin’s Formula Sampling Techniques

By Stephanie Ellen, eHow Contributor
Stephanie Ellen
Stephanie Ellen teaches mathematics and statistics at the university and college level. She coauthored a statistics textbook published by Houghton-Mifflin. She has been writing professionally since 2008. Ellen holds a Bachelor of Science in health science from State University New York, a master’s degree in math education from Jacksonville University and a Master of Arts in creative writing from National University.
When it is not possible to study an entire population (such as the population of the United States), a smaller sample is taken using a random sampling technique. Slovin’s formula allows a researcher to sample the population with a desired degree of accuracy. It gives the researcher an idea of how large his sample size needs to be to ensure a reasonable accuracy of results.
  1. When to Use Slovin’s Formula

    • If a sample is taken from a population, a formula must be used to take into account confidence levels and margins of error. When taking statistical samples, sometimes a lot is known about a population, sometimes a little and sometimes nothing at all. For example, we may know that a population is normally distributed (e.g., for heights, weights or IQs), we may know that there is a bimodal distribution (as often happens with class grades in mathematics classes) or we may have no idea about how a population is going to behave (such as polling college students to get their opinions about quality of student life). Slovin’s formula is used when nothing about the behavior of a population is known at all.

    How to Use Slovin’s Formula

    • Slovin’s formula is written as:
      n = N / (1 + Ne^2)
      n = Number of samples
      N = Total population
      e = Error tolerance
      To use the formula, first figure out what you want your error of tolerance to be. For example, you may be happy with a confidence level of 95 percent (giving a margin error of 0.05), or you may require a tighter accuracy of a 98 percent confidence level (a margin of error of 0.02). Plug your population size and required margin of error into the formula. The result will be the number of samples you need to take.
      For example, suppose that you have a group of 1,000 city government employees and you want to survey them to find out which tools are best suited to their jobs. You decide that you are happy with a margin of error of 0.05. Using Slovin’s formula, you would be required to survey n = N / (1 + Ne^2) people:
      1,000 / (1 + 1000 * 0.05 * 0.05) = 286

Sampel dan Ukuran Sampel

Sampel dan Ukuran Sampel



Keabsahan hasil penelitian atau survey sangat bergantung pada data sampel. Data sampel yang baik akan menghasilkan kesimpulan yang baik. Sebaliknya, data sampel yang buruk akan menghasilkan kesimpulan yang buruk pula. Bahkan, data sampel yang buruk dapat menghasilkan kesimpulan yang menyesatkan. Mengapa demikian? Ini ada kaitannya dengan sifat alamiah dari uji statistika itu sendiri.
Uji statistika itu hanyalah suatu alat. Uji ini tidak memiliki kemampuan untuk bisa menyaring baik-buruknya data yang masuk. Uji statistika bagaikan mesin atau robot tanpa indera. Buruk masuk, maka buruk keluar. Baik masuk, maka baik keluar. Dengan demikian, kesyahihan kesimpulan dari suatu uji statistik bermula dari kesyahihan data sampel.
Data sampel yang baik adalah data yang objektif dan representatif. Data sampel yang objektif dan representatif dapat diperoleh dengan melakukan dua hal yaitu 1) pengacakan (randominasi) data dan 2) pengambilan jumlah sampel yang memadai.
Pengacakan data bertujuan untuk mendapatkan data yang objektif. Data yang diperoleh dari proses pengacakan adalah data yang acak. Data acak bermakna data tanpa pilih kasih atau intervensi dari peneliti. Untuk mendapatkannya, si peneliti harus menciptakan kondisi sedemikian rupa sehingga setiap angka yang ada pada populasi harus mempunyai kesempatan yang sama untuk ditarik sebagai sampel pada saat pengambilan sampel. Artinya, data yang diperoleh bukan atas kemauan si peneliti. Dengan demikian, data acak akan menghasilkan data yang objektif.
Data yang representatif sangat ditentukan oleh ukuran sampel. Semakin besar ukuran atau jumlah sampel sampai pada tingkat tertentu, maka semakin representatif sampel tersebut. Begitu pula, semakin representatif suatu sampel akan semakin akurat suatu kesimpulan yang dihasilkan. Namun demikian, jumlah sampel juga terkait dengan waktu, tenaga, dan dana yang diperlukan. Semakin banyak sampel, maka semakin banyak pula waktu, tenaga, dan dana yang diperlukan. Bisa dibayangkan betapa sulit dan mahalnya, kalau kita harus mendata seratus juta orang. Oleh karena itu, perlu suatu angka kompromi, suatu angka yang efisien tapi dapat diterima secara statistika.
Ada beberapa cara yang bisa ditempuh untuk menentukan jumlah sampel. Namun demikian, di sini hanya diberikan satu cara saja, yaitu dengan menggunakan rumus. Ada banyak rumus yang ditawarkan oleh para ahli statistika menurut bidang dan jenis uji yang akan dipakai untuk menganalisis data sampel tersebut. Berikut adalah formula tersebut:
1. Formula menghitung jumlah sampel untuk peubah kontinu menurut Sokal dan Rohlf (1981)
n ≥ 2 (σ/δ)2tα(v) + t(2β)v)2
n = jumlah sampel
σ = standar deviasi populasi
δ = perbedaan terkecil yang ingin dideteksi
α = taraf significan (misalnya 0,05)
v = t(n-1)
t = jumlah perlakuan
β= taraf kesalahan tipe II
Perlu diketahui bahwa rumus ini dipakai dengan solusi berulang (iterative). Artinya perhitungan dilakukan berulang-ulang sampai mencapai n yang stabil.
Pertama kita coba n = 20 sebagai percobaan. Ini menghasilkan v = 4(20-1) = 76, bila jumlah perlakuannya 4 (misalnya, 4 lokasi atau 4 cara dsbnya). Standar deviasi (S) = 6 % (6y/100) dan δ= 5% dari rata (5y/100). Memakai S sebagai estimasi untuk σ, maka ratio σ/δ=6/5. α=0,01 dan β=0,20.
Maka,
n ≥ 2(σ/δ)2tα(v) + t(2β)v)2
n = 2 (6/5)2(t0,01(76) + t2(0,20)(76))2
= 2 (1,2)2 (2,642 + 0,847)2
= 2(1,44)(12,171) = 35,1
Maka, berikutnya
Kita gunakan n = 35, yang menghasilkan v=4(35-1)= 4(34) = 136
Maka,
n ≥ 2(1,44)(2,612 + 0,845)2 = 2,88 (11,95) = 34,45
Kita bulatkan menjadi 35. Nilai ini sama dengan solusi yang pertama yang mengindikasikan bahwa nilai ini sudah stabil. Dengan demikian, untuk penelitian ini diperlukan 35 sampel untuk setiap perlakuan. Total sampel untuk 4 perlakuan menjadi 4(35) = 140 sampel
2. Formula lain untuk menghitung sampel untuk peubah kontinu
Ada dua metoda untuk menentukan ukuran sampel untuk peubah yang kontinu. Metode pertama adalah menggabungkan semua respons kedalam dua katagori dan kemudian gunakan formula proporsional untuk menghitungnya. Cara kedua adalah menggunakan formula berikut ini.
n = z2σ2/e2

dimana
n = jumlah sampel
z = nilai pada kurva normal (1-α), misalnya 95%
e = keakuratan
σ = varian populasi
Sebagai contoh,
Katakan kita ingin mengevaluasi program penyuluhan yang mengajak petani untuk menggunakan beberapa varietas unggul baru. Anggaplah populasinya besar. Kita tidak mau berasumsi mengenai tingkat penerimaan dari setiap varietas tersebut, namun kita bersedia menerima Standar deviasi 30% (0,3). Selanjutnya kita pilih α = 0,05 dan keakuratan 5% . Maka, jumlah sampel yang diperlukan adalah sebagai berikut:
n = z2σ2/e2= (1,96)2(0,32/(0,05)2=138,3 petani
Kelemahan formula ini adalah perlunya nilai estimasi yang baik untuk nilai σ. Bahkan sering nilai estimasi juga tidak tersedia. Oleh karena itu, formula menghitung sampel untuk peubah proporsional lebih disukai.
3. Formula menghitung jumlah sampel untuk peubah proporsional
Untuk populasi yang besar, Cochran (1963:75) mengembangkan formula sebagai berikut:
n = z2pq/e2
dimana
n = jumlah sampel
z = nilai pada kurva normal (1-α), misalnya 95%
p = proporsi estimasi dari kejadian pada populasi
q = 1-p
e = keakuratan
Sebagai contoh, katakan kita ingin mengevaluasi program penyuluhan yang mengajak petani untuk menggunakan metode baru. Anggaplah populasinya besar tetapi kita tidak tahu persentase dari penerimaan metode baru tersebut. Oleh karena itu, kita berasumsi tingkat penerimaannya 50:50 atau p = 0,5. Selanjutnya kita pilih α = 0,05 dan keakuratan 5% . Jumlah sampel yang diperlukan adalah sebagai berikut:
n = z2pq/e2 = (1,96)2(0,5)(0,5)/(0,05)2= 385 petani

4. Koreksi untuk populasi terbatas dari peubah proporsional

Jika populasi yang dipelajari kecil, maka jumlah sampel bisa lebih kecil lagi. Ukuran sampel bisa dihitung menggunakan formula berikut.
n1 = n/(1+((n-1/N))
Dimana
n1 = jumlah sampel koreksi
N = jumlah populasi
Contoh, misalnya jumlah petani yang mungkin terpengaruhi oleh penerapan metode baru tersebut adalah 2000 orang,
Maka jumlah sampel koreksi adalah
n1 = n/(1+((n-1/N)) = 385/(1+((385-1)/2000))= 323 petani


5. Formula sederhana untuk peubah proporsional
Yamane (1967) memberikan formula yang sederhana untuk menghitung jumlah sampel. Furmulanya adalah sebagai berikut
n = N/(1+N(e2)=2000/(1+2000(0,052) = 333 petani

dimana
n = jumlah sampel
N = jumlah populasi
e = keakuratan
6. Formula sederhana untuk rancangan percobaan
Dalam buku perancangan percobaan, Mbue Kata Bangun (1980) memberikan formula jumlah sampel (t-1)(n-1) ≥ 15 atau bisa ditulis juga sebagai berikut
n ≥ 1 + (15/(t-1))

dimana
n = jumlah sampel
t = jumlah perlakuan

Contoh: kita ingin menguji 4 jenis varietas padi baru, maka ulangan yang diperlukan adalah
n ≥ 1+(15/(4-1)) = 6
sehingga unit percobaan adalah txn = 4×6=24
7. Formula sederhana lainnya berdasarkan formula
n = z2σ2/e2
bila α=5% (sering menjadi patokan), maka z2= 1,962=3,84, coeficien variation (cv)= 20% (nilai yang umum pada percobaan di lapangan), maka jumlah ulangan ditentukan berdasarkan nilai e (penyimpangan dari nilai rata-rata). Dengan demikian, formulanya dapat disederhanakan menjadi
n ≥ 0,40 (1/e)
Bila e kita tetapkan 1%, maka jumlah sampel yang diperlukan adalah
n ≥ 0,40 (1/0,01) = 40

Sabtu, 05 Januari 2013

Uji Normalitas Regresi

Uji normalitas pada model regresi digunakan untuk menguji apakah nilai residual yang dihasilkan dari regresi terdistribusi secara normal atau tidak. Model regresi yang baik adalah yang memiliki nilai residual yang terdistribusi secara normal. Beberapa metode uji normalitas yaitu dengan melihat penyebaran data pada sumber diagonal pada grafik Normal P-P Plot of regression standardized residual atau dengan uji One Sample Kolmogorov Smirnov. Berikut pembahasannya:

Contoh kasus:
Akan dilakukan analisis regresi untuk mengatahui pengaruh biaya produksi, distribusi, dan promosi terhadap tingkat penjualan. sebelumnya akan dilakukan uji normalitas pada model regresi untuk mengetahui apakah residual terdistribusi normal atau tidak. Data seperti berikut:

Tahun
Tingkat penjualan
Biaya produksi
Biaya distribusi
Biaya promosi
1996
127300000
37800000
11700000
8700000
1997
122500000
38100000
10900000
8300000
1998
146800000
42900000
11200000
9000000
1999
159200000
45200000
14800000
9600000
2000
171800000
48400000
12300000
9800000
2001
176600000
49200000
16800000
9200000
2002
193500000
48700000
19400000
12000000
2003
189300000
48300000
20500000
12700000
2004
224500000
50300000
19400000
14000000
2005
239100000
55800000
20200000
17300000
2006
257300000
56800000
18600000
18800000
2007
269200000
55900000
21800000
21500000
2008
308200000
59300000
24900000
21700000
2009
358800000
62900000
24300000
25900000
2010
362500000
60500000
22600000
27400000



1)   Metode grafik
Uji normalitas residual dengan metode grafik yaitu dengan melihat penyebaran data pada sumber diagonal pada grafik Normal P-P Plot of regression standardized residual. Sebagai dasar pengambilan keputusannya, jika titik-titik menyebar sekitar garis dan mengikuti garis diagonal maka nilai residual tersebut telah normal.
Langkah-langkah analisis pada SPSS sebagai berikut:
-       Inputkan data pada SPSS 
- Untuk analisis data, klik menu Analyze >> Regression >> Linear       
-       Pada kotak dialog Linear Regression, masukkan variabel Tingkat penjualan ke kotak Dependent, kemudian masukkan variabel Biaya produksi, Biaya distribusi, dan Biaya promosi ke kotak Independent(s).
-          Klik tombol Plots, kemudian terbuka kotak dialog Linear Regression: Plots.
-          Beri tanda centang pada ‘Normal probability plot’, kemudian klik tombol Continue. Akan kembali ke kotak dialog sebelumnya, klik tombol OK. Maka hasil grafik Normal P-P Plot seperti berikut:


Dari gambar grafik di atas dapat diketahui bahwa titik-titik menyebar sekitar garis dan mengikuti garis diagonal maka nilai residual tersebut telah normal.

2)   Metode statistik One Sample Kolmogorov Smirnov
Uji One Sample Kolomogorov Smirnov digunakan untuk mengetahui distribusi data, apakah mengikuti distribusi normal, poisson, uniform, atau exponential. Dalam hal ini untuk mengetahui apakah distribusi residual terdistribusi normal atau tidak. Residual berdistribusi normal jika nilai signifikansi lebih dari 0,05.
Langkah-langkah analisis pada SPSS sebagai berikut:
-       Inputkan data di SPSS 
-       Langkah pertama yaitu mencari nilai residual, caranya klik Analyze >> Regression >> Linear        
-       Pada kotak dialog Linear Regression, masukkan variabel Tingkat penjualan ke kotak Dependent, kemudian masukkan variabel Biaya produksi, Biaya distribusi, dan Biaya promosi ke kotak Independent(s).
- Klik tombol Save, selanjutnya akan terbuka kotak dialog ‘Linear Regression: Save’
-          Pada Residuals, beri tanda centang pada ‘Unstandardized’. Kemudian klik tombol Continue. Akan kembali ke kotak dialog sebelumnya, klik tombol OK. Hiraukan hasil output SPSS, Anda buka input data di halaman Data View, disini akan bertambah satu variabel yaitu residual (RES_1).
 - Langkah selanjutnya melakukan uji normalitas residual, caranya klik Analyze >> Non Parametric tests >> Legacy Dialogs >> 1-Sample K-S.
-       Selanjutnya akan terbuka kotak dialog ‘One Sample Kolmogorov Smirnov Test’ seperti berikut:
-       Masukkan variabel Unstandardized Residual(RES 1) ke kotak Test Variable List. Pada Test Distribution, pastikan terpilih Normal. Jika sudah klik tombol OK. Akan kembali ke kotak dialog sebelumnya. Klik OK, maka hasil output seperti berikut:


    Dari output di atas dapat diketahui bahwa nilai signifikansi (Asymp.Sig 2-tailed) sebesar 0,631. Karena signifikansi lebih dari 0,05 (0,631 > 0,05), maka nilai residual tersebut telah normal.