Reliabilitas

Secara umum pengukuran reliabitas dilakukan untuk menghitung ketepatan atau kekonsistenan hasil yang ditunjukkan dari sebuah pengukuran. Semakin tidak konsisten dan tidak tepat sebuah hasil pengukuran, maka tes tersebut dapat dikatakan semakin tidak reliabel dan memiliki measurement error yang semakin tinggi. Secara umum, untuk menguji seberapa konsisten dan tepat hasil pengukuran sebuah alat tes ditunjukkan oleh koefisien reliabilitas dari alat tes tersebut.  Semakin tinggi koefisien reliabilitas sebuah alat ukur, maka dapat dikatakan bahwa measurement error  yang dimiliki oleh alat ukur tersebut semakin rendah dan hasil skor dari alat ukur tersebut semakin dapat dipercaya.

Menurut Urbina (2004), secara umum sumber error dapat dibagi menjadi:

  • Time sampling error

Perbedaan hasil pengukuran yang disebabkan karena sebuah hasil pengukuran diperoleh pada waktu tertentu dan bukan pada waktu yang lain. Dalam melihat sumber eror berdasarkan time sampling ini, ada satu hal yang harus diperhatikan, yaitu apakah konstruk yang hendak diukur itu memang bersifat stabil dan menetap pada diri seseorang, atau memang memiliki sifat berubah-ubah seiring dengan perbedaan waktu.

  • Content sampling eror

Kesalahan yang bersumber dari content sampling error adalah kesalahan yang berkaitan dengan bagaimana pengaturan konten atau isi dari item secara keseluruhan di dalam sebuah tes. Jika sebuah tes dimaksudkan untuk mengukur beberapa indikator, maka tes tersebut harus meliputi semua konten yang hendak diukur oleh tes tersebut.

  • Interitem inconsistency

Perbedaan yang terjadi dikarenakan perbedaan item-item yang ada di dalam sebuah tes. Perbedaan hasil disebabkan karena item-item yang ada di dalam sebuah tes berbeda satu sama lain sehingga hasil yang diperoleh dari item tersebut juga berbeda.

Secara umum, Pengukuran reliabilitas  dapat dilakukan dengan tiga cara:

1. Test-retest

Bentuk pengujian reliabilitas dengan cara memberikan tes pada satu waktu lalu mengulangi dengan memberikan tes yang sama pada orang yang sama dengan rentang waktu tertentu. Hasil tes pertama dan kedua kemudian dikorelasikan. Pengujian reliabilitas dengan cara ini bisa menunjukkan sejauh mana skor yang diperoleh oleh seseorang sama dari waktu ke waktu. Metode pengujian test retest ini dapat digunakan untuk membuktikan reliabilitas alat tes berkaitan dengan sumber error time sampling. Pengujian reliabilitas dengan menggunakan metode test-restest ini sangat tepat dilakukan untuk tes-tes yang mengukur sebuah variabel yang memang secara teoritis bersifat menetap dan stabil pada diri individu, misalnya tes intelegensi atau trait kepribadian.

Hal yang menjadi permasalahan dalam pengujian test-retest ini adalah menentukan jarak yang sesuai antara tes pertama dan tes kedua. Jika waktu pengujian terlalu lama, bisa saja memang perbedaan hasil disebabkan oleh perubahan yang terjadi pada individu, sebaliknya jika rentang waktu terlalu singkat, ada kemungkinan bahwa individu masih ingat jawaban yang ia berikan pada tes yang pertama sehingga korelasi yang tinggi disebabkan oleh efek ingatan ini.

2. Single trial

Pada metode pengujian reliabilitas single trial ini, tes hanya diadministrasikan satu kali. Ada dua macam pengujian reliabilitas single trial yang bisa dilakukan. Yang pertama  dengan metode split half (membagi setengah pertama dengan setengah kedua)atau bisa dengan membagi odd-even (korelasi antara item genap atau ganjil). Dengan metode split half ini, kita bisa melihat sejauh mana reliabilitas sebuah alat tes berkaitan dengan sumber error content samplingnya. Dengan melakukan korelasi antara separuh tes dengan separuh yang lain, maka dapat dibuktikan apakah content di antara kedua bagian ini setara atau tidak. Hasil yang tinggi membuktikan bahwa konten yang dimiliki oleh kedua bagian ini bisa dikatakan setara. Permasalahan yang mungkin timbul pada metode split half ini adalah menentukan bagaimana membagi tes menjadi dua dengan cara yang sesuai. Bisa saja korelasi yang rendah ternyata disebabkan oleh pembagian yang tidak tepat antara separuh tes dengan separuh tes yang lain.

Yang kedua adalah pengukuran internal consistency antar item (KR atau alpha cronbach). Metode pengujian single trial ini merupakan cara untuk mengukur sejauh mana konsistensi internal dari sebuah alat ukur. Dengan melakukan pengujian reliabilitas seperti ini, kita bisa mengukur sumber error yang disebabkan oleh ketidakkonsistenan antar item. Permasalahan yang mungkin timbul dari pengujian internal consistency ini adalah jika sebuah konstruk secara teoritis memang tidak bersifat homogen. Jika hal ini yang terjadi, maka pengujian internal consistency akan menghasilkan koefisien reliabilitas yang rendah, tetapi hal ini memang seharusnya terjadi karena secara teoritis konstruk tersebut bersifat heterogen.

3. Alternate form

Bentuk pengujian reliabilitas dengan cara mengadministrasikan tes pada seseorang pada kesempatan pertama, lalu memberikan form alternatif tes yang sama kepada orang tersebut. Jika kita kaitkan dengan sumber error dalam pengukuran, maka metode ini dimaksudkan untuk menguji content sampling error yang ada pada sebuah tes. Dengan korelasi yang tinggi dapat dikatakan bahwa secara konten kedua tes sama dan menghasilkan hasil yang sama. Keterbatasan metode ini adalah adanya kesulitan untuk membuat dua buah tes paralel yang benar-benar setara.

Jika ada rentang waktu antara pengadministrasian tes pertama dan kedua, maka metode ini disebut test-retest with alternate form. Metode ini sebenarnya menggabungkan antara pengujian reliabilitas untuk mengatasi error content sampling, dan juga dengan pengujian reliabilitas tes-retest. Dengan hasil korelasi yang tinggi bisa menunjukkan bahwa selain hasil tes stabil pada pengujian dengan waktu yang berbeda, dan secara content juga sudah memuaskan. Meskipun memberikan informasi yang lebih banyak, metode test retest dengan alternate form ini juga memiliki kelemahan dari metode pengujian reliabilitas test-retest dan metode pengujian alternate form.

Jika kita melihat sumber kesalahan yang mempengaruhi ketepatan dan keterandalan hasil pengukuran ini, maka idealnya semua alat tes harus diuji reliabilitasnya menggunakan ketiga bentuk pengujian reliabilitas ini. Akan tetapi, ini juga tergantung pada sifat dari alat tes itu sendiri. Sebuah alat tes yang memang mengukur konstruk yang secara teoritis berubah-ubah seperti mood dan sikap, mungkin tidak tepat jika diuji reliabilitas tes retesnya. Contoh lain, untuk sebuah tes yang didesain untuk mengukur penguasaan materi sebuah pelatihan sebelum dan sesudah pelatihan dilakukan, mungkin harus memiliki alternate form sehingga bisa diadministrasikan di kedua kesempatan ini, untuk tes seperti ini, mungkin reliabilitas alternate form lah yang harus ditekankan pada saat melakukan konstruksi alat tes untuk keperluan semacam ini.

Sudah dijelaskan di awal bahwa reliabilitas berhubungan dengan ketepatan hasil pengukuran. Selain sumber error yang sudah dijelaskan sebelumnya, ada dua hal lain yang juga akan sangat mempengaruhi reliabilitas sebuah alat ukur. Menurut Anastasi & Urbina (1997) ada hal yang mempengaruhi koefisien reliabilitas dari sebuah alat ukur:

  • Variability

Yang dimaksud dengan variability ini adalah sejauh mana penyebaran karakteristik dari kelompok yang dijadikan sampel dalam penghitungan reliabilitas alat ukur. Jika pengujian reliabilitas dilakukan pada kelompok yang homogen atau mirip, maka varians yang ada dalam kelompok akan sangat kecil, ketika dilakukan penghitungan reliabilitas pada alat ukur ini –yang dilakukan dengan melakukan perhitungan korelasi- maka koefisien yang akan didapat juga akan sangat rendah. Oleh karena itu, dalam pengujian reliabilitas sebuah alat ukur, akan sangat penting untuk memastikan bahwa sampel yang digunakan beragam dan mewakili seluruh rentang kelompok yang memang akan dituju untuk penggunaan alat ukur tersebut.

  • Ability Level

Selain perbedaan individu pada sebuah kelompok sampel, reliabilitas juga dipengaruhi oleh perbedaan rata-rata kemampuan pada kelompok yang berbeda. Sebuah tes yang reliabel membedakan kemampuan aritmetika anak-anak SD, mungkin akan tidak reliabel untuk membedakan kemampuan aritmetika anak-anak SMP. Pada kelompok anak SMP mungkin saja item-item yang ada tidak bisa membedakan kemampuan aritmetika mereka karena soal-soal yang ada terlalu mudah. Apa yang bisa membedakan kemampuan pada anak SD mungkin hanya bisa membedakan kecepatan pengerjaan pada anak SMP. Oleh karena itu, pengujian reliabilitas juga harus melaporkan pada sampel apa pengujian itu dilakukan. Jika sebuah tes hendak dipakai pada kelompok yang berbeda, maka perlu dilakukan pengujian reliabilitas kembali untuk meyakinkan bahwa memang tes tersebut tepat digunakan untuk kelompok yang berbeda ini.

Aplikasi dari pengujian reliabilitas terhadap penggunaan alat ukur adalah untuk mendapatkan Standard Error of Measurement dari sebuah alat ukur. Semakin tinggi reliabilitas sebuah alat ukur, maka SEM dari sebuah alat ukur akan semakin kecil. Pada dasarnya SEM dapat diaplikasikan pada semua koefisien reliabilitas sebuah alat ukur. Menurut Urbina (2004), nilai SEM akan lebih baik jika didapatkan dari penggabungan berbagai macam koefisien reliabilitas tersebut. Dengan menghitung semua koefisien reliabilitas yang menguji sumber kesalahan yang berbeda, maka akan diperoleh informasi SEM yang juga semakin baik. Oleh karena itu, idealnya sebuah alat ukur memang memiliki koefisien reliabilitas internal, stability (test-retest) dan content sampling.

 

 

This entry was posted in Konsep Psikometri and tagged , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s