Validitas

Selain reliabilitas, hal penting yang juga perlu diperhatikan dari sebuah alat ukur adalah validitasnya. Secara umum validitas mengukur sejauh mana sebuah alat ukur benar-benar mengukur apa yang hendak diukur. Sebuah tes baru bisa dikatakan benar-benar mengukur apa yang diukur ketika hasil yang diberikan oleh pengukuran itu sudah tepat. Oleh karena itu, sebuah tes baru bisa dikatakan valid jika tes tersebut sudah reliabel. Sebelum sebuah tes bisa dibuktikan reliabilitasnya, maka tes tersebut tidak bisa dikatakan bisa mengukur apa yang hendak diukur.

Reliabilitas memberikan bukti bahwa hasil pengukuran sudah tepat dapat dipercaya, sedangkan validitas membuktikan bahwa sebuah tes memang benar-benar sesuai dengan tujuan pengetesan. Oleh karena itu, kedua hal ini mutlak harus dimiliki oleh sebuah alat tes yang baik. Tidak ada yang lebih penting di antara keduanya, karena dua hal ini adalah persyaratan dari sebuah alat tes yang baik.

Secara umum validitas dapat dibagi menjadi tiga:

  1. Content Validity

Validitas jenis ini menilai sejauh mana isi dari sebuah alat ukur sudah benar-benar mencakup seluruh spesifikasi konstruk yang hendak diukur. jika sebuah tes dibuat untuk mengukur hasil belajar selama satu semester, maka isi dari tes tersebut harus mencakup semua materi pelajaran untuk semester tersebut sesuai dengan kisi-kisi dan bahan ajar yang diajarkan. Untuk menguji validitas isi sebuah alat tes, dapat dilakukan dengan cara kualitatif, yaitu meminta penilaian dari seorang yang dianggap ahli dalam bidang yang hendak diukur, bisa juga dengan melakukan korelasi dari hasil rating dari dua ahli yang berbeda. Biasanya pengujian validitas konten ini adalah pengujian yang dilakukan pertama kali sebelum dilakukan trial untuk sebuah alat ukur.

Meskipun sebuah alat ukur secara konten sudah dianggap valid, namun tetap perlu dilakukan pengujian validitas yang lain karena pengujian validitas konten hanya mengukur apakah sebuah tes benar-benar mencakup keseluruhan dari blue print atau spesifikasi sebuah konstruk. Kita masih belum bisa membuktikan apakah tes ini memang benar-benar secara konstruk sudah baik dan memang bisa digunakan untuk melakukan prediksi mengenai apa yang ingin kita prediksi sesuai dengan tujuan pengetesan.

  1. Criterion Validity

Validitas jenis ini membuktikan seberapa efektif sebuah alat ukur dalam memprediksi sebuah kriteria independen. Pembuktian criterion validity ini sangat berkaitan erat dengan tujuan penggunaan sebuah alat tes. Sebuah alat tes yang digunakan untuk keperluan sebuah seleksi, harus benar-benar dibuktikan valid untuk membedakan antara orang yang akan sukses dan tidak sukses pada hal yang sedang diseleksikan. Misalnya sebuah tes masuk perguruan tinggi, dikatakan memiliki criterion validity yang baik jika memang bisa membedakan antara orang yang akan berhasil atau tidak di perguruan tinggi tersebut yang diperlihatkan dengan nilai IPK. Untuk melakukan pengujian validitas ini, nilai tes masuk yang akan diujikan dikorelasikan dengan nilai IPK yang didapat oleh individu.

Berdasarkan ketersediaan kriteria, maka pengujian validitas ini dapat dibagi menjadi dua, yaitu concurrent dan predictive. Concurrent validity adalah ketika kriteria didapat pada saat yang bersamaan dengan skor test, sedangkan predictive validity adalah ketika kriteria diperoleh setelah rentang waktu tertentu dari didapatkannya hasil skor tes.

Penentuan kriteria untuk pengujian tes ini biasanya dipilih sesuai dengan tujuan pembuatan alat tes tersebut. Untuk tes seleksi masuk sekolah kriterianya bisa digunakan nilai rapor, untuk seleksi pegawai kriterianya kinerja pekerjaan dll. Selain itu, ada salah satu cara lain yang dapat dilakukan untuk mengukur criterion validity yaitu dengan menggunakan contrasted grup. Metode ini biasa diterapkan dalam pengujian terhadap tes-tes kepribadian. Yaitu dengan membedakan hasil tes antara kelompok yang memang benar-benar dianggap memiliki karakteristik tinggi pada hal yang hendak diukur dibandingkan dengan kelompok yang tidak. Sebuah tes dianggap baik jika bisa dibuktikan bahwa hasil kelompok yang memang dianggap tinggi itu hasilnya memang lebih tinggi dibandingkan dengan kelompok yang lain.

  1. Construct Validity

Pengujian validitas yang ketiga adalah pengujian validitas konstruk. Pengujian validitas ini berkaitan dengan pembuktian sejauh mana sebuah alat ukur memang benar-benar mengukur konstruk yang hendak diukur. pada dasarnya pengujian validitas inilah yang paling dekat dengan definisi validitas secara umum. Ada tiga metode penghitungan validitas konstruk yang biasa digunakan:

  • Korelasi dengan tes lain

Ini adalah bentuk validitas yang umum dilakukan yaitu dengan cara mengkorelasikan sebuah tes dengan tes lain yang dianggap mengukur hal yang sama. Salah satu kelemahan utama dari pengujian ini adalah kita tidak bisa menentukan apakah tes lain tersebut memang benar-benar mengukur apa yang hendak kita ukur. Kita tidak bisa mengecek apakah memang tes lain tersebut benar-benar sudah valid sehingga bisa digunakan sebagai dasar pengujian validitas tes kita.

  • Konvergen dan diskriminan

Prinsip dasar dari pengujian konstruk dengan metode ini adalah bahwa tes yang memiliki validitas konstruk yang baik akan berkorelasi dengan tes yang mengukur hal yang sama dan tidak akan berkorelasi dengan tes yang mengukur hal yang tidak berhubungan secara teoritis. Salah satu metode yang sistematis untuk mengukur hal ini adalah dengan melakukan multitrait-multimethod. Dengan melakukan hal ini kita bisa benar-benar yakin bahwa tes kita hanya mengukur satu konstruk dan bukan mengukur konstruk yang lain.

  • Analisis Faktor

Ini adalah metode pengukuran validitas konstruk yang terbaik karena bisa membuktikan secara statistik bagaimana konstruk-konstruk yang ada dalam sebuah alat ukur dibuktikan keterkaitannya. Pada awalnya metode analisis faktor digunakan untuk menemukan triat-trait pada tes kepribadian. Seiring dengan perkembangannya, ada jenis metode analisis faktor yang disebut confirmatory factor Analysis yang bisa dilakukan untuk melakukan pembuktian/atau konfirmasi apakah secara konstruk atau secara struktural item-item dan dimensi-dimensi yang ada dalam alat ukur kita sesuai dengan konstruk yang kita susun berdasarkan data dari sampel yang kita ambil. Untuk melakukan perhitungan confirmatory factor analysis, diperlukan program komputer khusus yang memang didesain untuk melakukan hal ini seperti LISRELL, AMOS, atau M plus.

Ketiga jenis validitas ini harus ada pada setiap alat ukur yang baik. Sama halnya dengan reliabilitas, semua jenis validitas ini juga harus dimiliki oleh setiap tes tetapi mungkin titik beratnya berbeda sesuai dengan tujuan pengkonstruksian alat tes tersebut.

Validitas biasanya mengacu pada sebuah tes secara keseluruhan, meskipun begitu, kita juga bisa menguji apakah sebuah item dalam tes memang benar-benar valid mengukur apa yang hendak diukur. dalam hal ini sebenarnya pengujiannya lebih berkaitan dengan analisis item dan bukan pada pengujian validitas tes secara umum.

Untuk menguji validitas sebuah item tes, prinsip dan metode yang digunakan sebenarnya sama dengan pengujian validitas tes. Biasanya item akan dikorelasikan dengan kriteria yang dianggap mewakili kriteria tertentu. Cara yang umum digunakan adalah dengan mengkorelasikan item dengan total skor. Total skor dianggap sebagai kriteria, semakin tinggi total skor maka dianggap mewakili karakteristik yang hendak diukur. Permasalahan mendasar dari pengujian validitas item seperti ini adalah total skor diperoleh dari penjumlahan item-item yang juga belum teruji validitasnya. Untuk mengatasi hal ini, salah satu cara yang bisa dilakukan adalah dengan memilih kriteria di luar yang memang sudah terbukti valid. Cara pengujiannya mirip dengan pengujian validitas korelasi dengan tes lain, tetapi dalam pengujian validitas item ini yang dilakukan adalah korelasi antara skor di tiap item dengan skor tes lain tersebut. Jika ditemukan korelasi yang tinggi maka dianggap item tersebut juga mengukur konstruk yang sama dengan konstruk tes yang dijadikan kriteria.

 

 

Referensi:

Anastasi & Urbina (1997). Psychological Testing 7th edition.  New Jersey: Prentice Hall

Urbina (2004). Essential of Psychological Testing. New Jersey: John Wiley & Sons, Inc.

About these ads
This entry was posted in Konsep Psikometri and tagged , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s