14 Desember 2008

Terjemah (lanjutan): Classroom Assessment (Popham, WJ. 1995)

BAB 2
RELIABILITAS PENILAIAN
Reliabilitas adalah komoditas yang sangat berharga. Dalam bidang penilaian pendidikan, reliabilitas juga merupakan sesuatu yang sangat diharapkan. Kita tentu ingin penilaian pendidikan yang reliabel. Namun dalam kaitannya dengan pengukuran, reliabilitas memiliki makna yang sangat terbatas. Ketika anda menemui istilah reliabilitas dalam isi penilaian, maka anda harus memahami kesetaraan antara reliabilitas dan konsistensi, sebab reliabilitas merujuk pada konsistensi pada pengukuran yang dilakukan oleh sebuah tes. Jadi reliabilitas = konsistensi.
Standards for Educational and Psychology Testing, sebuah publikasi bersama the American Educational Research Association, the American Psychological Association, dan the National Council on Measurement in Education, secara umum dianggap sebagai dokumen paling penting yang membahas prosedur penilaian pendidikan publikasi tersebut merefleksikan opini dari berbagai ahli terkemuka tentang tes pendidikan dan psikologi. Seperti standar tersebut kemukakan, reliabilitas merujuk pada tingkat dimana skor tes bebas dari eror pengukuran. Dengan kata lain, semakin sedikit eror pengukuran, maka semakin konsisten skor pengukuran yang akan dengahn akurat merefleksikan status aktual peserta tes.
Namun dalam penilaian pendidikan, konsistensi muncul dalam tiga varietas, bukan hanya satu. Dengan kata lain, terdapat tiga cara berbeda untuk memahami konsistensi pengukuran. Namun menganggap ketiga jenis varietas ini dapat dipertukarkan jelas salah.
Tabel 2-1. Tiga Jenis Bukti Reliabilitas
Jenis bukti Deskripsi ringkas
Stabilitas Konsistensi hasil antar tes yang dilakukan di saat berbeda
Bentuk pengganti Konsistensi hasil antar dua atau lebih bentuk tes
Konsitensi internal Konsistensi dalam cara item instrumen penilaian berfungsi
STABILITAS
Jenis reliabilitas yang pertama adalah stabilitas. Konsep reliabilitas ini sering muncul di benak orang ketika seseorang menegaskan bahwa reliabilitas setara dengan konsistensi. Stabilitas, sebagai sebuah bentuk reliabilitas, merujuk pada konsistensi hasil tes setiap saat. Kita ingin penilaian pendidikan atas siswa kita memperoleh hasil yang sama jika tes dijalankan pada waktu yang berbeda. Misalnya, anda memberikan tes pada hari Selasa, namun di sore hari, hasil tes tersebut hilang. Maka keesokan harinya anda meminta ssiwa untuk melakukan tes yang sama. Dikarenakan tidak ada peristiwa signifikan yang mempengaruhi, maka anda mengharapkan agar tes yang siswa anda lakukan pada hari Rabu akan memperoleh hasil yang sama dengan tes yang anda berikan pada hari Selasa – tes yang hasilnya hilang. Dan itulah yang disebut reliabilitas tes menurut konsep stabilitas.
Untuk menentukan bagaimana stabilnya hasil tes siswa, maka biasanya anda akan melakukan sebuah tes, kemudian menunggu hingga satu atau dua pekan, dan lalu memberikan kembali tes tersebut tanpa sebelumnya melakukan pengajaran tentang materi yang sama. Untuk itu, reliabilitas stabilita sering disebut dengan reliabilitas tes-retes. Terdapat dua pendekatan untuk menentukan konsistensi tes setiap saat, yakni dengan menggunakan koefesiesni korelasi dan konsistensi keputusan. Koefesiesni korelasi dihitung antara skor tes siswa ada dua kali tes yang dilakukan, yakni tes awal dan tes ulangan. Koefesiesni korelasi merefleksikan tingkat kesamaan antara skor siswa pada kedua tes tersebut. Pendekatan lainnya adalah konsistensi keputusan; yang dapat digunakan ketika guru memutuskan siswa mana yang dikecualikan pada studi selanjutnya mengenai topik X. Misalnya, jika guru menetapkan tingkat kebenaran 80% sebagai tingkat kemahiran yang disyaratkan untuk mempelajari topik X lanjutan, maka berdasarkan tes-retes, guru dapat menentukan persentase siswa yang diklasifikasikan memiliki kesamaan pada kedua tes yang dilakukan. Sehingga, jika seorang siswa memperoleh skor benar 84% pada tes pertama dan 99% pada tes kedua, maka siswa tersebut tidak akan dilibatkan pada pembahasan topik X sebab dia mampu lulus pada kedua tes tersebut. Dan guru menganggap tes siswa tersebut konsisten. Apapun pendekatan yang akan anda gunaka, yang pasti anda harus melakukan tes sebanyak dua kali sehingga anda dapat menentukan stabilitasnya.
RELIABILITAS BENTUK PENGGANTI
Yang kedua dari tiga bukti reliabilitas penilaian pendidikan kita fokus pada konsistensi antara dua bentuk tes – bentuk yang dianggap setara. Reliabilitas bentuk-pengganti berkaitan dengan pertanyaan apakah dua atau lebih tes yang katanya equivalen benar-benar ekuivalen atau tidak. Di kelas, guru jarang memiliki alasan untuk menggunakan dua instrumen penilaian. Untuk menentukan tingkat reliabilitas konsistensi bentuk-pengganti, pendekatan prosedural digunakan yang dalam beberapa hal memiliki kesamaan dengan yang digunakan untuk menentukan reliabilitas stabilitas. Pertama, dua bentuk tes digunakan pada individu yang sama. Misalnya, anda ingin menentukan kompitabilitas dua bentuk tes bahasa. Misalnya terdapat 100 siswa yang akan mengikuti tes tersebut. Dikarenakan waktu yang dibutuhkan untuk mengerjakan tes tersebut hanya 20-25 menit, maka anda dapat menjalankan kedua tes tersebut (bentuk A dan B) pada tiap siswa selama satu periode saja.
Setelah semua siswa menyelesaikan kedua bentuk tes tersebut, maka hitunglah skor pada kedua tes itu guna menentukan koefesiensi korelasi yang merefleksikan hubungan antara kinerja siswa pada tes A dengan pada tes B. Sama seperti pada reliabilitas stabilitas, semakin dekat koefesiensi korelasinya dengan 1,0, maka semakin terdapat kesepakatan antara skor pada kedua tes tersebut. Selain itu, anda juga dapat menggunakan pendekatan konsistensi keputusan untuk menentukan reliabilitas bentuk-pengganti yang dijabarkan sebelumnya. Reliabilitas bentuk-pengganti tidak ditetapkan dengan proklamasi/pernyataan. Akan tetapi, bukti harus dikumpulkan berkenaan dengan konsistensi pada kedua bentuk tes tersebut.
RELIABILITAS KONSISTENSI INTERNAL
Jenis akhir bukti reliabilitas disebut dengan reliabilitas konsistensi internal. Reliabilitas ini sangat berbeda dengan reliabilitas stabilitas dan bentuk-pengganti. Konsistensi internal tidak fokus pada konsistensi skor peserta pada sebuah tes. Melainkan pada tingkat dimana item pada sebuah instrumen penilaian pendidikan memiliki konsistensi satu sama lain. Ketika stabilitas dan bentuk-pengganti membutuhkan dua pelaksanaan tes, maka konsistensi internal dapat dihitung hanya dengan satu kali pelaksanaan tes. Reliabilitas konsistensi internal merefleksikan tingkat dimana item pada sebuah tes berfungsi secara konsisten – yakni tingkat dimana item tes berfungsi secara homogen. Terdapat beberapa beberapa rumusan berbeda dalam menghitung konsistensi internal. Tiap rumusan menghasilkan perkiraan numerik reflektif mengenai tingkatan dimana item prosedur tes berfungsi secara homogen.
Berikut ini saya akan mengilustrasikan prosedur penghitungan konsistensi internal yang paling sederhana guna menggambarkan betapa mudahnya menentukan konsistensi internal sebuah tes. Berikut ini diajikan rumus Kuder-Richardson 21, atau biasanya disebut dengan K-21. Catat bahwa rumus itu hanya mengharuskan anda untuk menggunakan angka jumlah item tes dan mean (nilai tengah) yang berupa rata-rata skor tes serta standar deviasi skor tes tersebut. Berikut ini adalah rumusnya:

K-R21 koefesiensi reliabilitas =
Dimana:
K = jumlah item pada tes
M = mean skor tes tersebut
s = standar deviasi skor tes tersebut
Untuk menunjukan bagaimana rumus tersebut bekerja, maka mari kita coba gunakan. Misalnya kita memiliki 40 item pada sebuah tes dimana siswa diberi skor dengan cukup adil. Mean skor tersebut adalah 30,0 dan standar devaisinya adalah 6,0. Maka penghitungannya akan sebagai berikut:

K-R21 =
= 1,03
= 1,03
= 0,82

Misalnya, setelah melakukan penghitungan seperti di atas, kita memperoleh nilai koefesiensi K-R21 sebesar 0,82 untuk tes tersebut. Apa signifikasi K-R21 sebesar 0,82 tersebut? Sama seperti penghitungan pada reliabilitas sebelumnya, yakni semakin dekat dengan 1,0, maka semakin homogen item tes tersebut. Apa arti dari 0,82 tersebut adalah bahwa terdapat jumlah homogenitas substansial diantara item tes anda. Dengan kata lain, item tes tersebut mengukur hal yang sama.
TIGA KOIN URAIAN RELIABILITAS
Sekarang anda telah mengetahui bahwa terdapat tiga cara berbeda dalam mengkonseptualisasikan cara konsistensi hasil tes dijabarkan. Konsistensi pengukuran adalah persyaratan dalam menjadikan hasil tes masuk akal. Jika tes menunjukan hasil yang tak konsisten, bagaimana guru dapat mengambil keputusan masuk akal berdasarkan hasil tes yang tak terduga-duga? Yah, kita telah mengetahui bahwa reliabilitas muncul dalam tiga rasa. Tergantung kepada anda untuk memastikan bahwa bukti reliabilitas yang dimasukan pada sebuah tes sesuai dengan penggunaan hasil tes tersebut – pengambilan keputusan yang terkait dengan hasil tes. Meski tentunya terdapat hubungan antara tiga jenis reliabilitas, namun hal-hal berikut ini adalah benar adanya
Reliabilitas stabilitas ≠ Reliabilitas bentukpengganti ≠ Reliabilitas konsistensi internal
Untuk mengilustrasikannya, misalnya anda seorang guru pada sebuah sekolah dimana sebuah tes ujian Diploma disusun oleh asisten pengawas untuk pengajaran dengan bekerjasama dengan komite guru di distrik dimana sekolah tersebut berada. Asisten pengawas tersebut mengklaim bahwa tiga bentuk tes yang berbeda yang akan digunakan tersebut pada aintinya dapat dipertukarkan karena menghasilkan koefesien 0,88 atau lebih pada K-R21. Ketiga bentuk tes yang berbeda tersebut reliabel dan ekuivalen; demikian dijelaskan oleh asisten tersebut. Jika asisten tersebut benar ingin mengetahui komparabilitas antara bentuk tes tersebut, maka jenis bukti reliabilitas yang dibutuhkan adalah reliabilitas bentuk-pengganti, bukan konsistensi internal.
Standard Error Pengukuran
Sebelum lebih jauh tentang reliabilitas dan semua aspeknya, terdapat satu hal lain yang harus anda ketahui berkenaan dengan konsistensi pengukuran. Sejauh ini, jenis bukti reliabilitas yang kita bahas berkaitan dengan reliabilitas kelompok skor peserta tes. Berikut ini, saya ingin sedikit mengalihkan perhatian anda pada konsistensi yang berkaitan dengan kinerja individu. Indeks yang digunakan dalam penilaian pendidikan untuk menjabarkan konsisteni kinerja seseorang disebut dengan standar error pengukuran.
Anda harus menganggap standar error pengukuran sebagai refleksi konsistensi skor individu jika prosedur tes yang diberikan diberikan kepada invidi tersebut lagi, lagi dan lagi. Namun, sebagai tataran praktis, tidak mungkin untuk memberikan tes yang sama berulang-ulang pada siswa yang sama sebab siswa akan menolak atau bahkan bosan. Kita harus memperkirakan seberapa banyak variabilitas yang ada jika kita mampu memberikan prosedur penilaian berulang-ulang pada individu yang sama.
Kita dapat memperkirakan variabilitas kinerja tes individu menggunakan data yang diambil dari sebuah kelompok. Rumus standar error pengukuran adalah sebagai berikut:


Standar error pengukuran =
Dimana:
Sx = standar deviasi skor tes
rxx= reliabilitas tes
Misalnya anda membuat sebuah tes dengan 50 item dengan standar deviasi 7,5 dan K-E21 = 0,91; untuk menghitung ukuran standar error pengukuran pada tes anda tersebut, maka anda hanya tinggal melakukan penghitungan sebagai berikut:
Standar error pengukuran =
= 7,5(0,3)
= 2,25
Standar error pengukuran sebesar 2,25 mengindikasikan bahwa ketika salahs atu siswa anda mengikuti tes tersebut dan memperoleh skor 39, jika siswa tersebut mengikuti kembali tes itu berulang-ulang, maka skor siswa tersebut akan berada antara kurang atau lebih satu standar error pengukuran sekitar 67% dan antara kurang lebih dua standar error pengukuran sekitar 95%. Untuk mengilustrasikannya, dua per tiga skor siswa tersebut akan jatuh antara kurang lebih satu standar error pengukuran, yakni antara 36,75 dan 41,25.
Apa Yang Sesungguhnya Harus Guru Ketahui Tentang Reliabilitas?
Sebagai guru atau calon guru, apa yang anda benar-benar harus ketahui tentang reliabilitas? Misalnya, apakah anda harus mengumpulkan data dari prosedur penilaian kelas anda sendiri sehingga anda dapat menghitung koefesiensi reliabilitasnya? Jika ya, apakah anda harus mengumpulkan semua tiga varietas bukti reliabilitas seperti dikemukakan di atas? Jawaban saya mungkin mengagetkan anda. Menurut saya anda harus mengetahui apa relaibilitas itum namun saya pikir anda tidak harus menggunakan reliabilitas pada tes anda kecuali terdapat bagian pada tes anda yang tak lazim.
Anda harus tahu tentang reliabilitas dikarenakan anda mungkin diharuskan mereview beberapa jenis tes, dan petunjuk tekhnik tes yang mengarahkan anda pada bukti reliabilitasnya. Reliabiltas adalah konsep utama dalam pengukuran. Jika prosedur penilaian gagal memperoleh hasil yang konsisten, maka hampir tidak mungkin bagi anda untuk dapat membuat kesimpulan akurat tentang apa signifikasi skor seorang peserta tes. Pengukuran yang inkonsisten sama dengan pengukuran yang tak akurat. Hal lain yang anda juga harus ketahui tentang reliabilitas adalah bahwa hal tersebut muncul dalam tiga bentuk/rasa – tiga jenis bukti reliabilitas tidak dapat dieprtukarkan satu sama lain. Apa yang saya sarankan kepada anda para guru adalah bahwa anda harus memahami bahwa atribut penting prosedur penilaian adalah reliabilitas.

Tidak ada komentar: