Ahad siang, tepatnya
tanggal 14 September 2012 di kampus Universitas Mercubuana Meruya, tepatnya di
ruang D 201, kuliah jam 13.30 siang itu adalah KONSTRUKSI ALAT UKUR PSIKOLOGI. Pada
pertemuan ke 5 kemarin Sanita Magda
Idhola sebagai dosen pengganti.
Penyusunan Skala Psikologi
Pengukuran merupakan proses
kuantifikasi atribut dan dapat menghasilkan data yang valid dan dilakukan
secara sistematik. Tes psikologi adalah tes yang digunakan untuk mengukur aspek-aspek
psikologi yang merupakan representative dari tingkah laku. Tes psikologi sangat
beragam tergantung dari penggunaannya. Berdasarkan apa yang akan diukur, tes
psikologi dapat dibagi kedalam beberapa bagian.
Menurut Cronbach
(1976), tes psikologi terdiri dari tes yang mengukur performansi maksimal(maximal
performance) dan tes yang mengukur performansi tipikal (typical
performance).
Tes yang mengukur performansi maksimal
(maximum performance)
Tes ini dirancang untuk mengungkap apa
yang dapat dilakukan oleh subjek dan seberapa baik ia dapat melakukannya. Dalam
penyajiannya, subjek selalu didorong untuk berusaha sebaik mungkin. Kesiapan,
motivasi dan keinginan untuk berusaha di pihak subjek sangat penting artinya
adalam mengerjakan tes ini. Karena itu petunjuk pengejaan tes harus dibuat
sejelas dan setepat mungkin, Cara pemberian skor pun seringkali harus
diberitahukan sebelumnya kepada subjek, demikian pula halnya batas waktu
pengerjaan dan semacamnya. Dalam hal ini hanya pendekatan dan strategi
pengerjaan soal-soal yang tidak diberitahukan kepada subjek. Yang dapat
digolongkan dalam jenis tes ini adalah tes intelegensi, tes kemampuan khusus
(misal tes bakat) dan sebagainya.
Tes yang mengukur performansi tipikal (typical
performance)
Tes ini disusun untuk mengungkap apa
yang cenderung dilakukan oleh subjek dalam situasi-situasi tertentu. Jadi tes
ini tidak dimaksudkan untuk mengukur apa yang dapat atau mampu dilakukan oleh
subjek, tetapi mengungkap apa yang akan dilakukannya. Biasanya subjek tidak
mengetahui apa yang diharapkan darinya. Stimulus dalam pengerjaan tes ini acap
kali tidak mempunyai struktur yang jelas sehingga, subjek sulit untuk menebak
jawaban yang terbaik yang harus diberikan, dan subjek tidak mengetahui
bagaimana jawabannya nanti akan diberikan skor. Yang termasuk dalam jenis tes
ini seperti tes inventori minat, inventori kepribadian, dan semacamnya.
VALIDITAS DAN
RELIABILITAS
Uji Validitas:
Validitas adalah ketepatan mengukur konstruk, menyangkut: “what the test measure and how well it does” (Anastasi, 1990), atau “apakah alat tes memenuhi fungsinya sebagai alat ukur psikologis?” (Nunnaly, 1978).
Validitas adalah ketepatan mengukur konstruk, menyangkut: “what the test measure and how well it does” (Anastasi, 1990), atau “apakah alat tes memenuhi fungsinya sebagai alat ukur psikologis?” (Nunnaly, 1978).
Prosedur validitas:
* Criterion-related validation: memprediksi dan mendiagnosa.
Criterion-related melihat validitas tes dalam memprediksi suatu tingkah laku. Criteria adalah tingkah laku yang hendak diramalkan. Jenis validitas ini dibagi menjadi dua yaitu, predictive dan concurrent. Predictive berguna untuk memprediksi suatu tingkah laku, memvalidasi tes-tes seleksi dan penempatan, yang kriterianya diambil setelah interval waktu tertentu. Concurrent digunakan untuk mendiagnosa suatu tingkah laku terutama kepribadian yang kriterianya diambil bersamaan dengan saat pengetesan.
* Content-related validation: merepresentasikan materi (domain behavior)
Sejauh mana peneliti yakin bahwa item-item sudah merepresentasikan sample tingkah laku perlu batasan tingkah laku à definisi operasional à domain. Di dalamnya terdapat expert judgement.
* Construct related validation: mengukur psychological traits
Melihat sejauh sebuah tes tepat mengukur konstruk atau trait. Beberapa metode yang dapat digunakan untuk mengukur validitas konstruk:
* Criterion-related validation: memprediksi dan mendiagnosa.
Criterion-related melihat validitas tes dalam memprediksi suatu tingkah laku. Criteria adalah tingkah laku yang hendak diramalkan. Jenis validitas ini dibagi menjadi dua yaitu, predictive dan concurrent. Predictive berguna untuk memprediksi suatu tingkah laku, memvalidasi tes-tes seleksi dan penempatan, yang kriterianya diambil setelah interval waktu tertentu. Concurrent digunakan untuk mendiagnosa suatu tingkah laku terutama kepribadian yang kriterianya diambil bersamaan dengan saat pengetesan.
* Content-related validation: merepresentasikan materi (domain behavior)
Sejauh mana peneliti yakin bahwa item-item sudah merepresentasikan sample tingkah laku perlu batasan tingkah laku à definisi operasional à domain. Di dalamnya terdapat expert judgement.
* Construct related validation: mengukur psychological traits
Melihat sejauh sebuah tes tepat mengukur konstruk atau trait. Beberapa metode yang dapat digunakan untuk mengukur validitas konstruk:
- Perubahan yang dipengaruhi perkembangan
- Korelasi dengan alat tes lain, yang dibagi menjadi alat tes baru dengan alat tes lama, dan korelasi alat tes baru dengan alat tes lain.
- Analisis factor
- Experimental intervention
- Human information processing
- Internal consistency
- Convergent – Discriminant validity
1. Konsep teoritik tidak cukup dipahami.
2. Aspek keperilakuan tidak operasional.
3. Penulisan aitem tidak mengikuti kaidah
4. Administrasi skala tidak berhati-hati
(penampilan skala, situasi ruang, dan kondisi subjek)
5. Pemberian skor tidak cermat.
6. Keliru interpretasi.
Selanjutnya validitas dibagi menjadi 3 tipe yaitu: validitas
isi, validitas konstrak, dan validitas yang berdasat kriteria :
1). Validitas
Isi
Validitas isi
merupakan validitas yang diperhitumgkan melalui pengujian terhadap isi alat
ukur dengan analisis rasional. Pertanyaan yang dicari jawabannya dalam validasi
ini adalah "sejauhmana item-item dalam suatu alat ukur mencakup
keseluruhan kawasan isi objek yang hendak diukur oleh alat ukur yang
bersangkutan?" atau berhubungan dengan representasi dari keseluruhan
kawasan.
Pengertian
"mencakup keseluruhan kawasan isi" tidak saja menunjukkan bahwa alat
ukur tersebut harus komprehensif isinya akan tetapi harus pula memuat hanya isi
yang relevan dan tidak keluar dari batasan tujuan ukur.mWalaupun isi atau kandungannya komprehensif tetapi bila suatu alat
ukur mengikutsertakan pula item-item yang tidak relevan dan berkaitan dengan
hal-hal di luar tujuan ukurnya, maka validitas alat ukur tersebut tidak dapat
dikatakan memenuhi ciri validitas yang sesungguhnya. Apakah validitas isi sebagaimana dimaksudkan itu telah dicapai oleh alat
ukur, sebanyak tergantung pada penilaian subjektif individu. Dikarenakan
estimasi validitas ini tidak melibatkan komputasi statistik, melainkan hanya
dengan analisis rasional maka tidak diharapkan bahwa setiap orang akan
sependapat dan sepaham dengan sejauhmana validitas isi suatu alat ukur telah
tercapai.
Selanjutnya,
validitas isi ini terbagi lagi menjadi dua tipe, yaitu face validity (validitas
muka) dan logical validity(validitas logis).
·
Face Validity (Validitas Muka). Validitas muka adalah tipe validitas yang paling rendah signifikasinya
karena hanya didasarkan pada penilaian selintas mengenai isi alat ukur. Apabila
isi alat ukur telah tampak sesuai dengan apa yang ingin diukur maka dapat
dikatakan validitas muka telah terpenuhi.
Dengan alasan kepraktisan, banyak alat
ukur yang pemakaiannya terbatas hanya mengandalkan validitas muka. Alat ukur
atau instrumen psikologi pada umumnya tidak dapat menggantungkan kualitasnya
hanya pada validitas muka. Pada alat ukur psikologis yang fungsi pengukurannya
memiliki sifat menentukan, seperti alat ukur untuk seleksi karyawan atau alat
ukur pengungkap kepribadian (asesmen), dituntut untuk dapat membuktikan
validitasnya yang kuat.
·
Logical Validity (Validitas Logis). Validitas logis disebut juga sebagai validitas sampling (sampling
validity). Validitas tipe ini menunjuk pada sejauhmana isi alat ukur
merupakan representasi dari aspek yang hendak diukur. Untuk
memperoleh validitas logis yang tinggi suatu alat ukur harus dirancang
sedemikian rupa sehingga benar-benar berisi hanya item yang relevan dan perlu
menjadi bagian alat ukur secara keseluruhan. Suatu objek ukur yang hendak
diungkap oleh alat ukur hendaknya harus dibatasi lebih dahulu kawasan
perilakunya secara seksama dan konkrit. Batasan perilaku yang kurang jelas
akan menyebabkan terikatnya item-item yang tidak relevan dan tertinggalnya
bagian penting dari objek ukur yang seharusnya masuk sebagai bagian dari alat
ukur yang bersangkuatan.
Validitas logis memang sangat penting peranannya
dalam penyusunan tes prestasi dan penyusunan skala, yaitu dengan memanfaatkan blue-print atau
tabel spesifikasi.
2). Validitas
Konstruk
Validitas
konstruk adalah tipe validitas yang menunjukkan sejauhmana alat ukur mengungkap
suatu trait atau konstruk teoritis yang hendak diukurnya
(Allen & Yen, dalam Azwar 1986).Pengujian validitas konstruk merupakan
proses yang terus berlanjut sejalan dengan perkembangan konsep mengenaitrait yang
diukur. Walaupun pengujian validitas konstruk
biasanya memerlukan teknik analisis statistik yang lebih kompleks daripada
teknik yang dipakai pada pengujian validitas empiris lainnya, akan tetapi
validitas konstruk tidaklah dinyatakan dalam bentuk koefisien validitas
tunggal.
Konsep validitas
konstruk sangatlah berguna pada alat ukur yang mengukur trait yang
tidak memiliki kriteria eksternal.
3). Validitas Berdasar Kriteria
Pendekatan
validitas berdasar kriteria menghendaki tersedianya kriteria eksternal yang
dapat dijadikan dasar pengujian skor alat ukur. Suatu kriteria adalah variabel
perilaku yang akan diprediksikan oleh skor alat ukur. Untuk melihat tingginya validitas berdasar kriteria dilakukan komputasi
korelasi antara skor alat ukur dengan skor kriteria. Koefisien ini merupakan
koefisien validitas bagi alat ukur yang bersangkutan, yaitu rxy, dimana x
melambangkan skor alat ukur dan y melambangkan skor kriteria.
Dilihat dari segi
waktu untuk memperoleh skor kriterianya, prosedur validasi berdasar kriteria
menghasilkan dua macam validitas yaitu validitas prediktif (predictive
validity) dan validitas konkuren (concurrent validity).
·
Validitas Prediktif. Validitas
prediktif sangat penting artinya bila alat ukur dimaksudkan untuk berfungsi
sebagai prediktor bagi kinerja di masa yang akan datang. Contoh situasi yang
menghendaki adanya prediksi kinerja ini antara lain adalah dalam bimbingan
karir; seleksi mahasiswa baru, penempatan karyawan, dan semacamnya. Contohnya adalah sewaktu kita melakukan pengujian validitas
alat ukur kemampuan yang digunakan dalam penempatan karyawan. Kriteria yang
terbaik antara lain adalah kinerjanya setelah ia betul-betul ditempatkan
sebagai karyawan dan melaksanakan tugasnya selama beberapa waktu. Skor kinerja
karyawan tersebut dapat diperoleh dari berbagai cara, misalnya menggunakan
indeks produktivitas atau rating yang dilakukan oleh
atasannya.Koefisien korelasi antara skor alat ukur dan kriteria
merupakan petunjuk mengenai saling hubungan antara skor alat ukur dengan skor
kriteria dan merupakan koefisien validitas prediktif. Apabila koefisien ini
diperoleh dari sekelompok individu yang merupakan sampel yang representatif,
maka alat ukur yang telah teruji validitasnya akan mempunyai fungsi prediksi
yang sangat berguna dalam prosedur alat ukur di masa datang. Prosedur validasi prediktif pada umumnya
memerlukan waktu yang lama dan mungkin pula beaya yang tidak sedikit
dikarenakan prosedur ini pada dasarnya bukan pekerjaan yang dianggap selesai
setelah melakukan sekali tembak, melainkan lebih merupakan kontinuitas dalam
proses pengembangan alat ukur. Sebagaimana prosedur validasi yang lain,
validasi prediktif pada setiap tahapnya haruslah diikuti oleh usaha peningkatan
kualitas item alat ukur dalam bentuk revisi, modifikasi, dan penyusunan
item-item baru agar prosedur yang dilakukan itu mempunyai arti yang lebih besar
dan bukan sekedar pengujian secara deskriptif saja.
·
Validitas
Konkuren. Apabila
skor alat ukur dan skor kriterianya dapat diperoleh dalam waktu yang sama, maka
korelasi antara kedua skor termaksud merupakan koefisien validitas konkuren. Suatu
contoh dimana validitas konkuren layak diuji adalah apabila kita menyusun suatu
skala kecemasan yang baru. Untuk menguji validitas skala tersebut kita dapat
mengunakan skala kecemasan lain yang telah lebih dahulu teruji validitasnya,
yaitu dengan alat ukur TMAS (Tylor Manifest Anxiety Scale).
Uji Reliabilitas:
Reliabilitas adalah konsistensi alat tes yang dilihat dari skor dan z-score. Mengapa diperlukan kekonsistenan? Karena adanya perubahan-perubahan pada skor dan z-score yang disebabkan oleh ERROR. Terdapat dua macam error yaitu: systematic dan unsystematic error.
Prosedur reliabilitas:
Pengujian reliabilitas dengan satu kali administrasi
Reliabilitas adalah konsistensi alat tes yang dilihat dari skor dan z-score. Mengapa diperlukan kekonsistenan? Karena adanya perubahan-perubahan pada skor dan z-score yang disebabkan oleh ERROR. Terdapat dua macam error yaitu: systematic dan unsystematic error.
Prosedur reliabilitas:
Pengujian reliabilitas dengan satu kali administrasi
·
Split half; Pengukuran reliabilitas alat ukur
dilakukan dengan cara membelah alat tes tersebut menjadi dua bagian yang
ekuivalen. Koefisien reliabilitas diperoleh dengan cara mengkorelasikan
skor-skor antar dua belahan (internal consistency). Teknik pengujian
reliabilitas dengan teknik ini dibagi menjadi dua, yaitu Rulon dan Spearman
Brown.
·
Kuder Richardson; Mengukur konsistensi
respon subjek pada item-item tes, sehingga disebut interitem consistency.
Errornya disebut content sampling dan content heterogeneity sampling. Teknik
pengujian reliabilitas dengan teknik ini dibagi menjadi dua, yaitu KR-20 dan
KR-21
·
Coefficient alpha; Tujuannya sama
dengan KR, hanya saja syarat yang harus dipenuhi adalah data yang diperoleh
bersifat kontinum dan bukan dikotomi.
Pengujian reliabilitas
dengan dua kali administrasi
·
Tes-retes. Untuk melihat stabilitas atau
kekonsistenan alat tes dalam mengukur karakteristik atau trait dengan
melaksanakan tes dan pengukuran terdiri lebih dari satu kali (diulang).
Koefisien korelasi yang dihasilkan disebut dengan coefficient of stability.
Error pada uji reliabilitas dengan teknik ini disebut time sampling
error.
·
Alternate form: immediate alternate
form & delayed alternate form. Untuk melihat stabilitas alat tes dalam
mengukur trait individu dengan melaksanakan tes dan pengukuran lebih dari satu
kali dan menggunakan dua form tes, yaitu
§
Immediate: form kedua diberikan langsung setelah form pertama diberikan.
Koefisien korelasi yang dihasilkan disebut dengan coefficient of equivalence.
Error pada teknik ini disebut sebagai content sampling & human error.
§
Delayed: ada penundaan pemberian form kedua setelah form pertama
diberikan. Koefisiennya disebut sebagai coefficient of equivalence &
stability. Error pada teknik ini disebut sebagai content sampling, time
sampling, & human error.
Interscorer
reliability.
Tujuan dari uji reliabilitas ini adalah untuk menunjukkan konsistensi skor-skor yang diberikan skore satu dengan skorer lainnya. Error yang muncul adalah interscorer differences.
o Revisi item
o Kalau memungkinkan dan perlu, dilakukan uji coba lagi
Tujuan dari uji reliabilitas ini adalah untuk menunjukkan konsistensi skor-skor yang diberikan skore satu dengan skorer lainnya. Error yang muncul adalah interscorer differences.
o Revisi item
o Kalau memungkinkan dan perlu, dilakukan uji coba lagi
Skala psikologi
banyak kelemahan dan memerlukan tingkat validitas dan reliabilitas yang tinggi
disebabkan:
1. Atribut psikologi bersifat latent dan tidak mempunyai eksistensi riil.
2. Atribut2 dalam skala
psikologi ditulis berdasarkan indikator perilaku yang jumlahnya
terbatas.
3. Respon yang diberikan oleh subjek terhadap stimulus dalam
skala psikologi sedikit banyak dipengaruhi oleh variabel-variabel yang tidak relevan.
4. Atribut psikologi yang terdapat dalam diri manusia
stabilitasnya tidak tinggi.
5. Interpretasi terhadap hasil ukur psikologi hanya dapat
dilakukan secara normatif.
Objek pengukuran
dapat berupa atribut fisik atau atribut psikologi. Kelebihan atribut fisik,
dapat diukur sampai pada tingkat skala ratio yaitu angka interval yang memiliki
harga 0 mutlak. Atribut psikologi hanya dapat diukur sampai tingkat skala
ordinal.
Atribut Psikologi
dikategorikan menjadi: atribut Kemampuan Kognitif (Intelegensi, Bakat dan
Prestasi) dan Atribut Bukan Kemampuan (Atribut kepribadian). Skala dan tes
adalah 2 hal yang BERBEDA.
·
Tes digunakan untuk penyebutan alat ukur
kemampuan kognitif
·
Skala digunakan untuk penyebutan alat ukur
atribut non-kognitif.
Karakteristik skala sebagai alat ukur psikologi:
1.
Stimulus berupa pernyataan yang tidak langsung
mengungkap indikator perilaku yang hendak diukur.
2.
Skala psikologi selalu terdiri dari aitem2.
3.
Respon subjek tidak diklasifikasikan sebagai
jawaban “benar” atau “salah”
Karakteristik di atas menjadi ciri pengukuran terhadap
performansi tipikal.
Validitas: ketepatan dan kecermatan instrumen dalam
menjalankan fungsi ukur. Validitas menunjuk sejauh mana skala itu mampu
mengungkap dengan akurat dan teliti mengenai atribut yang akan diukurnya. Validitas
merupakan karakteristik utama yang harus dimiliki oleh setiap alat ukur.
Ini saja kirannya
tulisan saya dari beberapa sumber agar memberikan penjelasan bagi yang membaca
terutama diri saya pribadi, dalam menyusun proposal konstruksi alat ukur
psikologi.
wassalam dan tetap semangat tuk menyelesaikan tugas-tugas kuliah di semester ini.
sumber bacaan :
- ppt penyusunan skala psikologi, dosen Sagita M.I
- http://www.psychologymania.com/2012/03/klasifikasi-tes-psikologi.html
- http://violetatniyamani.blogspot.com/2007/09/teori-validitas.html
Bagus Bu...sangat psikometri...dan saya suka, tetap berbagi ya Bu...salam SOBAT !
BalasHapus