Instrument Pemeriksaan Okupasi Terapi : Reliabilitas dan Validitas

Journal Source : Heale R, Twycross A. 2015. Validity and realibility in qualitative research. Evide Based Nurse. Vol 18 ; 3.

Picture on Articles Source : http://www.rehabmeasures.orgotpotential.com

Edited by : Sebat – OT

Teman – teman pasti sudah tidak asing dengan beberapa pemeriksaan (instrument) yang digunakan untuk melakukan sebuah assesment pada seorang klien, sebut saja FIM (Functional Independence Measure) untuk mengukur level kemandirian pasien dalam aktifitas kehidupan sehari- hari, MMT ( Manual Muscel Testing ), COPM (Canadian Occupational Performance Measurement), atau Barthel Index.

Beberapa instrumen yang sudah tidak asing bagi seorang praktisi Okupasi Terapis dan masih digunakan hingga sekarang dikhususkan untuk mengevaluasi variabel yang hendak diamati, sebut saja jika rekan-rekan menggunakan Barthel Index atau FIM berarti variabel yang akan diamati tentu saja tingkat kemandirian bukan?

Namun apakah rekan-rekan sudah mengerti istilah Reliabilitas dan Validitas instrumen? Ternyata tidak semua instrumen dalam penelitian yang bersifat Kuantitatif dapat dipakai untuk menguji hasil temuan yang diinginkan. Pemilihan instrumen yang tepat yang memiliki nilai uji Realibilitas dan Validitas yang baik dan merupakan syarat yang harus dipenuhi dalam melakukan sebuah penelitian Kuantitatif maupun melakukan sebuah pemeriksaan pada pasien sehingga mendapatkan hasil yang akurat dan memiliki dasar teori yang kuat.

Nah apakah FIM, MMT, Barthel Index memiliki keriteria dan syarat yang baik untuk digunakan dalam sebuah penelitian atau pemeriksaan berkala? Baik, kita akan ulas dahulu pengertian dari Realibilitas dan Validitas sebelum mengkritisi instrumen tersebut.

A. Validitas (Validity)

Validitas didefinisikan sebagai sejauh mana sebuah konsep diukur secara akurat dalam sebuah studi kuantitatif. Misalnya, sebuah instrumen dirancang untuk mengeksplorasi depresi tapi yang sebenarnya diukur adalah tingkat kecemasan  maka  uji konsep tidak akan dianggap valid.

Ukuran kedua kualitas dalam studi kuantitatif adalah reliabilitas, atau keakuratan instrumen. Dengan kata lain, sejauh mana instrumen penelitian secara konsisten memiliki hasil yang sama jika digunakan dalam situasi yang sama pada kesempatan berulang. Contoh sederhana tentang validitas dan reliabilitas adalah jam alarm yang biasa berdering pada pukul 7:00 setiap pagi, namun diatur pukul 6.30. Hal ini sangat dapat diandalkan (secara konsisten berdering pada waktu yang sama setiap hari), namun tidak valid (tidak berdering pada waktu yang diinginkan). Penting untuk mempertimbangkan validitas dan reliabilitas alat pengumpulan data (instrumen) saat melakukan atau mengkritisi penelitian.

Ada tiga jenis validitas diantaranya :

  1. Validitas isi (content validity). Kategori ini melihat apakah instrumen tersebut cukup mencakup semua konten yang seharusnya berkaitan dengan variabel tersebut. Dengan kata lain, apakah instrumen mencakup keseluruhan domain yang terkait dengan variabel, atau konstruksinya dirancang untuk mengukur sebuah variabel?
  2. Construct validity mengacu pada apakah anda dapat menarik kesimpulan tentang nilai tes yang terkait dengan konsep yang sedang dipelajari. Misalnya, jika seseorang memiliki skor tinggi dalam survei yang mengukur kecemasan, apakah orang ini benar-benar memiliki tingkat kecemasan yang tinggi?

Ada tiga jenis bukti yang bisa digunakan untuk mendemonstrasikan instrumen penelitian yang memiliki construct validity yang baik

  1. Homogenitas – yang berarti bahwa instrumen mengukur satu konstruksi misalnya level kecemasan.
  2. Konvergensi – Ini terjadi ketika instrumen mengukur konsep yang serupa dengan instrumen lainnya.
  3. Bukti teori – ini terbukti ketika perilaku serupa dengan proposisi teoritis konstruk yang diukur dalam instrumen menghasilkan hasil yang sama dari gejala yang dialami oleh sample disertai dengan landasan kajian teori. Misalnya, ketika instrumen mengukur level kecemasan, hasil pengukuran akan menentukan bahwa skor tinggi pada instrumen yang mengukur level kecemasan memang menunjukkan gejala kegelisahan yang serupa pada individu dalam kehidupan sehari-hari mereka [2]

Ukuran akhir dari validitas adalah criterion validity, yaitu membendingkan instrumen lain yang mengukur variabel yang sama. Korelasi dapat dilakukan untuk menentukan sejauh mana instrumen yang berbeda mengukur variabel yang sama. Validitas kriteria diukur dalam tiga cara:

  1. Convergent Validity : Menunjukkan bahwa instrumen sangat berkorelasi dengan instrumen yang mengukur variabel serupa.
  2. Divergent Validity : Menunjukkan bahwa instrumen berkorelasi buruk dengan instrumen yang mengukur variabel yang berbeda. Dalam kasus ini, misalnya, terdapat korelasi rendah antara instrumen yang mengukur motivasi dan satu instrument yang mengukur self-efficacy.
  3. Predictive validity : Berarti instrumen tersebut memiliki korelasi tinggi. Misalnya, skor self-efficacy yang tinggi yang berkorelasi dengan bagaimana individu melakukan tugas dapat meramalkan kemungkinan peserta menyelesaikan tugas pada periode waktu yang akan datang [2].

B. Reliabilitas (Reliability)

Reliabilitas berhubungan dengan konsistensi suatu ukuran. Partisipan yang menyelesaikan instrumen  untuk mengukur tingkat motivasi harus memiliki respons yang sama setiap kali tes selesai pada partisipan lainnya.

Pengujian realibilitas sebuah instrumen mencakup 3 syarat :

Homogenitas (internal consistency)

Dinilai menggunakan korelasi item-to-total, reliabilitas split-half, koefisien KuderRichardson dan Cronbach’s α. Korelasi yang kuat menunjukkan reliabilitas tinggi, sementara korelasi lemah menunjukkan instrumen yang kurang dapat diandalkan dalam uji variabel penelitian.

Cronbach’s α adalah tes yang paling umum digunakan untuk menentukan konsistensi internal instrumen. Instrumen dengan pertanyaan yang memiliki lebih dari dua tanggapan dapat digunakan dalam tes ini. Hasil Cronbach α adalah angka antara 0 dan 1. Skor reliabilitas yang dapat diterima adalah nilai yang 0.7 dan lebih tinggi dari 1,3. [1] [3]

Stabilitas (Stabilllity) diuji dengan uji coba test-retest dan uji reliabilitas bentuk-linier atau alternatif. Test–retest reliability dinilai saat instrumen diberikan kepada peserta yang sama lebih dari sekali dalam keadaan serupa. Perbandingan statistik dibuat antara nilai ujian peserta untuk setiap kali mereka menyelesaikannya. Ini memberikan indikasi keandalan instrumen.

Stabilitas keandalan instrumen yang baik harus memiliki korelasi tinggi antara skor setiap kali peserta menyelesaikan tes. Secara umum, koefisien korelasi kurang dari 0,3 menunjukkan korelasi yang lemah, 0,3-0,5 moderat dan lebih besar dari 0,5 kuat. [4]

Kesetaraan (Equivalence) sebuah instrumen  dinilai melalui inter-rater reliability. Tes ini mencakup proses untuk menentukan secara kualitatif tingkat kesepakatan antara dua atau lebih pengamat. Contoh yang baik dari proses yang digunakan dalam menilai reliabilitas inter-rater adalah skor hakim yang menentukan individu dalam kompetisi skating.

Skor yang diberikan kepada peserta skating adalah ukuran keandalan antar-penilai. Contoh dalam penelitian adalah ketika peneliti diminta memberi skor untuk relevansi masing-masing item pada instrumen. Konsistensi dalam skor mereka berhubungan dengan tingkat reliabilitas instrumen antar-penilai.

Menentukan seberapa penting masalah reliabilitas dan validitas yang telah ditangani dalam sebuah penelitian adalah komponen penting dalam sebuah penelitian serta mempengaruhi keputusan tentang apakah penelitian cukup relevan atau tidak dipraktikan dalam dunia kesehatan. Dalam studi kuantitatif, ketelitian ditentukan melalui evaluasi validitas dan reliabilitas alat atau instrumen yang digunakan dalam penelitian. Studi penelitian berkualitas baik akan memberikan bukti bagaimana semua faktor termasuk instrumen dikaji berdasarkan validitas dan realibilitas yang memang sudah teruji sebelumnya.

Apakah rekan – rekan sudah mengerti bagaimana cara menentukan instrumen yang baik berdasarkan uji Realibilitas dan Validitas? Mari kita kritisi dua instrumen yang familiar yaitu FIM dan Barthel Index, keduanya sama sama mengevaluasi tingkat kemandirian bagaimana mengetahui Realibilitas dan Validitas antara FIM dan Barthel Index?

FIM

Data diatas menjelaskan uji Realibilitas dan Validitas instrumen FIM dimana hasil test – retest mendapatkan hasil Excellent yang dilakukan pada pasien lansia ICC = 0,98 pada tiap aspek motorik dan kognitif pada instrumen FIM.

Inter-raterreliability instrumen FIM yang dilakukan untuk pasien ortopedi dan stroke mendapatkan hasil Adequate – Poor pada 4 item yaitu naik tangga, berpakaian, berjalan dan manajemen BAB. Interrater berkaitan dengan penilaian beberapa penguji dalam satu periode waktu yang sama terhadap pasien dengan kondisi serupa.

Hal berbeda tejadi pada pemeriksaan pasien SCI, Inter -rater instrumen FIM mendapatkan hasil Excellent pada pengukuran selama satu bulan yang dilakukan beberapa parktisi klinis, dengan beberapa item dengan nilai dibawah 0,5 : Locomotion, communication dan social cognition. Artinya beberapa konten dalam FIM termasuk locomotion, communication dan social cognition tidak memperoleh konsistensi dalam uji inter – rater.

FIM 3

Sekarang kita akan membahas masalah internal – consistency pada instrumen FIM yang diukur menggunakan cronbach alpha, sebelumnya rekan – rekan masih ingat kan? sebuah instrumen yang baik memiliki nilai cronbach alpha diatas 0,7. Pada instrumen FIM yang digunakan untuk memeriksa beberapa kasus stroke, neurological disorder menunjukan bahwa rata – rata nilai cronbach alpha menunjukan angka lebih dari 0,9 yang menunjukan bahwa instrumen FIM sangat layak digunakan untuk sebuah pemeriksaan pada kasus tertentu dan memenuhi syarat Realibilitas yang baik diukur dari Inter-rater, test-retest dan internal consistency.

Bagaimana dengan Validitasnya? Validitas sebuah instrumen dikatakan baik apabila terdapat penjelasan dan pembuktian dari penelitian yang dilakukan untuk menguji instrumen tersebut, coba kita lihat Predictive Validity instrument FIM, dikatakan bahwa skor FIM 37 -72 memiliki lebih banyak keuntungan daripada pasien dengan skor diatas 73 atau dibawah 36.

FIM 6.png

Content Validity instrumen FIM dapat digunakan namun membutuhkan validitas atau pengembangan lebih lanjut, dan kurang tepat digunakan untuk penelitian kasus SCI.

Untuk penelitian kasus TBI walaupun FIM telah memiliki reliabilitas dan validitas, FIM memiliki 5 item yang kurang tepat untuk dilakukan pada pasien TBI yaitu kognitif, prilaku, komunikasi yang merupakan kekurangan dari validitas untuk kasus TBI.

Sekarang coba kita bandingkan dengan instrumen Barthel Indeks

BI 1.png

Instrumen Barthel indeks belum memiliki kajian test – retest realibilitas yang berarti belum ada uji reabilitas test-retest yang dilakukan beberapa kali dengan pasien yang sama.

Sementara Inter-rater reliability instrumen Barthel Index kebanyakan dilakukan pada pasien stroke akut dengan hasil excellent pada beberapa penelitian dengan nilai ICC lebih dari 0,9

Internal Consistency instrumen barthel indeks juga banyak dilakukan pada pasien stroke akut dengan nilai alpha lebih dari 0,70 yang menunjukan bahwa instrumen tersebut layak digunakan untuk pasien stroke akut.

BI1

 

Bagaimana dengan validitasnya? Predictive Validity instrumen Barthel Indeks dilakukan pada kasus stroke akut dan pasien Brain Injury, dan didapatkan korelasi yang tinggi ditunjukan dari nilai r dan ICC diatas 0,70

Construct Validity pada instrumen Barthel Indeks diukur pada pasien Rehabilitasi Neurologis, didapatkan hasil adanya korelasi yang baik antara disabilitas pada skor BI.

Bagaimana apakah rekan – rekan sudah dapat menyimpulkan perbedaan antara kedua instrumen tersebut? instrumen yang sama sama mengevaluasi level kemandirian nyatanya dalam uji Realibilitas dan Validitas diuji pada pasien yang beragam dan tidak semua pasien dapat diukur menggunakan instrumen FIM dan Barthel Indeks.

Misalnya dari contoh diatas instrumen FIM kurang layak digunakan untuk pasien TBI dan SCI karena dari hasil uji Validitas konten mengatakan bahwa ada item yang tidak sesuai dengan kondisi SCI dan TBI. Korelasi tersebut berbanding lurus pada pada uji Inter -rater instrumen FIM dimana instrumen mendapatkan hasil Excellent pada pengukuran selama satu bulan yang dilakukan beberapa parktisi klinis, namun terdapat item dengan nilai dibawah 0,5 : Locomotion, communication dan social cognition merupakan sebuah tanda bahwa instrumen ini kurang cocok digunakan untuk pasien TBI dan SCI, walaupun nilai  alpha pada kasus SCI lebih dari 0,9 hal inilah yang menjadi bahan kritisi dalam menilai sebuah instrument.

Lain halnya dengan Barthel Indeks, kajian teori yang mendasari uji realibilitas dan validitas instrument tersebut lebih spesifik digunakan untuk pasien dengan stroke akut. hal ini terlihat dari beberapa penelitian terkait pembuktian realibilitas dan validitas instrumen Barthel Indeks. Nilai alpha pada beberapa penelitian menunjukan konsistensi diatas 0,7 pada pasien stroke akut dan hal ini sudah dapat dijadikan landasan teori yang kuat apabila kita melakukan pemeriksaan pada pasien stroke akut menggunakan instrumen ini.

Namun kekurangannya adalah, tidak adanya data yang menjelaskan apakah instrumen Barthel Indeks dapat digunakan pada kasus geriatri/lansia? tidak adanya data ini dalam penelitian realibilitas dan validitas Barthel Indeks menjadikan instrumen ini memiliki kelemahan pada bagian ini, dibandingkan instrumen FIM yang memiliki data penelitian dan uji realibilitas untuk kasus geriatri.

KESIMPULAN

Tidak semua instrumen dapat dipakai untuk semua kasus walaupun pada dasarnya dapat digunakan untuk mengukur sebuah variabel, didalam sebuah penelitian kualitatif atau pemeriksaan yang diharuskan untuk dievaluasi bersama praktisi kesehatan lain diperlukan dasar ilmu yang kuat agar pemeriksaan kita dapat dipertanggung jawabkan dengan dasar teori yang jelas,  berdasarkan kajian penelitian, termasuk didalamnya kajian reliabilitas dan validitas instrumen itu sendiri. Sehingga apa yang kita kerjakan memberi dampak yang positif terhadap klien dan lebih mudah dikomunikasikan bersama disiplin ilmu lainnya.

Apakah akhirnya rekan – rekan semua penasaran realibilitas dan validitas instrumen yang telah anda gunakan selama ini cocok atau tidak menurut penelitian? Rekan – rekan dapat mengakses referensi website http://www.rehabmeasures.org  untuk mengetahui instrumen okupasi terapi berdasarkan uji Realibilitas dan Validitasnya.

REFERENCES

2. Korb K. Conducting Educational Research. Validity of Instruments. 2012. http://korbedpsych.com/R09eValidity.html
3. Shuttleworth M. Internal Consistency Reliability. 2015. https:// explorable.com/internal-consistency-reliability
4. Laerd Statistics. Determining the correlation coefficient. 2013. https://statistics.laerd.com/premium/pc/pearson-correlation-inspss-8.ph

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google+ photo

You are commenting using your Google+ account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

w

Connecting to %s