Skala Odds Ratio dan Logit dalam Pemodelan IRT

Algoritma IRT tidak bekerja di persentase subjek menjawab benar, akan tetapi pada bentuk skala yang dinamakan dengan odds ratio dan logit. IRT bekerja dalam unit log-odds yang sering dinamakan dengan logits. Logit adalah cara untuk mentransformasi antara probabilitas dan abilitas dalam metrik yang linier. Melalui skala logit, tingkat abilitas dinyatakan dalam bentuk eksponen model IRT. Dalam unit skala ini, perbedaan antara individu atau item memiliki arti yang sama pada semua tingkat. Ada tiga tipe unit skala yang populer dalam aplikasi IRT yaitu (a) logit scale, (b) odd ratio dan (c) proporsi skor murni. Tipe skala ini menentukan jenis perbandingan skor yang dapat dijustifikasi dalam pemodelan IRT. logit unit dan unit peluang terkait dengan justifikasi perbandingan antar skor. Proporsi skor murni biasanya dipakai dalam studi perbandingan antara pendekatan IRT dan pendekatan klasik.

Misalnya P adalah probabilitas munculnya nilai tertentu, dan 1-P adalah probabilitas tidak munculnya nilai tersebut. Odds ratio didefinisikan dengan perbandingan antara P dan 1-P.

Odds Ratio = P / (1-P)

Logit didapatkan dari menarik logaritma natural dari odds ratio atau yang dijabarkan dalam persamaan berikut :

Logit = LN (P/(1-P)

Dengan mentransformasi nilai probabilitas menjadi Odds ratio kemudian menjadi Logit maka distribusi skor berubah yang awalnya dari 0 hingga 100 (probabilitas) menjadi ≈0  s/d ≈20 (odd ratio) menjadi (-3) hingga 3 (logit). Hal ini memudahkan untuk memahami abilitas dalam konteks distribusi normal, karena distribusi normal bergerak dari -3 hingga 3. Hasil transformasi dari P menuju odd-ratio dan logit dapat dilihat pada Tabel 1.

Tabel 1. Transformasi dari P menjadi odd-ratio dan logit.

Estimasi awal tingkat abilitas dapat dilihat dalam dua proses. Diawali dengan menentukan proporsi butir yang di jawab benar oleh subjek. Untuk tiap subjek, proporsi tersebut didapatkan dari jumlah aitem yang dijawab benar dibagi dengan jumlah jumlah aitem yang dijawab oleh subjek. Misalnya subjek A, proporsi menjawab benar 0.40 didapatkan dari  jumlah aitem yang dijawab benar (2) dan jumlah aitem (5) sehingga 2/5=0.4. Level abilitas didapatkan dari dengan mentransformasikan nilai proporsi ke dalam skala logit dengan menarik logaritma natural pada nilai proporsinya.

Untuk Subjek A : LN (2/5) = LN(0.4) = -0.41

Untuk Subjek C : LN (3/5) =  LN(0.6) = 0.41

Hasil ini menunjukkan bahwa nilai estimasi trait/abilitas Subjek A setengah SD di bawah rata-rata dibanding dengan Subjek C yang memiliki abilitas lebih tinggi karena posisinya setengah SD di atas rerata.

Tabel 2. Data Simulasi Skor Tes

Estimasi tingkat kesulitan aitem juga didapatkan dengan cara yang hampir sama. Diawali dari menentukan proporsi butir yang dijawab benar kemudian mentransformasikan ke dalam skala logit.

Untuk Aitem 1 : LN(5/6) = LN(0.83) = 1.61

Untuk Aitem 2 : LN(4/6) = LN(0.67) = 0.69

Hasil ini menunjukkan bahwa Aitem 1 tergolong sulit karena subjek yang memiliki abilitas yang cukup tinggi (1.61 atau hampir satu setengah SD di atas rerata) memiliki peluang 50% untuk menjawab benar. Dengan demikian peluang menjawab benar pada subjek dibawah 1.61 kurang dari 50%, dan sebaliknya bagi subjek dengan abilitas di atas 1.61, mereka memiliki peluang di atas 50% untuk menjawab benar.

Logit nilainya sama dengan estimasi abilitas individu dikurangi dengan tingkat kesulitan aitem (θ – b), yang menunjukkan perbedaan antara kemampuan siswa dan kesulitan item yang diukur dalam satuan logits. Semakin tinggi nilai abilitas individu, semakin tinggi nilai estimasi theta (θ) yang dihasilkan. Estimasi abilitas, θ, dapat berkisar dari – ∞ < θ <∞. Demikian juga, semakin tinggi nilai estimasi kesulitan, b, aitem yang bersangkutan tergolong sulit. Sama seperti nilai theta perkiraan kesulitan item (b) berkisar dari – ∞ < b <∞.

Persamaan di atas menunjukkan hubungan antara skala logit dengan selisih abilitas individu (θ) dengan tingkat kesukaran butir (b).

Misalnya, jika itu abilitas seseorang (dalam skala logit) lebih besar dari nol, maka ia cenderung dapat mengatasi item tersebut (jika yang dihadapi adalah tes prestasi) atau menyetujui pernyataan dalam aitem (jika pada skala psikologi). Sebaliknya, jika abilitas orang tersebut kurang dari nol, maka ia cenderung tidak mampu mengatasi atau menyetujui aitem yang diberikan. Jika tingkat abilitas orang tersebut adalah nol, maka abilitasnya setara dengan tingkat rata-rata level aitem.

Logit kemudian menjadi inspirasi  dalam mengestimasi probablitas individu untuk menjawab benar dalam pemodelan IRT. Di bawah ini adalah persamaan melalui pendekatan Rasch (kadang dinamakan dengan 1PL).  P(θ) adalah probabilitas individu untuk menjawab aitem dengan benar, θ adalah estimasi tingkat abilitas individu dan b adalah tingkat kesukaran aitem.

Sebagai contoh, subjek yang memiliki abilitas sebesar -3 memiliki probabilitas sebesar 0.02 pada aitem dengan tingkat kesukaran 0.8 , cukup rendah kemungkinan subjek ini untuk mendapatkan skor 1 (alias benar). Di sisi lain subjek yang memiliki abilitas sebesar 3 akan memiliki peluang sebesar 0.9 (90 persen) untuk menjawab aitem 8 dengan benar.