Pendugaan generalized linear model dengan Iteratively Reweighted Least Squares
Generalized Linear Model
Generalized Linear Model (GLM) adalah perluasan dari model regresi linear, yang memungkinkan pemodelan peubah respons yang tidak harus berdistribusi normal.
GLM terdiri dari tiga komponen utama yaitu:
- Komponen Acak: Menentukan distribusi peluang dari peubah respons
. Pada GLM, respons berasal dari Exponential (Dispersion) Family atau Keluarga (Dispersi) Eksponensial, yang merupakan generalisasi dari distribusi normal dan mencakup berbagai distribusi seperti binomial, Poisson, normal, gamma, dll. - Komponen Sistematis:Mendefinisikan prediktor linear
, yang merupakan kombinasi linear dari peubah penjelas (prediktor). di mana adalah matriks desain dari prediktor, dan adalah vektor koefisien. - Fungsi Hubung: Menghubungkan prediktor linear
dengan rata-rata distribusi . Fungsi hubung memastikan bahwa kombinasi linear dari prediktor memetakan secara tepat ke domain . Fungsi hubung umum termasuk logit (untuk hasil biner), log (untuk jumlah kejadian), dan identitas (untuk respon yang memiliki domain bilangan Real).
Keluarga (Dispersi) Eksponensial
Keluarga Dispersi Eksponensial adalah kelas distribusi peluang yang mencakup banyak distribusi umum yang digunakan dalam GLM, termasuk distribusi normal, binomial, Poisson, gamma, dan invers Gaussian. Sebuah peubah acak
dengan
adalah natural parameter adalah dispersion parameter adalah cumulant function adalah normalizing function yang memastikan integral dari fkp sama dengan 1.
Distribusi yang termasuk dalam keluarga ini memiliki sifat-sifat antara lain:
Fungsi log-likelihood dan Score Function
Fungsi log-likelihood dari Exponential dispersion family untuk
Kemudian, score function dari Equation 2 dapat diturunkan sebagai berikut
Selanjutnya, untuk memasukan unsur GLM dalam Equation 2, mari kita perhatikan hubungan antara natural parameter
Misalkan fungsi hubung
Kemudian, berdasarkan Equation 3 diperoleh
sehingga fungsi log-likelihood menjadi
Kemudian untuk mendapatkan score function dihitung turunan pertama dari fungsi log-likelihood dengan aturan rantai turunan
Aturan rantai pada Equation 4 terbentuk dari hubungan antara
maka diperoleh hasil sebagai berikut
Jadi dapat disimpulkan bahwa score function dalam GLM adalah
atau dalam bentuk matriks dapat dinyatakan sebagai
Hubungan Mean-Ragam dalam GLM
Dari sifat keluarga dispersi eksponensial, kita tahu bahwa
Karena
Persamaan Equation 7 menunjukkan hubungan antara mean-ragam. Hubungan ini dapat menjadi karakteristik sebaran-sebaran tertentu yang masuk dalam keluarga dispersi eksponensial. Misalnya
- jika
Poisson distribution maka - jika
Binomial distribution maka - jika
Normal distribution maka
Selanjutnya, Equation 7 menyebabkan
Expected Fisher Information
Kemudian kita akan menghitung turunan pertama dari @#eq-sfglm2 untuk mendapatkan Observed Fisher Information Fisher
Selanjutnya untuk mendapatkan Expected Fisher Observed, kita akan menghitung ekspetasi dari Observed Fisher Information sebagai berikut:
sehingga
jadi Expected Fisher Information adalah sebagai berikut:
Pemisalan matriks
Penduga koefisien
Nilai dugaan koefisien
jadi, formulasi fisher scoring untuk menduga koefisien
Equation 8 sering disebut sebagai Iteratively Reweighted Least Squares (IRLS).
Algoritme IRLS dapat dituliskan sebagai berikut:
Tentukan perkiraan awal nilai optimal
dan stopping criterionTentukan
danHitung
sehingga diperoleh perkiraan nilai optimalLakukan Langkah 5 sampai stopping criterion terpenuhi
Hitung
untuk iterasiSaat stopping criterion terpenuhi, maka
merupakan nilai penduga bagi parameterRagam dari
dapat diperoleh dari saat stopping criterion terpenuhi.
Sifat Sebaran Asimtotik dari Penduga koefisien
Sifat Sebaran Asimtotik dari Penduga koefisien
Sifat Asimtotik dari MLE
Misalkan
adalah sampel acak dari suatu distribusi dengan parameter . Misalkan menyatakan penduga maksimum likelihood (MLE) dari . Sedemikian sehingga
bersifat konsisten secara asimtotik, yaitu,
tidak bias secara asimtotik, yaitu, Ketika
, mendekati peubah acak normal. Lebih tepatnya, peubah acak acak berkonvergensi dalam distribusi ke .
Berdasarkan sifat asimtok MLE ketiga maka dapat disimpulkan bahwa