Pendugaan generalized linear model dengan Iteratively Reweighted Least Squares

Author

Gerry Alfa Dito

Published

September 2, 2023

Generalized Linear Model

Generalized Linear Model (GLM) adalah perluasan dari model regresi linear, yang memungkinkan pemodelan peubah respons yang tidak harus berdistribusi normal.

GLM terdiri dari tiga komponen utama yaitu:

  1. Komponen Acak: Menentukan distribusi peluang dari peubah respons Y. Pada GLM, respons Y berasal dari Exponential (Dispersion) Family atau Keluarga (Dispersi) Eksponensial, yang merupakan generalisasi dari distribusi normal dan mencakup berbagai distribusi seperti binomial, Poisson, normal, gamma, dll.
  2. Komponen Sistematis:Mendefinisikan prediktor linear η, yang merupakan kombinasi linear dari peubah penjelas (prediktor). η=Xβ di mana X adalah matriks desain dari prediktor, dan β adalah vektor koefisien.
  3. Fungsi Hubung: Menghubungkan prediktor linear η dengan rata-rata distribusi μ=E(Y|X). Fungsi hubung g(μ) memastikan bahwa kombinasi linear dari prediktor η memetakan secara tepat ke domain μ. g(μ)=η Fungsi hubung umum termasuk logit (untuk hasil biner), log (untuk jumlah kejadian), dan identitas (untuk respon yang memiliki domain bilangan Real).

Keluarga (Dispersi) Eksponensial

Keluarga Dispersi Eksponensial adalah kelas distribusi peluang yang mencakup banyak distribusi umum yang digunakan dalam GLM, termasuk distribusi normal, binomial, Poisson, gamma, dan invers Gaussian. Sebuah peubah acak Y termasuk dalam Keluarga (Dispersi) Eksponensial jika fungsi kepekatan peluang (fkp) atau fungsi massa peluang (fmp)-nya dapat ditulis dalam bentuk berikut:

f(y;θ,ϕ)=exp{yθb(θ)a(ϕ)+c(y,ϕ)}(1)

dengan

  • θ adalah natural parameter
  • ϕ adalah dispersion parameter
  • b(.) adalah cumulant function
  • c(yi,ϕ)adalah normalizing function yang memastikan integral dari fkp sama dengan 1.

Distribusi yang termasuk dalam keluarga ini memiliki sifat-sifat antara lain:

E(y)=ddθb(θ)=b(θ)Var(y)=[d2dθ2b(θ)]a(ϕ)=b(θ)a(ϕ)

Fungsi log-likelihood dan Score Function

Fungsi log-likelihood dari Exponential dispersion family untuk n pengamatan dapat dituliskan sebagai

l(θ)=i=1nyiθib(θi)a(ϕ)+i=1nc(yi,ϕ)(2)

Kemudian, score function dari dapat diturunkan sebagai berikut

S(θ)=ddθl(θ)=ddθi(i=1nyiθib(θi)a(ϕ)+i=1nc(yi,ϕ))=i=1nyib(θi)a(ϕ)+0=i=1nyib(θi)a(ϕ)

Selanjutnya, untuk memasukan unsur GLM dalam , mari kita perhatikan hubungan antara natural parameter θ, fungsi hubung g(.), mean μ=E(Y) dan komponen sistematis η berikut ini:

η=g(μ)g(μ)=η=i=1pxijβjg1(g(μ))=g1(i=1pxijβj)μ=g1(i=1pxijβj)

Misalkan fungsi hubung g(.) merupakan fungsi hubung kanonik, yang didefinisikan sebagai g(μ)=θ sehingga berimplikasi bahwa

θ=g(μ)=η=i=1pxijβj(3)

Kemudian, berdasarkan diperoleh

θi=i=1pxijβj

sehingga fungsi log-likelihood menjadi

l(β)=i=1nyi(i=1pxijβj)b(i=1pxijβj)a(ϕ)+i=1nc(yi,ϕ)

Kemudian untuk mendapatkan score function dihitung turunan pertama dari fungsi log-likelihood dengan aturan rantai turunan

S(β)=dl(θ)dθdθdμdμdηdηdβ(4)

Aturan rantai pada terbentuk dari hubungan antara θ,μ, dan η pada . Selanjutnya, karena diketahui dl(θ)dθ=S(θ)=i=1nyib(θi)a(ϕ)dθdμ=1dμdθ=1db(θ)dθ=1b(θ)dηdβ=(i=1pxijβj)dβ=xij

maka diperoleh hasil sebagai berikut

S(β)=i=1nyib(θi)a(ϕ)dθdμdμdηdηdβ=i=1nyib(θi)a(ϕ)1b(θi)dμdηdηdβ=i=1nyib(θi)a(ϕ)1b(θi)dμdηxij=i=1nyib(θi)a(ϕ)1b(θi)xijdμdη=i=1nyiμia(ϕ)(a(ϕ)Var(yi))xijdμdη=i=1nyiμiVar(yi)xijdμdη dμdη bergantung pada pemilihan fungsi hubung g(.) karena g(μ)=η.

Jadi dapat disimpulkan bahwa score function dalam GLM adalah

S(β)=i=1nyiμiVar(yi)xijdμdη(5)

atau dalam bentuk matriks dapat dinyatakan sebagai

Sp×1=Xp×ntDn×n(Vn×n)1(yn×1μn×1)(6)

dengan
  • Xn×p=[1x11x12x1p1x21x22x2p1xn1xn2xnp]

  • Dn×n=[dμ1dη1000dμ2dη2000dμndηn]

  • (Vn×n)1=[1Var(y1)0001Var(y2)0001Var(yn)]

  • yn×1=[y1y2yn]

  • μn×1=[μ1μ2μn]=[g1(X1:1,1:p βp×1)g1(X2:2,1:p βp×1)g1(Xn:n,1:p βp×1)]=g1(Xn×p βp×1)

Hubungan Mean-Ragam dalam GLM

Dari sifat keluarga dispersi eksponensial, kita tahu bahwa E(yi)=μi=b(θi)Var(yi)=b(θi)a(ϕ)

Karena b(θi) didapatkan dari turunan pertama μi maka dapat dipandang b(θi) merupakan fungsi dari μi. Kemudian, kita misal suatu fungsi ν sebagai fungsi dari μi yang berkaitan dengan b(θi) maka

Var(yi)=b(θi)a(ϕ)=ν(μi)a(ϕ)(7)

Persamaan menunjukkan hubungan antara mean-ragam. Hubungan ini dapat menjadi karakteristik sebaran-sebaran tertentu yang masuk dalam keluarga dispersi eksponensial. Misalnya

  • jika yi Poisson distribution maka v(μi)=μi
  • jika yi Binomial distribution maka v(μi)=μi(1μi)
  • jika yi Normal distribution maka v(μi)=σ2

Selanjutnya, menyebabkan

(Vn×n)1=[1Var(y1)0001Var(y2)0001Var(yn)]=[1ν(μ1)a(ϕ)0001ν(μ2)a(ϕ)0001ν(μn)a(ϕ)]

Expected Fisher Information

Kemudian kita akan menghitung turunan pertama dari @#eq-sfglm2 untuk mendapatkan Observed Fisher Information Fisher

Ip×p=I(β)=ddβSp×1=ddβ(Xp×ntDn×n(Vn×n)1(yn×1μn×1))karena Xp×ntDn×n(Vn×n)1 tidak mengandung β maka =Xp×ntDn×n(Vn×n)1ddβ(yn×1μn×1)=Xp×ntDn×n(Vn×n)1(ddβyn×1ddβμn×1)=Xp×ntDn×n(Vn×n)1(ddβμn×1)=Xp×ntDn×n(Vn×n)1(dμn×1dη)(dηn×1dβ)=Xp×ntDn×n(Vn×n)1(dμn×1dη)(dXn×pβp×1dβ)=Xp×ntDn×n(Vn×n)1(dμn×1dη)(Xn×p) karena dμn×1dη=Dn×n maka =Xp×ntDn×n(Vn×n)1Dn×n(Xn×p) jadi Observed Fisher Information dihasilkan adalah

Ip×p=Xp×ntDn×n(Vn×n)1Dn×n(Xn×p)

Selanjutnya untuk mendapatkan Expected Fisher Observed, kita akan menghitung ekspetasi dari Observed Fisher Information sebagai berikut:

Ip×p=E(I)=E(Xp×ntDn×n(Vn×n)1Dn×n(Xn×p))=E(Xp×ntDn×n(Vn×n)1Dn×n(Xn×p))karena tidak mengandung yn×1 maka =Xp×ntDn×n(Vn×n)1Dn×n(Xn×p) untuk simplifikasi, kita misalkan

Wn×n=Dn×n(Vn×n)1Dn×n=[dμ1dη1000dμ2dη2000dμndηn][1ν(μ1)a(ϕ)0001ν(μ2)a(ϕ)0001ν(μn)a(ϕ)][dμ1dη1000dμ2dη2000dμndηn]=[(μ1η1)2var(μ1)a(ϕ)000(μ2η2)2var(μ2)a(ϕ)000(μnηn)2var(μn)a(ϕ)]

sehingga

Ip×p=Xp×ntDn×n(Vn×n)1Dn×n(Xn×p)=Xp×ntWn×nXn×p dengan

Wn×n=[(μ1η1)2var(μ1)a(ϕ)000(μ2η2)2var(μ2)a(ϕ)000(μnηn)2var(μn)a(ϕ)]

jadi Expected Fisher Information adalah sebagai berikut:

Ip×p=Xp×ntWn×nXn×p

Pemisalan matriks Wn×n juga berakibat pada score function.

Wn×n=Dn×n(Vn×n)1Dn×nWn×nDn×n1=Dn×n(Vn×n)1Dn×nDn×n1=Dn×n(Vn×n)1 Sehingga score function menjadi

Sp×1=Xp×ntDn×n(Vn×n)1(yn×1μn×1)=Xp×ntWn×nDn×n1(yn×1μn×1)

Penduga koefisien β

Nilai dugaan koefisien β dapat dihitung dengan menggunakan metode Fisher Scoring. Berikut adalah formulasinya

βp×1(i+1)=βp×1(i)+[Ip×p(i)]1Sp×1=βp×1(i)+[Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(Dn×n(i))1(yn×1μn×1(i))][Xp×ntWn×n(i)Xn×p]βp×1(i+1)=[Xp×ntWn×n(i)Xn×p]βp×1(i)+[Xp×ntWn×n(i)Xn×p][Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(Dn×n(i))1(yn×1μn×1(i))]=[Xp×ntWn×n(i)Xn×p]βp×1(i)+[Xp×ntWn×n(Dn×n(i))1(yn×1μn×1(i))]=[Xp×ntWn×n(i)][Xn×pβp×1(i)+(Dn×n(i))1(yn×1μn×1(i))] misal zn×1=Xn×pβp×1(i)+(Dn×n(i))1(yn×1μn×1(i))=[Xp×ntWn×n(i)]zn×1(i)[Xp×ntWn×n(i)Xn×p]βp×1(i+1)=[Xp×ntWn×n(i)]zn×1(i)[Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(i)Xn×p]βp×1(i+1)=[Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(i)]zn×1(i)βp×1(i+1)=[Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(i)]zn×1(i)

jadi, formulasi fisher scoring untuk menduga koefisien β adalah

βp×1(i+1)=[Xp×ntWn×n(i)Xn×p]1[Xp×ntWn×n(i)]zn×1(i)(8)

sering disebut sebagai Iteratively Reweighted Least Squares (IRLS).

Algoritme IRLS dapat dituliskan sebagai berikut:

  1. Tentukan perkiraan awal nilai optimal βp×1(0) dan stopping criterion

  2. Tentukan Wn×n(0) dan zn×1(0)

  3. Hitung βp×1(1)={Xp×ntWn×n(0)Xn×p}1Xp×ntWn×n(0)zn×1(0) sehingga diperoleh perkiraan nilai optimal βp×1(1)

  4. Lakukan Langkah 5 sampai stopping criterion terpenuhi

  5. Hitung βp×1(i+1)={Xp×ntWn×n(i)Xn×p}1Xp×ntWn×n(i)zn×1(i) untuk iterasi i=1,2,

  6. Saat stopping criterion terpenuhi, maka βp×1(i+1) merupakan nilai penduga bagi parameter βp×1

  7. Ragam dari βp×1 dapat diperoleh dari Var(βp×1)=(Xp×ntWn×n(m)Xn×p)1 saat stopping criterion terpenuhi.

Sifat Sebaran Asimtotik dari Penduga koefisien β

Sifat Sebaran Asimtotik dari Penduga koefisien β diturunkan dari sifat asimtotik ML (Maximum Likelihood) yaitu

Sifat Asimtotik dari MLE

Misalkan X1,X2,X3,,Xn adalah sampel acak dari suatu distribusi dengan parameter θ. Misalkan θ^ML menyatakan penduga maksimum likelihood (MLE) dari θ. Sedemikian sehingga

  1. θ^ML bersifat konsisten secara asimtotik, yaitu, limnP(|θ^MLθ|>ϵ)=0.

  2. θ^ML tidak bias secara asimtotik, yaitu, limnE[θ^ML]=θ.

  3. Ketika n , θ^ML mendekati peubah acak normal. Lebih tepatnya, peubah acak acak θ^MLθVar(θ^ML) berkonvergensi dalam distribusi ke N(0,1).

Berdasarkan sifat asimtok MLE ketiga maka dapat disimpulkan bahwa

β^p×1βp×1(Xp×ntWn×n(m)Xn×p)1nN(0,1) Sehingga untuk melakukan pengujian koefisien akan menggunakan sebaran z.