Sahte regresyon

Sahte regresyon kullanımı olduğu bir durumu ifade eder zaman serileri olmayan sabit bir yer lineer regresyon bu durum böyle değil ise değişkenler arasında ilişki inanıyoruz fazla iyimser hatalı sonuçların gösterdi.

Tarihi

Granger ve Newbold, 1974'te, zaman serilerinin birçok istatistiksel çalışmasının yanlış sonuçlar gösterdiğini, çünkü verilerin otokorelasyon problemini hesaba katmadığını gösterdi. Gerçekten de, güçlü bir otokorelasyonla, indeks ve katsayılar üzerindeki testler fazla iyimser olma ve aslında sadece yanıltıcı olan değişkenler arasındaki bir ilişkiye inanma eğilimindedir . $R ^ {2}$

Açıklama

: İki zaman serisi arasındaki doğrusal regresyon yapılmasının arzu ile bir beyaz gürültü . ${\ displaystyle Y_ {t} = aX_ {t} + \ epsilon _ {t} \ qquad}$ $\ epsilon _ {t}$

Eğer ve ikisi entegre değişkenler sırayla 1 , katsayı tahmincisi klasik dağılımı uyarınca artık Öğrencinin hukuk , ancak uygun Brown hareketi . Bununla birlikte, Öğrenci dağılımını kullanmak kesinlikle bu çok iyi sonuçlara yol açar. $YT}$ ${\ displaystyle X_ {t}}$

Gerçekten de, geleneksel durumda, yakınsama tahmincisi arasında en küçük kareler numunenin varyans-kovaryans matrisi 'biz Ω bu almak nüfusun varyans-kovaryans matrisi eğilimi olmasından gösterilmiştir â = σ ε ² · ( X ' X ) −1 . Bununla birlikte, 1. dereceden entegre bir sabit olmayan değişkenin varyansı sabit değildir ve bu nedenle tahminci, Philips'in (1986) gösterdiği gibi, kalıntıların kendilerinin 1. dereceden entegre olmaları nedeniyle olasılıkta yakınsak değildir. Sonuç olarak Student ve Fisher'in testleri de yetersiz kalıyor.

Çözüm

Sorunun etrafında birkaç yol var. Değişkenler 1. sıraya göre entegre edilmişse, farklılıklarının serisi durağan olacaktır (entegrasyon sırasının tanımı gereği). Daha sonra, geçerli olabilmesi için fark değişkenleri üzerinde regresyon yapmak yeterlidir.

Değilse, dağıtılmış bir gecikme modeli, yani açıklanan değişken ve açıklayıcı değişkenin gecikmelerini de içeren bir model kullanmak mümkündür. (Hamilton, 1994, sayfa 562)

Misal

Ücretsiz R istatistik yazılımı ile bir simülasyon olguyu göstermektedir:

Rastgele oluşturulan iki beyaz sesin gerilemesi

Görüntülenen sonuç

R kodu

Çağrı: lm (formül = x ~ y)

Kalıntılar

Min.	1Ç	Medyan	3Ç	Max
-2.776e + 00	-6.140e-01	-1.208e-03	6.279e-01	3.205e + 00

Katsayılar

	Tahmin	Std. Hata	t değeri	Pr (> \| t \|)
(Tutmak)	0,03447376	0,04348857	0,79270862	0,42832508
y	-0.04997771	0,04306249	-1.16058589	0,24636639

Kalan standart hata: 498 serbestlik derecesinde 0.972

Çoklu R-kare: 0.0027, Düzeltilmiş R-kare: 0.000695

F istatistiği: 1 ve 498 DF'de 1.35, p değeri: 0.246

İki beyaz sesi gerilediğimiz bu örnekte, ilişki reddedilir: R 2 = 0,002 7 ve y = 0 olasılığı% 24'tür.

Rastgele oluşturulmuş iki rastgele yürüyüşün gerilemesi

Görüntülenen sonuç

R kodu

Çağrı: lm (formül = x2 ~ y2)

Kalıntılar

Min.	1Ç	Medyan	3Ç	Max
-1.357. + 01	-6.564. + 00	-1.047. + 00	6.846e + 00	1.631e + 01

Katsayılar

	Tahmin	Std. Hata	t değeri	Pr (> \| t \|)
(Tutmak)	-1.591223e + 01	7.543316e-01	-2.109447e + 01	4.727110e-71
y2	-5.255336e-01	3.562320e-02	-1.475257e + 01	3.990599e-41

Kalan standart hata: 498 serbestlik derecesinde 7,49

Çoklu R-kare: 0.304, Düzeltilmiş R-kare: 0.303

F istatistiği: 1 ve 498 DF'de 218, p değeri: <2e-16

set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem summary(lm(x2~y2)) #Régression linéaire

Öte yandan , burada 1. derecenin entegre süreçleri olan rastgele yürüyüşlerin regresyonunun önemli bir ilişki gösterdiğini fark ediyoruz : R 2 = 0.304 katsayısı ve y'nin sıfır olma olasılığı% 0.000.000 1'den azdır. değişkenler arasında bir ilişki olduğunu düşündürür. Kendi başına regresyonun mantıklı olup olmadığını test eden Fisher'in istatistiği de çok güçlü bir şekilde reddedilir.

Rastgele oluşturulan iki rastgele yürüyüşün farklılıklarının gerilemesi

Görüntülenen sonuç

R kodu

Çağrı: lm (formül = x3 ~ y3)

Kalıntılar

Min.	1Ç	Medyan	3Ç	Max
-3.503. + 00	-6,791e-01	-9.397e-03	6.483e-01	3,133e + 00

Katsayılar

	Tahmin	Std. Hata	t değeri	Pr (> \| t \|)
(Tutmak)	0,009479887	0,046269837	0.204882665	0,837747679
y3	0,091363533	0,048239919	1,893940415	0,058813318

Kalan standart hata: 497 serbestlik derecesinde 1.03

Çoklu R-kare: 0.00717, Düzeltilmiş R-kare: 0.00517

F istatistiği: 1 ve 497 DF'de 3,59, p değeri: 0,0588

Rastgele yürüyüşlerin farklılıklarını gerilediğimizde, artık görünür bir ilişki sorunumuz kalmaz: Fisher ve Student istatistikleri daha az güçlü bir şekilde reddedilir ve her şeyden önce R 2 katsayısı 0,007 17'ye eşittir, bu da şu sonuca götürür: bu değişkenler arasında bir ilişki yoktur.

Notlar ve referanslar

Granger, CWJ, Newbold, P. (1974): "Ekonometride Sahte Regresyonlar", Journal of Econometrics , 2, 111-120

Ayrıca görün

Kaynakça

Philips PCB, " Ekonometride Sahte Regresyonu Anlamak ", Journal of Econometrics , cilt. 33,1986, s. 311-340
Hamilton (1994), Zaman Serisi Analizi, Princeton University Press

İlgili Makaleler

Zaman serisi