Sahte regresyon kullanımı olduğu bir durumu ifade eder zaman serileri olmayan sabit bir yer lineer regresyon bu durum böyle değil ise değişkenler arasında ilişki inanıyoruz fazla iyimser hatalı sonuçların gösterdi.
Granger ve Newbold, 1974'te, zaman serilerinin birçok istatistiksel çalışmasının yanlış sonuçlar gösterdiğini, çünkü verilerin otokorelasyon problemini hesaba katmadığını gösterdi. Gerçekten de, güçlü bir otokorelasyonla, indeks ve katsayılar üzerindeki testler fazla iyimser olma ve aslında sadece yanıltıcı olan değişkenler arasındaki bir ilişkiye inanma eğilimindedir .
: İki zaman serisi arasındaki doğrusal regresyon yapılmasının arzu ile bir beyaz gürültü .
Eğer ve ikisi entegre değişkenler sırayla 1 , katsayı tahmincisi klasik dağılımı uyarınca artık Öğrencinin hukuk , ancak uygun Brown hareketi . Bununla birlikte, Öğrenci dağılımını kullanmak kesinlikle bu çok iyi sonuçlara yol açar.
Gerçekten de, geleneksel durumda, yakınsama tahmincisi arasında en küçük kareler numunenin varyans-kovaryans matrisi 'biz Ω bu almak nüfusun varyans-kovaryans matrisi eğilimi olmasından gösterilmiştir â = σ ε ² · ( X ' X ) −1 . Bununla birlikte, 1. dereceden entegre bir sabit olmayan değişkenin varyansı sabit değildir ve bu nedenle tahminci, Philips'in (1986) gösterdiği gibi, kalıntıların kendilerinin 1. dereceden entegre olmaları nedeniyle olasılıkta yakınsak değildir. Sonuç olarak Student ve Fisher'in testleri de yetersiz kalıyor.
Sorunun etrafında birkaç yol var. Değişkenler 1. sıraya göre entegre edilmişse, farklılıklarının serisi durağan olacaktır (entegrasyon sırasının tanımı gereği). Daha sonra, geçerli olabilmesi için fark değişkenleri üzerinde regresyon yapmak yeterlidir.
Değilse, dağıtılmış bir gecikme modeli, yani açıklanan değişken ve açıklayıcı değişkenin gecikmelerini de içeren bir model kullanmak mümkündür. (Hamilton, 1994, sayfa 562)
Ücretsiz R istatistik yazılımı ile bir simülasyon olguyu göstermektedir:
Rastgele oluşturulan iki beyaz sesin gerilemesiGörüntülenen sonuç | R kodu | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Çağrı: lm (formül = x ~ y) Kalıntılar
Katsayılar
Kalan standart hata: 498 serbestlik derecesinde 0.972 Çoklu R-kare: 0.0027, Düzeltilmiş R-kare: 0.000695 F istatistiği: 1 ve 498 DF'de 1.35, p değeri: 0.246 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc summary(lm(x~y)) #Régression linéaire |
İki beyaz sesi gerilediğimiz bu örnekte, ilişki reddedilir: R 2 = 0,002 7 ve y = 0 olasılığı% 24'tür.
Rastgele oluşturulmuş iki rastgele yürüyüşün gerilemesiGörüntülenen sonuç | R kodu | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Çağrı: lm (formül = x2 ~ y2) Kalıntılar
Katsayılar
Kalan standart hata: 498 serbestlik derecesinde 7,49 Çoklu R-kare: 0.304, Düzeltilmiş R-kare: 0.303 F istatistiği: 1 ve 498 DF'de 218, p değeri: <2e-16 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem summary(lm(x2~y2)) #Régression linéaire |
Öte yandan , burada 1. derecenin entegre süreçleri olan rastgele yürüyüşlerin regresyonunun önemli bir ilişki gösterdiğini fark ediyoruz : R 2 = 0.304 katsayısı ve y'nin sıfır olma olasılığı% 0.000.000 1'den azdır. değişkenler arasında bir ilişki olduğunu düşündürür. Kendi başına regresyonun mantıklı olup olmadığını test eden Fisher'in istatistiği de çok güçlü bir şekilde reddedilir.
Rastgele oluşturulan iki rastgele yürüyüşün farklılıklarının gerilemesiGörüntülenen sonuç | R kodu | |||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Çağrı: lm (formül = x3 ~ y3) Kalıntılar
Katsayılar
Kalan standart hata: 497 serbestlik derecesinde 1.03 Çoklu R-kare: 0.00717, Düzeltilmiş R-kare: 0.00517 F istatistiği: 1 ve 497 DF'de 3,59, p değeri: 0,0588 |
set.seed(123) #Conditionnement du compteur aléatoire pour obtenir les mêmes valeurs que l'exemple x<-rnorm(500) #Simulation d'un bruit blanc y<-rnorm(500) #Simulation d'un bruit blanc x2<-cumsum(x) #Génération d'une marche aléatoire à partir du bruit blanc : somme cumulée y2<-cumsum(y) #idem x3<-diff(x2) #Série des différences de la marche aléatoire y3<-diff(y2) #idem summary(lm(x3~y3)) #Régression linéaire |
Rastgele yürüyüşlerin farklılıklarını gerilediğimizde, artık görünür bir ilişki sorunumuz kalmaz: Fisher ve Student istatistikleri daha az güçlü bir şekilde reddedilir ve her şeyden önce R 2 katsayısı 0,007 17'ye eşittir, bu da şu sonuca götürür: bu değişkenler arasında bir ilişki yoktur.