Yerel regresyon

Yerel regresyon veya Lös , yöntemidir parametrik olmayan regresyon kuvvetle meta modelinde birleştirir birkaç çoklu regresyon modelleri dayalı olduğu bağlı yöntemine k komşuları yakın . “LOESS”, “LOcally Estimated Scatterplot Smoothing” in kısaltmasıdır.

Yerel regresyon, ikincisinin uygun olmadığı durumlarda, doğrusal veya doğrusal olmayan en küçük kareler regresyonu gibi olağan regresyon yöntemlerine olası bir alternatiftir . Doğrusal en küçük kareler regresyonunun basitliğini doğrusal olmayan regresyon esnekliğiyle birleştirerek yerel veri alt kümeleri üzerinde basit regresyon gerçekleştirir. Bu yöntemin temel avantajlarından biri, regresyon modelini tanımlayacak tek bir global işlevi tanımlamayı gereksiz kılmasıdır, çünkü yöntem, veri segmentleri olduğu kadar çok sayıda yerel işlevi hesaplamaktan oluşur.

Yerel regresyon ilkesi ilk olarak William S. Cleveland (1979) tarafından tanımlanmış , daha sonra Cleveland (1981) ve Cleveland ve Devlin (1988) tarafından geliştirilmiş ve zenginleştirilmiştir.

Yerel regresyon modelinin tanımı

Yerel regresyon, yerel ağırlıklandırma ile polinom regresyon olarak da adlandırılır. İlk veri setinin her noktası için, verilerin bir alt kümesinin regresyonunu gerçekleştirmek için düşük dereceli bir polinomun katsayılarının belirlenmesinden oluşur , rastgele değişkenlerin değerleri regresyonun yapıldığı noktaya yakın, daha sonra bu polinomun dikkate alınan nokta için değerini hesaplamak. Polinomun katsayıları, ağırlıklı en küçük kareler yöntemi kullanılarak hesaplanır ; bu, cevabı tahmin edilen noktaya yakın noktalara daha fazla ağırlık verir ve daha uzak noktalara daha az ağırlık verir.

Polinomun derecesi veya ağırlık katsayıları gibi yerel regresyon yönteminin birçok öğesi yapılandırılabilir. Genel olarak, 1. derece (yerel olarak doğrusal) veya 2 (yerel olarak ikinci dereceden) polinomları kullanılır, daha yüksek dereceler her bir alt kümenin verilerini aşma eğilimindedir ve derece 0, ağırlıklı hareketli ortalamaların hesaplanmasıyla sonuçlanır .

Ağırlıklandırma, yakın noktaların uzak noktalardan daha basit bir şekilde birbirine bağlanma olasılığının daha yüksek olduğu fikrine dayanmaktadır. Bu ilkeye uyulduğunda, yerel modelin parametrelerini tahmin etmek için modele karşılık gelmesi daha muhtemel olan noktalara daha büyük bir ağırlık atanır.

Genellikle bir yerel regresyon gerçekleştirmek için kullanılan ağırlıklandırma işlevi, ağırlıklı bir kübik fonksiyondur :

w (x) = (1- | x | ^ {3}) ^ {3} \ operatöradı {I} \ sol [\ sol | x \ sağ | <1 \ sağ]

Bununla birlikte, Cleveland tarafından listelenen özellikleri karşılayan başka herhangi bir ağırlıklandırma fonksiyonunu kullanmak mümkündür. Yerel bir alt kümenin belirli bir noktasının ağırlığı, bu nokta ile tahmin noktası arasındaki mesafe ile ağırlıklandırma fonksiyonunun değeri hesaplanarak, mesafenin ölçeklendirilmesinden sonra, verilerin tüm noktalarındaki maksimum mutlak mesafe alt küme tam olarak 1'e eşittir.

Faydaları

Yerel regresyonun diğer birçok yönteme göre en büyük avantajı, bir modeli örneklemdeki veri setine uydurmak için global bir fonksiyon tanımlamayı gerektirmemesidir. Yalnızca yumuşatma parametresinin değerini ve yerel polinomun derecesini belirtmeyi gerektirir. Yerel regresyon yönteminin uygulanması da çok esnektir ve uygulaması nispeten basittir.

Dahası, en küçük kareler regresyonlarına dayandığı ölçüde, yerel regresyon da bu regresyon yöntemleriyle ilgili araçların çoğundan, özellikle de tahmin ve kalibrasyon belirsizliklerini hesaplama teorisinden yararlanır. En küçük kareler modellerini doğrulamak için kullanılan diğer birçok test ve prosedür de yerel regresyon modellerine genişletilebilir.

Dezavantajları

Diğer en küçük kareler regresyon yöntemlerine göre daha az verimli veri kullanımı sağlayan yerel regresyon, iyi modeller üretebilmek için genellikle daha büyük veri kümeleri gerektirir.

Diğer dezavantajların yanı sıra, yerel regresyon, matematiksel bir formül şeklinde kolayca temsil edilebilen bir regresyon fonksiyonunun oluşturulmasını mümkün kılmaz. Sonuçların diğer insanlara iletilmesi daha da zorlaşır, çünkü daha sonra tüm veri setine ve yerel regresyon hesaplamalarını gerçekleştiren araca ihtiyaç duyarlar.

Ayrıca, diğer en küçük kareler regresyon yöntemlerinde olduğu gibi, yerel regresyon, veri kümesindeki aykırı değerlerin etkilerine tabidir.

Son olarak, yerel regresyon nispeten hesaplama açısından yoğundur ve bu, çok büyük veri kümeleri için sorunlu olabilir.

Ayrıca görün

Referanslar

William S. Cleveland, " Sağlam Yerel Ağırlıklı Regresyon ve Düzleştirici Dağılım Grafikleri " Journal of the American Statistical Association , cilt. 74, n o 368,1979, s. 829–836 ( DOI 10.2307 / 2286407 , JSTOR 2286407 )
William S. Cleveland, " DÜŞÜK: Sağlam yerel ağırlıklı regresyon ile dağılım grafiklerini yumuşatmak için bir program ", Journal of the American Statistical Association , cilt. 35, n o 1,bin dokuz yüz Seksen bir, s. 54 ( DOI 10.2307 / 2683591 , JSTOR 2683591 )
William S. Cleveland ve Susan J. Devlin, " Yerel Ağırlıklı Regresyon: Yerel Uydurma Tarafından Regresyon Analizine Yaklaşım, " Amerikan İstatistik Derneği Dergisi , cilt. 83, n o 403,1988, s. 596–610 ( DOI 10.2307 / 2289282 , JSTOR 2289282 )

Dış bağlantılar