Maksimum düzenlenmiş

In matematik , bir regularize maksimum ( en fazla yumuşatmak bir bir) endeksli ailesinin x 1 , ...,  x n sayılarının bir olan pürüzsüz yaklaşım içinde maksimum fonksiyonu max ( x 1 , ..., x n ) , yani fonksiyonların parametreli bir aile m α ( x 1 , ..., x , n ) fonksiyonu öyle ki m α herhangi bir gerçek değer normal olan a ve en fazla işlevine doğru eğilimi α → ∞ iken . Düzenlenmiş minimum kavramı benzer bir şekilde tanımlanabilir. Birkaç durumda, iki işlevi yaklaşık olarak hesaplamak için bir aile kullanılabilir; çok büyük pozitif değerler için maksimum, minimum negatif sonsuza doğru:

Terim, parametrelendirilmeden maksimum işleve benzer şekilde davranan herhangi bir düzenleyici işlev için kullanılabilir.

Örnekler

Parametresi büyük değerler için α > 0 , işlev S α aşağıda tanımlanan, bazen “  α -softmax” terimi, bir düz ve bir türevlenebilir yaklaşım maksimum fonksiyonunun. Mutlak değerde büyük olan parametrenin negatif değerleri için minimuma yaklaşır. Α -softmax işlevi şu şekilde tanımlanır:

S α aşağıdaki özelliklere sahiptir:

  1. S 0 döner aritmetik ortalaması

S α'nın gradyanı softmax fonksiyonuna bağlıdır ve şuna eşittir :

Bu, softmax işlevini gradyan iniş kullanan optimizasyon teknikleri için ilginç kılar .

Hölder standartları

Düzenlenmiş bir maksimum biçimi, genelleştirilmiş bir ortalamaya dayalı olabilir . Örneğin, pozitif değerler x 1 , ..., x n için , α > 1 mertebesinde bir ortalama kullanabiliriz , yani

LogSumExp

Başka bir düzenli hale getirilmiş maksimum "LogSumExp" adı altında bilinir:

Fonksiyon, x i'nin tümü pozitifse normalize edilebilir, bu da [0, + ∞ [ n - [0, + ∞ [ :

Terimi, ( n - 1) dikkate almak için bir düzeltme katsayısıdır exp (0) 1 = böylece biz sahip olmasını sağlayarak, g (0, ..., 0) = 0 , tüm eğer x i sıfırdır.

LogSumExp işlevi, yapaylıkların düzgünleştirilmesini önlemek için ayarlanabilir. Bu forma "  α -quasimax" adını veriyoruz.

Sayısal yöntemlerde kullanın

Düzgün maksimumlar, ayrık veri kümeleri veya gradyan iniş optimizasyon algoritmaları üzerindeki ekstrema aramalarda ilgi çekicidir.

Ayrıca görün

Referanslar

  1. (tr) M. Lange, D. Zühlke, O. Holz ve T. Villmann, “  uygulamaları l p gradyanının -norms ve düz yaklaşımları vektör nicemleme öğrenme bazlı  ” , Proc. ESANN ,2014, s.  271-276 ( çevrimiçi okuyun )
  2. (in) Gabor Takacs '  maksimum sınıflandırma, regresyon ve ortak filtreleme göre algoritmaları Yumuşak  " , Açta Technica Jaurinensis , Vol.  3, n o  1,2010, s.  27-63


<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">