Hareket tahmini

Hareket tahmini veya hareket kestirimi (in) arayan grup, videodaki nesnelerin yerinden incelenmesinden oluşmaktadır bir süreçtir korelasyon içerikleri pozisyonunda değişikliği tahmin iki ardışık görüntü arasında. Hareket, üç boyutlu bir bağlamı tanımladığından, görüntüler 2B düzlemde 3B sahnelerin bir projeksiyonu olduğu için videoda kötü bir şekilde ortaya konan bir sorundur. Genel olarak, iki boyutlu bir görüntüden diğerine dönüşümü tanımlayan bir hareket vektörü ile temsil edilir . Hareket vektörleri, blokları aynı görüntüye yansıtarak iki bloğu birbirine bağlar, yani vektörün koordinatları zaman kısıtlamaları olmaksızın yalnızca uzamsal olarak tanımlanır. Söz konusu bloklar, algoritmaya bağlı olarak farklıdır: tüm görüntü, küresel hareket tahmininde olduğu gibi vektöre veya dikdörtgen bloklar, rastgele şekiller ve hatta piksel başına gibi görüntünün sadece belirli kısımlarına bağlanabilir . Vektörler, geleneksel bir modelle veya yakınlaştırmayı unutmadan üç boyutlu döndürme ve öteleme gibi gerçek bir video kameranın hareketine yaklaşabilen diğer birçok modelle temsil edilebilir . Bu tahmin tekniği temel olarak video sıkıştırma , robotik ve görüntü işlemede kullanılır . En iyi bilinen Blok Eşleştirme ve Optik Akış olmak üzere birkaç hareket kestirim yöntemi vardır .

Uygulama alanları

Video sıkıştırmada, hareket tahmini, hareketi tahmin etmek ve böylece verileri uzamsal tahmine göre daha verimli bir şekilde sıkıştırmak için önceden kodlanmış görüntülerin zamansal fazlalığından yararlanmaya çalışan ara tahmin sürecinin bir parçasıdır . Teknik olarak, algoritma , kaynak görüntünün bir bloğuna benzer bir bloğu sözde referans görüntüsünde arar ve kodlamak için bunları birbirine bağlayan hareket vektörünü kaydeder . Hareket tahminini, sonraki görüntünün dönüşümünü sentezlemek için görüntüye bulunan hareket vektörlerini uygulamayı amaçlayan hareket telafisi izler . Diğer bir deyişle, vektörler tarafından hedeflenen bloklar tarafından tanımlanan görüntü, genellikle kaynak görüntü ile aynı değildir. Bir görüntünün kodunu çözebilmek için, hedeflenen bloklar ile kaynak bloklar arasındaki farkı belirlemek ve onu kodlamak gerekir. MPEG-1 , MPEG-2 ve MPEG-4 dahil olmak üzere çeşitli video standartlarında ve ayrıca birçok video kodeklerinde mevcuttur .

Hareket kestirimi, aynı zamanda, hedef nesnelerin görüntü işlemede ve daha kesin olarak taslaklarının tanımlanmasında da kullanılır. Esas olarak bir görüntüdeki bölümleme ve filtreleme teknikleriyle ilgilidir .

Robotikte bu süreç, modelin dış çevre ile etkileşimini iyileştirmek için nesnelerin yer değiştirmesini veya konumunu tahmin etmeyi mümkün kılar.

Mevcut algoritmalar

Hareket vektörlerini bulmaya yönelik arama algoritmaları iki kategoride tanımlanabilir: sözde doğrudan piksel tabanlı yöntemler ve sözde dolaylı içeriğe dayalı yöntemler .

Doğrudan yöntemler

Optik akış

Hareket tahminine en yakın teknik , vektörleri piksel düzeyinde algılanan harekete karşılık gelen optik akış olarak adlandırılır . Hareket tahmininde, her bir görüntüdeki piksellerin konumunun tam olarak uyuşması bir zorunluluk değildir.

Blok eşleştirme

Blok-Eşleştirme algoritması bir korelasyon yöntemi olduğunu en yakın güncel bloğa referans görüntüde benzer blok için arar. Mevcut görüntü, her bir bloğu oluşturan piksellerin aynı hareket hızına sahip olduğu bağımsız bloklar olarak görülen, birbiriyle örtüşmeyen aynı büyüklükteki bloklara bölünmüştür. Uygulama genellikle donanım performansı nedeniyle mevcut bloğun etrafına çizilen bir arama penceresi ile sınırlıdır. En iyi benzer blokları belirlemek için algoritma, kaynak blok ile diğer bloklar arasındaki farkı SAD gibi bir kalite kriteri kullanarak karşılaştırır ve bu kuralı en aza indiren hedeflenen blok korunur.

Diğer teknikler Değerlendirme önlemleri

Bir blok için en iyi hareket vektörünü değerlendirmek için, doğrudan yöntemler için birkaç değerlendirme kriteri vardır:

Dolaylı yöntemler

Dolaylı yöntemler, Harris dedektörü gibi içeriği kullanır ve genellikle küresel veya yerel bir alana uygulanan istatistiksel bir işlevle her çerçeve arasında benzer içerik bulur. Bu işlevin amacı, mevcut harekete karşılık gelmeyen bölgeleri kaldırmaktır. İstatistiksel fonksiyonlar, RANSAC yöntemlerinde de kullanılır .

Notlar ve referanslar

  1. (in) PHS Torr ve A. Zisserman , "  Özellik Yapısı ve Hareket tahmini yöntemleri Tabanlı  " [PDF] üzerine ox.ac.uk (erişilen 26 Ocak 2011 tarihinde )
  2. (in) Mr. Irani ve P. Anandan, "  All About Direct Methods  " [PDF] , wisc.edu'da ( 26 Ocak 2011'de erişildi )

Ekler

Kaynaklar

  • (en) EG Richardson, H.264 ve MPEG-4 Video Sıkıştırma: Yeni Nesil Multimedya için Video Kodlama , Chichester, John Wiley & Sons Ltd.,Eylül 2003( ISBN  0-470-84837-5 )

İlgili Makaleler