anlambilim

Semantik bir dalıdır dilbilim çalışmalar anlamına biz iletmek istiyorum ne konuşacak, ne, deyimi . Dil yapısının destek sözdizimi , kendi payına kaygılar imleyen , şeklini kendi dil, onun yazım , onun gramer ,  vb  ; bu ifadenin şeklidir.

Özellikle, anlambilimin birkaç çalışma nesnesi vardır:

Anlambilim terimi , biçimsel olarak geliştirildiği bilgisayar dillerinin incelenmesinde sözdizimininkine zıt olarak kullanılır (bakınız programlama dillerinin anlambilimi ). Anlambilim ve sözdizimi arasında içerik ve biçim arasındaki ilişkinin aynısı vardır.

etimoloji

Semantik kelime türetilmiştir Yunan σημαντικός ( sêmantikos kendisi σημαίνω (oluşan, "anlamına") sêmainô "işaret, belirtmek için" veya σῆμα (,) Sema ), "işareti, işaret". O sonunda alındı XIX inci  Fransız dilbilimci tarafından yüzyılın Michel Bréal , ilk antlaşma semantik yazarı semantik testi 1897 yılında ortaya çıktı.

Anlamsal analiz ve ayrıştırma arasındaki fark

Dilbilimde semantik analizin yanı sıra sözdizimsel analizin amacı , esas olarak sözce yapılarını belirleyerek sözceyi bir bütün olarak karakterize etmektir. Her iki durumda da yapıların belirlenmesi, temel öğelerinin, kelimelerin ve kendi bileşenlerinin karakterizasyonuna dayanır, ancak bu iki yaklaşıma göre farklı bir şekilde.

Sözdizimsel analiz , bir cümleyle ilgili olarak ifadelerle ilgilenir . Örneğin, bir cümlede yer almıyorsa, "küçük" kelimesinin sözdizimsel bir analizini yapmak, diğer kelimelerin tamamlayıcıları veya grup liderleri ile ilgili olarak mümkün değildir.

Ayrıştırma, bu nedenle, dilbilgisi kurallarının uygulanması yoluyla elde edilebilecek işlevsel yapıların bir analizi olarak tanımlanabilir.

Semantik analiz ise, anlamın inşasına özgü mekanizmaları gözlemleyerek bu yapılarla ilgilenir. Bir tohum anlam en küçük birimidir.

Semantik kelimesi kelimesine ilgili olabilir.

Misal:

"Küçük" kelimesini şu şekilde analiz edeceğiz:

PETIT (Sıfat ⇒ büyük olmayan) + E (dişil işaret) + S (çoğul işaret) [PETIT - kelimenin kökü veya kökü (sözcük işareti), E + S - dilbilgisi işaretleridir] .

Bu nedenle "küçük" kelimesi için üç sem vardır.

Bu aynı kelimeden, tüm bir ifadeyi mutlaka gün ışığına çıkarmadan başka analizler yapmak mümkündür (karş. giriş).

Burada kurulan sözdizimsel analiz ile anlamsal analiz arasındaki ayrım, çağdaş dilbilimdeki en yaygın yaklaşıma, Ferdinand de Saussure tarafından tanıtılan yapısalcılıktan miras kalan yaklaşıma tekabül eder . Bu teoriye göre semantik analizi gerçekleştirmek için kullanılan yaklaşımı daha doğrudan ifade etmek için eşdeğer olarak kullanılan yapısal analiz veya bileşen analizi terimlerini bulacağız. Yapı, doğrudan cümlenin altında yatan olarak algılanır , ikincisi, sözdizimi veya dilbilgisi tarafından kanıtlandığı gibi bir yapıdır ve kelimenin anlamsal özellikleriyle ilişkili olduğu düşünülür . Gibi öncelikli olarak, başka yaklaşımlar, bağımlılık gramer arasında Lucien TESNIERE , önce structuralism , sözdizimsel yeterlilik yapısı saklıdır. Tesnière için, sözdizimsel düzeye yapısal düzlem denirken, anlamsal düzlemin psikoloji ve aynı zamanda mantıkla ilgili olduğu düşünülür .

Veri madenciliği uygulamaları

Veri araştırma yöntemleri , a priori olarak farklı görünen bir dizi veriyi anlamlandırmayı mümkün kılar (ayrıca bkz. yapay zeka ) ve bu nedenle anlambilim oluşturur . Serbest bırakılan anlambilim, genellikle yapay zekadan kaynaklanan üç biçim alır (biçimsel gösterenler tarafından tercüme edilir):

Bilgiyi temsil etmeleri anlamında gösterenlerdir . Bu tür yapılar daha sonra başlangıç ​​verilerinde açıklanır, ardından her veri ağacın bir dalına, tablonun bir kutusuna vb. ait olduğunun işaretini taşır. Analiz daha sonra daha karmaşık bir anlama düzeyinde devam eder.

Veritabanlarında bilginin keşfi

Ancak, makine yalnızca gösterenleri manipüle ettiğinden, veri madenciliği sürecinin bu alanda uzman bir insan içermesi zorunludur . Bu, çıkarılan semantiği geri yükleyecek ve ona anlam ve değer verecektir. Bu amaçla üç kriter gösterilmektedir:

İdeal olanı HAYIR / EVET / EVET üçlüsüne sahip olmaktır .

Böyle bir projeye "veritabanlarında bilgi keşfi", İngilizce KDD'de, Veritabanlarında Bilgi Keşfi denir .

Son olarak, çıkarılan semantik, bilgi haritalama rolünü oynar, bilgilerin birbiriyle ilişkili olarak konumlandırılmasına izin verir. Bu “kartografik” rol, bilgiyi depolamayı, düzenlemeyi ve daha sonra bulmayı mümkün kılar. Herhangi bir model, kategoriler dizisi, Freudyen topografya , o zaman fiili bir bilgi kartografisidir, yani resmileştirilmiş bir bağlamdır.

Aslında verilerle ilgili veriler, meta veriler . Yönetmek için özel mimariler meta , denir müşteri veya sunucu arasında meta veri . Bilinen bir sistem, Dublin Core Metadata Initiative'dir (DCMI).

Semantik Web oluşturmak, yönetmek ve istifade edilmesine yönelik, DCMI aynı türde bir projedir sistematik meta her biri için bir web sayfası . Böylece, her web sayfasının içeriği gösterenlere açıklandığında, makine artık sözlük istatistiklerine değil, içeriğin uygunluğuna göre akıl yürütebilecektir. Bunun bilgi alma teknolojileri ve arama motorlarının görünümü ve işlevi üzerinde çarpıcı sonuçları olabilir .

Metin kazısının özel durumu

Metin madenciliği, bir "metin" nesnesini, anlamsal veya sözdizimsel işleme kullanarak bir "tablo", "ağaç" veya "grafik" nesnesine dönüştürmek ve ardından bu resmileştirilmiş nesneye metin madenciliği tekniklerini uygulamaktan oluşur. Beklenen sonuçlar genel olarak şunlardır:

Anlamsal yaklaşım, sözdizimsel yaklaşımdan daha verimli bir literatüre sahiptir: ikincisi daha üstün sonuçlara sahip olsa bile, gereken hesaplama kaynakları genellikle ölçekleri anlamsal analiz lehine yönlendirir.

Semantik analiz, bir dizi metni sözlüksel bir matrise dönüştürür  :

Ontolojilerin özel durumu

" Ontoloji  " terimi  felsefi bir anlama sahiptir, ancak bilgi yönetiminde muhtemelen bilginin anlamsal temsilinin en gelişmiş biçimini temsil eder.
Belirli bir sosyal grupta, tipik olarak bir şirkette depolanan, gelen veya giden tüm belgesel prodüksiyonları endekslemeyi amaçlayan bir tür "süper eşanlamlılar"dır. Böylece, aynı temaları paylaşan bir e-posta, bir referans kitabı, bir çalışma belgesi otomatik olarak bağlanacak, bu nedenle bağlama oturtulacak ve böylece anlamsal bilgi serbest bırakılacaktır.
Bir ontolojinin yapılandırılması, kütüphane sözlüğünün tasarımı ve bakımı gibi, pratik olarak başlı başına bir meslektir. İnşaat her zaman kolektiftir ve yetkinlik alanlarının bir araya gelmesiyle oluşur.

Bir ontolojinin temel eklemlenmesi aşağıdaki gibidir:

Örnek: KUŞ> AIGLE {aigle royal}. Makine daha sonra altın kartalın bir kuş olduğu sonucunu çıkarabilir.

Pratikte, beş tür kavram (tarih, yer, olay, gerçek kişi, tüzel kişi) ve yaklaşık otuz sözlü bağlantı kategorisini göz önünde bulundurarak bir tarih ders kitabını otomatik olarak ontolojiye çevirebiliriz.

Makine için, bu şekilde temsil edilen bilgi hakkında akıl yürütmek, bir yol ağı tarzında, kavramlar ağında "yürümek" anlamına gelir. Belirli algoritmalar vardır, örneğin yol bulucu (Yol Bulucu) , bir kavramdan diğerine en kısa yolu arayan ve bir ekonomi kriterine saygı göstererek: "daha az sayıda kavram", "daha fazla sayıda dil",“ daha fazla sayıda eşanlamlılar ”, vb. Özellikle başlangıç ​​noktası ve bitiş noktasının kavram olmadığını, dizin URI'leri (şirket belgeleri) olduğunu aklınızda bulundurursanız, sonuçlar muhteşem olabilir .

Şuna da bakın:

bibliyografya

Makale yazmak için kullanılan belge : Bu makale için kaynak olarak kullanılan belge.

İlgili Makaleler

Listeler

Dış bağlantılar

Notlar ve referanslar

  1. Dominique Maingueneau ve Ruth Amossy , “  9 | 2012 Eleştiri ve argümantasyon arasındaki söylemin analizi  ” , Journals.openedition.org'da ( 28 Mayıs 2020'de erişildi )
  2. Grossmann 2008 , s.  222.
  3. Breal 1897 .
  4. Clive Perdue ve José Deulofeu , “  İfadenin yapılandırılması: boylamsal çalışma  ”, Diller , cilt.  21, n o  84,1986, s.  43–63 ( DOI  10.3406 / lgge.1986.1519 , çevrimiçi okuma , erişim tarihi 28 Mayıs 2020 )
  5. http://www.unil.ch/webdav/site/ling/shared/IntroductionLing/Serra/Intr.a_la_ling.Cours_n_8.pdf .
  6. M. Arrivé, Yapısal sözdiziminin Öğeleri, Lucien Tesnière , Fransızca , 1969, s. 36-40.