alt sınıfı | BT , yapay zeka |
---|---|
Parçası | Yapay zeka |
Alan | Artımlı öğrenme algoritması |
Makine öğrenme (in English : makine öğrenimi , . Tam anlamıyla " makine öğrenme "), makine öğrenimi veya istatistiksel öğrenme çalışma alanıdır yapay zeka vermek matematiksel ve istatistiksel yaklaşımlar dayanmaktadır bilgisayarları verilerden 'öğrenme' yeteneği yani, her biri için açıkça programlanmadan görevleri çözmedeki performanslarını geliştirmek. Daha geniş olarak, bu tür yöntemlerin tasarımı, analizi, optimizasyonu, geliştirilmesi ve uygulanması ile ilgilidir.
Makine öğreniminin tipik olarak iki aşaması vardır. Birincisi, sistemin tasarım aşamasında mevcut ve sonlu sayıdaki gözlemler adı verilen verilerden bir model tahmin etmektir. Model tahmini, bir konuşmayı tercüme etme, bir olasılık yoğunluğunu tahmin etme, bir fotoğrafta bir kedinin varlığını tanıma veya otonom bir aracı sürmeye katılma gibi pratik bir görevi çözmeyi içerir . Bu "öğrenme" veya "eğitim" aşaması genellikle modelin pratik kullanımından önce gerçekleştirilir. İkinci aşama, üretimin başlangıcına karşılık gelir: belirlenen model, ardından istenen göreve karşılık gelen sonucu elde etmek için yeni veriler sunulabilir. Uygulamada, bazı sistemler, üretilen sonuçların kalitesi hakkında geri bildirim almanın bir yolu olduğu sürece, üretimde bir kez öğrenmeye devam edebilir.
Öğrenme aşamasında mevcut olan bilgilere bağlı olarak, öğrenme farklı şekillerde nitelenir. Veriler etiketlenmişse (yani, bu veriler için görev yanıtı biliniyorsa), bu denetimli öğrenmedir . Etiketler ayrık ise sınıflandırma veya sınıflandırmadan , sürekli ise regresyondan bahsederiz. Model, üstlenilen eylemlerin her biri için program tarafından alınan bir ödülün bir fonksiyonu olarak aşamalı olarak öğrenilirse, buna pekiştirmeli öğrenme denir . En genel durumda, bir etiket olmadan, verilerin (olasılık yoğunluğu olabilir) altında yatan yapısını belirlemeye çalışırız ve o zaman bu bir denetimsiz öğrenme sorunudur . Makine öğrenimi, sürekli veya ayrık nitel veya nicel değişkenler olabilen grafikler , ağaçlar , eğriler veya daha basit özellik vektörleri gibi farklı veri türlerine uygulanabilir .
Antik çağlardan beri düşünen makineler konusu zihinleri meşgul etmiştir. Bu kavram, daha sonra yapay zeka haline gelecek olan düşüncenin temeli ve alt dallarından biri olan makine öğrenimi.
Bu fikrin gerçekleşmesi büyük ölçüde Alan Turing'e (İngiliz matematikçi ve kriptolog) ve 1936'da günümüz bilgisayarlarının temeli olan "evrensel makine" kavramına bağlıdır. 1950'de Turing testinin yanı sıra geliştirdiği "Bilgisayar ve zeka" konulu makalesiyle makine öğreniminin temellerini atmaya devam edecek .
1943'te nörofizyolog Warren McCulloch ve matematikçi Walter Pitts, nöronların nasıl çalıştığını elektrik devrelerini kullanarak temsil ederek açıklayan bir makale yayınladı . Bu temsil, sinir ağlarının teorik temeli olacaktır .
Amerikalı bir bilgisayar bilimcisi ve yapay zeka alanında öncü olan Arthur Samuel , 1952'de IBM için programının oluşturulmasının ardından 1959'da makine öğrenimi (Fransızca, "makine öğrenimi") ifadesini kullanan ilk kişi oldu. Dama ve oynamakla daha iyi oldu. Sonunda, dövmek başardı 4 th ABD'de en iyi oyuncu.
Makine zekası alanında büyük bir ilerleme, 1997 yılında dünya satranç şampiyonu Garry Kasparov'u ilk kez mağlup eden IBM tarafından geliştirilen bilgisayar Deep Blue'nun başarısıdır. Deep Blue projesi birçok kişiye ilham verecektir. zeka, özellikle de başka bir büyük zorluk: Hedefi Jeopardy oyununu kazanmak olan bilgisayar IBM Watson ! . Bu hedefe, Watson'ın Jeopardy'de kazandığı 2011 yılında ulaşıldı! doğal dil işlemeyi kullanarak soruları yanıtlayarak.
Sonraki yıllarda, yüksek profilli makine öğrenimi uygulamaları birbirini eskisinden çok daha hızlı takip etti.
2012 yılında Google tarafından geliştirilen bir sinir ağı , YouTube videolarında kedilerin yanı sıra insan yüzlerini de tanımayı başardı .
2014 yılında, Alan Turing'in tahmininden 64 yıl sonra, diyalog yazarı Eugene Goostman , Turing testini geçen ilk kişi oldu ve beş dakikalık bir konuşmanın ardından insan yargıçların %33'ünü kendisinin bir bilgisayar değil, 13 yaşında bir Ukraynalı olduğuna ikna etti. oğlan.
2015 yılında, Google'ın “ AlphaGo ” bilgisayarı , dünyanın en zor masa oyunu olarak kabul edilen Go oyununda en iyi oyunculardan birine karşı kazandığında yeni bir dönüm noktasına ulaşıldı .
2016 yılında LipNet adlı makine öğrenimine dayalı bir yapay zeka sistemi büyük bir başarı oranıyla dudak okumayı başarıyor.
Makine öğrenimi (AA), bir program, yapay zeka veya robot gibi kontrollü veya bilgisayar destekli bir sistemin, veritabanlarından, sensörlerden veya veritabanlarından gelen geçmiş ampirik verilerin analizine dayanarak yanıtlarını veya davranışlarını karşılaşılan durumlara uyarlamasını sağlar. ağ.
AA, tüm olası girdileri hesaba katan tüm olası davranışlar kümesinin, klasik bir şekilde tanımlamak ve programlamak için hızlı bir şekilde çok karmaşık hale gelmesi gerçeğinden kaynaklanan zorluğun üstesinden gelmeyi mümkün kılar (biri kombinatoryal patlamadan bahsediyor ). Bu nedenle AA programlarına, bu karmaşıklığı basitleştirmek için bir modeli ayarlama ve onu işlevsel bir şekilde kullanma görevi verilmiştir. İdeal olarak, öğrenme denetimsiz olmayı hedefleyecektir , yani eğitim verilerine yanıtlar modele sağlanmaz.
Bu programlar, gelişmişlik derecelerine bağlı olarak, olasılıksal veri işleme yetenekleri, sensörlerden veri analizi, tanıma (ses tanıma, şekil, el yazısı, vb.), veri madenciliği , teorik bilgisayar bilimi ...
Makine öğrenimi, bilgisayarlara veya makinelere aşağıdakiler gibi girdi verilerini analiz etme yeteneği sağlamak için geniş bir uygulama yelpazesinde kullanılır: çevrelerinin algılanması ( görme , yüzler , desenler gibi şekillerin tanınması , 'görüntünün bölümlenmesi , doğal diller , yazılan veya el yazısı karakterler ; arama motorları , özellikle içeriğe göre görüntü arama için görüntülerin ve videoların analizi ve indekslenmesi ; teşhise yönelik yardım , özellikle tıbbi, biyoinformatik , kemoinformatik ; beyin-makine arayüzleri ; kredi kartı dolandırıcılık tespiti , siber güvenlik , borsa dahil finansal analiz analiz ; DNA dizi sınıflandırması ; oyun ; yazılım mühendisliği ; web sitesi uyarlaması ; robotik ( robot hareketi vb ); birçok alanda ( finansal, tıbbi, yasal, adli ) tahmine dayalı analiz.
Örnekler:
Öğrenme algoritmaları kullandıkları öğrenme moduna göre sınıflandırılabilir.
denetimli öğrenme Eğer sınıflar , önceden belirlenmiş ve edilmektedir örnekler bilinen sistem, bir birine göre sınıflandırmak öğrenir sınıflandırma ya da sınıflandırma modeli ; daha sonra denetimli öğrenmeden (veya diskriminant analizinden ) söz ederiz . Bir uzman (veya kahin ) önce örnekleri etiketlemelidir. Süreç iki aşamada gerçekleşir. İlk aşamada (çevrimdışı, öğrenme olarak bilinir ), etiketlenmiş verilerden bir model belirleme sorunudur. İkinci aşama (çevrimiçi, test denir ), önceden öğrenilen modeli bilerek yeni bir veri öğesinin etiketini tahmin etmekten oluşur. Bazen bir veri parçasını tek bir sınıfla değil, önceden belirlenmiş sınıfların her birine ait olma olasılığıyla ilişkilendirmek tercih edilir (buna olasılıksal denetimli öğrenme denir).ör. : Doğrusal ayırma analizi veya SVM tipik örnekleridir. Başka bir örnek: dayalı ortak noktaları tespit semptomları diğer bilinen hasta ( örnekler ), sistem kendi dayalı yeni hastaları kategorize gibi tıbbi analizler bir tahmini risk ( olasılık belirli bir hastalığa yakalanma). denetimsiz öğrenme Sistem veya operatör yalnızca örneklere sahip olduğunda, ancak etiket olmadığında ve sınıfların sayısı ve doğası önceden belirlenmemişse, İngilizce'de denetimsiz öğrenme veya kümelemeden söz ederiz . Herhangi bir uzman gerekli değildir. Algoritma , verilerin az çok gizli yapısını kendi başına keşfetmelidir . Veri bölümleme , veri kümeleme İngilizce, denetimsiz bir öğrenme algoritmasıdır. Sistem burada - açıklama alanında (tüm veriler) - verileri homojen örnek gruplarına sınıflandırmak için mevcut niteliklerine göre hedeflemelidir . Benzerlik , genel olarak örnek çiftleri arasındaki mesafe fonksiyonu kullanılarak hesaplanır. Daha sonra , her grup ve grupların veya grup gruplarının "uzaylarında" görünüşlerinin kalıpları ( İngilizce kalıplar ) için anlam ilişkilendirmek veya anlam çıkarmak operatöre kalmıştır . Çeşitli matematik araçları ve yazılımları ona yardımcı olabilir. Ayrıca regresyon veri analizinden (bir modelin en küçük kareler tipi prosedürle ayarlanması veya bir maliyet fonksiyonunun diğer optimizasyonundan ) bahsediyoruz . Yaklaşım olasılıklıysa (yani her örneğin tek bir sınıfta sınıflandırılmak yerine, sınıfların her birine ait bir dizi olasılık ile karakterize ediliyorsa), o zaman " yumuşak kümeleme " den bahsediyoruz (tersine " sert kümeleme " için). Bu yöntem genellikle bir şans kaynağıdır .ör. : Oldukça büyük bir karaciğer kanseri kurbanları grubunda açıklayıcı hipotezler ortaya çıkarmaya çalışmak isteyen bir epidemiyolog için bilgisayar, epidemiyologun daha sonra çeşitli açıklayıcı faktörlerle, coğrafi kökenlerle, çeşitli açıklayıcı faktörlerle ilişkilendirmeye çalışacağı farklı gruplar arasında ayrım yapabilir. genetik , tüketim alışkanlıklar ya da uygulamalar, çeşitli potansiyel veya etkin toksik ajanlara maruz kalma ( ağır metaller , toksinler gibi aflatoksin , vs. ). Yarı denetimli öğrenme Olasılıklı veya olasılıksız bir şekilde gerçekleştirilen bu çalışma, örneklerin açıklama uzayındaki temel dağılımını ortaya çıkarmayı amaçlar . Veriler (veya “etiketler”) eksik olduğunda uygulanır… Model , yine de bilgi sağlayabilecek etiketlenmemiş örnekler kullanmalıdır .ör. : Tıpta, tanıya yardımcı olabilir veya tanı testlerinin en ucuz yolunun seçiminde yardımcı olabilir. Kısmen denetimli öğrenme Olasılıklı veya değil, verilerin etiketlenmesi kısmi olduğunda. Bu, bir modelin bir verinin bir A sınıfına değil, belki de bir B veya C sınıfına ( A, B ve C , örneğin ayırıcı tanı bağlamında bahsedilen üç hastalık olduğu) ait olduğunu belirttiği durumdur : pekiştirmeli öğrenme algoritma bir gözlem verilen bir davranışı öğrenir. Algoritmanın ortam üzerindeki eylemi, öğrenme algoritmasına rehberlik eden bir dönüş değeri üretir.ör. : Q-Learning algoritması klasik bir örnektir. Öğrenimi aktarın Transfer öğrenimi, bir sistemin önceki görevlerden öğrenilen bilgi ve becerileri tanıma ve benzerlikleri paylaşan yeni görevlere veya alanlara uygulama yeteneği olarak görülebilir. Ortaya çıkan soru şudur: hedef görev(ler) ile kaynak görev(ler) arasındaki benzerlikler nasıl belirlenir ve ardından kaynak görev(ler)in bilgisi hedef görev(ler)e nasıl aktarılır?Algoritmalar dört ana aileye veya türe ayrılabilir:
Daha kesin :
Bu yöntemler genellikle çeşitli öğrenme değişkenlerini elde etmek için birleştirilir. Algoritma seçimi, çözülecek göreve (sınıflandırma, değerlerin tahmini…), verinin hacmine ve doğasına güçlü bir şekilde bağlıdır. Bu modeller genellikle istatistiksel modellere dayanır .
Öğrenmenin ve analizin kalitesi, yukarı yöndeki ihtiyaca ve apriori olarak operatörün analizi hazırlama yetkinliğine bağlıdır. Aynı zamanda modelin karmaşıklığına (özel veya genel), uygunluğuna ve işlenecek konuya uyarlanmasına da bağlıdır. Nihai olarak , çalışmanın kalitesi aynı zamanda son kullanıcı için sonuçların moduna (görsel vurgulama) da bağlı olacaktır (ilgili bir sonuç aşırı karmaşık bir diyagramda gizlenebilir veya uygun olmayan bir grafik temsiliyle yetersiz vurgulanabilir).
Bundan önce, çalışmanın kalitesi, veritabanıyla ilgili ilk bağlayıcı faktörlere bağlı olacaktır :
Makine öğrenimi sadece bir dizi algoritma değil, birbirini takip eden adımları takip eder.
Bu adımların çoğu, veri madenciliği projeleriyle ilgili KDD, CRISP-DM ve SEMMA proje yöntem ve süreçlerinde bulunur .
Özerk araba 2016 makine öğrenimi sayesinde ve arabaların giderek Bağlı filosu tarafından oluşturulan verilerin büyük miktarlarda makul görünmemektedir. Geleneksel algoritmaların (önceden belirlenmiş bir dizi kuralı takip eden) aksine, makine öğrenimi kendi kurallarını öğrenir.
Alanında önde gelen yenilikçiler, ilerlemenin süreçlerin otomasyonundan geldiği konusunda ısrar ediyor. Bu, makine öğrenme sürecinin özelleştirilmesi ve belirsiz hale gelmesi gibi bir kusura sahiptir. Özelleştirildi, çünkü AA algoritmaları devasa ekonomik fırsatlar oluşturuyor ve anlaşılması, optimizasyonlarının gerisinde kaldığı için belirsiz. Bu gelişme, halkın makine öğrenimine olan güvenini sarsma potansiyeline sahiptir, ancak daha da önemlisi, çok umut verici tekniklerin uzun vadeli potansiyeli.
Otonom araba, toplumda makine öğrenimiyle yüzleşmek için bir test çerçevesi sunuyor. Gerçekten de, karayolu trafiği ve kuralları konusunda eğitilen sadece algoritma değil, aynı zamanda tersidir. Sorumluluk ilkesi, makine öğrenimi tarafından sorgulanır, çünkü algoritma artık yazılı değildir, aksine bir tür dijital sezgiyi öğrenir ve geliştirir. Algoritma yaratıcıları, algoritmaları tarafından verilen "kararları" artık anlayamaz, bu da makine öğrenimi algoritmasının çok matematiksel yapısından kaynaklanır.
AA ve kendi kendini süren arabalarda, bir kaza durumunda sorumluluk sorunu ortaya çıkar. Toplum bu soruya farklı olası yaklaşımlarla bir cevap vermelidir. Amerika Birleşik Devletleri'nde bir teknolojiyi ürettiği sonucun kalitesine göre yargılama eğilimi varken, Avrupa'da ihtiyatlılık ilkesi uygulanmaktadır ve yeni bir teknolojiyi öncekilere kıyasla daha fazla değerlendirme eğilimi vardır. zaten bilinenlerle karşılaştırıldığında farklılıklar. Avrupa ve Amerika Birleşik Devletleri'nde risk değerlendirme süreçleri devam etmektedir.
Tasarımcılar için öncelik, onu anlamakta değil, optimal bir algoritmanın tasarımında yattığından, sorumluluk sorunu daha da karmaşıktır. Algoritmaların yorumlanabilirliği, özellikle bu kararların bireylerin yaşamları üzerinde derin bir etkisi olduğunda, kararları anlamak için gereklidir. Bu yorumlanabilirlik kavramı, yani bir algoritmanın neden ve nasıl hareket ettiğini anlama kapasitesi de yoruma tabidir.
Veri erişilebilirliği sorunu tartışmalıdır: Kendi kendini süren arabalar söz konusu olduğunda, bazıları algoritmalarda daha iyi öğrenmeye izin verecek ve bu "dijital altını" "bir avuç kişinin elinde toplamayacak" verilere kamu erişimini savunuyor. artı diğerleri, iyi verilerin bir rekabet avantajı ve dolayısıyla ekonomik bir avantaj oluşturduğu gerçeğini ihmal etmeden, serbest piyasa adına verilerin özelleştirilmesi için kampanya yürütüyor.
Tehlikeli veya ölümcül durumlarda AA algoritmalarına ve kendi kendine giden arabalara bırakılan kararlarla ilgili ahlaki seçimler sorusu da ortaya çıkıyor. Örneğin, aracın frenlerinin arızalanması ve kaçınılmaz bir kaza durumunda öncelikli olarak kurtarılması gereken hayatlar: yolcuların mı yoksa karşıdan karşıya geçen yayaların mı?
2000-2010 yıllarında, makine öğrenimi hala gelişmekte olan, ancak doğası gereği teorik olarak otomasyonun hızını ve kendi kendine öğrenmeyi hızlandırabilen çok yönlü bir teknolojidir. Üreten, depolayan ve yaptığı gibi, o (teknolojiler ve toplumu bozabilir enerjiyi, hem de her yerde bilgi işlem dolaşan yeni yollar ortaya çıkması ile birlikte buhar motoru ve elektrik. , Daha sonra petrol ve bilgisayar bilimleri içinde önceki sanayi devrimler . Makine öğrenimi olabilir beklenmedik yenilikler ve yetenekler üretebilir, ancak bazı gözlemcilere göre, insanların yaptıkları birçok görev üzerindeki kontrolünü kaybetme riski vardır. artık anlaşılamayacak ve bilgisayar ve robotize edilmiş varlıklar tarafından rutin olarak gerçekleştirilecektir. İstihdam, çalışma ve daha genel olarak ekonomi ve eşitsizlikler üzerinde değerlendirilmesi hala imkansız olan ve karmaşık olan belirli etkiler önerir.2017
sonunda Science dergisine göre: “İstihdam üzerindeki etkiler, ikame ve ikame gibi basit sorulardan daha karmaşıktır. bazıları tarafından vurgulanmıştır. BA bugün nispeten sınırlı olmasına ve bazen ilan edildiği gibi yakın bir 'iş sonu' ile karşı karşıya kalmamamıza rağmen, ekonomi ve işgücü üzerindeki etkileri derin ” .
Öğrenebilen makineler tasarlamak için canlıları safça kopyalamadan onlardan ilham almak cezbedicidir . Fiziksel nöronal fenomenler olarak algı ve kavram kavramları Jean-Pierre Changeux tarafından Fransızca konuşulan dünyada da popüler hale getirilmiştir . Makine tüm alt alanın üstünde kalıntıları öğrenme bilgisayar bilimleri , ancak operasyonel yakından bağlantılıdır bilişsel bilimler , sinir bilimleri , biyoloji ve psikoloji bu alanlarda, kesişme noktasında olabilir ve nanoteknoloji, biyoteknoloji, bilgisayar bilimi ve bilişsel bilim , kurşun için daha geniş bir tabana sahip yapay zeka sistemleri. Collège de France'da halka açık kurslar özellikle , biri Stanislas Dehaene tarafından sinirbilimin Bayesyen yönüne, diğeri ise derin öğrenmenin teorik ve pratik yönlerine Yann LeCun tarafından verildi .
Makine öğrenimi, düzgün çalışması için büyük miktarda veri gerektirir . Özellikle sosyal ağlar tarafından oluşturulan veriler söz konusu olduğunda, veri kümelerinin bütünlüğünü kontrol etmek zor olabilir.
Bir AA algoritması tarafından alınan “kararların” kalitesi, eğitim için kullanılan verilerin yalnızca kalitesine (dolayısıyla homojenliği, güvenilirliği vb.) değil, her şeyden önce niceliğine bağlıdır. Bu nedenle, azınlıkların temsiline özellikle dikkat edilmeden toplanan bir sosyal veri kümesi için, AA onlara istatistiksel olarak adaletsizdir. Aslında, “iyi” kararlar verme yeteneği, azınlıklar için orantılı olarak daha küçük olacak olan verilerin boyutuna bağlıdır.
AA şu anda neden ve korelasyonu matematiksel yapısıyla ayırt etmemektedir ve verilerinin dayattığı çerçevenin ötesine geçememektedir, bu nedenle ekstrapolasyon kapasitesine sahip değildir .
Bu nedenle makine öğrenimi algoritmalarının kullanımı, kullanımları sırasında öğrenme için kullanılan veri çerçevesinin farkında olmayı gerektirir. Bu nedenle, makine öğrenimi algoritmalarına çok büyük erdemler atfetmek iddialıdır.
Bir algoritma, sonucu tarafsız, adil veya hakkaniyete uygun bir sonuçtan saptığında önyargılı olabilir. Bazı durumlarda, algoritmik önyargılar ayrımcılık durumlarına yol açabilir .
Modeli eğitmek için kullanılan veri örneği tarafsız değilse ve gerçeği temsil etmiyorsa veya dengesizse, veriler de önyargılı olabilir. Bu önyargı daha sonra model tarafından öğrenilir ve yeniden üretilir.
Makine öğrenimi algoritmaları, sistemin genel açıklanabilirliği ile ilgili sorunlar ortaya çıkarır. Doğrusal regresyon veya lojistik regresyon gibi bazı modellerin sınırlı sayıda parametresi vardır ve bunlar yorumlanabilirken, yapay sinir ağları gibi diğer model türlerinin açık bir yorumu yoktur.