Tarafından geliştirildi | Google DeepMind |
---|---|
Tür | Oyun yazılımına gidin |
İnternet sitesi | Resmi site |
AlphaGo , İngiliz şirketi Google DeepMind tarafından geliştirilen Go oyununu oynayabilen bir bilgisayar programıdır .
İçinde ekim 2015, profesyonel bir oyuncuyu (Fransız Fan Hui ) tam boy (19 × 19) gobanı engelsiz yenen ilk program oldu . Go player programı yapay zeka için karmaşık bir zorluk olduğundan, bu sembolik olarak güçlü bir adımdır . İçindeMart 2016O yendi Lee Se-dol (dünyanın en iyi oyuncularından biri 9 inci Dan profesyonel). 27 Mayıs 2017, dünya şampiyonu Ke Jie'yi yendi ve yazılımın kullanımdan kaldırıldığı açıklandı.
AlphaGo algoritma birleştirir makine öğrenme ve Graph dolaşma teknikleri insanlarda, diğer bilgisayarlarla eğitim bir sürü ile ilişkili, ve özellikle kendisi.
Bu algoritma sonraki sürümlerde daha da geliştirilecektir. AlphaGo Sıfır içindeEkim 2017sadece kendisine karşı oynayarak bir üst seviyeye ulaşır. AlphaZero , Aralık 2017'de, her zaman kendi kendine öğrenerek, yalnızca hareket halindeyken değil, satranç ve shgi'de de tüm insan ve yazılım oyuncularının seviyesini büyük ölçüde aştı .
Bir Go oyuncusunu programlamak, satranç gibi diğer oyunlara göre çok daha fazla sayıda olası kombinasyon nedeniyle çok daha zor bir problem olarak kabul edilir , ancak aynı zamanda zafer koşulu ve ara hedefler çok daha az net olduğundan, onu son derece karmaşık hale getirir. kapsamlı arama gibi geleneksel yöntemleri kullanmak . IBM'in bilgisayarı Deep Blue , 1997'de dünya satranç şampiyonu Garry Kasparov'u yendiğinde , bilgisayarlar Go oyunundaki zayıf amatör oyuncuların seviyesiyle sınırlıydı.
Araştırma dünyası bu zorluğu bir meydan okuma olarak görüyor ve algoritmalarını ve 2010'larda hızlanan programların seviyesini geliştiriyor . 2012 yılında, Zen programı yendi Takemiya Masaki ( 9 th bir ile iki kez Dan) handikap 5 ve 4 taş. 2013 yılında, Çılgın Taş yendi Yoshio Ishida ( 9 th 4 taş özürlü Dan).
2016'nın başında Facebook , Darkforest adlı kurum içi geliştirilmiş bir yapay zeka geliştirmesinden cesaret verici sonuçlar aldığını duyurdu.
AlphaGo, 2010 yılında Demis Hassabis , Mustafa Suleyman ve Shane Legg tarafından oluşturulan yapay zeka konusunda uzmanlaşmış bir İngiliz şirketi olan DeepMind Technologies tarafından geliştirildi ve 2014 yılında Google tarafından satın alındı .
AlphaGo, önceki go programlarına göre önemli bir gelişmeyi temsil ediyor . AlphaGo, Crazy Stone ve Zen gibi diğer programlara karşı oynanan 500 oyundan yalnızca birini kaybetti.
İçinde ekim 2015, AlphaGo Avrupa go şampiyonu yener Fan Hui ( 2 nd dan), yavaş oyunlarda 5-0 ve hızlı oyunlarda 3-2. Bu, bir Go programının profesyonel bir oyuncuyu tam boyutlu (19 × 19) bir goban ile handikapsız bir maçta ilk kez yenmesidir . Haber sadece şu tarihte açıklandı27 Ocak 2016Nature dergisinde kullanılan algoritmayı açıklayan bir makalenin yayınlanmasıyla aynı zamana denk geliyor .
AlphaGo yüzleri Mart 2016Oyuncunun Güney Koreli Lee Se-dol ( 9 th dan profesyonel, maksimum düzeyde), 2000 ve 2010 dolaşan ve internette canlı yorumladı edilir bir milyon dolarlık bir ödül kazandı maç arasında dünyanın en iyi oyuncusu olarak kabul. Lee Sedol , katılımı için 150.000 $ ve kazanılan her oyun için 20.000 $ alıyor .
5 bölümlük maç, bilgisayarın 4-1 galibiyetiyle sona eriyor:
Hatta geçen maçtan önce ve zafer güvence, AlphaGo sıralandığını 9 inci tarafından profesyonel dan honorarily Hanguk Kiwon (Kore Go Oyun Federasyonu). AlphaGo ekibi tarafından kazanılan 1 milyon dolarlık ödül hayır kurumlarına bağışlandı.
Toplantıdan önce bile, diğer profesyoneller, Ke Jie , Fan Hui'ye karşı oynadığı maçlarda kendisine layık bir rakip olmadığını düşünse bile, AlphaGo'ya karşı çıkma isteklerini dile getirmişlerdi . Maçtan sonra Lee Sedol tam potansiyelini vermediğine pişman oldu ve bir rövanş istedi. Ama başlangıcına kadar değildiHaziran 2016Yeni bir toplantının umudu netleşti ki sırasında yapılıyor "Yıl sonundan önce" Ke Jie karşı maçın duyuru Dünya Amatör Go Şampiyonası içinde Wuxi ; Ancak6 Haziran, Demis Hassabis bu bilgiyi teyit etmeyi reddetti.
Temmuz 18, 2016AlphaGo, GoRatings sıralamasında 3612 Elo puanıyla dünyanın en iyi oyuncusu oldu ( saniyede 3608'e karşı, Ke Jie ).
İçinde eylül 2016Gu Li ve Zhou Ruiyang (en) tarafından Lee Sedol'a karşı oynanan oyunların detaylı yorumları ve AlphaGo'nun analizine dayanarak DeepMind web sitesinde yayınlandı; Gu Li'ye göre, AlphaGo'nun ustalığı ve analizinin derinliği, maç sırasında daha önce söylediğimizi hala aşıyor.
4 Ocak 2017Demis Hassabis , AlphaGo'nun geliştirilmiş bir sürümünün, dünyanın en iyi oyuncularına ( Ke Jie , Iyama Yuta , Gu Li , Park Jeong-hwan (en) ...) karşı 60 hızlı oyun oynadığını duyurdu . hepsi kazandı ve yılın ilerleyen aylarında resmi maçlar oynayacak.
23 ile 27 Mayıs 2017Bir bayram denilen Git Zirvesi Geleceği Google ve tarafından düzenlenen Çin weiqi dernek içinde Wuzhen ; AlphaGo'nun en yeni versiyonu, üç maçlık bir maçta Ke Jie ile diğer Çinli profesyonellerin istişare halinde oynamasıyla karşı karşıya . Yine AlphaGo oynanan tüm oyunları kazanır. Bu toplantıdan sonra Google, AlphaGo'nun artık rekabetçi bir şekilde oynamayacağını, ancak en son iyileştirmelerini ve makinenin kendisine karşı oynadığı bir dizi oyunu açıklayan teknik belgeler yayınlayacağını duyurdu; ayrıca oyuncuların kullanımı için bu yazılıma dayalı bir analiz aracı geliştirmeyi planlıyorlar.
Ekim 17, 2017DeepMind, AlphaGo Zero adını verdikleri yeni bir geliştirme duyurdu ; bu program basitleştirilmiş bir mimari kullanır ve oyunun sıfır bilgisinden başlar (sadece kurallar); sadece kendine karşı oynarken, üç saat içinde başlangıç seviyesine ulaşır, 72 saat 100'den 0'a Lee Sedol'u yenerek versiyonu yener ve 40 gün sonra versiyonunu yener.Mayıs 2017 ("Usta" olarak bilinir) 100 üzerinden 89 oyun.
Aralık 5, 2017AlphaZero adlı yeni bir sürüm , bu algoritmayı daha da genelleştirir ve basit kural bilgisinden go, satranç veya shōgi oynamayı öğrenebilen genel bir program elde eder ; Program, örneğin satranç, bitti net bir zafer öğrenme sonra dört saat alır (en iyi mevcut programları yenmek için birkaç saat içinde yönetir stockfish : dışarı 100 oyun , 25 galibiyet Beyaz, Siyah ile 3 ile ve 72 çizer ).
AlphaGo'nun ilk sürümleri , her ikisi de derin bir sinir ağı kullanılarak uygulanan bir " değer ağı " ve bir " politika ağı " (bir değer ağı ve bir hedefler ağı ) tarafından yönlendirilen Monte Carlo yöntemini kullanır .
AlphaGo başlangıçta, uzman oyuncular tarafından yürütülen on binlerce oyunda kaydedilen isabetleri takip ederek insan oyuncuları "taklit etmek" için eğitildi. Belli bir seviyeye ulaştığında, kendisini geliştirmek için pekiştirmeli öğrenmeyi kullanarak diğer örneklerine karşı milyonlarca oyun oynamaya çalıştı .
Ancak Ekim 2017, DeepMind yayımlayan yeni bir çalışma içinde Nature anlatan AlphaGo Zero , yine de çok hızlı bir şekilde artık kullanımları ya Monte-Carlo yöntemi veya insan bilgi, ancak önceki sürümlere göre daha yüksek performans elde edebilmesi basitleştirilmiş bir mimari.
AlphaGo algoritması (veya en azından temel fikirleri) halka açık hale getirildikten sonra, birkaç grup onu yeniden üretmeye, hatta geliştirmeye çalıştı. Özellikle 2018 itibariyle, işbirlikçi ve açık kaynaklı bir proje olan Leela Zero , kişisel bilgisayarlarda ve hatta akıllı telefonlarda taşınabilir olarak bir yıl içinde benzer sonuçlar elde etti.