Tarafından geliştirildi | Waikato Üniversitesi |
---|---|
Son sürüm | 3.8.1 (23 Ocak 2017 (2017/01/23)) |
Gelişmiş sürüm | 3.9.1 (19 Aralık 2016) |
Depozito | svn.cms.waikato.ac.nz/svn/weka |
Yazılmış | Java |
İşletim sistemi | Microsoft Windows ve çapraz platform |
Çevre | Java platformu |
Biçimleri okuyun | Öznitelik İlişkisi Dosya Biçimi ( d ) |
Diller | Çok dilli |
Tür | Makine öğrenimi yazılım yapısı ( d ) |
Lisans | GNU Genel Kamu Lisansı sürüm 3 |
İnternet sitesi | www.cs.waikato.ac.nz/ml/weka/ |
Weka ( kısaltması için Waikato bilgi analizi için çevre Fransızca,: " Waikato bilgi analizi için çevre ") bir olan makine öğrenme yazılım paketi ile yazılmış Java ve Üniversitesi'nde geliştirilen Waikato içinde Yeni Zelanda'da . Weka, GNU Genel Kamu Lisansı ( GPL ) altında bulunan ücretsiz bir yazılımdır .
Weka çalışma alanı, veri analizi ve tahmine dayalı modelleme için bir dizi görselleştirme araçları ve algoritmalarının yanı sıra, işlevselliğine kolay erişim için bir grafik arabirim içerir. "Java olmayan" orijinal Weka versiyonu bir oldu ön uç içinde Tcl / Tk ticari tamamlanmaktadır diğer programlama dillerinde uygulanan algoritmalar (çoğunlukla üçüncü) modellemek için, önişlemci verilere C ve makefile- tabanlı sistem makineyi başlatmak için Öğrenme deneyimleri. Bu orijinal sürüm, öncelikle tarımsal verileri analiz etmek için bir araç olarak tasarlanmıştı, ancak 1997'de geliştirilmeye başlanan tamamen Java'ya (Weka 3) dayalı daha yeni sürüm , şimdi birçok farklı uygulama alanında, özellikle eğitim ve araştırma için kullanılmaktadır. . Weka'nın temel güçlü yönleri şudur:
Weka, çeşitli standart veri madenciliği araçlarını ve özellikle veri ön işlemcilerini , veri kümelemesini , istatistiksel sınıflandırıcıları , regresyon çözümleyicilerini , görselleştirme araçlarını ve ayırt edici analiz araçlarını destekler . Weka'nın tüm teknikleri, verilerin tek bir düz dosya veya ikili ilişkide mevcut olduğu varsayımına dayanır; burada her veri türü, sabit sayıda öznitelikle (sıradan, sayısal veya sembolik öznitelikler, ancak diğer birkaç öznitelikle) tanımlanır. öznitelik türleri de desteklenmektedir). Weka, Java Veritabanı Bağlantısı (JDBC) kullanarak SQL veritabanlarına erişim sağlar ve bir SQL sorgusunun sonucunu işleyebilir. Çok ilişkisel veri madenciliği yapamaz, ancak bağlantılı veritabanı tablolarının bir koleksiyonunu Weka tarafından işlenmeye uygun tek bir tabloya dönüştürmek için üçüncü taraf yazılımlar mevcuttur. Şu anda Weka dağıtımında yer alan algoritmalar tarafından kapsanmayan bir diğer önemli alan, dizi modellemedir.
Weka'nın ana arayüzü kaşiftir , ancak hemen hemen aynı işlevsellik her bileşenin "bilgi akışı" arayüzü ve komut satırından elde edilebilir . Ayrıca, Weka'nın makine öğrenimi algoritmalarının bir veri kümeleri koleksiyonu üzerindeki tahmini performansının sistematik (taksonomik) karşılaştırmasına izin veren deneyci de var .
Gezgin arayüzünde , çalışma alanının ana bileşenlerine erişim sağlayan birkaç sekme vardır. Önişlemci sekmesi, veri tabanlarından , bir CSV dosyasından verileri içe aktarmak ve bu verileri filtreleme adı verilen bir algoritma ile önceden işlemek için çeşitli özelliklere sahiptir . Bu filtreler, verileri dönüştürmek (örneğin, gerçek sayısal öznitelikleri ayrı özniteliklere dönüştürmek) ve örnekleri ve öznitelikleri belirli kriterlere göre silmeyi mümkün kılmak için kullanılabilir. Sınıflandırmak sekme kullanıcının uygulamak sağlar sınıflandırmaları ve regresyon algoritmaları (dönüşümlü olarak adlandırılan " sınıflandırıcılar için WEKA'da") Elde edilen veri kümesi tahmin etmek için, doğruluk tahmin modeli ve hatalı tahminler, görüntülemek için ROC eğrileri , vs. veya modelin kendisi (model bir Karar Ağacı gibi görselleştirmeye tabi ise ). İlişkilendirme sekmesi , verilerdeki öznitelikler arasındaki tüm önemli ilişkileri belirlemeye çalışan ilişkilendirme kurallarına göre öğrenmelere erişim sağlar . Küme sekmesi , Weka'nın k-ortalama algoritması gibi kümeleme tekniklerine erişim sağlar . Normal dağılımların bir karışımını eğitmek için beklenti maksimizasyon algoritmasının bir uygulaması da vardır . " Öznitelikleri seçin " sekmesi , bir veri kümesindeki en tahmini öznitelikleri tanımlamak için algoritmalar sağlar. Son sekme olan " Görselleştir ", tek tek nokta bulutlarının seçilebildiği ve büyütülebildiği ve çeşitli seçim operatörleri kullanılarak daha fazla analiz edilebildiği bir nokta bulutları matrisini gösterir .