16

herkes. Sınıflandırma algoritmaları konusuna tamamen yeni geldim ve bazı "ciddi okuma" işlemlerinin nerede başlayacağı konusunda birkaç iyi işaretçiye ihtiyacım var. Şu anda, öğrenme sürecinin, makine öğrenimi ve otomatik sınıflandırma algoritmalarının, benimkilerin bazı uygulamalarına eklemek için değerli bir şey olup olmadığını öğreniyorum.Başlangıç ​​kaynakları/sınıflandırma algoritmalarına girişler

Zaten kapsamında taranan

"Nasıl çözme It için: Modern sezgisel tarama" Z. Michalewicz ve D. Fogel'ın tarafından (özellikle nöron ağları kullanarak doğrusal sınıflandırıcılar hakkında bölümler) ve pratik tarafında, Şu anda benim WEKA toolkit kaynak koduna bakarak. Sonraki (planlı) adımım, Bayes sınıflandırma algoritmalarına dalmak olacaktır. Ne yazık ki, bu alanda ciddi bir teorik temelden yoksun değilim (bir yana kullanabilmemize izin vermeden), böylece bir sonraki bakacak yerlerdeki ipuçlarımız takdir edilecektir; Özellikle, mevcut sınıflandırma algoritmalarına iyi bir giriş yapılması yararlı olacaktır. Daha fazla bir usta ve daha az bir teorisyen olmak, daha pratik, daha iyi ...

İpuçları, kimse?

cevap

9

Çok yararlı olabilmek için her zaman Andrew Moore's Tutorials buldum. Katı istatistiksel teoriye dayanıyorlar ve gelecekte bunları okumayı seçerseniz, kağıtları anlamada çok faydalı olacaklar. Burada kısa bir açıklaması aşağıda verilmiştir:

Bunlar sınıflandırma dahil böyle bir karar ağaçları, nöral ağlar, Bayes sınıflandırıcılar, Destek Vektör Makineleri ve cased tabanlı (diğer adıyla parametrik olmayan) öğrenme gibi algoritmaları. Çok değişkenli polinom regresyon, MARS, Lokal Ağırlıklı Regresyon, GMDH ve nöral ağlar gibi regresyon algoritmaları içerir. Ve diğer veri böyle kümeleme olarak madencilik işlemleri (karışım modelleri, k-ortalama ve hiyerarşik), Bayes ağları ve Takviye Öğrenme

+0

Teşekkürler. Bu aradığım şey hakkındaydı. – Dirk

4

Bakış Makine Öğrenme dahil

iyi almak için Alana genel bakış, Andrew Ng's Machine Learning course video derslerini takip et.

Bu ders (CS229) - Profesör Andrew Ng tarafından öğretilen - Makine öğrenimi ve istatistiksel desen tanıma için geniş bir giriş sağlar. Konular arasında denetimli öğrenme, denetimsiz öğrenme, öğrenme teorisi, pekiştirme öğrenimi ve uyarlamalı kontrol yer alır. Robotik kontrol, veri madenciliği, otonom navigasyon, biyoinformatik, konuşma tanıma, metin ve web veri işleme gibi makine öğreniminin son uygulamaları da tartışılmaktadır. Kullanmak gerektiği gibi hangi sınıflandırıcı için

Sınıflandırıcılar

, ben genel uygulamalı sınıflandırma görevler için Support Vector Machines (SVM) ile başlayan ilk öneriyoruz. Size en yeni performansı verecekler ve WEKA gibi bir paket tarafından sağlanan uygulamayı kullanmak için arkasındaki tüm teorileri gerçekten anlamanız gerekmez.

Daha büyük bir veri kümesine sahipseniz, Random Forests kullanmayı deneyebilirsiniz. WEKA'da da bu algoritmanın an implementation'u var ve büyük veride'u çok daha hızlı bir şekilde eğitiyorlar. SVM'lerden daha az yaygın kullanılırken, bunların doğrulukları, birinden alabileceğiniz doğrulukla eşleşmeye veya neredeyse eşleşmeye eğilimlidir.

+0

Teşekkürler. SVN gibi yeni başlayanlar için çok okunabilir bir giriş, http://www.tristanfletcher.co.uk/SVM%20Explained.pdf gibi görünüyor. – Dirk

6

answer referring to Andrew Moore's tutorials is a good one. Bununla birlikte, pek çok sınıflandırma sisteminin yaratılmasını zorunlu kılan ihtiyaç üzerine bazı okumaları önererek, onu geliştirmek istiyorum: nedensel ilişkilerin tanımlanması. Bu istatistiksel çıkarımı içeren birçok modelleme problemiyle ilgilidir.

Nedensellik ve sınıflandırma sistemleri (özellikle Bayes sınıflandırıcıları) hakkında bilgi edinmek için bildiğim en geçerli kaynak Judea Pearl's book "Causality: models, reasoning, and inference".