Biri diğerinden daha eksiksiz değil, diğerinin olmaması ve tersi bir şeyden daha fazla bir sorudur. Aynı zamanda hedef kitle ve amaç bir sorudur.
Mallet, çeşitli doğal dil işleme görevleri için sağlam ve hızlı uygulamalar sağlamayı amaçlayan Java tabanlı bir makine öğrenme aracıdır.
NLTK, Python kullanılarak oluşturulmuştur ve WordNet gibi bir çok şirketle birlikte gelir. NLTK, daha çok NLP öğrenen insanlara yöneliktir ve bu nedenle bir öğrenme platformu olarak ve belki de bir mühendislik çözümü olarak daha az kullanılır. o belgeler, örnekler, korpus vs vs bütün bir ton ile gelir olarak Bence ikisi arasındaki temel fark ise
NLTK daha iyi konumlandırılmış makine öğrenme ve NLP ile ilgilenen kişiler için bir öğrenme kaynağı olarak olmasıdır
Mallet, alanda çalışan ve zaten ne yapmak istediklerini bilen araştırmacıları ve uygulayıcıları hedeflemektedir. NLTK'nın geniş kapsamlı genel NLP koleksiyonuna kıyasla, daha az dokümantasyonla (iyi örneklere sahip ve API iyi belgelenmiş olmasına rağmen) gelir.
GÜNCELLEME: Bu http://mallet.cs.umass.edu/ de Mallet dokümanlar ve örnekler olacağını açıklayan İyi haberler - NLTK kitabında Natural Language Processing with Python kenar çubuğu etiketleme diziye bağlantıları, konu modelleme vb
vardır ve NLTK için iyi bir tanıtım hem etmektir NLTK ve NLP'ye.
GÜNCELLEME
Geçenlerde sklearn Python kütüphanesi buldum. Bu, daha genel olarak makine öğrenmeyi amaçlamaktadır, doğrudan NLP için değil, bunun için de kullanılabilir. Çok geniş bir modelleme araçları yelpazesi ile geliyor ve çoğu NumPy'ye güveniyor gibi görünüyor, bu yüzden oldukça hızlı olması gerekiyor. Bunu oldukça kullandım ve çok iyi yazılmış ve belgelenmiş olduğunu söyleyebilirim ve bunu ileri süren aktif bir geliştirici topluluğuna sahiptir (Mayıs 2013 itibariyle).
GÜNCELLEME Şimdi de bir süre (özellikle tokmak API) için tokmak kullanıyorum ve başka projeye tokmak entegre planlıyorsanız çok aşina olması gerektiğini söyleyebiliriz 2
Java ve neredeyse tamamen belgesiz kod tabanı hata ayıklama çok zaman harcamak için hazır.
Tek yapmanız gereken, mallet komut satırı araçlarını kullanmaksa, bu iyi bir yöntemdir, API kullanımı mallet kodu üzerinden çok fazla kazma gerektirir ve genellikle bazı hataları da giderir. Uyarının, API ile ilgili asgari dokümantasyonla birlikte gelmesi konusunda uyarınız.
Bunu yanıtlayamıyorum, ancak NLTK bir çekiç arabirimi içeriyor, böylece bunları birbiri ardına deneyebilirsiniz. – alexis
Python'u zaten biliyorsan, sadece "insanlar için konu modellemesi" ni kullan. – Radim
@Radim; P yes 'gensim, kişisel olarak python için kullanılan/kullandım en kullanıcı dostu konu modelleme modülünden biridir. "Gensim, sadece ölümlüler için konu modellemesi" olmalıydı. =) – alvas