Yaklaşık 1 milyon başlıklı bir belgeyle doc2vec kullanıyorum. külliyat olarak eğitmek için aşağıdaki kodu kullanıyorum:KeyError, Doc2Vec modelinde, min_count eğitim sırasında 1'e ayarlandığında bile
model = gensim.models.Doc2Vec(min_count=1, window=10, size=300, workers=4)
model.build_vocab(corpus)
for epoch in range(10):
model.train(corpus)
Her şey düzgün eğitmek gibi görünüyor ve ben titles.most_similar kullanarak bir vektör anlaması mümkün.
Vektörleri kullanmaya çalıştığımda bir sorunla karşılaşıyorum. Son modelden bazı belgeler eksik gibi görünüyor! Yani .:
model.docvecs['SENT_157000']
Ben gensim forum ve stackoverflow kontrol edilip bulabildiğim tek öneri min_count = 1. ben yaptım emin olmak için oldu ama hala bu sorun yaşıyorum.KeyError: 'SENT_157000'
gensim
sitesindeki
Doc2Vec
documentation kaynaktan