Her iki sayımı ve tfidf'i çok terimli bir NB modelinin özellikleri olarak kullanmayı deniyorum. İşte benim kod:Sayımlar ve tfidf ile scikit'in özelliklerini kullanma
text = ["this is spam", "this isn't spam"]
labels = [0,1]
count_vectorizer = CountVectorizer(stop_words="english", min_df=3)
tf_transformer = TfidfTransformer(use_idf=True)
combined_features = FeatureUnion([("counts", self.count_vectorizer), ("tfidf", tf_transformer)]).fit(self.text)
classifier = MultinomialNB()
classifier.fit(combined_features, labels)
Ama FeatureUnion ve tfidf bir hatayı alıyorum:
TypeError: no supported conversion for types: (dtype('S18413'),)
herhangi bir fikir bu neden oluyor olabilir? Özellikler olarak hem sayım hem de tfidf olması mümkün değil mi?