Ben bir kelime ben csv dosyası okuma vePython'da bir veri çerçevesindeki her satırda bölünmüş işlev nasıl kullanılır?
reviews = pd.read_csv("amazon_baby.csv")
kod aşağıda satırını kullanarak bir piton dataframe depolayarak am
yorum dizesinde tekrarlanır ediliyor sayısını saymak istiyor Aşağıdaki satırları tek bir incelemeye uyguladığımda çalışır. Aşağıda hattı kullanarak tüm dataframe için mantığı, zaman
print reviews["review"][1]
a = reviews["review"][1].split("disappointed")
print a
b = len(a)
print b
hatlar için çıkış
it came early and was not disappointed. i love planet wise bags and now my wipe holder. it keps my osocozy wipes moist and does not leak. highly recommend it.
['it came early and was not ', '. i love planet wise bags and now my wipe holder. it keps my osocozy wipes moist and does not leak. highly recommend it.']
2
edildi. Sen (Seri hata iletisinde belirtilen olduğu) verileri çerçevesinin tamamını yorumu sütununu ayırmaya çalışıyorsun
Traceback (most recent call last):
File "C:/Users/gouta/PycharmProjects/MLCourse1/Classifier.py", line 12, in <module>
reviews['disappointed'] = len(reviews["review"].split("disappointed"))-1
File "C:\Users\gouta\Anaconda2\lib\site-packages\pandas\core\generic.py", line 2360, in __getattr__
(type(self).__name__, name))
AttributeError: 'Series' object has no attribute 'split'
yapılmış saymak ben yorum değişken veri okuma dışındaki bu koda başka çizgiler eklemek gerekiyor mu? Çünkü yukarıdaki iki satır işe yaramadı. – goutam
Yazılı olarak çalışmalıyım, ama test etmedim. Ne yanlış gitti? – hoyland
Dosya "Classifier.py", satır 18, yorum ["hayal kırıklığı"] = reviews.apply (f, eksen = 1) Dosya "pandas \ core \ frame.py", satır 3972, başvuruda self._apply_standard (f, eksen, azaltın = küçült) Dosya "pandas \ core \ frame.py", satır 4064, içinde _apply_standard sonuçları [i] = func (v) "Classifier.py" dosyası, satır 17, __getattr__ (tip (kendiliğinden) olarak len (değerlendirme [ "yorum"] bölme ("hayal kırıklığı").) -1 Dosya "panda \ çekirdek \ generic.py", hat 2360,: f = lambda x.__name__, name)) AttributeError: ("'Series' nesnesinin 'split' özniteliği yok, '0' dizininde işaretlenmemiş ') –
goutam