Bu benim ilk sorum olan özür dilerim. Ben bir ds yükledim csv bir dizi tweets tokenize nltk kullanıyorum. Jetonlaştırma iyi çalışır ve böyle bir şeyi [[Benim, dayım, ...]] bir df içindeki bir hücreye çıkarır. Ardından, df sütununun tamamı için jetonlanmış metne bir POS tagger'ı uygulamak istiyorum. Bunu yapmak için aşağıdaki kodu kullanıyorum. Zorlandığım hat df['tagged'] = df['tokenized'].apply(lambda row: [nltk.pos_tag(row) for item in row])
. Yanlış öğe üzerinde yinelemediğimi biliyorum (sıraya karşı öğe) ancak bunu yapmak için doğru yolu anlayamıyorum. kod aşağıda: Ben sadece (en azından Python 2.7 ile birlikte) NLTK 3.1 ile değil NLTK 3.2 çalışır pos_tag Birçok Thanks`NLTK, veri tabanlarına uygulandı, listeden nasıl yinelenir
0
A
cevap
1
Eğer başvuruyorsanız ile küçük bir hata bulundu
import pandas as pd
import numpy as np
import nltk
from nltk.tokenize import word_tokenize,wordpunct_tokenize
from nltk.tag import pos_tag
read_test = pd.read_csv("simontwittertest.csv")
df = read_test
df['tokenized'] = df['content'].apply(lambda row: [nltk.wordpunct_tokenize(row) for item in row])
df['tagged'] = df['tokenized'].apply(lambda row: [nltk.pos_tag(row) for item in row])
print(df['tagged'])`
ilgi Out Arka arkaya bir lambda fonksiyonu, sen axis=1
belirtmek gerekir:
df['tokenized'] = df['content'].apply(
lambda row: [nltk.wordpunct_tokenize(row) for item in row], axis=1)
df['tagged'] = df['tokenized'].apply(
lambda row: [nltk.pos_tag(row) for item in row], axis=1)
+0
Teşekkürler. Ben bunu zaten denedim sanırım ama başka bir gideceğim var! –
İlgili konular
- 1. NLTK
- 2. NLTK
- 3. Kontrole hangi stil (ler) uygulandı?
- 4. Zil sesi nasıl yinelenir
- 5. ArrayList nesneleriyle nasıl yinelenir?
- 6. rdlc tam sayfası nasıl yinelenir
- 7. python/nltk içinde tam penn treebank veri kümesini nasıl kullanabilirim
- 8. Retrofit "IllegalStateException: Zaten uygulandı"
- 9. Scala wrappedArray nasıl yinelenir? (Kıvılcım)
- 10. Python'da Queue.Queue öğeleri nasıl yinelenir?
- 11. Yükseltme özelliği ağacı nasıl yinelenir?
- 12. SesRecord için getMaxAmplitude uygulandı
- 13. python nltk
- 14. Python NLTK
- 15. NLTK Performansı
- 16. NLTK, Sentiment Analysis
- 17. $ (function() her zaman neden uygulandı?
- 18. Angularjs ng-fx animasyonu yanlış öğeye uygulandı
- 19. listeden
- 20. NLTK ve dil algılama
- 21. Haritadaki değer ile liste nasıl yinelenir?
- 22. Bir unordered_set içindeki sırasız çiftler nasıl yinelenir?
- 23. Scala'da dize biçimindeki bağımsız değişken nasıl yinelenir
- 24. Bir R ortamında karma öğeler nasıl yinelenir?
- 25. Bir HTML öğesindeki tüm öznitelikler nasıl yinelenir?
- 26. ajax çağrısı nasıl tekrarlanır başarıya kadar yinelenir
- 27. Sondan bir ilk ArrayList nasıl yinelenir?
- 28. Bir menüdeki Qt'deki eylemler nasıl yinelenir?
- 29. açı işlevini açısal olarak yineleme nasıl yinelenir
- 30. nasıl listeden değerler
çok sframe' 'çalışmak için daha kolay olabilir, bkz https://github.com/dato-code/SFrame/issues/16# issuecomment-185326257 – alvas
Çok teşekkürler. Bunu deneyeceğim. –