Online ingilizce kelimelerin çoğunun bir listesini buldum, ancak satır sonları unix tarzında (Unicode: UTF-8 olarak kodlanmış). Bu sitede buldum: http://dreamsteep.com/projects/the-english-open-word-list.htmlLF'yi CRLF'ye nasıl dönüştürebilirim?
Satır sonlarını CRLF'ye nasıl dönüştürebilirim? Onları kullanacağım program dosyadaki her satırdan geçiyor, bu yüzden kelimeler satır başına bir olmak zorunda.
Bu dosyanın bir kısmıdır: bitbackbitebackbiterbackbitersbackbitesbackbitingbackbittenbackboard
Olmalıdır:
bit
backbite
backbiter
backbiters
backbites
backbiting
backbitten
backboard
Nasıl bu tip dosyalarımı dönüştürebilirsiniz? Not: Toplamda 80.000 kelime veya toplamda 26 dosya (harf başına bir tane) (böylece program çok hızlı olmalıdır).
Nereden başlayacağımı bilmiyorum çünkü unicode ile çalışmadım. Şimdiden teşekkürler!
benim kodunda bununla, (önerilen) parametre olarak rU
kullanma:
Traceback (most recent call last):
File "<pyshell#5>", line 1, in <module>
addWords('B Words')
File "D:\my_stuff\Google Drive\documents\SCHOOL\Programming\Python\Programming Class\hangman.py", line 138, in addWords
for line in my_file:
File "C:\Python3.3\lib\encodings\cp1252.py", line 23, in decode
return codecs.charmap_decode(input,self.errors,decoding_table)[0]
UnicodeDecodeError: 'charmap' codec can't decode byte 0x8d in position 7488: character maps to <undefined>
kimse bu konuda bana yardımcı olabilir:
with open(my_file_name, 'rU') as my_file:
for line in my_file:
new_words.append(str(line))
my_file.close()
bu hatayı alıyorum?
Bu http://stackoverflow.com/questions/3891076/how-to-convert-windows-end-of-line-in-unix-end-of-line-cr-lf-to- sayfasını bulabilirsin Yararlı – dmi3y
Programınızı, her iki satır sonu türünü işlemek mümkün kılmıyor musunuz? –
@JamesMcLaughlin Zaten bir kelime listesi içeren bir dosyam var. Ayrıca, hiç bir zaman unicode kullanmamıştım (belirtildiği gibi), bu türden sonlarla nasıl başa çıkacağımı bilmiyorum. –