Olası Çoğalt:
Looking for dataset to test FULLTEXT style searches onÇok miktarda metin dosyası nereden bulabilirim?
Ben test için düz metin 100 GB gerekir bunun için veri madenciliğinin bir projeye son zamanlarda değilim ... Ben arama yoruldum Bütün gün net. Birisi, bu tür metin dosyalarını indirebileceğim bağlantıları sağlayarak bana yardımcı olun. Teşekkürler.
http://dumps.wikimedia.org/ indirmek 100GB metin dosyasını çalışıyorsun kullanmalıdır: http://www.gutenberg.org/
Vikipedi ayrıca makalelerin bir arşiv indirmek için izin verir:
Gutenberg Projesi iyi bir başlangıç olabilir. .... – vikky
Evet ..! Gerçekte 100 GB'den fazlası .. 1TB hedefimiz ..! – Sri
Gutenberg'in tamamını bir 7zip dosyasına alın: http://www.gutenberg-tar.com/ – JoeRocc