2008-10-06 34 views
11

Statik bir html sitesi kazıyorum ve içeriği bir veritabanı destekli CMS'ye taşıyorum. Tekstil'i CMS'de kullanmak isterim.HTML'yi Tekstil'e nasıl dönüştürebilirim?

HTML'yi Tekstil'e dönüştüren bir araç var mı? Bu yüzden mevcut siteyi kazıyarak, HTML'yi Tekstil'e dönüştürebilir ve bu verileri veritabanına ekleyebilir miyim?

cevap

-2

Bu, basit bir biçimlendirme yerine geçer, iyi bir normal ifade düzeltilemez.

ben Perl, LWP tavsiye :: Basit ve her şeyi yapmak için bazı regexes (spidering tasarım ve menüler sıyırma, tekstil dönüştürmek ve sonra veritabanına gönderme.) Burada

1

Bunun eski bir soru olduğunu biliyorum, ancak kendimi geçen gün yapmaya çalışıyorum ve Pandoc'u bulana kadar yararlı bir şey bulamadım. Diğer biçimlendirme formatlarını da yükleyebilir - oldukça zekice.

+0

Ancak stilleri ve diğer şeyleri kaybedersiniz. O zaman Markdown'a da dönüşebilirsin. – Bruno

-1

bu basit java kodu deneyin Eğer

import java.net.*; 
import java.io.*; 

class Crawle 
{ 

public static void main(String ar[])throws Exception 
{ 


URL url = new URL("https://www.google.co.in/#q=i+am+happy"); 
InputStream io = url.openStream(); 
BufferedReader br = new BufferedReader(new InputStreamReader(io)); 
FileOutputStream fio = new FileOutputStream("crawler/file.txt"); 
PrintWriter pr = new PrintWriter(fio,true); 
String data = ""; 
while((data=br.readLine())!=null) 
{ 
pr.println(data); 
System.out.println(data); 
} 

} 
} 
} 
+0

Textile – cmroanirgo

+0

ile ilgisi yok Soruya göre, herhangi bir web sitesi sayfasını taramak ve daha sonra herhangi bir metin dosyasına kaydetmek istiyor, cevabımda yazdıklarım sadece bununla ilgili. Ve cevabımda yukarıdaki sorgu için basit bir örnek paylaşmıştım. Reddetme nedenini hala alamıyorum. – Simmant

+0

tekstil <> metin dosyası. bkz http://redcloth.org/textile – cmroanirgo

İlgili konular