2016-04-14 16 views
0

Bir web sayfasını txtfile olarak kaydetmek istiyorum. Kodu kaydetmek istemiyorum, kodu hiç istemiyorum, sayfayı txtfile olarak kaydetmek istiyorum ve sonra txt dosyasıyla ne yapmak istediğimi biliyorum. Web sayfasını txt olarak kaydetme (web sayfası kodunda değil)

ben bu yapılabilir, göz gizli yapmak istiyorum yanı sayfa

import java.awt.Desktop; 
import java.net.URI; 


public class Main { 

public static void main(String[] args) throws Exception { 

    Desktop d = Desktop.getDesktop(); 
    String url = "http://www.google.com"; 
    d.browse(new URI(url)); 
} 

}

açmak için aşağıdaki kodu kullanabilirsiniz?

bunu daha açık hale getirmek için, bir sayfayı txt olarak kaydetmek için CTRL + S tuşlarına basıp txt'yi seçin. Sayfanın kodunu istemiyorum, arabellekli okuyucu ve giriş akışıyla denedim ama ihtiyacım olan şey bu değil çünkü bana ihtiyacım olmayan URL kodunu veriyorlar. Önerileriniz için teşekkür ederiz.

public static String getHTML(String urlToRead) throws Exception { 

     if (!urlToRead.startsWith("http")) 
      urlToRead = "http://" + urlToRead; 

     final StringBuilder result = new StringBuilder(); 
     final URL url = new URL(urlToRead); 
     final HttpURLConnection conn = (HttpURLConnection) url.openConnection(); 
     conn.setRequestMethod("GET"); 
     conn.setRequestProperty("User-Agent", USER_AGENT); 
//  @SuppressWarnings("unused") 
//  final int responseCode = conn.getResponseCode(); 
     final BufferedReader rd = new BufferedReader(new InputStreamReader(conn.getInputStream())); 

     String line; 
     while ((line = rd.readLine()) != null) 
      result.append(line); 
     rd.close(); 

     return result.toString(); 
    } 

sonra Document oluşturabilir:

final Document doc = Jsoup.parse(content); 

ve en iyi bahis bu (kod ile, yani) tüm sayfayı alacak http://jsoup.org/

kullanıyor

cevap

0

Oradan, kendi başına div s, span s ve p s ...

+0

Cevabınız için teşekkür ederim, ancak hala Java için tamamen yeni ve Jsoup Eclipse'de benim için çalışmıyor, içe aktarılamıyor ve nasıl oluşturulacağını bilmiyorum. div S, Span ve P listesinin ne olduğunu bilmiyorum. –

+0

@AboelmagdSaad Web sayfalarıyla çalışmaya başlamadan önce muhtemelen bazı temel HTML'yi öğrenmelisiniz. Koşmadan önce yürümeyi öğren. – Kayaman

+0

@Exceptyon Elbette doğru, ipucu için teşekkür ederim –