2016-03-29 14 views
1

HTML kaynağını php kullanarak cURL kullanarak başka birinin web sitesinden kopyalamaya çalışıyorum. Sadece HTML'lerini, üstbilgileri ve altbilgileri ve görüntüleri değil, yazdırılabilir olarak tanımlamak istiyorum. Amacım, indirme işlemini hızlandırmak ve sitelerine daha az yük yüklemektir. Sayfalarını ilk kez 8 yıl içinde güncellediler ve sayfanın basılabilir sürümünü belirlemek için bir GET değişkeni yerine CSS kullanmayı değiştirdiler. CURL'a sadece yazdırılabilir öğeleri döndürmesini söylemek mümkün mü? Düzenleme:Sadece bir web sayfasının yazdırılabilir sürümünü almak için php'de cURL'yi nasıl kurarsınız?

@media print { 
    .visible-print-block { 
     display: block !important; 
    } 
} 
+0

Yazdırma ortamı stil sayfasını ayrıştırmadan, bunun mümkün olacağını düşünmüyorum çünkü tüm HTML hala var. Baskı görünümü herhangi bir HTML düğümünü kaldırmaz, sadece CSS'ye göre gizler. – Quantastical

cevap

0

muhtemelen bu beklenen cevap değil ama yazdırılabilir versiyonunu üretmek olamaz DOM ağacını ayrıştırma ve kendinizi HTML işleme hariç: Onlar kendi CSS böyle tabloların çok kullandığınız .

Ancak 1999 yılında, web tabanlı e-posta için, böyle bir şey kullanılmış :

system("lynx --dump 'www.microsoft.com'"); 

Bu iyi çalışıyor, fakat:

  • muhtemelen MacOS üzerine, linux üzerine kutunun çalışır ve Windows, lynx tarayıcısını yüklemeniz gerekir.
  • yavaş - Biraz özen ve muhtemelen escapeshellarg ile, etki alanını kodlamak için gereken
  • o forklynx tarayıcı çünkü.
  • lynxJavascript da desteklemiyor CSS

bir başka yolu ekran görüntüleri yapmak için birçok yazılım paketlerine bir kullanmaktır çok gelişmiş değil. Ancak metin yerine görüntü üretecekler.

İlgili konular