Web sayfalarını kazıyarak içeren bir php komut dosyası yazıyorum. Şu anda, senaryo hattı ile sayfa hattını araştırıyor ama birden fazla satır yayılan bir etiket varsa hepsi satır sonları kaldırarak elimden muhtemelen sayfanın preprocess, Bir html etiketinin birden çok satıra bölünüp ayrılmadığı nasıl belirlenir
<img src="example.jpg"
alt="example">
kötü kötü gelirse
gibi kırar, daha sonra en yakın>
numarasından tekrar yerleştirilir, ancak bu bir kludge gibi görünür.
İdeal olarak, çizgileri kapsayan, yalnızca satırları birleştiren ve işlemeye devam eden bir etiketi algılayabileyim.
Peki bunu algılamanın en iyi yolu nedir?