Ortaya çıkan web sayfası içeriğini elde etmeye çalışıyorum, böylece görüntü metnini çıkarabiliyorum. Aşağıdaki kodu denedim ama sonuçta oluşan html değil, bana kaynak html verir. Web sayfasının çıktısını alın C#
string urlPath = "http://www.cbsnews.com/news/jamar-clark-protests-follow-decision-not-to-file-charges-in-minneapolis-police-shooting/";
WebClient client = new WebClient();
string str = client.DownloadString(urlPath);
Chrome tarayıcısında Geliştirici Araçları html ile str değişkeninde metin karşılaştırın ve farklı sonuçlar elde edeceksiniz.
Herhangi bir öneri takdir edilecektir.
Ve soru şu ki .......? –
Chrome HTML'yi ayrıştırır, sadece onu almaz. Bu, özel karakterlerin, satırların, vb. Işlemlerin gerçekleştirilmesi anlamına gelir. Tam olarak ne yapmaya çalışıyorsunuz? Gördüğünüz şey muhtemelen "Sayfa Kaynağını Göster" e daha yakındır ** edit ** Ayrıca sayfada yürütülen javascript, yüklü olan iframe'ler ve daha fazlası işlenen html'yi kaynağa göre değiştirebilir, böylece muhtemelen hiç gitmeyecek her neyse tam olarak – Matt
ve soru "tarayıcıda C# ile görüntülenen metni nasıl alırım". – Garagewerks