Beispiel für die Verwendung von C# zum Abrufen des HTML-Quellcodes einer Webseite-C#.Net-Tutorial-php.cn

Heim

Backend-Entwicklung

C#.Net-Tutorial

Beispiel für die Verwendung von C# zum Abrufen des HTML-Quellcodes einer Webseite

高洛峰

Jan 14, 2017 pm 01:29 PM

Ich arbeite kürzlich an einem Projekt und eine der Funktionen besteht darin, den Quellcode einer Webseite basierend auf einer URL-Adresse abzurufen. In ASP.NET (C#) scheint es viele Möglichkeiten zu geben, den Quellcode einer Webseite abzurufen. Ich habe gerade einen einfachen WebClient erstellt, der sehr einfach und unkompliziert ist. Später trat jedoch ein sehr lästiges Problem auf, und zwar die verstümmelten chinesischen Schriftzeichen.

Nach sorgfältiger Untersuchung sind chinesische Webseiten nichts anderes als zwei Kodierungen: GB2312 und UTF-8. Wir haben also den folgenden Code:

       /// <summary>
       /// 根据网址的URL，获取源代码HTML
       /// </summary>
       /// <param name="url"></param>
       /// <returns></returns>
       public static string GetHtmlByUrl(string url)
       {
           using (WebClient wc = new WebClient())
           {
               try
               {
                   wc.UseDefaultCredentials = true;
                   wc.Proxy = new WebProxy();
                   wc.Proxy.Credentials = CredentialCache.DefaultCredentials;
                   wc.Credentials = System.Net.CredentialCache.DefaultCredentials;
                   byte[] bt = wc.DownloadData(url);
                   string txt = System.Text.Encoding.GetEncoding("GB2312").GetString(bt);
                   switch (GetCharset(txt).ToUpper())
                   {
                       case "UTF-8":
                           txt = System.Text.Encoding.UTF8.GetString(bt);
                           break;
                       case "UNICODE":
                           txt = System.Text.Encoding.Unicode.GetString(bt);
                           break;
                       default:
                           break;
                   }
                   return txt;
               }
               catch (Exception ex)
               {
                   return null;
               }
           }
       }

Um es kurz zu erklären: WebClient wird hier verwendet, um ein WC-Objekt zu erstellen (diese Benennung ist etwas umständlich). Rufen Sie dann die DownloadData-Methode des WC-Objekts auf, übergeben Sie den URL-Wert und geben Sie ein Byte-Array zurück. Standardmäßig wird GB2312 verwendet, um dieses Byte-Array zu lesen und in einen String umzuwandeln. Suchen Sie die charakteristischen Zeichen des Codierungsformats der Webseite aus der Zeichenfolge des Quellcodes der Webseite, z. B. durch Suchen nach Informationen wie charset="utf-8", um das Codierungsformat der aktuellen Webseite zu bestimmen.

Die GetCharset-Funktion wird verwendet, um das Codierungsformat der aktuellen Webseite abzurufen. Der spezifische Code lautet wie folgt:

      /// <summary>
       /// 从HTML中获取获取charset
       /// </summary>
       /// <param name="html"></param>
       /// <returns></returns>
       public static string GetCharset(string html)
       {
           string charset = "";
           Regex regCharset = new Regex(@"content=[""'].*\s*charset\b\s*=\s*""?(?<charset>[^""']*)", RegexOptions.IgnoreCase);
           if (regCharset.IsMatch(html))
           {
               charset = regCharset.Match(html).Groups["charset"].Value;
           }
           if (charset.Equals(""))
           {
               regCharset = new Regex(@"<\s*meta\s*charset\s*=\s*[""']?(?<charset>[^""']*)", RegexOptions.IgnoreCase);
               if (regCharset.IsMatch(html))
               {
                   charset = regCharset.Match(html).Groups["charset"].Value;
               }
           }
           return charset;
       }

Weitere verwandte Artikel zu Beispielen für die Verwendung von C# zum Abrufen des HTML-Quellcodes von Webseiten finden Sie auf der chinesischen PHP-Website!

Stellungnahme

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Verwandter Artikel

Entwicklung mit C# .NET: Ein praktischer Leitfaden und BeispieleMay 12, 2025 am 12:16 AM

C# und .NET bieten leistungsstarke Funktionen und eine effiziente Entwicklungsumgebung. 1) C# ist eine moderne, objektorientierte Programmiersprache, die die Kraft von C und die Einfachheit von Java kombiniert. 2) Das .NET -Framework ist eine Plattform zum Erstellen und Ausführen von Anwendungen und unterstützt mehrere Programmiersprachen. 3) Klassen und Objekte in C# sind der Kern der objektorientierten Programmierung. Klassen definieren Daten und Verhalten, und Objekte sind Instanzen von Klassen. 4) Der Müllsammlungsmechanismus von .NET verwaltet automatisch Speicher, um die Arbeit der Entwickler zu vereinfachen. 5) C# und .NET liefern leistungsstarke Dateibetriebsfunktionen, die synchrone und asynchrone Programmierungen unterstützen. 6) Häufige Fehler können durch Debugger, Protokollierung und Ausnahmebehandlung gelöst werden. 7) Leistungsoptimierung und Best Practices umfassen die Verwendung von StringBuild

C# .NET: Verständnis des Microsoft .NET -FrameworksMay 11, 2025 am 12:17 AM

.NetFramework ist eine plattformübergreifende, plattformübergreifende Entwicklungsplattform, die ein konsistentes Programmiermodell und eine leistungsstarke Laufzeitumgebung bietet. 1) Es besteht aus CLR und FCL, die Speicher und Threads verwalten, und FCL bietet vorgefertigte Funktionen. 2) Beispiele für die Nutzung sind das Lesen von Dateien und LINQ -Abfragen. 3) Häufige Fehler beinhalten unbehandelte Ausnahmen und Speicherlecks und müssen mit Debugging -Tools gelöst werden. 4) Die Leistungsoptimierung kann durch asynchrones Programmieren und Caching erreicht werden, und die Aufrechterhaltung der Code -Lesbarkeit und -wartbarkeit ist der Schlüssel.

Die Langlebigkeit von C# .NET: Gründe für ihre dauerhafte PopularitätMay 10, 2025 am 12:12 AM

Gründe für C#.NET, die dauerhaft attraktiv bleiben, sind seine hervorragende Leistung, das reiche Ökosystem, die starken Unterstützung der Community und die plattformübergreifenden Entwicklungsfunktionen. 1) ausgezeichnete Leistung und eignet sich für Anwendungen auf Unternehmensebene und Spieleentwicklung. 2) Das .NET -Framework bietet eine breite Palette von Klassenbibliotheken und Tools, um eine Vielzahl von Entwicklungsfeldern zu unterstützen. 3) Es verfügt über eine aktive Entwicklergemeinschaft und eine reiche Lernressourcen. 4) .NetCore realisiert die plattformübergreifende Entwicklung und erweitert die Anwendungsszenarien.

Mastering C# .NET -Designmuster: Von Singleton zur AbhängigkeitsinjektionMay 09, 2025 am 12:15 AM

Entwurfsmuster in C#.NET umfassen Singleton -Muster und Abhängigkeitsinjektion. 1.Singleton -Modus stellt sicher, dass nur eine Instanz der Klasse vorhanden ist, die für Szenarien geeignet ist, in denen globale Zugriffspunkte erforderlich sind. Es sollte jedoch Aufmerksamkeit auf die Sicherheit von Threads und Missbrauch geschenkt werden. 2. Die Abhängigkeitsinjektion verbessert die Code -Flexibilität und -Testabilität durch Injektion von Abhängigkeiten. Es wird häufig für die Konstruktorinjektion verwendet, es ist jedoch erforderlich, übermäßigen Gebrauch zu vermeiden, um die Komplexität zu erhöhen.

C# .NET in der modernen Welt: Anwendungen und BranchenMay 08, 2025 am 12:08 AM

C#.NET wird in der modernen Welt in den Bereichen Spieleentwicklung, Finanzdienstleistungen, Internet der Dinge und Cloud Computing häufig eingesetzt. 1) Verwenden Sie in der Spielentwicklung C#, um über die Unity Engine zu programmieren. 2) Im Bereich Finanzdienstleistungen wird C#.NET verwendet, um Hochleistungshandelssysteme und Datenanalyse-Tools zu entwickeln. 3) In Bezug auf IoT und Cloud Computing unterstützt C#.NET Unterstützung durch Azure -Dienste zur Entwicklung der Gerätesteuerungslogik und der Datenverarbeitung.

C# .NET Framework vs. .net Core/5/6: Was ist der Unterschied?May 07, 2025 am 12:06 AM

.NETFRAMEWORKISWINDOWS-zentriert, while.Netcore/5/6SupportScross-Plattformdevelopment.1) .NETFRAMEWORK, SEber2002, ISIdeAlforwindowsApplicationsButlimitedIncross-PlatformCaps.2) .NETCORE, VORTEMANCE, MITTEILAGE und SITSEVOLUTUTIONS (.NETSVOLUTTATURE (.NETSVOLDS (.NETSVOLUTTIONS (.NETSVOLUTTION) (.NETSVOLUTTIONS (.NOLUTTUMS (.

Die Community von C# .NET -Entwicklern: Ressourcen und UnterstützungMay 06, 2025 am 12:11 AM

Die C#.NET Developer Community bietet umfangreiche Ressourcen und Unterstützung, einschließlich: 1. Microsoft offizielle Dokumente, 2. Community -Foren wie Stackoverflow und Reddit sowie 3. Open -Source -Projekte auf GitHub. Diese Ressourcen helfen Entwicklern, ihre Programmierkenntnisse vom grundlegenden Lernen bis hin zu erweiterten Anwendungen zu verbessern.

Der C# .NET -Vorteil: Funktionen, Vorteile und AnwendungsfälleMay 05, 2025 am 12:01 AM

Die Vorteile von C#.NET umfassen: 1) Sprachmerkmale wie asynchrone Programmierungen vereinfachen die Entwicklung; 2) Leistung und Zuverlässigkeit, Verbesserung der Effizienz durch JIT -Kompilierung und Mülleimermechanismen; 3) cross-plattform-Unterstützung, .Netcore erweitert die Anwendungsszenarien; 4) Eine breite Palette praktischer Anwendungen mit hervorragender Leistung vom Web bis zum Desktop und der Spieleentwicklung.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Wie kann ich KB5055612 in Windows 10 nicht installieren?

4 Wochen vorByDDD

<🎜>: Bubble Gum Simulator Infinity - So erhalten und verwenden Sie Royal Keys

4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

<🎜>: Wachsen Sie einen Garten - Komplette Mutationsführer

3 Wochen vorByDDD

Nordhold: Fusionssystem, erklärt

4 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Mandragora: Flüstern des Hexenbaum

3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

SublimeText3 Linux neue Version

SublimeText3 Linux neueste Version

SAP NetWeaver Server-Adapter für Eclipse

Integrieren Sie Eclipse mit dem SAP NetWeaver-Anwendungsserver.

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.

DVWA

Damn Vulnerable Web App (DVWA) ist eine PHP/MySQL-Webanwendung, die sehr anfällig ist. Seine Hauptziele bestehen darin, Sicherheitsexperten dabei zu helfen, ihre Fähigkeiten und Tools in einem rechtlichen Umfeld zu testen, Webentwicklern dabei zu helfen, den Prozess der Sicherung von Webanwendungen besser zu verstehen, und Lehrern/Schülern dabei zu helfen, in einer Unterrichtsumgebung Webanwendungen zu lehren/lernen Sicherheit. Das Ziel von DVWA besteht darin, einige der häufigsten Web-Schwachstellen über eine einfache und unkomplizierte Benutzeroberfläche mit unterschiedlichen Schwierigkeitsgraden zu üben. Bitte beachten Sie, dass diese Software

Heiße Themen

1671

1428

1329

1276

1256