cari
Rumahpembangunan bahagian belakangC++Bagaimana untuk Cekap Mendapatkan HTML Dijana Secara Dinamik Menggunakan .NET's WebBrowser dan mshtml.HTMLDocument?

How to Efficiently Retrieve Dynamically Generated HTML Using .NET's WebBrowser and mshtml.HTMLDocument?

Mengekstrak HTML Dijana Secara Dinamik menggunakan .NET's WebBrowser dan mshtml.HTMLDocument

Mengambil kandungan HTML yang dijana secara dinamik memberikan cabaran apabila menggunakan WebBrowser atau mshtml.HTMLDocument .NET secara individu. Kaedah unggul menggabungkan kedua-duanya, seperti yang ditunjukkan dalam contoh kod di bawah:

using Microsoft.Win32;
using System;
using System.ComponentModel;
using System.Diagnostics;
using System.Threading;
using System.Threading.Tasks;
using System.Windows.Forms;

namespace WbFetchPage
{
    public partial class MainForm : Form
    {
        public MainForm()
        {
            SetFeatureBrowserEmulation();
            InitializeComponent();
            this.Load += MainForm_Load;
        }

        // Initiate the asynchronous HTML retrieval
        async void MainForm_Load(object sender, EventArgs e)
        {
            try
            {
                var cts = new CancellationTokenSource(10000); // 10-second timeout
                var html = await LoadDynamicPage("https://www.google.com/#q=where+am+i", cts.Token);
                MessageBox.Show(html.Substring(0, 1024) + "..." ); // Display a truncated result
            }
            catch (Exception ex)
            {
                MessageBox.Show(ex.Message);
            }
        }

        // Asynchronous function to retrieve the HTML content
        async Task<string> LoadDynamicPage(string url, CancellationToken token)
        {
            // Navigate and wait for DocumentCompleted event
            var tcs = new TaskCompletionSource<bool>();
            WebBrowserDocumentCompletedEventHandler handler = (s, arg) => tcs.TrySetResult(true);

            using (token.Register(() => tcs.TrySetCanceled(), useSynchronizationContext: true))
            {
                this.webBrowser.DocumentCompleted += handler;
                try
                {
                    this.webBrowser.Navigate(url);
                    await tcs.Task; // Wait for page load
                }
                finally
                {
                    this.webBrowser.DocumentCompleted -= handler;
                }
            }

            // Get the root HTML element
            var documentElement = this.webBrowser.Document.GetElementsByTagName("html")[0];

            // Asynchronously poll for HTML changes
            string html = documentElement.OuterHtml;
            while (true)
            {
                // Wait asynchronously (cancellation possible)
                await Task.Delay(500, token);

                // Continue polling if the browser is busy
                if (this.webBrowser.IsBusy)
                    continue;

                string htmlNow = documentElement.OuterHtml;
                if (html == htmlNow)
                    break; // No changes, exit loop

                html = htmlNow;
            }

            // Check for cancellation
            token.ThrowIfCancellationRequested();
            return html;
        }

        // Enable HTML5 emulation (for IE10+)
        // More details: https://stackoverflow.com/a/18333982/1768303
        static void SetFeatureBrowserEmulation()
        {
            if (LicenseManager.UsageMode != LicenseUsageMode.Runtime)
                return;
            var appName = System.IO.Path.GetFileName(System.Diagnostics.Process.GetCurrentProcess().MainModule.FileName);
            Registry.SetValue(@"HKEY_CURRENT_USER\Software\Microsoft\Internet Explorer\Main\FeatureControl\FEATURE_BROWSER_EMULATION",
                appName, 10000, RegistryValueKind.DWord);
        }
    }
}

Kod ini menggunakan WebBrowser untuk menavigasi dan acara DocumentCompleted untuk pemuatan halaman awal. Ia kemudiannya menggunakan mekanisme pengundian tak segerak (Task.Delay()) untuk memantau perubahan dalam harta OuterHtml. Gelung ditamatkan apabila tiada perubahan selanjutnya dikesan dan penyemak imbas melahu, mengembalikan HTML yang diberikan sepenuhnya. Pendekatan teguh ini mengendalikan kandungan web dinamik dengan berkesan.

Atas ialah kandungan terperinci Bagaimana untuk Cekap Mendapatkan HTML Dijana Secara Dinamik Menggunakan .NET's WebBrowser dan mshtml.HTMLDocument?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
C# vs C: Memilih bahasa yang sesuai untuk projek andaC# vs C: Memilih bahasa yang sesuai untuk projek andaApr 29, 2025 am 12:51 AM

C# sesuai untuk projek yang memerlukan kecekapan pembangunan dan keselamatan jenis, manakala C sesuai untuk projek yang memerlukan prestasi tinggi dan kawalan perkakasan. 1) C# menyediakan koleksi sampah dan LINQ, sesuai untuk aplikasi perusahaan dan pembangunan Windows. 2) C dikenali dengan prestasi tinggi dan kawalan asasnya, dan digunakan secara meluas dalam pengaturcaraan permainan dan sistem.

Cara Mengoptimumkan KodCara Mengoptimumkan KodApr 28, 2025 pm 10:27 PM

Pengoptimuman kod C boleh dicapai melalui strategi berikut: 1. Menguruskan memori secara manual untuk penggunaan pengoptimuman; 2. Tulis kod yang mematuhi peraturan pengoptimuman pengkompil; 3. Pilih algoritma dan struktur data yang sesuai; 4. Gunakan fungsi inline untuk mengurangkan overhead panggilan; 5. Memohon template metaprogramming untuk mengoptimumkan pada masa penyusunan; 6. Elakkan penyalinan yang tidak perlu, gunakan semantik bergerak dan parameter rujukan; 7. Gunakan Const dengan betul untuk membantu pengoptimuman pengkompil; 8. Pilih struktur data yang sesuai, seperti STD :: vektor.

Bagaimana untuk memahami kata kunci yang tidak menentu di C?Bagaimana untuk memahami kata kunci yang tidak menentu di C?Apr 28, 2025 pm 10:24 PM

Kata kunci yang tidak menentu dalam C digunakan untuk memaklumkan pengkompil bahawa nilai pembolehubah boleh diubah di luar kawalan kod dan oleh itu tidak dapat dioptimumkan. 1) Ia sering digunakan untuk membaca pembolehubah yang boleh diubahsuai oleh perkakasan atau program perkhidmatan mengganggu, seperti keadaan sensor. 2) Tidak menentu tidak dapat menjamin keselamatan multi-thread, dan harus menggunakan kunci mutex atau operasi atom. 3) Menggunakan tidak menentu boleh menyebabkan prestasi sedikit berkurangan, tetapi memastikan ketepatan program.

Bagaimana untuk mengukur prestasi benang di C?Bagaimana untuk mengukur prestasi benang di C?Apr 28, 2025 pm 10:21 PM

Mengukur prestasi thread di C boleh menggunakan alat masa, alat analisis prestasi, dan pemasa tersuai di perpustakaan standard. 1. Gunakan perpustakaan untuk mengukur masa pelaksanaan. 2. Gunakan GPROF untuk analisis prestasi. Langkah -langkah termasuk menambah pilihan -pg semasa penyusunan, menjalankan program untuk menghasilkan fail gmon.out, dan menghasilkan laporan prestasi. 3. Gunakan modul Callgrind Valgrind untuk melakukan analisis yang lebih terperinci. Langkah -langkah termasuk menjalankan program untuk menghasilkan fail callgrind.out dan melihat hasil menggunakan kcachegrind. 4. Pemasa tersuai secara fleksibel dapat mengukur masa pelaksanaan segmen kod tertentu. Kaedah ini membantu memahami sepenuhnya prestasi benang dan mengoptimumkan kod.

Bagaimana cara menggunakan Perpustakaan Chrono di C?Bagaimana cara menggunakan Perpustakaan Chrono di C?Apr 28, 2025 pm 10:18 PM

Menggunakan perpustakaan Chrono di C membolehkan anda mengawal selang masa dan masa dengan lebih tepat. Mari kita meneroka pesona perpustakaan ini. Perpustakaan Chrono C adalah sebahagian daripada Perpustakaan Standard, yang menyediakan cara moden untuk menangani selang waktu dan masa. Bagi pengaturcara yang telah menderita dari masa. H dan CTime, Chrono tidak diragukan lagi. Ia bukan sahaja meningkatkan kebolehbacaan dan mengekalkan kod, tetapi juga memberikan ketepatan dan fleksibiliti yang lebih tinggi. Mari kita mulakan dengan asas -asas. Perpustakaan Chrono terutamanya termasuk komponen utama berikut: STD :: Chrono :: System_Clock: Mewakili jam sistem, yang digunakan untuk mendapatkan masa semasa. Std :: Chron

Apakah pengaturcaraan sistem operasi masa nyata di C?Apakah pengaturcaraan sistem operasi masa nyata di C?Apr 28, 2025 pm 10:15 PM

C berfungsi dengan baik dalam pengaturcaraan sistem operasi masa nyata (RTOS), menyediakan kecekapan pelaksanaan yang cekap dan pengurusan masa yang tepat. 1) C memenuhi keperluan RTO melalui operasi langsung sumber perkakasan dan pengurusan memori yang cekap. 2) Menggunakan ciri berorientasikan objek, C boleh merancang sistem penjadualan tugas yang fleksibel. 3) C menyokong pemprosesan gangguan yang cekap, tetapi peruntukan memori dinamik dan pemprosesan pengecualian mesti dielakkan untuk memastikan masa nyata. 4) Pemrograman templat dan fungsi sebaris membantu dalam pengoptimuman prestasi. 5) Dalam aplikasi praktikal, C boleh digunakan untuk melaksanakan sistem pembalakan yang cekap.

Bagaimana untuk memahami keserasian ABI dalam C?Bagaimana untuk memahami keserasian ABI dalam C?Apr 28, 2025 pm 10:12 PM

Keserasian ABI dalam C merujuk kepada sama ada kod binari yang dihasilkan oleh penyusun atau versi yang berbeza boleh serasi tanpa rekompilasi. 1. Konvensyen Calling Function, 2. Pengubahsuaian Nama, 3. Susun atur Jadual Fungsi Maya, 4. Struktur dan susun atur kelas adalah aspek utama yang terlibat.

Bagaimana untuk memahami operasi DMA di C?Bagaimana untuk memahami operasi DMA di C?Apr 28, 2025 pm 10:09 PM

DMA di C merujuk kepada DirectMemoryAccess, teknologi akses memori langsung, yang membolehkan peranti perkakasan secara langsung menghantar data ke memori tanpa campur tangan CPU. 1) Operasi DMA sangat bergantung kepada peranti perkakasan dan pemacu, dan kaedah pelaksanaan berbeza dari sistem ke sistem. 2) Akses langsung ke memori boleh membawa risiko keselamatan, dan ketepatan dan keselamatan kod mesti dipastikan. 3) DMA boleh meningkatkan prestasi, tetapi penggunaan yang tidak wajar boleh menyebabkan kemerosotan prestasi sistem. Melalui amalan dan pembelajaran, kita dapat menguasai kemahiran menggunakan DMA dan memaksimumkan keberkesanannya dalam senario seperti penghantaran data berkelajuan tinggi dan pemprosesan isyarat masa nyata.

See all articles

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

SublimeText3 Linux versi baharu

SublimeText3 Linux versi baharu

SublimeText3 Linux versi terkini

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

VSCode Windows 64-bit Muat Turun

VSCode Windows 64-bit Muat Turun

Editor IDE percuma dan berkuasa yang dilancarkan oleh Microsoft

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat

Pelayar Peperiksaan Selamat ialah persekitaran pelayar selamat untuk mengambil peperiksaan dalam talian dengan selamat. Perisian ini menukar mana-mana komputer menjadi stesen kerja yang selamat. Ia mengawal akses kepada mana-mana utiliti dan menghalang pelajar daripada menggunakan sumber yang tidak dibenarkan.

PhpStorm versi Mac

PhpStorm versi Mac

Alat pembangunan bersepadu PHP profesional terkini (2018.2.1).