>  기사  >  웹 프론트엔드  >  웹 브라우저 컨트롤에서 동적으로 생성된 HTML 코드를 검색하는 방법은 무엇입니까?

웹 브라우저 컨트롤에서 동적으로 생성된 HTML 코드를 검색하는 방법은 무엇입니까?

DDD
DDD원래의
2024-10-18 08:35:03354검색

How to Retrieve Dynamically Generated HTML Code from Web Browser Controls?

.NET의 WebBrowser 또는 mshtml.HTMLDocument를 사용하여 HTML 코드를 동적으로 생성하는 방법은 무엇입니까?

문제:

WebBrowser 클래스 또는 mshtml.HTMLDocument 인터페이스를 사용하여 웹페이지에서 동적으로 생성된 HTML 코드를 검색하는 것은 어려울 수 있습니다. WebBrowser 클래스가 렌더링된 HTML을 캡처하지 못하고 mshtml.HTMLDocument가 실제 페이지 콘텐츠와 다른 원시 HTML을 반환합니다.

해결책:

WebBrowser 사용 클래스:

WebBrowser 클래스는 렌더링된 HTML을 얻기 위한 직접적인 방법을 제공하지 않지만 해결 방법을 구현하는 것은 가능합니다. WebBrowser 컨트롤을 양식에 추가하고 원하는 URL로 이동한 후 다음 단계를 사용하여 HTML을 검색합니다.

  1. 모든 콘텐츠를 선택하려면 "CTRL A" 키를 보냅니다.
  2. 복사 방법을 사용하여 선택 항목을 클립보드에 복사합니다.
  3. 클립보드에서 HTML을 붙여넣고 필요에 따라 구문 분석합니다.

mshtml.HTMLDocument 인터페이스 사용 :

  1. mshtml.HTMLDocument의 인스턴스를 생성하고 write를 사용하여 다운로드한 HTML을 전달합니다.
  2. all 속성과 IsBusy를 폴링하여 HTML 스냅샷의 변경 사항을 확인하세요. WebBrowser 컨트롤의 속성입니다.
  3. IsBusy 속성이 false가 되고 HTML 스냅샷에 변경 사항이 없으면 페이지가 완전히 렌더링된 것으로 간주하고 HTML을 검색합니다.

추가 고려 사항:

  • 브라우저 기능 제어를 사용하여 HTML5 렌더링이 활성화되어 있는지 확인하세요.
  • 무한 렌더링을 방지하려면 시간 제한을 사용하세요.
  • Async/await 폴링 로직 구현을 단순화할 수 있습니다.

예제 코드:

<code class="C#">using Microsoft.Win32;
using System;
using System.Threading;
using System.Threading.Tasks;
using mshtml;

public async Task<string> LoadDynamicPage(string url, CancellationToken token)
{
    var doc = new HTMLDocument();
    doc.write(new System.Net.WebClient().DownloadString(url));

    // Poll for changes in HTML snapshot
    var html = doc.documentElement.outerHTML;
    while (true)
    {
        await Task.Delay(500, token);
        var htmlNow = doc.documentElement.outerHTML;
        if (html == htmlNow)
            break;

        html = htmlNow;
    }

    return html;
}</code>

위 내용은 웹 브라우저 컨트롤에서 동적으로 생성된 HTML 코드를 검색하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.