WinForms WebBrowser で IFrame をナビゲートしてビデオ リンクを抽出する
WinForms WebBrowser コントロール内の <video>
タグからビデオ リンクを抽出することは、IFrame を扱う場合に困難になります。 これは、各 IFrame に独自の HTML ドキュメントが含まれているためです。 このガイドでは、この状況に対処するための堅牢な方法について詳しく説明します。
IFrame 構造を理解する
IFrame はネストされたブラウザ ウィンドウとして機能し、メイン ページ内に独立した HTML コンテンツを埋め込みます。 したがって、1 つの Web ページが複数の HTML ドキュメント (メイン ページに 1 つ、各 IFrame に 1 つ) で構成される場合があります。
IFrame コンテンツへのアクセス
IFrame 内の要素にアクセスするには、HtmlWindowCollection
の WebBrowser.Document.Window
を反復処理する必要があります。各 HtmlWindow
オブジェクトはフレームまたは IFrame を表し、その Document
プロパティはその HTML コンテンツへのアクセスを提供します。
段階的なアプローチ:
DocumentCompleted
イベント ハンドラーを実装します:
<code class="language-csharp">browser.DocumentCompleted += Browser_DocumentCompleted;</code>
ドキュメントの読み込みを確認します:
イベント ハンドラー内で、ドキュメントが完全にロードされていることを確認します。
<code class="language-csharp">if (browser.ReadyState != WebBrowserReadyState.Complete) return;</code>
フレームを反復処理する:
HtmlWindowCollection
を使用して各フレームのドキュメントにアクセスします:
<code class="language-csharp">var documentFrames = browser.Document.Window.Frames;</code>
ビデオ要素の検索:
GetElementsByTagName("VIDEO")
を使用して各フレームの要素を反復処理します。
ビデオとポスターの属性を抽出:
HtmlElement.GetAttribute()
を使用して、src
タグからビデオリンク (poster
) とポスター画像 (<video>
) 属性を抽出します。
例外処理
IFrame 内の HTML を解析するときに、UnauthorizedAccessException
または InvalidOperationException
が発生する場合があります。 これらの例外は通常、セキュリティ制限によりアクセスできない要素を示します。 これらの例外を適切に処理すること (多くの場合は単純に無視すること) がベスト プラクティスです。
コード例:
この例はプロセスを示しています:
<code class="language-csharp">private void Browser_DocumentCompleted(object sender, WebBrowserDocumentCompletedEventArgs e) { var browser = sender as WebBrowser; if (browser.ReadyState != WebBrowserReadyState.Complete) return; var documentFrames = browser.Document.Window.Frames; foreach (HtmlWindow frame in documentFrames) { try { var videoElement = frame.Document.Body.GetElementsByTagName("VIDEO").Cast<HtmlElement>().FirstOrDefault(); if (videoElement != null) { string videoLink = videoElement.GetAttribute("src"); string posterImage = videoElement.GetAttribute("poster"); // Process videoLink and posterImage } } catch (UnauthorizedAccessException) { } catch (InvalidOperationException) { } } }</code>
この改善されたアプローチは、WinForms WebBrowser コントロール内の IFrame からビデオ リンクを抽出するための、より堅牢で効率的なソリューションを提供します。 videoLink
と posterImage
の処理を特定のニーズに合わせて調整してください。
以上がWinForms WebBrowser コントロール内の IFrame からビデオ リンクを効率的に抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。