取得した大量のhtmlデータを処理する-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

取得した大量のhtmlデータを処理する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 13, 2016 pm 12:08 PM

domhtmlsimple

取得した大量のHTMLデータ
を処理して、3万文字程度の大量のHTMLデータを取得します。ただし、最初の数単語は役に立たず、最後の数千文字だけが役に立つので、そこからデータを抽出したいと考えています。正規表現を直接使用して処理すると、多くのリソースが無駄になります。正規表現を文字列の末尾から開始し、特定の位置に到達したときに停止する方法はありますか。
simple_html_dom クラスを使って対処しようとしたのですが、行き詰まってしまいました...
アクセスするものが必ずしも長いか短いとは限らないため、直接インターセプトする良い方法ではありません固定文字数。

-----解決策のアイデア----------------------
正確ではないので必要なコンテンツをどこから始めれば、リソースを無駄にする問題はありません
-----ソリューションのアイデア------ - ---
Get html
file_get_contents
curl

HTML を定期的に解析して、目的のテキストを取得します。
------解決策----------------------
良い解決策はありません。フィルターデータは定期的に照合するか、使用するクラスを使用する必要があります。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

PHPアプリケーションをより速くする方法May 12, 2025 am 12:12 AM

tomakephpapplicationsfaster、followthesesteps：1）useopcodecachinglikeopcacheTostoredscriptbytecode.2）最小化abasequeriesecachingingindexing.3）leveragephp7機能forbettercodeefficiency.4）

PHP Performance Optimization Checklist：今すぐ速度を改善してくださいMay 12, 2025 am 12:07 AM

PoldeSeptepsに続きます

PHP依存性インジェクション：コードのテスト可能性を改善しますMay 12, 2025 am 12:03 AM

依存性注入（DI）は、明示的に推移的な依存関係によりPHPコードのテスト可能性を大幅に改善します。 1）DI分離クラスと特定の実装により、テストとメンテナンスが柔軟になります。 2）3つのタイプのうち、コンストラクターは、状態を一貫性に保つために明示的な式依存性を注入します。 3）DIコンテナを使用して複雑な依存関係を管理し、コードの品質と開発効率を向上させます。

PHPパフォーマンスの最適化：データベースクエリの最適化May 12, 2025 am 12:02 AM

DatabaseQueryoptimizationInpholvesseveralstrategESTOEnhancePerformance.1）selectonlynlynlyndorycolumnStoredatedataTransfer.2）useindexingtospeedupdataretrieval.3）revenmecrycachingtostoreres sultsoffrequent queries.4）

簡単なガイド：PHPスクリプトで電子メールを送信しますMay 12, 2025 am 12:02 AM

phpisusededemingemailsduetoitsbuilt-inmail（）functionandsupportiveLibrarieslikephpmailerandswiftmailer.1）usethemail（）functionforbasicemails、butithaslimitations.2）emploadforadvancedfeatureSlikelikelivableabableabuses.3）雇用

PHPパフォーマンス：ボトルネックの識別と修正May 11, 2025 am 12:13 AM

PHPパフォーマンスボトルネックは、次の手順で解決できます。1）パフォーマンス分析にXdebugまたはBlackfireを使用して問題を見つける。 2）データベースクエリを最適化し、APCUなどのキャッシュを使用します。 3）array_filterなどの効率的な関数を使用して、配列操作を最適化します。 4）bytecodeキャッシュ用のopcacheを構成します。 5）HTTP要求の削減や写真の最適化など、フロントエンドを最適化します。 6）パフォーマンスを継続的に監視および最適化します。これらの方法により、PHPアプリケーションのパフォーマンスを大幅に改善できます。

PHPの依存関係注射：簡単な要約May 11, 2025 am 12:09 AM

依存関係（di）inphpisadesignpatternativats anducesclassodulencies、拡張測定性、テスト可能性、および維持可能性。

PHPパフォーマンスの向上：キャッシュ戦略と技術May 11, 2025 am 12:08 AM

cachingemprovesppperformancebystring of computationsorquickretrieval、還元装置の削減は、reducingerloadendenhancersponseTimes.efcectivestrategiesInclude：1）opcodecaching、compiledphpscriptsinmemorytoskipcompilation;

See all articles