ホームページ  >  記事  >  バックエンド開発  >  PHPでWebページの指定タグ内のデータを収集する方法

PHPでWebページの指定タグ内のデータを収集する方法

WBOY
WBOYオリジナル
2016-06-23 13:59:441380ブラウズ

PHPの収集問題、ソースコード内のulタグ内のデータを収集してローカルデータベースに書き込む方法:

相手のWebページの特定のソースコードは次のとおりです:

 <ul class="priceTableRows">                                                                        <li class="cq">                                    <span class="w1"><a href="http://www.xxxx.cn/exchange-priceItem-290-1-0.html" title=" 鸡骨草" target="_blank"> 鸡骨草</a></span>                                    <span class="w2"><a href="http://www.xxxx.cn/exchange-prices-290-1-29001.html?t=1" title=" 大叶全草 广西" target="_blank"> 大叶全草 广西</a></span>                                    <span class="w9">亳州</span>                                    <span class="w3">17.00</span>                                     <span class="w4">平</span>                                    <span class="w5"><em class="up">126.67%</em></span>                                    <span class="w6"><em class="up">126.67%</em></span>                                    <span class="w7"><em class="up">286.36%</em></span>                                    <span class="w8"><a  href="http://www.xxxx.cn/exchange-prices-290-1-29001.html?t=1"  title=" 鸡骨草" target="_blank"><img src="http://img.zyctd.com/MarketCondition/icon_chart.gif" /></a></span>                                </li>                                                                           <li>                                <span class="w1"><a href="http://www.xxxx.cn/exchange-priceItem-290-1-0.html" title=" 鸡骨草" target="_blank"> 鸡骨草</a></span>                                  <span class="w2"><a href="http://www.xxxx.cn/exchange-prices-290-1-29002.html?t=1" title=" 小叶全草 广西" target="_blank"> 小叶全草 广西</a></span>                                                                <span class="w9">亳州</span>                                <span class="w3"> 20.00 </span>                                <span class="w4">平</span>                               <span class="w5"><em class="up">122.22%</em></span>                                <span class="w6"><em class="up">122.22%</em></span>                                <span class="w7"><em class="up">198.51%</em></span>                                <span class="w8"><a  href="http://www.xxxx.cn/exchange-prices-290-1-29002.html?t=1" title=" 鸡骨草" target="_blank"><img src="http://img.zyctd.com/MarketCondition/icon_chart.gif" /></a></span>                            </li>                                                               <li class="cq">                                    <span class="w1"><a href="http://www.xxxx.cn/exchange-priceItem-290-1-0.html" title=" 鸡骨草" target="_blank"> 鸡骨草</a></span>                                    <span class="w2"><a href="http://www.xxxx.cn/exchange-prices-290-1-29003.html?t=1" title=" 大叶光杆 广西" target="_blank"> 大叶光杆 广西</a></span>                                    <span class="w9">亳州</span>                                    <span class="w3">20.00</span>                                     <span class="w4">平</span>                                    <span class="w5"><em class="up">42.86%</em></span>                                    <span class="w6"><em class="up">42.86%</em></span>                                    <span class="w7"><em class="up">127.27%</em></span>                                    <span class="w8"><a  href="http://www.xxxx.cn/exchange-prices-290-1-29003.html?t=1"  title=" 鸡骨草" target="_blank"><img src="http://img.zyctd.com/MarketCondition/icon_chart.gif" /></a></span>                                </li>                                      ..........</ul>


すべて収集する必要があります16a84eff4c57a1a54bc7bfa355714987 ;span class="w1">、6364e88a5ad698e9839485aad7179944、8f37d439710df3c2d9a6cc46c4abb34f、 これらの最初の 4 つのラベルの値は、ローカル データベースに書き込まれます。

親愛なるヒーローの皆さん、コレクションコードの書き方は?


ディスカッションに返信 (解決策)

file_get_contents()/curl を使用して最初に収集し、次に必要なコンテンツを傍受します。

コレクション コードの書き方はこちらでご覧いただけます: http://www.jb51.net/tools/zhengze.html

正規表現を使用して一致させることができます

機関車ツール...

機関車ツール.. .

機関車 この効果は達成できますか? ? ? ? ? ? ? ?

通常のマッチングを使用する

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。