搜尋
首頁後端開發php教程用PHP抓取淘寶商品的用戶曬單評論+圖片實例 php採集淘寶資料 淘寶自動發貨php 小草淘寶客php

為什麼想起來做這個功能?是因為前陣子在做一個淘客網站的時候,想到是否能抓取到淘寶商品的買家秀呢?經過一番折騰發現,淘寶商品用戶評估資訊是透過Ajax來調取的,透過嗅探網址發現,評論資料的請求介面是:

https://rate.tmall.com/list_detail_rate.htm?itemId=524394294771&spuId=341564036&sellerId=100414600&order=3&currentPage=1&append=0&c/span>

其實上面很多參數也很容易理解,itemId是商品的ID,currentPage是當前頁,picture為1時顯示有圖的評價,既然是抓取買家秀,那麼picture參數一定要為1了。

如果你直接去存取上面的介面時,會得到如下圖所示的請求結果:

用PHP抓取淘寶商品的用戶曬單評論+圖片實例 php採集淘寶資料 淘寶自動發貨php 小草淘寶客php

看到請求結果是jsonp格式我就蛋碎了,我不知道如何去解析,但是換種思路,直接用PHP的正則去解析也未嘗不可嘛,通過嘗試,已經正確的能夠解析到評論內容和買家秀的圖片內容,如圖:

用PHP抓取淘寶商品的用戶曬單評論+圖片實例 php採集淘寶資料 淘寶自動發貨php 小草淘寶客php

效果不錯,代碼實現了評論內容的抓取、買家秀圖片的抓取,程式碼奉上:

<?php$url = "https://rate.tmall.com/list_detail_rate.htm?itemId=524394294771&spuId=341564036&sellerId=100414600&order=3&currentPage=1&append=0&c>;$ch2 = curl_init();
curl_setopt($ch2, CURLOPT_URL, $url);
curl_setopt($ch2, CURLOPT_FOLLOWLOCATION, TRUE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYHOST, FALSE);
curl_setopt($ch2, CURLOPT_SSL_VERIFYPEER, false);
curl_setopt($ch2, CURLOPT_RETURNTRANSFER, TRUE);$texts = curl_exec($ch2);
curl_close($ch2);//echo $texts;$pattern = &#39;/"pics"(.+?)","reply"/is&#39;;preg_match_all($pattern, $texts, $match);for($i=0;$i<count($match[0]);$i++){$pattern2 = &#39;/"rateContent":"(.+?)."reply"/is&#39;;preg_match($pattern2, $match[0][$i], $matchcomments_only);echo "".str_replace(&#39;","rateDate":"&#39;,&#39; &#39;,str_replace(&#39;","reply"&#39;,&#39;&#39;,str_replace(&#39;"rateContent":"&#39;,&#39;&#39;,$matchcomments_only[0])))."";$pattern3 = &#39;/img.alicdn(.+?).jpg/is&#39;;preg_match($pattern3, $match[0][$i], $matchpic_only);echo &#39;$matchpic_only[0].&#39;" width="120" _src="http://&#39;.$matchpic_only[0].&#39;"/>&#39;;
}/*匹配一张图片
$pattern = &#39;/"pics"(.+?)","position"/is&#39;;
preg_match_all($pattern, $texts, $matchpic);
for($i=0;$i<count($matchpic[0]);$i++){
    $pattern3 = &#39;/img.alicdn(.+?).jpg/is&#39;;
    preg_match($pattern3, $matchpic[0][$i], $matchpic_only);
    echo "".$matchpic_only[0]."";
}*//*匹配所有图片
$pattern = &#39;/"pics"(.+?)","position"/is&#39;;
preg_match_all($pattern, $texts, $matchpic);
for($i=0;$i<count($matchpic[0]);$i++){
    $pics_str=str_replace(&#39;"pics":["//&#39;,&#39;&#39;,str_replace(&#39;"],"picsSmall":"","position"&#39;,&#39;&#39;,$matchpic[0][$i]));
    $arr = explode(&#39;","//&#39;,$pics_str);
    echo "";
    foreach($arr as $newstr){
        echo &#39;&#39;;
    }
    echo "";
}*/?>

有什麼解析jsonp格式的好方法呢?求大神~~~

以上就介紹了用PHP抓取淘寶商品的用戶曬單評論+圖片實例,包括了php,淘寶商方面的內容,希望對PHP教程有興趣的朋友有所幫助。


陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
絕對會話超時有什麼區別?絕對會話超時有什麼區別?May 03, 2025 am 12:21 AM

絕對會話超時從會話創建時開始計時,閒置會話超時則從用戶無操作時開始計時。絕對會話超時適用於需要嚴格控制會話生命週期的場景,如金融應用;閒置會話超時適合希望用戶長時間保持會話活躍的應用,如社交媒體。

如果會話在服務器上不起作用,您將採取什麼步驟?如果會話在服務器上不起作用,您將採取什麼步驟?May 03, 2025 am 12:19 AM

服務器會話失效可以通過以下步驟解決:1.檢查服務器配置,確保會話設置正確。 2.驗證客戶端cookies,確認瀏覽器支持並正確發送。 3.檢查會話存儲服務,如Redis,確保其正常運行。 4.審查應用代碼,確保會話邏輯正確。通過這些步驟,可以有效診斷和修復會話問題,提升用戶體驗。

session_start()函數的意義是什麼?session_start()函數的意義是什麼?May 03, 2025 am 12:18 AM

session_start()iscucialinphpformanagingusersessions.1)ItInitiateSanewsessionifnoneexists,2)resumesanexistingsessions,and3)setsasesessionCookieforContinuityActinuityAccontinuityAcconActInityAcconActInityAcconAccRequests,EnablingApplicationsApplicationsLikeUseAppericationLikeUseAthenticationalticationaltication and PersersonalizedContentent。

為會話cookie設置httponly標誌的重要性是什麼?為會話cookie設置httponly標誌的重要性是什麼?May 03, 2025 am 12:10 AM

設置httponly標誌對會話cookie至關重要,因為它能有效防止XSS攻擊,保護用戶會話信息。具體來說,1)httponly標誌阻止JavaScript訪問cookie,2)在PHP和Flask中可以通過setcookie和make_response設置該標誌,3)儘管不能防範所有攻擊,但應作為整體安全策略的一部分。

PHP會議在網絡開發中解決了什麼問題?PHP會議在網絡開發中解決了什麼問題?May 03, 2025 am 12:02 AM

phpsessions solvathepromblymaintainingStateAcrossMultipleHttpRequestsbyStoringDataTaNthEserVerAndAssociatingItwithaIniquesestionId.1)他們儲存了AtoredAtaserver side,通常是Infilesordatabases,InseasessessionIdStoreDistordStoredStoredStoredStoredStoredStoredStoreDoreToreTeReTrestaa.2)

可以在PHP會話中存儲哪些數據?可以在PHP會話中存儲哪些數據?May 02, 2025 am 12:17 AM

phpsessionscanStorestrings,數字,數組和原始物。

您如何開始PHP會話?您如何開始PHP會話?May 02, 2025 am 12:16 AM

tostartaphpsession,usesesses_start()attheScript'Sbeginning.1)placeitbeforeanyOutputtosetThesessionCookie.2)useSessionsforuserDatalikeloginstatusorshoppingcarts.3)regenerateSessiveIdStopreventFentfixationAttacks.s.4)考慮使用AttActAcks.s.s.4)

什麼是會話再生,如何提高安全性?什麼是會話再生,如何提高安全性?May 02, 2025 am 12:15 AM

會話再生是指在用戶進行敏感操作時生成新會話ID並使舊ID失效,以防會話固定攻擊。實現步驟包括:1.檢測敏感操作,2.生成新會話ID,3.銷毀舊會話ID,4.更新用戶端會話信息。

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

PhpStorm Mac 版本

PhpStorm Mac 版本

最新(2018.2.1 )專業的PHP整合開發工具

SublimeText3 英文版

SublimeText3 英文版

推薦:為Win版本,支援程式碼提示!

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。