想获取网站中的所有超链接,使用的是php snoopy类
<code>$sourceURL = $url; $snoopy->fetchlinks($sourceURL); $content = $snoopy->results;</code>
获取的结果如下:
<code>array (size=627) 0 => string 'http://www.alibaba.com/https://login.alibaba.com/' (length=49) 1 => string 'http://sh.vip.alibaba.com?tracelog=nav_ma' (length=41) 2 => string 'http://message.alibaba.com/feedback/default.htm?routeto=inbox&tracelog=nav_ma_mc' (length=80) 3 => string 'http://www.alibaba.com//hz-favorite.alibaba.com/favorite/favorite_home.htm?tracelog=nav_ma_fav' (length=94) 4 => string 'http://rfq.alibaba.com/form.htm?tracelog=header_myalibaba' (length=57) 5 => string 'http://hz.sourcing.alibaba.com/rfq/request/rfq_manage_list.htm?tracelog=nav_ma_mana_rfq' (length=87) 6 => string 'http://biz.alibaba.com/generalorders/list_orders.htm?tracelog=ma_mana_orders' (length=76) 7 => string 'http://sh.vip.alibaba.com/product/post_product_interface.htm?tracelog=newschp_nav_madp' (length=86) 8 => string 'http://sh.vip.alibaba.com/product/manage_products.htm?tracelog=newschp_nav_mamng' (length=80) 9 => string 'http://hz.sourcing.alibaba.com/rfq/quotation/rfq_not_quoted_manage_list.htm?nav_ma_rec_rfqs' (length=91) 10 => string 'http://www.alibaba.com/javascript:;' (length=35) 11 => string 'http://www.alibaba.com/Products?tracelog=beacon_cate_140704' (length=59) 12 => string 'http://rfq.alibaba.com/form.htm?tracelog=header_forbuyers' (length=57) 13 => string 'http://globalexpo.alibaba.com?tracelog=beacon_expo_150820' (length=57) 14 => string 'http://wholesale.alibaba.com?tracelog=nav_ws' (length=44) 15 => string 'http://buyer.alibaba.com/bizid_buyer?tracelog=nav_bi' (length=52) 16 => string 'http://tradeassurance.alibaba.com/bao/buyer_advertise.htm?tracelog=from_home_menu' (length=81) 17 => string 'http://activities.alibaba.com/alibaba/secure-payment.php?tracelog=beacon_payment_150114' (length=87) 18 => string 'http://ecredit.alibaba.com/ecl/buyer.htm?tracelog=beacon_credit_140704' (length=70) 19 => string 'http://inspection.alibaba.com/?tracelog=beacon_is_140704' (length=56) 20 => string 'http://buyer.alibaba.com/intelligence?tracelog=beacon_ti_140704' (length=63) 21 => string 'http://buyer.alibaba.com/forum?tracelog=beacon_df_140704' (length=56) 22 => string 'http://ask.alibaba.com/?tracelog=beacon_ta_140704' (length=49) 23 => string 'http://www.alibaba.com/javascript:;' (length=35) 24 => string 'http://seller.alibaba.com/memberships/index.html?tracelog=seller_channel_member_hp_header' (length=89) 25 => string 'http://seller.alibaba.com/learningcenter?tracelog=seller_channel_lc_hp_header' (length=77) 26 => string 'http://seller.alibaba.com/training.htm?tracelog=seller_channel_training_hp_header' (length=81) 27 => string 'http://sourcing.alibaba.com/?tracelog=newschp_nav_narfq' (length=55) 28 => string 'http://www.alibaba.com/javascript:;' (length=35)</code>
怎么能把“http://www.alibaba.com/javascript:;”类似的URL去掉?
回复内容:
想获取网站中的所有超链接,使用的是php snoopy类
<code>$sourceURL = $url; $snoopy->fetchlinks($sourceURL); $content = $snoopy->results;</code>
获取的结果如下:
<code>array (size=627) 0 => string 'http://www.alibaba.com/https://login.alibaba.com/' (length=49) 1 => string 'http://sh.vip.alibaba.com?tracelog=nav_ma' (length=41) 2 => string 'http://message.alibaba.com/feedback/default.htm?routeto=inbox&tracelog=nav_ma_mc' (length=80) 3 => string 'http://www.alibaba.com//hz-favorite.alibaba.com/favorite/favorite_home.htm?tracelog=nav_ma_fav' (length=94) 4 => string 'http://rfq.alibaba.com/form.htm?tracelog=header_myalibaba' (length=57) 5 => string 'http://hz.sourcing.alibaba.com/rfq/request/rfq_manage_list.htm?tracelog=nav_ma_mana_rfq' (length=87) 6 => string 'http://biz.alibaba.com/generalorders/list_orders.htm?tracelog=ma_mana_orders' (length=76) 7 => string 'http://sh.vip.alibaba.com/product/post_product_interface.htm?tracelog=newschp_nav_madp' (length=86) 8 => string 'http://sh.vip.alibaba.com/product/manage_products.htm?tracelog=newschp_nav_mamng' (length=80) 9 => string 'http://hz.sourcing.alibaba.com/rfq/quotation/rfq_not_quoted_manage_list.htm?nav_ma_rec_rfqs' (length=91) 10 => string 'http://www.alibaba.com/javascript:;' (length=35) 11 => string 'http://www.alibaba.com/Products?tracelog=beacon_cate_140704' (length=59) 12 => string 'http://rfq.alibaba.com/form.htm?tracelog=header_forbuyers' (length=57) 13 => string 'http://globalexpo.alibaba.com?tracelog=beacon_expo_150820' (length=57) 14 => string 'http://wholesale.alibaba.com?tracelog=nav_ws' (length=44) 15 => string 'http://buyer.alibaba.com/bizid_buyer?tracelog=nav_bi' (length=52) 16 => string 'http://tradeassurance.alibaba.com/bao/buyer_advertise.htm?tracelog=from_home_menu' (length=81) 17 => string 'http://activities.alibaba.com/alibaba/secure-payment.php?tracelog=beacon_payment_150114' (length=87) 18 => string 'http://ecredit.alibaba.com/ecl/buyer.htm?tracelog=beacon_credit_140704' (length=70) 19 => string 'http://inspection.alibaba.com/?tracelog=beacon_is_140704' (length=56) 20 => string 'http://buyer.alibaba.com/intelligence?tracelog=beacon_ti_140704' (length=63) 21 => string 'http://buyer.alibaba.com/forum?tracelog=beacon_df_140704' (length=56) 22 => string 'http://ask.alibaba.com/?tracelog=beacon_ta_140704' (length=49) 23 => string 'http://www.alibaba.com/javascript:;' (length=35) 24 => string 'http://seller.alibaba.com/memberships/index.html?tracelog=seller_channel_member_hp_header' (length=89) 25 => string 'http://seller.alibaba.com/learningcenter?tracelog=seller_channel_lc_hp_header' (length=77) 26 => string 'http://seller.alibaba.com/training.htm?tracelog=seller_channel_training_hp_header' (length=81) 27 => string 'http://sourcing.alibaba.com/?tracelog=newschp_nav_narfq' (length=55) 28 => string 'http://www.alibaba.com/javascript:;' (length=35)</code>
怎么能把“http://www.alibaba.com/javascript:;”类似的URL去掉?
QueryList
<?php //采集某页面所有的图片 $data = QueryList::Query('http://cms.querylist.cc/bizhi/453.html',['image' => ['img','src']])->data; //打印结果 print_r($data); //采集某页面所有的超链接 $data = QueryList::Query('http://cms.querylist.cc/google/list_1.html',['link' => ['a','href']])->data; //打印结果 print_r($data);
http://git.oschina.net/jae/QueryList
可以看下这个,比snoopy要强大一些,支持jquery选择器语法

php把负数转为正整数的方法:1、使用abs()函数将负数转为正数,使用intval()函数对正数取整,转为正整数,语法“intval(abs($number))”;2、利用“~”位运算符将负数取反加一,语法“~$number + 1”。

实现方法:1、使用“sleep(延迟秒数)”语句,可延迟执行函数若干秒;2、使用“time_nanosleep(延迟秒数,延迟纳秒数)”语句,可延迟执行函数若干秒和纳秒;3、使用“time_sleep_until(time()+7)”语句。

php字符串有下标。在PHP中,下标不仅可以应用于数组和对象,还可应用于字符串,利用字符串的下标和中括号“[]”可以访问指定索引位置的字符,并对该字符进行读写,语法“字符串名[下标值]”;字符串的下标值(索引值)只能是整数类型,起始值为0。

php除以100保留两位小数的方法:1、利用“/”运算符进行除法运算,语法“数值 / 100”;2、使用“number_format(除法结果, 2)”或“sprintf("%.2f",除法结果)”语句进行四舍五入的处理值,并保留两位小数。

在php中,可以使用substr()函数来读取字符串后几个字符,只需要将该函数的第二个参数设置为负值,第三个参数省略即可;语法为“substr(字符串,-n)”,表示读取从字符串结尾处向前数第n个字符开始,直到字符串结尾的全部字符。

判断方法:1、使用“strtotime("年-月-日")”语句将给定的年月日转换为时间戳格式;2、用“date("z",时间戳)+1”语句计算指定时间戳是一年的第几天。date()返回的天数是从0开始计算的,因此真实天数需要在此基础上加1。

方法:1、用“str_replace(" ","其他字符",$str)”语句,可将nbsp符替换为其他字符;2、用“preg_replace("/(\s|\ \;||\xc2\xa0)/","其他字符",$str)”语句。

查找方法:1、用strpos(),语法“strpos("字符串值","查找子串")+1”;2、用stripos(),语法“strpos("字符串值","查找子串")+1”。因为字符串是从0开始计数的,因此两个函数获取的位置需要进行加1处理。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

Dreamweaver CS6
视觉化网页开发工具

螳螂BT
Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

记事本++7.3.1
好用且免费的代码编辑器

DVWA
Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中