情况一:
<META NAME="description" CONTENT="华尔街债券(bond.wswire.com) 是全球第一债券网站,为您提供全球债券市场最迅速最专业的债券资讯和全天候的债券理财、债券评级及报价服务, 华尔街债券覆盖交易所债券市场、银行间债券市场、银行同业拆借及公开市场等各方面的债券信息服务。华尔街债券汇聚多家顶级专业机构分析研究报告、每日两次的精确数据分析以及图文并茂的市况报道。"><META NAME="keywords" CONTENT="华尔街,电讯,华尔街电讯,全球债券,国债,债券,债市,企业债,企债,可转债,回购,正回购,赎回,债券公告,利率,金融债,央行,短期融资券,记账式国债,货币政策,财经,汇率,票据,公开市场,稳定收益,公债,柜台交易,银行间债市,同业拆借,债券资讯,融资债,债券理财,债券评级,银行间市场,交易所市场,海外市场,央行票据">
情况二:
<meta name=keywords content="微波炉使用高火档能耗低更节能(图),环保新知,,,微波炉,,,高火,,,节能,,,省电,,"><meta name=description content="微波炉使用高火档能耗低更节能(图)">
注意:可能大小写,还有就是name,和content属性[color=#FF6600] 位置 不一样[/color]
小弟试着写了一下,只能匹配一写网页,不知道有什么问题。大牛请解答,拜谢!
keyword:
1.preg_match("/<meta[\s]+name=['\"]keywords['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr); 2.preg_match("/<meta[\s] content=['\"](.*)['\"] name=['\"]keywords['\"]/isU",$this->tmpHtml,$inarr2);
1.preg_match("/<meta[\s]+name=['\"]description['\"] content=['\"](.*)['\"]/isU",$this->tmpHtml,$inarr); 2.preg_match("/<meta[\s]+content=['\"](.*)['\"] name=['\"]description['\"]/isU",$this->tmpHtml,$inarr2);
说明:一些网页能匹配,一些不能
回复讨论(解决方案)
哦对了,忘了说明了,有的网页 是这样的:
c8d00c20da08676006b9672fcb417d87
54766aacfb0b6f8cfb99afda8000c061
keywords 和description没有双引号。匹配不了、希望大哥们帮我完善一下,最好测试通过
不是有个get_meta_tags函数么
不是有个get_meta_tags函数么
+1,可以返回一个meta的数组的,再提取需要的就是了
呵呵,见笑了,恩谢谢啊,foolbirdflyfirst yangball
name在前面:
<meta(\s)name=(\'|\"|)keywords(\'|\"|)(\s*)content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|) keywords(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*) content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)>
name在后面:
<meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)description(\'|\"|)(\s*)> <meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)description(\'|\"|)(\s*)>
name在前面:
<meta(\s)name=(\'|\"|)keywords(\'|\"|)(\s*)content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|) keywords(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*) content=(\'|\"|)(.*)(\'|\"|)(\s*)><meta(\s)name=(\'|\"|)description(\'|\"|)(\s*)content=(\'|\"|)|(\'|\"|)(\s*)>
name在后面:
<meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)><meta(\s) content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|)keywords(\'|\"|)(\s*)><meta(\s)content=(\'|\"|)(.*)(\'|\"|)(\s*) name=(\'|\"|)description(\'|\"|)(\s*)><meta(\s)content=(\'|\"|)|(\'|\"|)(\s*)name=(\'|\"|) description(\'|\"|)(\s*)>
根据楼上,进一步得出:
name在前:
<(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*) (content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|)( keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)><(\s*)(meta|META|Meta) (\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*) (content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(name|NAME|Name)=(\'|\"|) (description|DESCRIPTION|Description)(\'|\"|)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)>
name在后:
<(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(keywords|KEYWORDS|Keywords)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)(.*)(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*)><(\s*)(meta|META|Meta)(\s*)(content|CONTENT|Content)=(\'|\"|)|(\'|\"|)(\s*)(name|NAME|Name)=(\'|\"|)(description|DESCRIPTION|Description)(\'|\"|)(\s*)>
以上就是正则获取网页源码keyword和description ,蛋有点疼的内容,更多相关内容请关注PHP中文网(www.php.cn)!

aphpdepentioncontiveContainerIsatoolThatManagesClassDeptions,增强codemodocultion,可验证性和Maintainability.itactsasaceCentralHubForeatingingIndections,因此reducingTightCightTightCoupOulplingIndeSingantInting。

选择DependencyInjection(DI)用于大型应用,ServiceLocator适合小型项目或原型。1)DI通过构造函数注入依赖,提高代码的测试性和模块化。2)ServiceLocator通过中心注册获取服务,方便但可能导致代码耦合度增加。

phpapplicationscanbeoptimizedForsPeedAndeffificeby:1)启用cacheInphp.ini,2)使用preparedStatatementSwithPdoforDatabasequesies,3)3)替换loopswitharray_filtaray_filteraray_maparray_mapfordataprocrocessing,4)conformentnginxasaseproxy,5)

phpemailvalidation invoLvesthreesteps:1)格式化进行regulareXpressecthemailFormat; 2)dnsvalidationtoshethedomainhasavalidmxrecord; 3)

tomakephpapplicationsfaster,关注台词:1)useopcodeCachingLikeLikeLikeLikeLikePachetoStorePreciledScompiledScriptbyTecode.2)MinimimiedAtabaseSqueriSegrieSqueriSegeriSybysequeryCachingandeffeftExting.3)Leveragephp7 leveragephp7 leveragephp7 leveragephpphp7功能forbettercodeefficy.4)

到ImprovephPapplicationspeed,关注台词:1)启用opcodeCachingwithapCutoredUcescriptexecutiontime.2)实现databasequerycachingusingpdotominiminimizedatabasehits.3)usehttp/2tomultiplexrequlexrequestsandredececonnection.4 limitsclection.4.4

依赖注入(DI)通过显式传递依赖关系,显着提升了PHP代码的可测试性。 1)DI解耦类与具体实现,使测试和维护更灵活。 2)三种类型中,构造函数注入明确表达依赖,保持状态一致。 3)使用DI容器管理复杂依赖,提升代码质量和开发效率。

databasequeryOptimizationinphpinvolVolVOLVESEVERSEVERSTRATEMIESOENHANCEPERANCE.1)SELECTONLYNLYNESSERSAYCOLUMNSTORMONTOUMTOUNSOUDSATATATATATATATATATATRANSFER.3)


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

SecLists
SecLists是最终安全测试人员的伙伴。它是一个包含各种类型列表的集合,这些列表在安全评估过程中经常使用,都在一个地方。SecLists通过方便地提供安全测试人员可能需要的所有列表,帮助提高安全测试的效率和生产力。列表类型包括用户名、密码、URL、模糊测试有效载荷、敏感数据模式、Web shell等等。测试人员只需将此存储库拉到新的测试机上,他就可以访问到所需的每种类型的列表。

SublimeText3 英文版
推荐:为Win版本,支持代码提示!

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

Dreamweaver CS6
视觉化网页开发工具

Atom编辑器mac版下载
最流行的的开源编辑器