ホームページ  >  記事  >  バックエンド開発  >  如何用php抓取js生成的页面?

如何用php抓取js生成的页面?

WBOY
WBOYオリジナル
2016-06-06 20:07:252227ブラウズ

目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?

回复内容:

目前用的是 simple_html_dom,它获取网页的方式直接file_get_contents获取网页,但是对于js生成的页面就无法获取了,用什么方法能够用php抓取js动态生成的页面?

这个并不好实现, 不然现在js的MVVM框架就不用想着服务端渲染来做SEO...

可以用V8JS,phantomjs

若是ajax生成的获取对应的url返回值即可

还是分析请求,找接口简单点。

使用phantomjs+nodejs来处理这类问题相对来说更容易一些。
phantomjs是一个无界面的浏览器环境,可以载入url,然后渲染页面。做到模拟出用户浏览器里输入url打开页面之后渲染的效果。然后通过编程调用phantomjs提供的接口去获取渲染出来的内容。

http://phantomjs.org/

1、phantomjs
2、如果js是异步加载的数据,直接php读那个接口数据。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。