搜索
首页web前端css教程Scrapestack:用于刮擦网站的API

Scrapestack:用于刮擦网站的API

并非每个站点都有一个API访问数据。实际上,大多数不是。如果您需要提取这些数据,一种方法是“刮擦”它。也就是说,将页面加载到Web浏览器中(您是自动化的),在DOM中找到您要寻找的内容,然后采用它。

如果您想处理成本,维护和技术债务,则可以自己执行此操作。例如,这是“无头”浏览器的大型用例之一,例如木偶器如何旋转和控制无头铬。

或者,您可以使用诸如Scrapestack之类的工具,该工具不仅可以为您抓取,而且可以做得更好,更快,并且选择更多的选择要比尝试自己做得更好。

假设我的目标是从Meetup.com页面上取出最新的完成聚会。 Metup.com有一个API,但它很昂贵,需要Oauth和其他东西。我们只需要在这里的过去聚会的名称和链接,所以让我们将其从页面上拉开。

我们可以看到我们在DOM中的需求:

要玩游戏,让我们用jquery用scrapestack api客户端来刮擦它:

 $ .get('https://api.scrapestack.com/scrape',
  {
    access_key:'my_api_key',
    URL:'https://www.meetup.com/bendjs/'
  },,
  函数(WebsIteContent){
     //我们在这里有整个网站! 
  }
);

在该回调中,我现在还可以使用jQuery穿越DOM,抓住我想要的部分,并在我们的网站上构造我需要的东西:

 //得到我们想要的
让Event = $(WebsIteContent)
  。
  。第一的();
让EventTitle = event
  .find(“。eventCard-link”)[0] .innertext;
令EventLink = 
  `https:// www.meetup.com/`   
  event.find(“。eventCard-link”)。attr(“ href”);

//在页面上使用它
$(“#event”)。附录(`
  $ {eventTitle}
`);

在实际用法中,如果我们这样做这样的客户端,我们将利用一些基本的存储空间,因此我们不必在每个页面负载上达到API,例如将结果粘贴在LocalStorage中,并在几天之后添加无效。

有用!

实际上,我们更有可能进行刮擦服务器端。一方面,这就是保护您的API键的方法,这是您的责任,如果您直接使用API​​,则在面向公共场所的责任是不可能的。

我自己,我可能会做一个云功能来执行此操作,这样我就可以留在JavaScript(Node.js)中,并有机会将数据塞入存储中。

我会说去查看文档,看看下次您需要进行一些刮擦时,这是否不是正确的答案。无论如何,您都会收到10,000条免费计划的请求,并且可以在任何具有更多功能的付费计划上跳起来。

直接链接→

以上是Scrapestack:用于刮擦网站的API的详细内容。更多信息请关注PHP中文网其他相关文章!

声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
两个图像和一个API:我们重新着色产品所需的一切两个图像和一个API:我们重新着色产品所需的一切Apr 15, 2025 am 11:27 AM

我最近找到了一种动态更新任何产品图像的颜色的解决方案。因此,只有一种产品之一,我们可以以不同的方式对其进行着色以显示

每周平台新闻:第三方代码,被动混合内容,连接最慢的国家的影响每周平台新闻:第三方代码,被动混合内容,连接最慢的国家的影响Apr 15, 2025 am 11:19 AM

在本周的综述中,灯塔在第三方脚本上阐明了灯光,不安全的资源将在安全站点上被阻止,许多国家连接速度

托管您自己的非JavaScript分析的选项托管您自己的非JavaScript分析的选项Apr 15, 2025 am 11:09 AM

有很多分析平台可帮助您跟踪网站上的访问者和使用数据。也许最著名的是Google Analytics(广泛使用)

它全部都在头上:管理带有React头盔的React Power Site的文档头它全部都在头上:管理带有React头盔的React Power Site的文档头Apr 15, 2025 am 11:01 AM

文档负责人可能不是网站上最迷人的部分,但是其中所处的内容对于您的网站的成功也一样重要

JavaScript中的Super()是什么?JavaScript中的Super()是什么?Apr 15, 2025 am 10:59 AM

当您看到一些称为super()的JavaScript时,在子类中,您会使用super()调用其父母的构造函数和超级。访问它的

比较不同类型的本机JavaScript弹出窗口比较不同类型的本机JavaScript弹出窗口Apr 15, 2025 am 10:48 AM

JavaScript具有各种内置弹出API,它们显示用于用户交互的特殊UI。著名:

为什么可访问的网站如此难以构建?为什么可访问的网站如此难以构建?Apr 15, 2025 am 10:45 AM

前几天,我与一些前端人们聊天,讲述了为什么这么多公司努力创建可访问的网站。为什么可访问的网站如此艰难

'隐藏”属性显然很弱'隐藏”属性显然很弱Apr 15, 2025 am 10:43 AM

有一个HTML属性,它可以正是您认为应该做的:

See all articles

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
4 周前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它们
4 周前By尊渡假赌尊渡假赌尊渡假赌

热工具

DVWA

DVWA

Damn Vulnerable Web App (DVWA) 是一个PHP/MySQL的Web应用程序,非常容易受到攻击。它的主要目标是成为安全专业人员在合法环境中测试自己的技能和工具的辅助工具,帮助Web开发人员更好地理解保护Web应用程序的过程,并帮助教师/学生在课堂环境中教授/学习Web应用程序安全。DVWA的目标是通过简单直接的界面练习一些最常见的Web漏洞,难度各不相同。请注意,该软件中

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

螳螂BT

螳螂BT

Mantis是一个易于部署的基于Web的缺陷跟踪工具,用于帮助产品缺陷跟踪。它需要PHP、MySQL和一个Web服务器。请查看我们的演示和托管服务。

SublimeText3 英文版

SublimeText3 英文版

推荐:为Win版本,支持代码提示!

mPDF

mPDF

mPDF是一个PHP库,可以从UTF-8编码的HTML生成PDF文件。原作者Ian Back编写mPDF以从他的网站上“即时”输出PDF文件,并处理不同的语言。与原始脚本如HTML2FPDF相比,它的速度较慢,并且在使用Unicode字体时生成的文件较大,但支持CSS样式等,并进行了大量增强。支持几乎所有语言,包括RTL(阿拉伯语和希伯来语)和CJK(中日韩)。支持嵌套的块级元素(如P、DIV),