Javascript – Knoten crawlt Weibo

Question

Ich war neu bei Node und wollte einen Crawler schreiben, um Sina Weibo-Kommentare zu crawlen, aber ich stellte fest, dass die Seite dynamisch von JS generiert wurde und nicht mit dem http-Modul gecrawlt werden konnte, also habe ich Phantomjs zum Crawlen verwendet (ich habe gehört, dass dies der Fall wäre). langsamer sein, und es hat fast 15 Minuten gedauert, das ist zu langsam, ich weiß nicht, ob ich es falsch geschrieben habe), wenn es immer noch nicht funktioniert, würde ich gerne fragen, was ich tun kann ...

扔个三星炸死你 · Answer

自己写过微博的爬取,有两种思路

仔细看一下应该是有接口去获取相应数据的然后用正则去匹配
微博提供了开发者API接口的,虽然用着比较麻烦

Javascript – Knoten crawlt Weibo

Antworte allen(1)Ich werde antworten