java - 解析HTML，获取其中想要的信息

Question

遇到一个比较棘手的需求： 开发语言Java； 程序定时读取HR邮箱中从前程无忧，智联发过来的简历（已实现，获到简历的HTML）； 从简历HTML中解析获取想要的信息想（姓名，性别，电话，邮箱，工作经历，教育经历等等...

PHPz · Answer

Il est préférable d'utiliser Jsoup pour le convertir en l'objet Document correspondant, ce qui est plus pratique lors de l'utilisation des éléments correspondants.
API jsoup : http://www.open-open.com/jsoup/

怪我咯 · Answer

Et si vous utilisiez des expressions régulières ? Réfléchissez davantage aux formats de correspondance possibles et cela devrait aller.

PHP中文网 · Answer

Il serait préférable d'utiliser la capture régulière

巴扎黑 · Answer

Vous pouvez utiliser jsoup

高洛峰 · Answer

Vous pouvez utiliser JSOUP. J'ai déjà fait quelque chose de similaire. C'est très pratique et peut traiter diverses balises, etc.

PHP中文网 · Answer

Préférez jsoup.
jsoup a une fonction de sélection, qui est similaire à la syntaxe du sélecteur CSS. L'API est simple et pratique que les expressions régulières.

伊谢尔伦 · Answer

1 Regular
2 bibliothèque d'analyse HTML, qui semble s'appeler "mithril" en chinois

java - 解析HTML，获取其中想要的信息

répondre à tous(7)je répondrai