解析HTML，获取其中想要的信息

Question

遇到一个比较棘手的需求：开发语言Java；程序定时读取HR邮箱中从前程无忧，智联发过来的简历（已实现，获到简历的HTML）；从简历HTML中解析获取想要的信息想（姓名，性别，电话，邮箱，工作经历，教育经历等等），保存到数据库中；把数据库中的简历数据用HTML展示，可让HR进行筛选；我现在卡在了简历HTML的解析信息这步，我用比较笨的方法，字符串定位截取，但是这样没办法比较准确的获取到想要信息。。。

三叔 · Answer

用正则捕获会好点吧

欧阳克 · Answer

可以用JSOUP 之前做过一个类似的东西，这个很方便的，可以对各种标签什么的进行处理。

三叔 · Answer

用正则表达式呢？多考虑一些可能的匹配格式，应该可以。

解析HTML，获取其中想要的信息

全部回复(3)我来回复