最近專案在做新聞爬蟲,想實現這個功能:爬蟲某個頁面失敗後,把這個頁面的 url 發到郵箱。最終實現的效果圖如下,後期可以加上過濾標籤、失敗狀態碼等,方便分類搜尋異常。
開發人員可以根據郵件裡的 url 和堆疊訊息,分析爬蟲失敗的原因。
是不是伺服器 down 了?
還是爬蟲的Dom 解析沒有解析到內容?
還是正規表示式對於這個頁面不適用?
開啟SMTP服務
在QQ 郵箱裡開啟的設定SM->服務
注意開啟完之後,QQ 郵箱會產生一個授權碼,在代碼裡連接郵箱使用這個授權碼而不是原始的郵箱密碼,這樣可以避免使用明文密碼。
網上查了一下例子,根據這篇文章Java Mail(二):JavaMail介紹及發送一封簡單郵件的示例代碼
Properties props = new Properties(); // 开启debug调试 props.setProperty("mail.debug", "true"); // 发送服务器需要身份验证 props.setProperty("mail.smtp.auth", "true"); // 设置邮件服务器主机名 props.setProperty("mail.host", "smtp.qq.com"); // 发送邮件协议名称 props.setProperty("mail.transport.protocol", "smtp"); Session session = Session.getInstance(props); //邮件内容部分 Message msg = new MimeMessage(session); msg.setSubject("seenews 错误"); StringBuilder builder = new StringBuilder(); builder.append("url = " + "http://blog.csdn.net/never_cxb/article/details/50524571"); builder.append("页面爬虫错误"); builder.append("\n data " + TimeTool.getCurrentTime()); msg.setText(builder.toString()); //邮件发送者 msg.setFrom(new InternetAddress("**发送人的邮箱地址**")); //发送邮件 Transport transport = session.getTransport(); transport.connect("smtp.qq.com", "**发送人的邮箱地址**", "**你的邮箱密码或者授权码**"); transport.sendMessage(msg, new Address[] { new InternetAddress("**接收人的邮箱地址**") }); transport.close();但是報錯了因為報錯了範例程式碼是用的163郵箱,而筆者是QQ 郵箱,看Log 分析是QQ 郵箱需要SSL 加密。 開啟 SSL 加密網路上搜了一下,其他例如163、新浪郵箱不需要 SSL 加密,可以放棄 QQ 信箱。 網路上還有種說法,把 smtp.qq.com 換成 smtp.exmail.qq.com也不需要 SSL加密,但筆者沒有run成功。所以還是老實加上 SSL 加密吧。 下面的程式碼開啟了SSL 加密
DEBUG SMTP: AUTH LOGIN command trace suppressed DEBUG SMTP: AUTH LOGIN failed Exception in thread "main" javax.mail.AuthenticationFailedException: 530 Error: A secure connection is requiered(such as ssl). More information at http://service.mail.qq.com/cgi-bin/help?id=28成功了,控制台輸出Log 和效果圖如下
MailSSLSocketFactory sf = new MailSSLSocketFactory(); sf.setTrustAllHosts(true); props.put("mail.smtp.ssl.enable", "true"); props.put("mail.smtp.ssl.socketFactory", sf);
以上就是本文的全部內容,希望對大家的學習有幫助。
更多Java基於JavaMail實現向QQ郵箱發送郵件相關文章請關注PHP中文網!