去除诸如以上验证码干扰线,采用 灰度图 → rof算法 → ImageEnhance.Sharpness → 二值图 产生如下效果
部分孤立噪点难以去除干净,这也对tesseract的识别产生影响,上面的方式只有30%识别率。
高洛峰2017-04-17 17:53:25
この種の検証コードの場合:
1. 干渉線はわずか 1px ~ 2px 程度です
2. フォントは干渉線よりも太いです
二値化後、次のように点をフィルタリングできます。
1. 周囲の 8 点のうち 1 の点が 2 つ未満です