An efficient class library for extracting text from HTML.
一個高效率的從HTML中擷取正文的類別庫。
正文擷取採用了基於文字密度的擷取演算法,支援從壓縮的HTML文件中擷取正文,每個頁面平均擷取時間為30ms,正確率在95%以上。
本站所有資源都是由網友投搞發佈,或轉載各大下載站,請自行檢測軟件的完整性! 本站所有資源僅供學習與參攷,請勿用於商業用途,否則產生的一切後果將由您自己承擔! 如有侵權請聯繫我們删除下架,聯繫方式: admin@php.cn