搜尋

首頁  >  問答  >  主體

python利用css的font-family 提取html字串的函式庫?

python下利用有利用css的font-family屬性來提取html字串的函式庫嗎?用來做字體子集化。

扔个三星炸死你扔个三星炸死你2758 天前1094

全部回覆(2)我來回復

  • 我想大声告诉你

    我想大声告诉你2017-06-12 09:29:55

    你問的問題有一點模糊,如果是使用CSS Selector取html內的內容,可以用lxml.cssselect,中文說明還有這有,且不只是用lxml

    回覆
    0
  • 巴扎黑

    巴扎黑2017-06-12 09:29:55

    font-family只是指定使用的字體。

    你想做的是對一篇HTML計算一共有多少個漢字,然後動態或半靜態產生只包含這些字的提及比較小的漢字字體遠端下載使用?

    如果只是計算漢字,其實python下面的set是最簡單的。

    但是要產生對應的字庫就是大坑了。目前方正有類似的服務,似乎叫雲端字庫,之前詢過價,對方老實表示問題還不少。

    回覆
    0
  • 取消回覆