#Python は漢数字をアラビア数字に変換します
(無料学習の推奨事項: Python ビデオ チュートリアル )
テキストから数値を抽出する正規表現
これはテキストから中国の年を抽出するデモです
import re m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"pattrern1 = '[零一二三四五六七八九]{4,}'pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'time1 = re.findall(pattrern1,m0)#转化数字次のような年を抽出します: '1949'、'1990'、'1996'
正規表現の多くの例を次に示します: example
中国語をアラビア数字に変換
辞書を作成し、数値エントリを照合します:CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1結果が表示され、上記の例の中国の年がアラビア数字に正常に変換されます: '1949'、'1990'、' 1996'
完全なコード
# 2、将句子中年份的大写数字改为阿拉伯数字import re m0 = "在一九四九年新中国成立比一九九零年低百分之五点二人一九九六年击败俄军,取得实质独立"pattrern1 = '[零一二三四五六七八九]{4,}'pattrern2 = '[〇一二三四五六七八九零壹贰叁肆伍陆柒捌玖貮两]{4,}'time1 = re.findall(pattrern1,m0)#转化数字CN_NUM = { '〇': 0, '一': 1, '二': 2, '三': 3, '四': 4, '五': 5, '六': 6, '七': 7, '八': 8, '九': 9, '零': 0, '壹': 1, '贰': 2, '叁': 3, '肆': 4, '伍': 5, '陆': 6, '柒': 7, '捌': 8, '玖': 9, '貮': 2, '两': 2,}for i in range(len(time1)): new_str = '' for j in time1[i]: new_str += str(CN_NUM[j]) time1[i] = new_str time1
多数の無料学習に関する推奨事項については、Python チュートリアル#をご覧ください。 # #######(ビデオ)#########
以上がPython を学習して漢数字をアラビア数字に変換するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。