Heim  >  Fragen und Antworten  >  Hauptteil

Regulärer Ausdruck – Wie kann man chinesisches Pinyin mit Python abgleichen?

Verwenden Sie beispielsweise reguläre Ausdrücke, um das Pinyin von shá abzugleichen.
ps: Was ich zuvor gesagt habe, ist möglicherweise nicht klar. Ich habe das Wort „zum Beispiel“ verwendet, was bedeutet, dass der zu verarbeitende Text Pinyin enthält, aber ich weiß nicht, was das spezifische Pinyin ist, das ich finden muss Geben Sie diese Pinyin-Zeichen aus. Der zu verarbeitende Text enthält chinesische und Pinyin-Symbole (,.: und dergleichen). Beantworten Sie daher bitte keine Fragen wie re.search(u'shá',text) Es muss regelmäßig sein, keine einfache feste Zeichenfolge. . .

ringa_leeringa_lee2701 Tage vor1687

Antworte allen(3)Ich werde antworten

  • 巴扎黑

    巴扎黑2017-05-27 17:41:30

    import re
    regex = re.compile(r'\b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńňǹɑɡ]+[a-z]*\b')
    text = "Thǐs ís à pìnyin abóut shá"
    m = regex.findall(text)
    print(m)

    匹配结果:
    ['ís', 'à', 'pìnyin', 'abóut', 'shá']
    没有匹配第一个Thǐs,因为默认拼音都是小写,排除了大写。

    Antwort
    0
  • PHPz

    PHPz2017-05-27 17:41:30

    你是要匹配所有合法的拼音吗?

    如果是,你去找个字典的拼音索引,把里边的所有拼音全部 | 到一起就可以了。也只能这样,因为拼音不是根据正则,或者其它某种机械的规则定义出来的。你想不漏又不多就只能这样了,反正也没多少个。

    Antwort
    0
  • 伊谢尔伦

    伊谢尔伦2017-05-27 17:41:30

    >>> import re
    >>> d='shá'
    >>> data='This is a pinyin about shá'
    >>> re.search(d,data)
    <_sre.SRE_Match at 0x404e308>

    Antwort
    0
  • StornierenAntwort