ホームページ >バックエンド開発 >Python チュートリアル >Python 文字列の文字変換、文字列分割、文字列結合の問題を解決する方法
前述の文字列置換は、「文字列内の部分文字列を置換する」です。文字列を新しい部分文字列に変換する場合、文字列内の特定の文字を変換する、つまり文字列内の 1 文字を置き換える場合は、maketrans メソッドと translation メソッドを呼び出してこれを実現できます。
まず、maketrans メソッドを呼び出して変換テーブルを作成し、その文字をどの文字に変換するかを変換テーブル内で宣言し、作成した変換テーブルをパラメータとして translation メソッドに渡すことで文字変換を実現します。
変換テーブルを作成するための maketrans メソッドの構文:
str.maketrans('转换的字符', '转换后的字符','删除的字符')
maketrans メソッドは 3 つのパラメーターを渡すことができます:
最初のパラメーターは次のとおりです。変換文字を指定するために使用されます。複数の文字が指定されている場合は、複数の変換文字も指定する必要があり、数値は同じである必要があります。変換される最初の文字は、2 番目のパラメータの最初の文字に変換されます。会議では説明が行われます。
2 番目のパラメータは、変換後の文字を指定するために使用されます。
3 番目のパラメータは、削除する文字を指定するために使用されます。
変換テーブルを定義した後、print を使用して変換テーブルの内容を出力できます。このとき、ディクショナリが返され、ディクショナリ内の各 key:value が対応します。文字の序数値。
translate メソッドは、変換テーブルをパラメーターとして渡し、定義された文字列を使用して呼び出して、最終的に文字変換を実行します。
1) 変換テーブルの作成
変換テーブルを定義する際、変換対象の文字が複数ある場合、指定した文字数を指定した場合、変換後の文字数と変換中の文字数が同じになる必要があります。このとき、第一引数と第二引数が相互変換されます。コードは次のとおりです。
contable = str.maketrans('agx', '789') print(contable) ''' 代码解释: str.maketrans('agx', '789')定义了一个转换表,其中字符a转换成字符7,字符g转换成字符8,字符x转换成字符9 当使用print函数打印定义的转换表时,返回的是一个字典,key是被转换的字符,value是转换后的字符,并且返回的是字符的ordinal value值 返回结果:{97: 55, 103: 56, 120: 57} {97是字符a: 55是字符7, 103是字符g: 56是字符8, 120是字符x: 57是字符9} '''
print 関数を使用して変換テーブルを印刷できます。返される結果は辞書です。辞書の値は、対応する文字の序数値です。辞書では、どの文字が表示されているかが明確にわかります下図のように、97 は文字 a、55 は文字 7 となり、97 に相当する文字は 55 に相当する文字に変換されます。
変換後の文字と変換後の文字の元の値を文字列として直接宣言するほかに、辞書メソッドを使用して宣言することもできます。変換と変換された文字。変換テーブルによって返される結果は辞書ですが、最も一般的な方法は、変換された文字を変換テーブルで直接宣言することです。
#使用字典的形式,在字典中声明转换的字符、被转换字符的原始值 contable = str.maketrans({'a': '7', 'g': '8', 'x': '9'}) print(contable) ''' 此时使用print打印转换表时,就会发现转换后的字符会以原始值的形式记录在字典中,被转换的字符还是以ordinal value值表示 ''' #输出结果:{97: '7', 103: '8', 120: '9'} #还是使用字典的行驶,在字典中声明被转换字符、转换字符的ordinal value值 contable = str.maketrans({97: 55, 103: 56, 120: 57}) print(contable) ''' 这种方法需要实现使用ord函数获取被转换字符、转换字符的ordinal value值,然后在字典中直接声明字符的ordinal value值 ''' #输出结果:{97: 55, 103: 56, 120: 57}
2) 文字変換
#首先定义一个转换表,这个转换表可以被任意字符串调用使用 contable = str.maketrans('agx', '789') #定义一个字符串 mystr = 'jiangxluplader' #使用translate方法将转换表以参数的形式传入,然后由字符串调用这个方法实现字符的转换 print(mystr.translate(contable)) #输出结果:ji7n89lupl7der
文字列内のすべての a 文字は 7 に変換され、すべての g 文字は 8 に変換され、すべて x に変換されることがわかりました。文字は 9 に変換されます。
3) maketrans メソッドで変換テーブルを定義するときに、文字 u、p を削除するなど、削除する文字を指定することもできます。
contable = str.maketrans('agx', '789', 'up') mystr = 'jiangxluplader' print(mystr.translate(contable)) ''' maketrans方法创建转换表时,第三个参数是指定删除的字符 ''' #输出结果:ji7n89ll7der
4) maketrans メソッド定義変換テーブルでは、u と p# の文字のみを削除するなど、文字を変換せずに特定の文字のみを削除することもできます。 ##
contable = str.maketrans('', '', 'up') mystr = 'jiangxluplader' print(mystr.translate(contable)) #输出结果:jiangxllader3 番目のパラメータを指定すると、指定された文字が削除され、実際には指定された文字は None オブジェクトに設定されます。 2. 文字列分割2.1. 文字列分割の概念いわゆる文字列分割とは、はい、文字列を指します。指定された区切り文字に従って N 個の部分に分割されます。たとえば、文字列「aaa bbb」。デフォルトの区切り文字はスペースで、文字列は区切り文字に従って「aaa」、「bbb」に分割できます。これは、文字列の分割。文字列を分割するには 2 つのメソッドがあります:
1) メソッド split または rsplit を呼び出して文字列を分割します
当字符串中没有指定的分隔符时,这两个方法都会返回字符串本身,但是也会将字符串本身放在列表中。
2)调用方法partition或者rpartition劈分字符串
partition和rpartition这两个方法在调用的时候必须指定分隔符,然后对字符串进行劈分,这两个方法对字符串劈分后会返回一个元组。
partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
partition方法和rpartition只会将字符串中第一次出现分隔符的位置,进行劈分,一分为三,这就是与split方法的最大区别
partition方法和rpartition两个方法只是开始劈分的位置处不同,然后将字符串劈分为三个元素:
分隔符前面的部分
分隔符
分隔符后面的部分
如果字符串中不存在指定的分隔符,两个方法都会返回字符串本身,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串,rpartition方法劈分的三个元素依次为:空字符串、空字符串、字符串本身。
1)基本的劈分案例
#原始字符串 mystr = "DevOps Jenkins Kubernetes" #左劈分 print(mystr.split()) #右劈分 print(mystr.rsplit()) ''' 左劈分是从DevOps第一个空格字符串处开始劈分,右劈分是从Kubernetes最后一个空格字符串处开始劈分 默认的劈分字符串是空格字符串,只要遇到空格字符串,就将空格字符串左侧的字符串劈分出来。 '''
可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。
2)通过参数sep指定分隔符劈分字符串
在split和rsplit方法中都可以使用sep参数指定分隔符,从而根据指定的分隔符去劈分字符串。
mystr = "DevOps|Jenkins|Kubernetes" print(mystr.split(sep='|')) print(mystr.rsplit(sep='|')) ''' split(sep='|')、rsplit(sep='|')指定分隔符为“|” '''
可以看到split和rsplit两个方法对字符串劈分后,并没有明显的区别。
当指定的分隔符字符串不存在时,则会返回字符串本身,但是也会将字符串本身放在列表中。
mystr = "DevOps Jenkins Kubernetes" print(mystr.split(sep='|')) print(mystr.rsplit(sep='|'))
3)通过参数maxsplit指定劈分字符串的最大劈分次数
在split和rsplit方法中都可以使用maxsplit参数指定劈分字符串的最大劈分次数,什么意思呢?原本一个字符串可以被劈分6次,但是我们只需要劈分2次就行,就可以使用maxsplit参数指定指定劈分字符串的最大劈分次数。
当指定了最大的劈分次数时,当超过最大的劈分次数后,剩余的子串会单独作为一部分输出,此时split和rsplit两个劈分方法就会有明显的区别。
#定义原始字符串 mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" ''' 使用split方法是从左往右开始劈分,从第一个子串位置处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么DevOps、Jenkins会被劈分出来作为列表的单独元素,而剩余的子串Kubernetes|Python|Gitlab会被作为一部分放在列表的一个元素内 ''' print(mystr.split(sep='|', maxsplit=2)) #输出结果:['DevOps', 'Jenkins', 'Kubernetes|Python|Gitlab'] ''' 使用rsplit方法是从右往左开始劈分,从最后一个子串处开始劈分,分隔符为"|",劈分次数为2,本身这个字符串可以被劈分5次,我们只劈分2次,那么Gitlab、Python这两个字符串会被劈分出来作为列表的单独元素,而剩余的字符DevOps|Jenkins|Kubernetes会被作为一部分,放在列表的一个元素内 ''' print(mystr.rsplit(sep='|', maxsplit=2)) #输出结果:['DevOps|Jenkins|Kubernetes', 'Python', 'Gitlab']
当在劈分方法内指定了最大的劈分次数的参数时,split左劈分和rsplit右劈分就会有明显的区别,split方法是从前往后根据分隔符进行劈分,rsplit方法是从后往前根据分隔符进行劈分。
partition方法是左劈分,从左往右找到分隔符第一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
rpartition方法是右劈分,从右往左找到分隔符第一次出现的位置,或者从左往右找到分隔符最后一次出现的位置,然后开始劈分字符串,始终劈分成三个元素,第一个元素是分隔符左侧的部分,第二个元素是分隔符,第三个元素是分隔符后面的部分。
这两个方法,只会根据一个分隔符进行劈分字符串,且始终劈分成三个元素,partition方法的分隔符取决于在字符串中第一次出现的分隔符,rpartition方法的分隔符取决于字符串中最后一次出现的分隔符。
1)调用方法partition劈分字符串
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.partition('|')) ''' partition从左往右找到第一次出现分隔字符串的位置,从这里开始劈分字符串,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。 ''' #输出结果:('DevOps', '|', 'Jenkins|Kubernetes|Python|Gitlab')
2)调用方法rpartition劈分字符串
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.rpartition('|')) ''' rpartition从左往右找到最后一次出现分隔字符串的位置,分隔符左侧的部分(DevOps)为第一个元素,分隔符(|)为第二个元素,分隔符右侧的部分(Jenkins|Kubernetes|Python|Gitlab)为第三个元素。 ''' #输出结果:('DevOps|Jenkins|Kubernetes|Python', '|', 'Gitlab')
确实和理论说明的一样,从左往右找到最后一次分隔符出现的位置,分隔符左侧的部分为元组中的第一个元素,分隔符为第二个元素,分隔符右侧的部分为元组中的第三个元素。
3)当字符串中只有一个分隔符字符串且分隔符后没有任何字符时
当字符串中只有一个分隔符字符串时,且分隔符后面没有任何字符串,此时无论是partition方法还是rpartition方法,劈分的字符串第三个元素一定为空。
mystr = "DevOps|" print(mystr.partition('|')) print(mystr.rpartition('|'))
第三个元素取的都是分隔符后面的部分,分隔符后面的部分什么也没有,因此就会输出空字符串。
4)当字符串中不存在指定的分隔符字符串(partition方法)
如果字符串中不存在指定的分隔符,partition方法劈分的三个元素顺序依次为:字符串本身、空字符串、空字符串。
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.partition('*')) #输出结果:('DevOps|Jenkins|Kubernetes|Python|Gitlab', '', '')
第一个元素是字符串的本身,第二个元素是空字符串,第三个元素也是空字符串。
4)当字符串中不存在指定的分隔符字符串(rpartition方法)
如果字符串中不存在指定的分隔符,rpartition方法劈分的三个元素顺序依次为:空字符串、空字符串、字符串本身。
mystr = "DevOps|Jenkins|Kubernetes|Python|Gitlab" print(mystr.rpartition('*'))
第一个元素是空字符串,第二个元素是空字符串,第三个元素是字符串的本身。
可以调用方法join将多个字符串合并成一个字符串。语法格式如下:
'字符串的间隔符'.join(列表|数组) 字符串的间隔符可以指定,也可以不指定,指定后,每个元素字符串在合并时都会在后面添加一个分隔符。
1)使用join方法将列表中多个字符串进行合并
使用join方法可以将列表中的多个元素,元素也都是字符串,将这些字符串进行合并。
print(''.join(["Python", "Go", "K8S"])) #输出结果:PythonGoK8S
使用join方法将列表中的每个元素合并时添加一个分隔符“|”
print('|'.join(["Python", "Go", "K8S"])) #输出结果:Python|Go|K8S
2)使用join方法将元组中的多个字符串进行合并
join方法也可以将元组中的元素合并。
print('|'.join(("Python", "Go", "K8S"))) #输出结果:Python|Go|K8S
3)可以把字符串看成是字符的列表,然后使用join方法将这些字符合并成字符串
可以把字符串看成是字符的列表,然后使用join将这些字符加上分隔符合并成新的字符串。
print('|'.join("Python")) #输出结果:P|y|t|h|o|n
以上がPython 文字列の文字変換、文字列分割、文字列結合の問題を解決する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。