최근 Python 데이터 분석 콘텐츠를 배우고 싶어서 일부 데이터를 크롤링하는 크롤러를 만들었고 Anaconda의 도구 세트(pandas, numpy, scipy, matplotlib, jupyter)를 사용하여 예비 데이터 마이닝 및 분석을 수행할 계획이었습니다. .
matplotlib를 사용하여 그릴 때 가로좌표가 중국어로 되어 있는데, 그려진 막대 차트의 가로좌표에는 항상 "프레임"이 표시되어 있어서 이를 해결하기 위해 정보를 확인하러 갔습니다. 나는 이것이 비교적 일반적인 문제라고 생각합니다. 인터넷에는 실제로 많은 중국어 자료가 있지만 그 중 어느 것도 제가 직면한 문제를 완전히 해결하지 못했습니다. 최종적으로 완료하는 데 거의 3시간 정도의 단편적인 작업이 소요되었습니다. 같은 문제를 겪고 있는 다른 아이들에게 도움이 되기를 바라며 이 글을 공유하고 싶습니다.
실행 환경:
python2.7
Linux Centos7
conda와 함께 설치된 matplotlib 및 pandas를 사용하세요
문제:
matplotlib 그리기, 중국어를 표시할 수 없음
문제 이유:
Linux 운영 체제와 matplotlib 글꼴 라이브러리에는 중국어 글꼴이 없습니다
matplotlib 패키지는 기본적으로 ASCII 코드만 지원하고 유니코드 코드는 지원하지 않습니다
온라인 정보 요약:
수정 "Simhei" 글꼴 추가 등 matplotlib의 리소스 구성 파일(이 글꼴은 모든 Linux 시스템에서 사용할 수 없습니다. 수정해도 효과가 없습니다.)
Linux용 중국어 글꼴 설치 및 리소스 구성 수정 matplotlib 파일입니다. (하하, 안되네요)
해결책:
사실 이것도 인터넷에 있는 다양한 솔루션을 조합한 것이기도 합니다. 일반적으로 다음 단계가 있습니다.
1. matplotlibrc 파일이 있는 경로를 가져옵니다. jupyter 노트북에 들어가세요:
1 import matplotlib2 matplotlib.matplotlib_fname()
예를 들어, 내 파일은
u'~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/matplotlibrc'
에 있습니다. 후속 단계에서는 이 파일의 글꼴 매개변수를 수정합니다.
2. 시스템에 있는 모든 글꼴과 사용 가능한 중국어 글꼴을 살펴보세요. 또한 jupyter nb에서:
from matplotlib.font_manager import FontManagerimport subprocess fm = FontManager() mat_fonts = set(f.name for f in fm.ttflist)print mat_fonts output = subprocess.check_output('fc-list :lang=zh -f "%{family}\n"', shell=True)print '*' * 10, '系统可用的中文字体', '*' * 10print output zh_fonts = set(f.split(',', 1)[0] for f in output.split('\n')) available = mat_fonts & zh_fontsprint '*' * 10, '可用的字体', '*' * 10for f in available:print f
위 작업을 완료하면 "사용 가능한 글꼴"이 비어 있음을 알 수 있습니다. matplotlib에는 중국어 글꼴이 없기 때문에(한자가 "상자"로 표시되는 이유입니다)
3. 운영 체제에 중국어 글꼴이 없다고 가정합니다. 이때 ttf 중국어 폰트를 다운받아 cenos에 설치합니다. 글꼴 모음을 감지할 수 있는 시스템을 설치해야 합니다. 그렇지 않으면 유효하지 않습니다. 저는 이 웹사이트에서 다운로드했습니다:
rar 파일의 압축을 풀어주세요. yourfontdir 폴더를 만들어 이 글꼴을 /usr/share/fonts 경로에 저장하고, 다운로드한 ttf 파일을 yourfontdir에 복사하세요. (더 쉬운 작업을 위해 파일을 영어 이름으로 변경할 수 있습니다.)
4. 세노스.
cd /usr/share/fonts/yourfontsdir#生成字体索引信息. 会显示字体的font-familysudo mkfontscale sudo mkfontdir#更新字体缓存:fc-cache
5. matplotlibrc 파일을 수정합니다.
1단계에서 얻은 matplotlibrc 파일 구성을 수정합니다.
font.family 부분의 주석을 제거하고 Font.serif 지원 글꼴에 중국어 글꼴을 추가하세요. 여기에 방금 다운로드한 중국어 글꼴의 글꼴 모음을 추가합니다. fc-list 명령을 통해 검색할 수 있습니다(따라서 미리 적어 두는 것이 가장 좋습니다). 여기에 추가한 것은 "WenQuanYi Zen Hei Mono" 글꼴입니다.
다음 주석을 제거해야 합니다. 그렇지 않으면 중국어 빼기 기호에도 사각형이 표시됩니다.
axes.unicode_minus : False
6 이 단계가 가장 중요합니다! matplotlib에 중국어 글꼴 추가
5단계를 완료한 후 2단계로 진행하면 "사용 가능한 중국어 글꼴"에 방금 설치한 글꼴이 이미 있지만 그림에 여전히 중국어가 표시되지 않는 것을 확인할 수 있습니다. 이는 centos에 글꼴을 설치하고 matplotlib에 이 글꼴을 사용하도록 지시했지만 matplotlib가 이 글꼴의 ttf 파일을 찾을 수 없기 때문입니다. . . . 그래서 나는 그것을 위해 하나를 얻어야합니다.
다운로드한 ttf 글꼴을
~/miniconda2/lib/python2.7/site-packages/matplotlib/mpl-data/fonts/ttf
경로에 복사하고 해당 캐시를 삭제하세요. 다음 경로에서
~/.cache/matplotlib
글꼴 관련 캐시를 삭제하세요
7. 이제 다시 그림을 그려보세요. 완료.
참조:
위 내용은 Linux 시스템에서 Python matplotlib 그리기의 중국어 표시 문제 해결의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!