Cx_Oracle 쿼리 시 UnicodeDecodeError 문제를 Python으로 해결합니다.-파이썬 튜토리얼-php.cn

집

백엔드 개발

파이썬 튜토리얼

Cx_Oracle 쿼리 시 UnicodeDecodeError 문제를 Python으로 해결합니다.

高洛峰

Feb 16, 2017 am 11:13 AM

datatablesoraclepython

최근 프로젝트에서 100만 개 이상의 레코드가 포함된 테이블을 쿼리한 후 일부 데이터 통계를 수행해야 했는데 이 과정에서 일부 데이터만 쿼리한 후에 UnicodeDecodeError가 발생하는 것을 발견했습니다.
여기에서는 쿼리를 위해 sqlalchemy 라이브러리를 사용하고 내부적으로 Cx_Oracle을 사용하여 해당 작업을 수행합니다. 사용된 Python 버전은 3.5.0이고 호스트 시스템은 Windows 2008 Server이며 다음과 유사한 작업이 수행됩니다.

from sqlalchemy import create_engine

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST')
conn = engine.connect()
sql = 'select t.type from TS t'
result = conn.execute(sql)
for row in result:
    print(row['type'])

여기에서는 먼저 데이터베이스에 대한 연결을 만든 다음 해당 쿼리 작업을 수행합니다. 안타깝게도 10개 미만의 레코드를 쿼리한 후 UnicodeDecodeError가 발생했습니다.
원래는 데이터베이스의 서버 인코딩 문제인 줄 알고 create_engine 함수에 인코딩 매개변수를 추가하고 다음과 같이 변경했습니다.

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST',encoding="UTF-8")

또 다른 방법으로는 연결에서 인코딩을 직접 지정하는 방법이 있습니다. 경로는 다음과 유사합니다:

engine = create_engine('oracle://demo:123456@192.168.1.202/TEST?charset=utf-8')

그러나 문제는 아직 해결되지 않았습니다. 인터넷을 검색했지만 적합한 솔루션을 찾을 수 없었습니다. Mysql 데이터베이스를 사용할 때(저는 개인적으로 Postgresql을 더 좋아합니다), 잘못된 문자가 나타날 때 다음 작업을 자주 수행했다는 것이 기억났습니다.

set names gbk;

우리는 설정했습니다. 터미널에서 문자 깨짐 문제를 해결하기 위해 서버 인코딩이 아닌 클라이언트 인코딩을 이런 방식으로 사용합니다(Postgresql의 기본 데이터베이스는 UTF-8이므로 문자 깨짐 가능성이 낮습니다). 또한 Linux에서 Oracle 클라이언트를 설치하는 경우 NLS_LANG라는 환경 변수가 설정됩니다. 자세한 내용은 Ubuntu 14.04에 Oracle Instant Client 설치 문서를 참조하세요. 물론 이 문서에서는 일부 세부 사항을 소개하지 않습니다.
일반적으로 cmd에서 다음과 같이 설정합니다.

setenv NLS_LANG=SIMPLIFIED CHINESE_CHINA.ZHS16GBK

Oracle 메시지에 사용되는 언어는 중국어 간체이고 클라이언트의 문자 집합은 GBK로 지정합니다.
또한 다음 명령문을 실행하여 위 작업이 올바른지 확인할 수도 있습니다.

SELECT * FROM v$nls_parameters;

위 데이터베이스 서버가 Windows에 배포되었으므로 결과는 당연히 GBK이므로 고객이 만약 클라이언트는 디코딩을 위해 UTF8 문자 세트를 사용하므로 디코딩 오류는 자연스럽게 발생합니다.
주의해야 할 점은 데이터베이스 서버와 클라이언트의 인코딩이 일관되어야만 비ASCII 인코딩을 정상적으로 표시할 수 있으며, sqlalchemy에서는 기본적으로 쿼리 문자열을 강제로 유니코드로 변환한다는 점입니다. 따라서 Python3에서는

>>> a='中国'.encode('gbk')
>>> a
b'\xd6\xd0\xb9\xfa'

의 과정과 유사합니다. sqlalchemy에서는 강제 인코딩 변환으로 인해

>>> a.decode('utf-8')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xd6 in position 0: invalid continuation byte</module></stdin>

의 과정과 유사하게 됩니다. 따라서 위와 같은 문제가 발생합니다. . 일반적인 상황에서는 인코딩을 GBK:

>>> a.decode('gbk')
'中国'

로 지정해야 하며 NLS_LANG 설정은 위 인코딩을 GBK로 수정하는 것과 같습니다.

Python에 대한 자세한 내용 - Cx_Oracle 쿼리 시 UnicodeDecodeError 문제 해결에 대한 내용은 PHP 중국어 웹사이트에서 관련 기사를 참고하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

oracle怎么查询所有索引May 13, 2022 pm 05:23 PM

方法：1、利用“select*from user_indexes where table_name=表名”语句查询表中索引；2、利用“select*from all_indexes where table_name=表名”语句查询所有索引。

什么是oracle asmApr 18, 2022 pm 04:16 PM

oracle asm指的是“自动存储管理”，是一种卷管理器，可自动管理磁盘组并提供有效的数据冗余功能；它是做为单独的Oracle实例实施和部署。asm的优势：1、配置简单、可最大化推动数据库合并的存储资源利用；2、支持BIGFILE文件等。

oracle全角怎么转半角May 13, 2022 pm 03:21 PM

在oracle中，可以利用“TO_SINGLE_BYTE(String)”将全角转换为半角；“TO_SINGLE_BYTE”函数可以将参数中所有多字节字符都替换为等价的单字节字符，只有当数据库字符集同时包含多字节和单字节字符的时候有效。

Oracle怎么查询端口号May 13, 2022 am 10:10 AM

在Oracle中，可利用lsnrctl命令查询端口号，该命令是Oracle的监听命令；在启动、关闭或重启oracle监听器之前可使用该命令检查oracle监听器的状态，语法为“lsnrctl status”，结果PORT后的内容就是端口号。

oracle查询怎么不区分大小写May 10, 2022 pm 05:45 PM

方法：1、利用“LOWER(字段值)”将字段转为小写，或者利用“UPPER(字段值)”将字段转为大写；2、利用“REGEXP_LIKE(字符串,正则表达式,'i')”，当参数设置为“i”时，说明进行匹配不区分大小写。

oracle怎么查询数据类型May 13, 2022 pm 04:19 PM

在oracle中，可以利用“select ... From all_tab_columns where table_name=upper('表名') AND owner=upper('数据库登录用户名');”语句查询数据库表的数据类型。

oracle怎么删除sequenceMay 13, 2022 pm 03:35 PM

在oracle中，可以利用“drop sequence sequence名”来删除sequence；sequence是自动增加数字序列的意思，也就是序列号，序列号自动增加不能重置，因此需要利用drop sequence语句来删除序列。

Oracle怎么修改sessionMay 13, 2022 pm 05:06 PM

方法：1、利用“alter system set sessions=修改后的数值 scope=spfile”语句修改session参数；2、修改参数之后利用“shutdown immediate – startup”语句重启服务器即可生效。

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

WebStorm Mac 버전

유용한 JavaScript 개발 도구

DVWA

DVWA(Damn Vulnerable Web App)는 매우 취약한 PHP/MySQL 웹 애플리케이션입니다. 주요 목표는 보안 전문가가 법적 환경에서 자신의 기술과 도구를 테스트하고, 웹 개발자가 웹 응용 프로그램 보안 프로세스를 더 잘 이해할 수 있도록 돕고, 교사/학생이 교실 환경 웹 응용 프로그램에서 가르치고 배울 수 있도록 돕는 것입니다. 보안. DVWA의 목표는 다양한 난이도의 간단하고 간단한 인터페이스를 통해 가장 일반적인 웹 취약점 중 일부를 연습하는 것입니다. 이 소프트웨어는

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.