>백엔드 개발 >파이썬 튜토리얼 >문자열 변환 후 내 DataFrame 열에 \'Object\' 데이터 유형이 표시되는 이유는 무엇입니까?

문자열 변환 후 내 DataFrame 열에 \'Object\' 데이터 유형이 표시되는 이유는 무엇입니까?

Susan Sarandon
Susan Sarandon원래의
2024-10-28 15:25:02961검색

Why is My DataFrame Column Showing

명시적 문자열 변환에도 불구하고 DataFrame 열에 "객체" 데이터 유형이 표시됨

문제:
DataFrame을 문자열로 변환하면 dtype 'object'로 유지됩니다. 개별 열 값을 검사하면 실제로 문자열인지 확인됩니다.

Int64Index: 56992 entries, 0 to 56991
Data columns (total 7 columns):
id            56992 non-null values
attr1         56992 non-null values
attr2         56992 non-null values
attr3         56992 non-null values
attr4         56992 non-null values
attr5         56992 non-null values
attr6         56992 non-null values
dtypes: int64(2), object(5)

Column 'attr2' remains as dtype 'object' despite conversion:

convert attr2 to string

설명:

Pandas는 dtype 'object'를 사용하여 가변 길이 데이터 유형이 포함된 열을 설명합니다. , 문자열과 같은. 이는 'int64' 및 'float64'와 같은 고정 길이 데이터 유형과 다릅니다. 내부적으로 Pandas는 '객체' ndarray의 문자열 객체에 대한 포인터를 사용하여 문자열 데이터를 저장합니다.

int64 array:
[1, 2, 3, 4]

object array:
[pointer to string 'John', pointer to string 'Mary', pointer to string 'Bob', pointer to string 'Alice']

'dtype 객체'는 그 안에 있는 객체가 문자열이 아니라는 것을 의미하지 않습니다. 각 문자열 객체는 여전히 메모리에 상주하며 '객체' ndarray의 포인터를 통해 액세스할 수 있습니다.

Pandas가 열을 문자열로 인식하도록 하려면 해당 열의 모든 요소가 일관된 문자열인지 확인하세요. 또한 .apply(str) 또는 .astype('string')과 같은 메서드를 사용하여 요소를 문자열로 변환할 수 있습니다.

위 내용은 문자열 변환 후 내 DataFrame 열에 \'Object\' 데이터 유형이 표시되는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.