문제:
DataFrame을 문자열로 변환하면 dtype 'object'로 유지됩니다. 개별 열 값을 검사하면 실제로 문자열인지 확인됩니다.
Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 non-null values attr3 56992 non-null values attr4 56992 non-null values attr5 56992 non-null values attr6 56992 non-null values dtypes: int64(2), object(5) Column 'attr2' remains as dtype 'object' despite conversion: convert attr2 to string
설명:
Pandas는 dtype 'object'를 사용하여 가변 길이 데이터 유형이 포함된 열을 설명합니다. , 문자열과 같은. 이는 'int64' 및 'float64'와 같은 고정 길이 데이터 유형과 다릅니다. 내부적으로 Pandas는 '객체' ndarray의 문자열 객체에 대한 포인터를 사용하여 문자열 데이터를 저장합니다.
int64 array: [1, 2, 3, 4] object array: [pointer to string 'John', pointer to string 'Mary', pointer to string 'Bob', pointer to string 'Alice']
'dtype 객체'는 그 안에 있는 객체가 문자열이 아니라는 것을 의미하지 않습니다. 각 문자열 객체는 여전히 메모리에 상주하며 '객체' ndarray의 포인터를 통해 액세스할 수 있습니다.
Pandas가 열을 문자열로 인식하도록 하려면 해당 열의 모든 요소가 일관된 문자열인지 확인하세요. 또한 .apply(str) 또는 .astype('string')과 같은 메서드를 사용하여 요소를 문자열로 변환할 수 있습니다.
위 내용은 문자열 변환 후 내 DataFrame 열에 \'Object\' 데이터 유형이 표시되는 이유는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!