Pandas 데이터 프레임에서 공백 값을 찾아 NaN으로 바꾸는 것은 어려울 수 있습니다. 목표는 빈 문자열 값이 있는 데이터프레임을 NaN 값이 있는 데이터프레임으로 변환하여 잠재적으로 데이터 처리 및 분석을 향상시키는 것입니다.
df.replace() 메서드는 다음과 같은 우아한 솔루션을 제공합니다.
<code class="python">df.replace(r'^\s*$', np.nan, regex=True)</code>
이 정규식 패턴에서 ^는 문자열의 시작 부분과 일치하고, s*는 0개 이상의 공백 문자와 일치하며, $는 문자열의 끝과 일치합니다. 따라서 이 정규 표현식은 완전히 공백 또는 빈 문자열로 구성된 문자열을 검사합니다.
이 솔루션을 예제 데이터 프레임에 적용하면:
<code class="python">df = pd.DataFrame([ [-0.532681, 'foo', 0], [1.490752, 'bar', 1], [-1.387326, 'foo', 2], [0.814772, 'baz', ' '], [-0.222552, ' ', 4], [-1.176781, 'qux', ' '], ], columns='A B C'.split(), index=pd.date_range('2000-01-01','2000-01-06')) result = df.replace(r'^\s*$', np.nan, regex=True) print(result)</code>
이렇게 하면 원하는 출력:
A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz NaN 2000-01-05 -0.222552 NaN 4 2000-01-06 -1.176781 qux NaN
Temak에서 지적한 대로 유효한 데이터에 공백이 포함될 수 있는 경우 정규식 패턴을 r'^s $'로 수정하여 구성된 문자열만 일치시킬 수 있습니다. 완전히 공백:
<code class="python">df.replace(r'^\s+$', np.nan, regex=True)</code>
위 내용은 Pandas 데이터 프레임에서 공백 값을 NaN으로 어떻게 바꾸나요?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!