Pandas를 사용하여 DataFrame 문자열에서 숫자 추출
데이터 분석에서는 문자열에서 특정 패턴이나 데이터 유형을 추출해야 하는 경우가 많습니다. Pandas DataFrames의 경우 문자열 열에는 문자와 숫자를 포함한 혼합 데이터 유형이 포함될 수 있습니다. 이 문서에서는 강력한 Pandas 라이브러리를 사용하여 이러한 문자열에서 숫자를 추출하는 문제를 다룹니다.
문자열과 숫자 값이 혼합되어 있는 'A'라는 열이 있는 'df'라는 다음 DataFrame 예제를 고려해 보세요.
<code class="python">import pandas as pd import numpy as np df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], })</code>
우리의 목표는 각 셀에서 숫자 값을 분리하여 정수만 포함된 깨끗한 열을 만드는 것입니다.
A 0 1 1 NaN 2 10 3 100 4 0
정규 표현식 및 캡처 그룹 사용
문자열에서 숫자를 추출하는 효과적인 접근 방식 중 하나는 캡처 그룹과 함께 정규식(regex)을 활용하는 것입니다. Regex를 사용하면 문자열의 특정 문자나 시퀀스와 일치하는 패턴을 지정할 수 있습니다. 캡처 그룹을 사용하면 문자열에서 일치하는 부분을 캡처하고 추출할 수 있습니다.
이 경우 다음 정규식 패턴을 사용할 수 있습니다.
(\d+)
이 패턴은 일치하는 캡처 그룹을 나타냅니다. 한 행 이상의 숫자(d).
'str.extract' 메서드를 사용하여 이 패턴을 DataFrame에 적용하면
<code class="python">df.A.str.extract('(\d+)')</code>
원하는 결과가 생성됩니다.
0 1 1 NaN 2 10 3 100 4 0 Name: A, dtype: object
캡처 그룹이 문자를 무시하고 문자열의 숫자 부분을 추출하는 데 성공했습니다. 이 방법은 정수에만 적용되며 부동 소수점 값에는 작동하지 않는다는 점에 유의하는 것이 중요합니다.
결론적으로 캡처 그룹과 함께 정규식을 활용하면 문자열 열에서 숫자를 추출하는 간결하고 효율적인 방법을 제공합니다. Pandas DataFrames 내에서. 이 기술을 통합함으로써 데이터 분석가는 추가 분석 및 조작을 위해 숫자 데이터를 효과적으로 분리할 수 있습니다.
위 내용은 Pandas DataFrames의 문자열에서 숫자를 추출하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

이 기사에서는 HTML을 구문 분석하기 위해 파이썬 라이브러리 인 아름다운 수프를 사용하는 방법을 설명합니다. 데이터 추출, 다양한 HTML 구조 및 오류 처리 및 대안 (SEL과 같은 Find (), find_all (), select () 및 get_text ()와 같은 일반적인 방법을 자세히 설명합니다.

Python의 통계 모듈은 강력한 데이터 통계 분석 기능을 제공하여 생물 통계 및 비즈니스 분석과 같은 데이터의 전반적인 특성을 빠르게 이해할 수 있도록 도와줍니다. 데이터 포인트를 하나씩 보는 대신 평균 또는 분산과 같은 통계를보고 무시할 수있는 원래 데이터에서 트렌드와 기능을 발견하고 대형 데이터 세트를보다 쉽고 효과적으로 비교하십시오. 이 튜토리얼은 평균을 계산하고 데이터 세트의 분산 정도를 측정하는 방법을 설명합니다. 달리 명시되지 않는 한,이 모듈의 모든 함수는 단순히 평균을 합산하는 대신 평균 () 함수의 계산을 지원합니다. 부동 소수점 번호도 사용할 수 있습니다. 무작위로 가져옵니다 수입 통계 Fracti에서

파이썬 객체의 직렬화 및 사막화는 사소한 프로그램의 주요 측면입니다. 무언가를 Python 파일에 저장하면 구성 파일을 읽거나 HTTP 요청에 응답하는 경우 객체 직렬화 및 사태화를 수행합니다. 어떤 의미에서, 직렬화와 사제화는 세계에서 가장 지루한 것들입니다. 이 모든 형식과 프로토콜에 대해 누가 걱정합니까? 일부 파이썬 객체를 지속하거나 스트리밍하여 나중에 완전히 검색하려고합니다. 이것은 세상을 개념적 차원에서 볼 수있는 좋은 방법입니다. 그러나 실제 수준에서 선택한 직렬화 체계, 형식 또는 프로토콜은 속도, 보안, 유지 보수 상태 및 프로그램의 기타 측면을 결정할 수 있습니다.

이 기사는 딥 러닝을 위해 텐서 플로와 Pytorch를 비교합니다. 데이터 준비, 모델 구축, 교육, 평가 및 배포와 관련된 단계에 대해 자세히 설명합니다. 프레임 워크, 특히 계산 포도와 관련하여 주요 차이점

이 기사는 Numpy, Pandas, Matplotlib, Scikit-Learn, Tensorflow, Django, Flask 및 요청과 같은 인기있는 Python 라이브러리에 대해 설명하고 과학 컴퓨팅, 데이터 분석, 시각화, 기계 학습, 웹 개발 및 H에서의 사용에 대해 자세히 설명합니다.

이 기사는 Python 개발자가 CLIS (Command-Line Interfaces) 구축을 안내합니다. Typer, Click 및 Argparse와 같은 라이브러리를 사용하여 입력/출력 처리를 강조하고 CLI 유용성을 향상시키기 위해 사용자 친화적 인 디자인 패턴을 홍보하는 세부 정보.

이 튜토리얼은 간단한 나무 탐색을 넘어서 DOM 조작에 중점을 둔 아름다운 수프에 대한 이전 소개를 바탕으로합니다. HTML 구조를 수정하기위한 효율적인 검색 방법과 기술을 탐색하겠습니다. 일반적인 DOM 검색 방법 중 하나는 EX입니다

이 기사는 프로젝트 종속성 관리 및 충돌을 피하는 데 중점을 둔 Python에서 가상 환경의 역할에 대해 설명합니다. 프로젝트 관리 개선 및 종속성 문제를 줄이는 데있어 생성, 활성화 및 이점을 자세히 설명합니다.


핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

Eclipse용 SAP NetWeaver 서버 어댑터
Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

SublimeText3 Linux 새 버전
SublimeText3 Linux 최신 버전

MinGW - Windows용 미니멀리스트 GNU
이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

WebStorm Mac 버전
유용한 JavaScript 개발 도구

VSCode Windows 64비트 다운로드
Microsoft에서 출시한 강력한 무료 IDE 편집기
