난제: 빈 데이터 구조 생성
DataFrame을 구성한 후 시계열 데이터로 채우고자 합니다. 처음에는 모두 0 또는 NaN 값으로 장식된 특정 열과 타임스탬프가 포함된 빈 DataFrame을 상상합니다.
현재 접근 방식: 우아하지 않은 솔루션
현재 코드가 초기화됩니다. 새 값을 계산하기 위해 데이터를 반복하기 전에 모두 0인 열과 타임스탬프 행이 있는 DataFrame입니다. 이 접근 방식은 목적에 부합하지만 번거롭고 더 효율적인 솔루션이 있음을 시사합니다.
선호 솔루션: 목록에 데이터 축적
이 프로세스를 최적화하려면 , DataFrame에서 행 단위 증가를 피하는 것이 현명합니다. 대신 데이터를 목록에 축적한 다음 데이터 수집이 완료되면 DataFrame을 초기화하세요. 목록은 더 가볍고 메모리를 덜 소비하며 자동 dtypes 추론 및 인덱스 할당을 용이하게 합니다.
data = [] for row in some_function_that_yields_data(): data.append(row) df = pd.DataFrame(data)
목록 누적의 장점
사용되지 않는 방법
초보 사용자에게 널리 퍼져 있는 특정 관행은 다음과 같은 이유로 피해야 합니다. 비효율성과 미묘한 차이:
위 내용은 시계열 데이터를 채우기 전에 빈 DataFrame을 효율적으로 생성하려면 어떻게 해야 합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!