찾다
Javajava지도 시간Spark DataFrames에서 복잡한 데이터 구조를 평면화하는 방법은 무엇입니까?

How to Flatten Complex Data Structures in Spark DataFrames?

Spark 데이터 프레임에서 복잡한 데이터 구조를 분할하는 방법

Spark 데이터 프레임에서는 구조체, 맵과 같은 복잡한 데이터 구조를 사용하여 저장할 수 있습니다. 데이터를 효율적으로 중첩했습니다. 그러나 개별 요소를 직접 사용하려면 이러한 구조를 평면화해야 할 수도 있습니다.

중첩 구조체 평면화

구조체의 중첩 필드를 추출하려면 col 함수는 * 와일드카드 기호와 결합될 수 있습니다. 예를 들어 다음 데이터 프레임 스키마를 고려해보세요.

|-- data: struct (nullable = true)
 |    |-- id: long (nullable = true)
 |    |-- keyNote: struct (nullable = true)
 |    |    |-- key: string (nullable = true)
 |    |    |-- note: string (nullable = true)
 |    |-- details: map (nullable = true)
 |    |    |-- key: string
 |    |    |-- value: string (valueContainsNull = true)

이 구조체를 평면화하고 새 데이터 프레임을 생성하려면 다음을 사용하세요.

df.select(df.col("data.*"))

이렇게 하면 다음과 같은 평면화된 구조로 데이터 프레임이 생성됩니다.

     |-- id: long (nullable = true)
     |-- keyNote: struct (nullable = true)
     |    |-- key: string (nullable = true)
     |    |-- note: string (nullable = true)
     |-- details: map (nullable = true)
     |    |-- key: string
     |    |-- value: string (valueContainsNull = true)

중첩 지도 평면화

마찬가지로 다음 구문을 사용하여 중첩 지도를 평면화할 수 있습니다.

df.select(df.col("data.details").as("map_details"))

이렇게 하면 데이터프레임이 생성됩니다. 평면화된 지도를 "map_details"라는 새 열로 사용합니다. 열의 구조는 다음과 같습니다.

     |-- map_details: map (nullable = true)
     |    |-- key: string
     |    |-- value: string (valueContainsNull = true)

위 내용은 Spark DataFrames에서 복잡한 데이터 구조를 평면화하는 방법은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

AI Hentai Generator

AI Hentai Generator

AI Hentai를 무료로 생성하십시오.

뜨거운 도구

VSCode Windows 64비트 다운로드

VSCode Windows 64비트 다운로드

Microsoft에서 출시한 강력한 무료 IDE 편집기

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

SublimeText3 Linux 새 버전

SublimeText3 Linux 새 버전

SublimeText3 Linux 최신 버전