>  기사  >  빅데이터의 세 가지 소스는 무엇입니까?

빅데이터의 세 가지 소스는 무엇입니까?

Guanhui
Guanhui원래의
2020-07-24 16:02:2841152검색

빅데이터의 세 가지 소스는 무엇입니까?

빅데이터의 세 가지 소스는 무엇인가요?

1. POS 기계 데이터, 신용 카드 긁기 데이터 등을 포함한 거래 데이터

2. WeChat, 블로그, Twitter 등을 통해 생성된 데이터 스트림을 포함한 인간 데이터

3. 센서, 계량기 및 기타 시설의 데이터와 같은 기계 및 센서 데이터.


빅데이터란 무엇인가요?

'빅데이터' 연구 기관인 Gartner가 이런 정의를 내렸습니다. "빅데이터"는 거대하고 높은 성장률과 다양화된 정보 자산에 적응하기 위해 더 강력한 의사결정력, 통찰력 발견 및 프로세스 최적화 기능을 갖춘 새로운 처리 모델이 필요합니다.

McKinsey Global Institute에서 정의한 정의는 다음과 같습니다. 획득, 저장, 관리 및 분석이 기존 데이터베이스 소프트웨어 도구의 기능을 크게 능가하는 대규모 데이터 컬렉션입니다. 이는 대규모 데이터 규모, 빠른 데이터 흐름, 다양한 데이터를 갖추고 있습니다. 유형과 낮은 가치 밀도는 네 가지 주요 특징입니다.

빅데이터 기술의 전략적 중요성은 거대한 데이터 정보를 마스터하는 것이 아니라 이러한 의미 있는 데이터를 전문적으로 처리하는 데 있습니다. 즉, 빅데이터를 산업에 비유한다면, 이 산업의 수익성의 핵심은 데이터의 '처리 능력'을 향상시키고, '가공'을 통해 데이터의 '부가가치'를 달성하는 데 있습니다.

기술적으로 빅데이터와 클라우드 컴퓨팅의 관계는 동전의 양면처럼 뗄 수 없는 관계입니다. 빅데이터는 단일 컴퓨터로 처리할 수 없으며 분산 아키텍처를 사용해야 합니다. 대용량 데이터의 분산 데이터 마이닝이 특징이다. 그러나 분산 처리, 분산 데이터베이스 및 클라우드 스토리지, 클라우드 컴퓨팅의 가상화 기술에 의존해야 합니다.

클라우드 시대가 도래하면서 빅데이터(Big Data) 역시 더욱 주목을 받고 있습니다. 분석팀은 빅데이터가 일반적으로 회사에서 생성된 대량의 비정형 및 반정형 데이터를 설명하는 데 사용되며, 분석을 위해 관계형 데이터베이스에 다운로드하는 데 너무 많은 시간과 비용이 소요된다고 생각합니다. 대규모 데이터 세트를 실시간으로 분석하려면 작업을 수십, 수백, 심지어 수천 대의 컴퓨터에 배포하기 위한 MapReduce와 같은 프레임워크가 필요하기 때문에 빅 데이터 분석은 종종 클라우드 컴퓨팅과 연관됩니다.

빅데이터는 많은 양의 데이터를 허용 가능한 시간 동안 효과적으로 처리하기 위해서는 특별한 기술이 필요합니다. 빅데이터에 적용할 수 있는 기술로는 MPP(대량병렬처리) 데이터베이스, 데이터 마이닝, 분산 파일 시스템, 분산 데이터베이스, 클라우드 컴퓨팅 플랫폼, 인터넷, 확장 가능한 스토리지 시스템 등이 있습니다.

추천 튜토리얼: "

PHP"

위 내용은 빅데이터의 세 가지 소스는 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.