빅데이터라고 하면 다들 개념만 들어보셨을 거라 생각하는데, 구체적으로 무엇인지, 어떻게 정의해야 할지 정해져 있는 기준이 없습니다. 비즈니스 형태가 수백 가지라 이해하기가 쉽지 않기 때문에 빅데이터를 문자 그대로 이해해야 한다고 제안합니다. Victor Mayer-Schoenberg와 Kenneth Cukier가 쓴 "The Era of Big Data"에서는 빅데이터의 4가지 특성을 언급했습니다. :
첫 번째는 그 양이 상대적으로 많다는 점입니다. 데이터의 양이 PB 수준 이상이어야 빅데이터라고 할 수 있습니다. (추천 학습: Python 동영상 튜토리얼)
1PB는 1024TB, 1TB는 1024G, 1PB는 1024*1024G의 데이터와 같습니다.
두 번째는 훌륭한 가치입니다.
전국 20~35명의 청년 전체의 인터넷 데이터가 1PB 이상이라면 당연히 상업적 가치가 있을 것입니다. 제품개발 방향 등
전국 수백만명의 환자 데이터가 있다면, 이 데이터를 분석하여 질병 발생을 예측할 수 있는 것이 바로 빅데이터의 가치입니다.
세 번째는 다양성입니다.
데이터가 단 하나라면 그 데이터는 가치가 없습니다. 예를 들어 개인 데이터가 하나뿐이거나 사용자가 제출한 데이터는 빅데이터라고 할 수 없으므로 빅데이터가 필요합니다. 다양한. .
예를 들어 현재 인터넷 사용자들 사이에서는 나이, 학력, 취미, 성격 등 사람마다 특성이 다릅니다. 이것이 바로 빅데이터의 다양성입니다. 물론, 전국으로 확대하면 데이터의 다양성이 커집니다. 더욱 강해질 것이며, 모든 지역, 모든 기간에 다양한 데이터 다양성이 있을 것입니다.
네번째는 빠릅니다.
알고리즘을 통한 데이터의 논리적 처리 속도는 매우 빠릅니다. 1초 규칙은 다양한 유형의 데이터에서 빠르게 가치 있는 정보를 얻을 수 있다는 점 또한 기존 데이터 마이닝 기술과 근본적으로 다릅니다.
더 많은 Python 관련 기술 기사를 보려면 Python Tutorial 칼럼을 방문하여 알아보세요!
위 내용은 빅데이터는 어떤 수준의 데이터를 잘 처리하는가?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!