빅데이터의 4V 특성은 다음과 같습니다. 1. 정보 기술의 급속한 발전으로 인해 데이터가 폭발적으로 증가하기 시작합니다. 2. 속도. 3. 다양성은 주로 다양한 데이터 소스, 다양한 데이터 유형 및 데이터 간의 강력한 상관관계에 반영됩니다.
이 기사의 운영 환경: windows10 시스템, thinkpad t480 컴퓨터.
IT 업계의 용어인 빅데이터는 기존 소프트웨어 도구로는 특정 시간 내에 수집, 관리, 처리할 수 없는 데이터의 집합을 의미하며, 더 강력한 의사결정력과 통찰력을 갖기 위해서는 새로운 처리 모델이 필요합니다. . 강력한 역량과 프로세스 최적화 역량을 갖춘 거대하고 높은 성장률과 다양한 정보 자산입니다.
빅데이터의 4V 특성
빅데이터의 특성은 Viktor Mayer-Schonberg와 Kenneth Keyer가 쓴 "빅데이터 시대"에 제안되었습니다. 빅데이터의 4V 특성: Volume(볼륨), Velocity, 다양성과 가치.
(1) 규모
정보기술의 급속한 발전으로 인해 데이터가 폭발적으로 증가하기 시작했습니다. 빅데이터의 데이터는 더 이상 기가바이트나 테라바이트 단위가 아니라 PB(1,000테라바이트), EB(100만 테라바이트) 또는 ZB(10억 테라바이트) 단위로 측정됩니다.
(2) 다양성
다양성은 주로 다양한 데이터 소스, 다양한 데이터 유형, 데이터 간의 강력한 상관관계라는 세 가지 측면에 반영됩니다.
① 데이터 소스는 다양합니다. 기업이 직면한 전통적인 데이터는 주로 거래 데이터인 반면, 인터넷과 사물 인터넷의 발달로 인해 소셜 네트워킹 사이트, 센서 등 다양한 소스에서 데이터가 가져왔습니다.
그리고 데이터는 다양한 애플리케이션 시스템과 다양한 장치에서 오기 때문에 빅데이터 형태의 다양성을 결정합니다. 이는 크게 세 가지 범주로 나눌 수 있습니다. 첫째, 데이터 간의 강한 인과관계가 특징인 금융 시스템 데이터, 정보 관리 시스템 데이터, 의료 시스템 데이터 등과 같은 정형 데이터, 둘째, 비디오와 같은 비정형 데이터, , 사진, 오디오 등은 데이터 간의 인과관계가 없는 것이 특징이며, 셋째, HTML 문서, 이메일, 웹페이지 등과 같은 반구조화된 데이터는 데이터 간의 인과관계가 약한 것이 특징입니다.
②데이터 유형은 다양하며 주로 비정형 데이터입니다. 기존 기업에서는 데이터가 테이블에 저장됩니다. 빅데이터 데이터의 70~85%는 사진, 오디오, 비디오, 웹 로그, 링크 정보 등 비정형 및 반정형 데이터입니다.
3데이터는 상호 연관성이 높고 자주 상호작용합니다. 예를 들어 관광객이 여행 중에 업로드한 사진과 로그는 관광객의 위치, 여행 일정 및 기타 정보와 밀접한 관련이 있습니다.
(3) 고속
이는 기존 데이터 마이닝과 구별되는 빅데이터의 가장 중요한 특징입니다. 빅데이터와 대규모 데이터의 중요한 차이점은 두 가지 측면에 있습니다. 즉, 빅데이터의 데이터 규모가 더 크고, 다른 한편으로는 빅데이터가 데이터 처리의 응답 속도에 대한 요구 사항이 더 엄격하다는 것입니다. 일괄 분석이 아닌 실시간 분석으로 데이터 입력, 처리, 폐기가 거의 지연 없이 즉시 수행됩니다. 데이터의 증가율과 처리 속도는 빅데이터의 빠른 속도를 보여주는 중요한 표현입니다.
(4) 가치
기업은 방대한 양의 데이터를 보유하고 있지만 그 중 아주 작은 부분만이 가치를 발휘합니다. 빅데이터 뒤에 숨겨진 가치는 엄청납니다. 빅데이터에서 가치 있는 데이터가 차지하는 비중은 매우 작기 때문에, 빅데이터의 실제 가치는 다양한 유형의 관련 없는 데이터가 대량으로 반영됩니다. 기계학습법, 인공지능법, 데이터 마이닝법 등을 통해 미래 트렌드와 패턴을 예측하고 분석하며 심층 분석을 위한 귀중한 데이터를 마이닝하고 이를 농업, 금융, 의료 등 다양한 분야에 적용합니다. 더 큰 가치를 창출하기 위해.
더 많은 관련 기사를 보려면 PHP 중국어 웹사이트를 방문하세요! !
위 내용은 빅데이터의 4V 특성은 무엇입니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!