빅데이터는 기존 소프트웨어 도구를 사용하여 특정 시간 범위 내에서 캡처, 관리 및 처리할 수 없는 데이터 모음을 의미합니다. 이를 위해서는 더 강력한 의사결정력, 통찰력 및 프로세스 최적화 기능을 갖춘 새로운 처리 모델이 필요합니다. 거대하고, 고성장하며, 다양한 정보자산을 보유하고 있습니다.
빅데이터는 무엇을 할 수 있나요?
계속 늘어나는 센서 정보, 사진, 텍스트, 사운드, 비디오 데이터 스트림이 빅데이터의 기초입니다.
이제 우리는 몇 년 전에는 불가능했던 방식으로 이 데이터를 사용할 수 있습니다. 이제 빅 데이터 프로젝트는 다음과 같이 도움이 될 수 있습니다.
질병 치료 및 암 예방 - 질병을 조기에 발견하고 신약을 개발하는 데 도움이 될 수 있는 패턴을 찾기 위해 대량의 의료 기록과 이미지를 분석하는 데이터 기반 의학
배고픈 사람들에게 먹이를 줍니다. - 농업 작물 수확량을 극대화하고, 생태계에 방출되는 오염 물질의 양을 최소화하며, 기계와 장비의 사용을 최적화하는 데 사용할 수 있는 데이터로 혁신을 이루고 있습니다.
먼 행성 탐험 - US Aerospace 기관은 수백만 개의 데이터 포인트를 분석하고 사용합니다. 화성 표면에 탐사선을 착륙시킬 수 있는 모든 가능성을 모델링하고 향후 임무를 계획합니다.
자연재해와 인재를 예측하고 대응합니다. 센서 데이터를 분석하고 다음에 일어날 지진을 예측하려면 인간 행동 패턴이 조직을 지원하는 데 도움이 됩니다. 생존자를 구출하기 위한 단서를 제공합니다. 빅 데이터 기술은 전 세계 전쟁 지역에서 난민을 모니터링하고 보호하는 데에도 사용됩니다.
범죄 예방 – 경찰은 자원을 보다 효과적으로 배치하고
온라인 쇼핑, 단체 여행, 휴가 여행, 항공권 예약에 가장 적합한 시간 선택, 다음에 볼 영화 결정 등 일상 생활을 더 쉽고 편리하게 만들어줍니다. 빅 데이터 덕분에 이 모든 것이 가능해졌습니다. 쉬워집니다.
빅데이터는 어떻게 작동하나요?
빅 데이터의 작동 방식은 어떤 것이나 상황에 대해 더 많이 알수록 앞으로 일어날 일을 더 확실하게 예측할 수 있다는 것입니다. 더 많은 데이터 포인트를 비교함으로써 이전에 숨겨진 관계가 나타나기 시작하고 우리가 변화를 시작할 수 있는 방법에 대한 통찰력을 포함하게 될 것입니다.
일반적으로 이는 수집할 수 있는 데이터를 기반으로 모델을 구축한 다음 시뮬레이션을 실행하고 매번 데이터 포인트의 값을 조정하고 결과에 어떤 영향을 미치는지 모니터링하는 과정을 통해 수행됩니다. 이 프로세스는 자동화되어 있습니다. 오늘날의 고급 분석 기술은 수백만 개의 시뮬레이션을 실행하여 문제 해결에 도움이 되는 패턴이나 통찰력을 찾을 때까지 가능한 모든 변수를 조정합니다.
데이터가 구조화되지 않은 형태로 점점 더 많이 다가오고 있습니다. 즉, 데이터를 행과 열이 있는 구조화된 테이블에 쉽게 넣을 수 없다는 의미입니다. 이 데이터의 대부분은 위성 이미지부터 Facebook이나 Twitter에 업로드된 사진, 이메일, 인스턴트 메시지, 녹음된 전화 통화에 이르기까지 사진과 비디오의 형태로 되어 있습니다. 이 모든 것을 이해하기 위해 빅 데이터 프로젝트에서는 인공 지능과 기계 학습의 최첨단 분석을 사용하는 경우가 많습니다. 예를 들어, 컴퓨터가 이미지 인식이나 자연어 처리를 통해 이 데이터가 나타내는 것을 인식하도록 교육함으로써 컴퓨터는 인간보다 더 빠르고 안정적으로 패턴을 식별할 수 있습니다.
지난 몇 년 동안 "as-a-service" 플랫폼을 통해 빅 데이터 도구 및 기술에 대한 강력한 추세가 있었습니다. 기업과 조직은 타사 클라우드 서비스 제공업체로부터 서버 공간, 소프트웨어 시스템, 처리 능력을 임대합니다. 모든 작업은 서비스 제공업체의 시스템에서 수행되며 고객은 사용한 만큼만 비용을 지불합니다. 이 모델을 사용하면 모든 조직에서 빅 데이터 기반 검색 및 변환에 액세스할 수 있으며 하드웨어, 소프트웨어, 부동산 및 기술 직원에 상당한 비용을 지출할 필요가 없습니다.
빅 데이터의 문제
오늘날 빅 데이터는 우리에게 전례 없는 통찰력과 기회를 제공하지만 해결해야 할 우려와 문제도 제기합니다.
데이터 개인 정보 보호 – 현재 우리가 생성하는 방대한 양의 데이터에는 우리의 개인 생활에 관한 많은 정보 중 대부분은 비공개로 유지될 권리가 있습니다. 우리는 유출되는 개인 데이터의 양과 빅 데이터 기반 애플리케이션 및 서비스가 제공하는 편리함의 균형을 맞춰야 한다는 요청을 점점 더 많이 받고 있습니다. 우리는 누구에게 이 데이터에 대한 접근을 허용합니까?
데이터 보안 – 누군가가 특정 목적을 위해 우리 데이터를 갖고 있다는 데 동의하더라도 그 사람이 데이터를 안전하게 유지할 것이라고 믿을 수 있습니까? 기존 법적 체계가 이 정도 규모의 데이터 사용을 규제할 수 있습니까?
데이터 차별 – 모든 것이 알려졌을 때, 사람들의 삶에 대한 데이터를 기반으로 차별하는 것이 용납될 수 있을까요? 우리는 이미 누가 돈을 빌릴 수 있는지 결정하기 위해 신용 점수를 사용하고 있으며 보험은 주로 데이터 중심입니다. 우리는 더 자세한 분석과 평가를 기대할 수 있으며, 이는 이미 자원과 정보에 접근할 수 있는 자원이 부족한 사람들의 삶을 더 어렵게 만들기 위해 수행되는 것이 아니라는 점에 유의해야 합니다.
이러한 과제에 직면하는 것도 '빅 데이터'의 일부입니다. 이는 확실히 학계에서 빅데이터 활용에 관한 논쟁의 주요 부분입니다. 그러나 비즈니스에 빅 데이터를 활용하려는 사람들도 이 문제를 해결해야 합니다. 개인 데이터와 관련된 모든 작업을 수행하지 않으면 막대한 벌금이 부과될 수 있습니다. 우리는 이러한 문제를 해결하지 못하는 것이 빅 데이터 기업 이니셔티브가 실패하는 이유 중 하나라는 사실을 여러 번 확인합니다.
사람들이 처음 "빅 데이터"에 대해 이야기하기 시작하면 일시적 유행으로 간주되기도 합니다. 이는 한동안 이야기되었다가 다음 번 큰 사건에서는 조용히 잊혀질 최신 유행 기술 용어입니다. 이는 아직 입증되지 않았습니다. 사실 새로운 인기 언어가 등장했지만 빅 데이터는 여전히 모든 언어의 원동력입니다. 우리가 이용할 수 있는 데이터의 양은 계속 늘어날 것이며, 분석 기술도 더욱 강력해질 것입니다.
위 내용은 빅데이터란 무엇인가의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!