搜尋
首頁常見問題《大數據時代》一書中的大數據是指什麼

“大數據時代”一書中的大數據是指“全體數據或所有數據”,又稱“巨量資料”,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。

《大數據時代》一書中的大數據是指什麼

本教學操作環境:windows7系統、Dell G3電腦。

《大數據時代》一書中的大數據是指「全體資料或所有資料」。

大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟體工具,在合理時間內達到擷取、管理、處理、並整理成為幫助企業經營決策更積極目的的資訊。

在維克多·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而採用所有數據的方法)大數據的4V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。

大數據概念的發展歷史:

「大數據」這個術語最早期的引用可追溯到apache org的開源專案Nutch。當時,大數據被用來描述為更新網路搜尋索引需要同時進行大量處理或分析的大量資料集。隨著GoogleMapReduce和Google File System (GFS)的發布,大數據不再只用來描述大量的數據,還涵蓋了處理數據的速度。

早在1980年,著名未來學家阿爾文·托夫勒便在《第三波》一書中,將大數據熱情地讚頌為“第三波的華彩樂章” 。

不過,大約從2009年開始,「163大數據」才成為網路資訊科技產業的流行詞彙。美國網路資料中心指出,網路上的資料每年將成長50%,每兩年便將翻一番,而目前全球90%以上的資料是最近幾年才產生的。此外,數據並非單純指人們在網路上發布的訊息,全世界的工業設備、汽車、電錶上有著無數的數位感測器,隨時測量並傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的數據資訊。

大數據概念結構:

大數據就是網路發展到現今階段的一種表像或特徵而已,沒有必要神話它或對它保持敬畏之心,在以雲端運算為代表的技術創新大幕的襯托下,這些原本很難收集和使用的數據開始容易被利用起來了,透過各行各業的不斷創新,大數據會逐步為人類創造更多的價值。

其次,想要係統的認知大數據,必須要全面而細緻的分解它,我著手從三個層面來展開:

第一層面是理論,理論是認知的必經途徑,也是廣為認同與傳播的基線。我會從大數據的特徵定義理解產業對大數據的整體描繪和定性;從對大數據價值的探討來深入解析大數據的珍貴所在;洞悉大數據的發展趨勢;從大數據隱私這個特別而重要的視角審視人和數據之間的長久博弈。

第二層面是技術,技術是大數據價值體現的手段和前進的基石。我將分別從雲端運算、分散式處理技術、儲存技術和感知技術的發展來說明大數據從採集、處理、儲存到形成結果的整個過程。

第三層面是實踐,實踐是大數據的最終價值體現。我將分別從網路的大數據,政府的大數據,企業的大數據和個人的大數據四個面向來描繪大數據已經展現的美好景象及即將實現的藍圖。

大數據概念的特點:

大數據分析比起傳統的資料倉儲應用,具有資料量大、查詢分析複雜等特點。 《電腦學報》刊登的「架構大數據:挑戰、現況與展望」一文列舉了大數據分析平台需要具備的幾個重要特性,對當前的主流實現平台——並行資料庫、MapReduce及基於兩者的混合架構進行了分析歸納,指出了各自的優勢及不足,同時也對各個方向的研究現狀及作者在大數據分析方面的努力進行了介紹,對未來研究做了展望。

大數據的4個“V”,或者說特點有四個層面:第一,資料體積龐大。從TB級別,躍升到PB級別;第二,資料類型繁多。前文提到的網誌、影片、圖片、地理位置資訊等等。第三,處理速度快,1秒定律,可從各種類型的資料中快速獲得高價值的訊息,這一點也是和傳統的資料探勘技術有著本質的不同。第四,只要合理利用數據並進行正確、準確的分析,將會帶來很高的價值回報。業界將其歸納為4個「V」-Volume(大量)、Variety(多元)、Velocity(高速)、Value(價值)。

從某種程度上說,大數據是資料分析的尖端技術。簡言之,從各種類型的數據中,快速獲得有價值資訊的能力,就是大數據技術。明白這一點至關重要,也正是這一點促使該技術具備走向眾多企業的潛力。

大數據概念的用途:

大數據可分成大數據科技、大數據工程、大數據科學和大數據應用等領域。目前人們談論最多的是大數據技術和大數據應用。工程和科學問題尚未被重視。大數據工程指大數據的規劃建設運營管理的系統工程;大數據科學關注大數據網絡發展和運營過程中發現和驗證大數據的規律及其與自然和社會活動之間的關係。

物聯網、雲端運算、行動互聯網、車聯網、手機、平板電腦、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數據來源或者承載的方式。

有些例子包括網絡日誌,RFID,感測器網絡,社會網絡,社會數據(由於數據革命的社會),互聯網文本和文件;互聯網搜索索引;呼叫詳細記錄,天文學,大氣科學,基因組學,生物地球化學,生物,和其他複雜和/或跨學科的科研,軍事偵察,醫療記錄;攝影檔案館視頻檔案;和大規模的電子商務。

大數據的作用

對於一般的企業而言,大數據的作用主要表現在兩個方面,分別是數據的分析使用與進行二次開發項目。透過對禧金資訊大數據進行分析,不僅能把隱藏的數據挖掘出來,還能透過這些隱藏的訊息,透過實體的銷售,提升自己的客戶來源。至於對資料進行二次開發,在網路服務專案中被運用的比較多,透過將這些資訊進行總結與分析,從而製定出符合客戶需求的個人化方案,並營造出一種全新的廣告行銷方式,在這裡,你需要明白的是,透過大數據的分析,將產品與服務結合起來的並不是偶然事件,而實現這種的往往是數據時代的領導者。

綜上所述,大數據的運用,不僅標誌著時代的進步,同時也激勵人們進行更深層領域的探究。此外,針對大數據的研究,除了上述內容外,還需要了解大數據的三個特徵,分別是規模大、運轉速度快及資料多樣性。透過這三個面向的研究,不僅可以更容易的觀察到資料的本質嗎,有利於軟體處理平台的有效運作。

更多相關知識,請造訪常見問題欄位!

以上是《大數據時代》一書中的大數據是指什麼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
在 Microsoft Excel 中如何创建数据透视表在 Microsoft Excel 中如何创建数据透视表Apr 22, 2023 pm 12:10 PM

当您拥有大量数据时,分析数据通常会变得越来越困难。但真的必须如此吗?MicrosoftExcel提供了一个令人惊叹的内置功能,称为数据透视表,可用于轻松分析庞大的数据块。它们可用于通过创建您自己的自定义报告来有效地汇总您的数据。它们可用于自动计算列的总和,可以对其应用过滤器,可以对其中的数据进行排序等。可以对数据透视表执行的操作以及如何使用数据透视表为了缓解您的日常excel障碍是无止境的。继续阅读,了解如何轻松创建数据透视表并了解如何有效组织它。希望你喜欢阅读这篇文章。第1节:什么是数据透视

如何阻止 Apple 在 iPhone 上收集诊断和使用数据如何阻止 Apple 在 iPhone 上收集诊断和使用数据Apr 16, 2023 pm 09:25 PM

苹果以其对用户隐私的承诺而闻名。当您购买iPhone或Mac时,您知道您正在投资一家承诺保护您的数据的公司的产品。这在我们这个时代非常重要——因为我们越来越多地将更多的个人信息存储在这些设备上。我们使用的大多数设备都会收集使用数据以改进相应的产品和服务。例如,当应用程序在您的手机上崩溃时,可以通知开发人员以帮助他们查明此错误的原因。虽然这些数据通常是匿名的,但一些用户不喜欢让公司收集他们的日志。此外,通过共享这些诊断信息,您的设备会将它们上传到公司的服务器。这可能会耗尽您的(有限)数据计划和部分

如何用零替换 Excel 数据透视表中的空白单元格如何用零替换 Excel 数据透视表中的空白单元格Apr 15, 2023 am 11:52 AM

了COLUMNS部分下的字段Item、ROWS部分下的字段Date和VALUES部分下的Profit字段。注意:如果您需要有关数据透视表如何工作以及如何有效地创建数据透视表的更多信息,请参阅我们的文章如何在MicrosoftExcel中创建数据透视表。因此,根据我的选择,我的数据透视表生成如下面的屏幕截图所示,使其成为我想要的完美摘要报告。但是,如果您查看数据透视表,您会发现我的数据透视表中有一些空白单元格。现在,让我们在接下来的步骤中将它们替换为零。第6步:要用零替换空白单元格,首先右键单击数

如何在 Microsoft Excel 图表中添加和自定义数据标签?如何在 Microsoft Excel 图表中添加和自定义数据标签?May 07, 2023 pm 04:22 PM

Microsoft Excel有许多至今令人们惊叹的功能。人们每天都会学到一些新东西。今天,我们将了解如何在Excel图表中添加和自定义数据标签。Excel图表包含大量数据,一眼看懂图表可能具有挑战性。使用数据标签是指出重要信息的好方法。数据标签可以用作柱形图或条形图的一部分。当您创建饼图时,它甚至可以用作标注。添加数据标签为了展示如何添加数据标签,我们将以饼图为例。虽然大多数人使用图例来显示饼图中的内容,但数据标签的效率要高得多。要添加数据标签,请创建饼图。打开它,然后单击显示图表设计

AI 算法在大数据治理中的应用AI 算法在大数据治理中的应用Apr 12, 2023 pm 01:37 PM

本文主要分享 Datacake 在大数据治理中,AI 算法的应用经验。本次分享分为五大部分:第一部分阐明大数据与 AI 的关系,大数据不仅可以服务于 AI,也可以使用 AI 来优化自身服务,两者是互相支撑、依赖的关系;第二部分介绍利用 AI 模型综合评估大数据任务健康度的应用实践,为后续开展数据治理提供量化依据;第三部分介绍利用 AI 模型智能推荐 Spark 任务运行参数配置的应用实践,实现了提高云资源利用率的目标;第四部分介绍在 SQL 查询场景中,由模型智能推荐任务执行引擎的实践;第五部分

大数据在生活中的应用有哪些大数据在生活中的应用有哪些Sep 22, 2021 am 10:48 AM

大数据在生活中的应用有:1、农业互联网;2、金融业互联网;3、电子商务;4、医疗器械行业;5、零售业大数据;6、生物科技等。

腾讯广告模型基于"太极"的训练成本优化实践腾讯广告模型基于"太极"的训练成本优化实践Apr 14, 2023 pm 06:46 PM

近年来,大数据加大模型成为了AI领域建模的标准范式。在广告场景,大模型由于使用了更多的模型参数,利用更多的训练数据,模型具备了更强的记忆能力和泛化能力,为广告效果向上提升打开了更大的空间。但是大模型在训练过程中所需要的资源也是成倍的增长,存储以及计算上的压力对机器学习平台都是巨大的挑战。腾讯太极机器学习平台持续探索降本增效方案,在广告离线训练场景利用混合部署资源大大降低了资源成本,每天为腾讯广告提供50W核心廉价混合部署资源,帮助腾讯广告离线模型训练资源成本降低30%,同时通过一系列优化手段使得

如何使用 Go 语言进行大数据分析?如何使用 Go 语言进行大数据分析?Jun 11, 2023 am 11:11 AM

随着数据规模逐渐增大,大数据分析变得越来越重要。而Go语言作为一门快速、轻量级的编程语言,也成为了越来越多数据科学家和工程师的选择。本文将介绍如何使用Go语言进行大数据分析。数据采集在开始大数据分析之前,我们需要先采集数据。Go语言有很多包可以用于数据采集,例如“net/http”、“io/ioutil”等。通过这些包,我们可以从网站、API、日志

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前By尊渡假赌尊渡假赌尊渡假赌

熱工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

將Eclipse與SAP NetWeaver應用伺服器整合。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

WebStorm Mac版

WebStorm Mac版

好用的JavaScript開發工具