検索
ホームページよくある問題『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?

書籍「ビッグデータ時代」におけるビッグデータとは、「すべてのデータまたはすべてのデータ」を指し、「巨大データ」とも呼ばれます。これは、膨大な量のデータを指します。ソフトウェア ツールは、企業がより前向きなビジネス上の意思決定を行えるよう、合理的な時間内で情報を取得、管理、処理、整理することができます。

『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?

このチュートリアルの動作環境: Windows 7 システム、Dell G3 コンピューター。

書籍『ビッグデータ時代』におけるビッグデータとは、「すべてのデータ、またはすべてのデータ」を指します。

ビッグデータ (ビッグデータ) または膨大な量のデータとは、現在の主流では適切な時間内に取得、管理、管理することができないほど大量のデータを指します。ソフトウェア ツール: 情報を処理および整理して、企業がより前向きなビジネス上の意思決定を行えるようにします。

Victor Meyer-Schoenberg と Kenneth Cukier 著「ビッグデータの時代」では、ビッグデータとは、ランダム分析 (サンプリング調査) などの近道を使わずにすべてのデータを利用することを指します。データ: ボリューム、速度、多様性、および値。

ビッグ データの概念の発展の歴史:

「ビッグ データ」という用語への最初の言及は、オープン ソース プロジェクト Nutch of に遡ります。アパッチ組織。当時、ビッグ データは、Web 検索インデックスを更新するために同時にバッチ処理または分析する必要がある大規模なデータ セットを表すために使用されていました。 Google MapReduce と Google File System (GFS) のリリースにより、ビッグ データはもはや大量のデータを記述するためだけでなく、データの処理速度もカバーするようになりました。

1980 年にはすでに、有名な未来学者アルビン トフラーが著書『第三の波』の中でビッグ データを「第 3 の波のカデンツァ」として熱狂的に賞賛しました。

しかし、2009 年頃から、インターネット情報技術業界では「163 ビッグデータ」という言葉がよく使われるようになりました。米国インターネット データ センターは、インターネット上のデータは毎年 50%、2 年ごとに 2 倍ずつ増加し、現在、世界中のデータの 90% 以上が近年生成されたものであると指摘しています。また、データとは単に人々がインターネット上に公開する情報だけを指すのではなく、世界中の産業機器や自動車、電力メーターなどには無数のデジタルセンサーが設置されており、位置、動き、振動、温度、湿度などの情報を計測し、伝達しています。物質の変化によっても、大量のデータ情報が生成されます。

ビッグ データの概念構造:

ビッグ データは、現在の段階に至るまでのインターネットの発展の現れまたは特徴にすぎません。神話する必要はありません。クラウドコンピューティングに代表される技術革新を背景に、本来収集や利用が難しかったこれらのデータが容易に活用されるようになり、あらゆる分野での継続的な革新により、ビッグデータは徐々に多くのデータを生み出します。人間にとっての価値。

第二に、ビッグデータを体系的に認識したい場合は、それを包括的かつ慎重に分解する必要があります。3 つのレベルから始めます:

最初のレベルは理論であり、理論は認識です。それを知る唯一の方法であり、広く認識され普及しているベースラインでもあります。ビッグデータの特徴の定義からビッグデータ業界の全体像と特徴を理解し、ビッグデータの価値の議論からビッグデータの貴重性を深く分析し、ビッグデータの発展傾向を洞察します。ビッグデータのプライバシーという特別かつ重要な問題からスタートし、人間とデータの間の長期的なゲームをある観点から検証します。

第 2 レベルはテクノロジーです。テクノロジーはビッグデータの価値を具体化する手段であり、進歩の基礎です。クラウドコンピューティング、分散処理技術、ストレージ技術、認識技術のそれぞれの発展から、ビッグデータの収集、処理、保存、結果形成までの全プロセスを解説します。

3 番目のレベルは実践であり、実践はビッグ データの究極の価値の表現です。インターネットビッグデータ、政府ビッグデータ、企業ビッグデータ、個人ビッグデータの4つの側面から、ビッグデータが示した美しい光景と今後の実現の青写真を解説します。

ビッグ データの概念の特徴:

従来のデータ ウェアハウス アプリケーションと比較して、ビッグ データ分析には、大量のデータと複雑なクエリと分析という特徴があります。 「Journal of Computer Science」に掲載された記事「Architecting Big Data: Challenges, Current Status and Prospects」では、ビッグデータ分析プラットフォームに必要ないくつかの重要な機能を列挙し、現在の主流の実装プラットフォームである並列データベース、MapReduce、ハイブリッドを分析しています。両者をベースにアーキテクチャを分析・整理し、それぞれの長所と短所を指摘するとともに、各方向の研究状況と著者のビッグデータ解析への取り組みを紹介し、今後の研究を展望する。

ビッグ データの 4 つの「V」または特性には 4 つのレベルがあります。まず、データの量が膨大です。 TB レベルから PB レベルまで、第 2 に、データの種類が豊富です。上記のウェブログ、ビデオ、写真、地理的位置情報など。 3つ目は、処理速度が速く、1秒ルールによりさまざまなデータから価値の高い情報を素早く取得できる点で、これも従来のデータマイニング技術とは根本的に異なります。第 4 に、データが適切に活用され、正確かつ正確に分析されている限り、高い価値の利益がもたらされます。業界では、ボリューム、多様性、速度、価値の 4 つの「V」に要約されています。

ビッグデータは、ある意味、最先端のデータ分析テクノロジーです。つまり、さまざまなデータから価値のある情報を迅速に得ることができるのがビッグデータ技術です。これを理解することは非常に重要であり、それがこのテクノロジーの潜在力を非常に多くのビジネスにもたらす原動力となっています。

ビッグデータの概念の使用:

ビッグデータは、ビッグデータテクノロジー、ビッグデータエンジニアリング、ビッグデータサイエンス、ビッグデータアプリケーションなどの分野に分類できます。今、人々が最も話題にしているのは、ビッグデータ テクノロジーとビッグ データ アプリケーションです。工学と科学の問題はまだ真剣に受け止められていません。ビッグデータエンジニアリングは、ビッグデータの計画、構築、運用、管理の体系的なエンジニアリングを指します。ビッグデータサイエンスは、ビッグデータネットワークの開発と運用におけるビッグデータの法則と自然活動および社会活動との関係の発見と検証に焦点を当てます。 。

モノのインターネット、クラウド コンピューティング、モバイル インターネット、車両のインターネット、携帯電話、タブレット、PC、地球の隅々に広がるさまざまなセンサーはすべて、データ ソースまたは伝送手段です。

例としては、ウェブログ、RFID、センサー ネットワーク、ソーシャル ネットワーク、ソーシャル データ (社会のデータ革命のおかげ)、インターネットのテキストとファイル、インターネット検索インデックス、通話詳細の記録、天文学、大気科学、ゲノミクスなどがあります。 、生物地球化学、生物学、およびその他の複雑および/または学際的な科学研究、軍事偵察、医療記録、写真アーカイブ、ビデオアーカイブ、および大規模な電子商取引。

ビッグデータの役割

一般企業にとって、ビッグデータの役割は主にデータの分析と活用と二次加工開発の2つの側面に反映されます。プロジェクト。西進情報のビッグデータを分析することで、隠されたデータを掘り出すだけでなく、これらの隠されたメッセージを物理的な販売を通じて顧客ベースの向上に活用することもできます。データの二次展開については、ネットワークサービス事業などで活用されることが多く、その情報を集約・分析することで、お客様のニーズに合わせたパーソナライズされた企画を立案したり、新たな広告・マーケティング手法を創出したりすることができます。ビッグデータ分析を通じて製品とサービスを組み合わせるのは偶然ではなく、これを実現した人がデータ時代のリーダーとなることがよくあります。

要約すると、ビッグデータの応用は時代の進歩を示すだけでなく、人々がより深い探求を行うよう促すことにもなります。また、ビッグデータの研究には、上記の内容に加えて、ビッグデータの3つの特徴である大規模、高速、データの多様性を理解する必要があります。これら 3 つの側面を研究することにより、データの性質を観察することが容易になるだけでなく、ソフトウェア処理プラットフォームの効果的な動作にも役立ちます。

関連知識の詳細については、FAQ 列をご覧ください。

以上が『ビッグデータ時代』という本に出てくるビッグデータとは何を意味するのでしょうか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
在 Microsoft Excel 中如何创建数据透视表在 Microsoft Excel 中如何创建数据透视表Apr 22, 2023 pm 12:10 PM

当您拥有大量数据时,分析数据通常会变得越来越困难。但真的必须如此吗?MicrosoftExcel提供了一个令人惊叹的内置功能,称为数据透视表,可用于轻松分析庞大的数据块。它们可用于通过创建您自己的自定义报告来有效地汇总您的数据。它们可用于自动计算列的总和,可以对其应用过滤器,可以对其中的数据进行排序等。可以对数据透视表执行的操作以及如何使用数据透视表为了缓解您的日常excel障碍是无止境的。继续阅读,了解如何轻松创建数据透视表并了解如何有效组织它。希望你喜欢阅读这篇文章。第1节:什么是数据透视

如何阻止 Apple 在 iPhone 上收集诊断和使用数据如何阻止 Apple 在 iPhone 上收集诊断和使用数据Apr 16, 2023 pm 09:25 PM

苹果以其对用户隐私的承诺而闻名。当您购买iPhone或Mac时,您知道您正在投资一家承诺保护您的数据的公司的产品。这在我们这个时代非常重要——因为我们越来越多地将更多的个人信息存储在这些设备上。我们使用的大多数设备都会收集使用数据以改进相应的产品和服务。例如,当应用程序在您的手机上崩溃时,可以通知开发人员以帮助他们查明此错误的原因。虽然这些数据通常是匿名的,但一些用户不喜欢让公司收集他们的日志。此外,通过共享这些诊断信息,您的设备会将它们上传到公司的服务器。这可能会耗尽您的(有限)数据计划和部分

如何用零替换 Excel 数据透视表中的空白单元格如何用零替换 Excel 数据透视表中的空白单元格Apr 15, 2023 am 11:52 AM

了COLUMNS部分下的字段Item、ROWS部分下的字段Date和VALUES部分下的Profit字段。注意:如果您需要有关数据透视表如何工作以及如何有效地创建数据透视表的更多信息,请参阅我们的文章如何在MicrosoftExcel中创建数据透视表。因此,根据我的选择,我的数据透视表生成如下面的屏幕截图所示,使其成为我想要的完美摘要报告。但是,如果您查看数据透视表,您会发现我的数据透视表中有一些空白单元格。现在,让我们在接下来的步骤中将它们替换为零。第6步:要用零替换空白单元格,首先右键单击数

如何在 Microsoft Excel 图表中添加和自定义数据标签?如何在 Microsoft Excel 图表中添加和自定义数据标签?May 07, 2023 pm 04:22 PM

Microsoft Excel有许多至今令人们惊叹的功能。人们每天都会学到一些新东西。今天,我们将了解如何在Excel图表中添加和自定义数据标签。Excel图表包含大量数据,一眼看懂图表可能具有挑战性。使用数据标签是指出重要信息的好方法。数据标签可以用作柱形图或条形图的一部分。当您创建饼图时,它甚至可以用作标注。添加数据标签为了展示如何添加数据标签,我们将以饼图为例。虽然大多数人使用图例来显示饼图中的内容,但数据标签的效率要高得多。要添加数据标签,请创建饼图。打开它,然后单击显示图表设计

AI 算法在大数据治理中的应用AI 算法在大数据治理中的应用Apr 12, 2023 pm 01:37 PM

本文主要分享 Datacake 在大数据治理中,AI 算法的应用经验。本次分享分为五大部分:第一部分阐明大数据与 AI 的关系,大数据不仅可以服务于 AI,也可以使用 AI 来优化自身服务,两者是互相支撑、依赖的关系;第二部分介绍利用 AI 模型综合评估大数据任务健康度的应用实践,为后续开展数据治理提供量化依据;第三部分介绍利用 AI 模型智能推荐 Spark 任务运行参数配置的应用实践,实现了提高云资源利用率的目标;第四部分介绍在 SQL 查询场景中,由模型智能推荐任务执行引擎的实践;第五部分

大数据在生活中的应用有哪些大数据在生活中的应用有哪些Sep 22, 2021 am 10:48 AM

大数据在生活中的应用有:1、农业互联网;2、金融业互联网;3、电子商务;4、医疗器械行业;5、零售业大数据;6、生物科技等。

腾讯广告模型基于"太极"的训练成本优化实践腾讯广告模型基于"太极"的训练成本优化实践Apr 14, 2023 pm 06:46 PM

近年来,大数据加大模型成为了AI领域建模的标准范式。在广告场景,大模型由于使用了更多的模型参数,利用更多的训练数据,模型具备了更强的记忆能力和泛化能力,为广告效果向上提升打开了更大的空间。但是大模型在训练过程中所需要的资源也是成倍的增长,存储以及计算上的压力对机器学习平台都是巨大的挑战。腾讯太极机器学习平台持续探索降本增效方案,在广告离线训练场景利用混合部署资源大大降低了资源成本,每天为腾讯广告提供50W核心廉价混合部署资源,帮助腾讯广告离线模型训练资源成本降低30%,同时通过一系列优化手段使得

如何使用 Go 语言进行大数据分析?如何使用 Go 语言进行大数据分析?Jun 11, 2023 am 11:11 AM

随着数据规模逐渐增大,大数据分析变得越来越重要。而Go语言作为一门快速、轻量级的编程语言,也成为了越来越多数据科学家和工程师的选择。本文将介绍如何使用Go语言进行大数据分析。数据采集在开始大数据分析之前,我们需要先采集数据。Go语言有很多包可以用于数据采集,例如“net/http”、“io/ioutil”等。通过这些包,我们可以从网站、API、日志

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SublimeText3 英語版

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン