作者 Jonathan Allen ,译者 张晓鹏 Splunk的用户大会已经接近尾声。三天时间的会议里,共进行了160多个主题研讨,涵盖了从安全、运营到商业智能,甚至包括物联网,会议中一遍又一遍出现相同的中心主题:大数据的关键是机器学习。 存储不再是一个问题。从运
作者 Jonathan Allen ,译者 张晓鹏
Splunk的用户大会已经接近尾声。三天时间的会议里,共进行了160多个主题研讨,涵盖了从安全、运营到商业智能,甚至包括物联网,会议中一遍又一遍出现相同的中心主题:大数据的关键是机器学习。
存储不再是一个问题。从运行Hadoop兼容节点的专用存储硬件,到数百台使用普通硬盘的计算机组成的集群,毫无疑问,我们具备了处理这类存储问题的能力。另一方面,像Splunk这样的分析和可视化工具也应运而生。如果你知道你要找什么,这些工具可以很快给你所需要的答案。
但是,你应该找什么呢?对于绝大多数的基层供应商来说,问题的答案就在机器学习里面。无论你是在谈论网络流量、用户行为,或者是消费趋势,这都不要紧,你能真正洞察你所监控的东西的方式是找到数据中的模式和相关性。虽然人类操作员可以通过试错法蹒跚而行,但他们相信,可以通过训练计算机来得到结果,并且速度更快和不带偏见。
当然,这并不是说人类已经过时。必须有人来确认相关性不只是种巧合,并找出对信息采取行动的方法。而这也正是前面所提到的可视化工具可以发挥作用的地方。
大数据和机器学习的主要用例
虽然大数据的潜力几乎是无限的,但不可避免的是一或两个行业会在前面带头冲锋。如果再过一年问我,我可能会说不同的话,但现在的预测是,无论是安全还是运营,都会处在第一线。
只要比那些只收现金的咖啡亭大的公司,都需要考虑信息的安全性。即使他们没有知识产权可言,但他们都在处理一些敏感信息,如信用卡号码。有方法可以可靠地检测和阻止那些正在发生的违约行为,对公司的长期成功是至关重要的。基于机器学习的安全产品承诺提供这种能力,并且它的易用性接近“交钥匙工程(译者注:意为卖方把所有事情都做好了,买方只要拿钥匙验收就可以了)”的水准。
与此类似,运营分析将会流行起来。现在你就可以买到工具来监视你的网络,解码数据包,或向你精确呈现一个给定的REST调用是如何经过服务器的中间层一路到达数据库或文件系统的,然后把它和一周,一个月或一年以前的行为做对比。这不是未来的概念,而是今天现成的东西,并可以在一周内运行起来。
其它领域的研究将会继续下去,但不会有如此快的速度。欺诈检测是非常重要的,但大多数公司会依靠他们的金融机构来设计和实施必要的控制措施。我预计在这方面不会有太多商业化的、现成的产品。
商业智能是另一个会看到大量金钱投入的研究领域。但可口可乐与百事可乐公司用来确定下一个流行口味的算法,看起来一点也不像通用和福特公司用来预测每种尺寸的车型会有多少量的算法。如此类推,商业化产品对大数据的运用目前可能会主要局限于基本的分析和可视化方面。
其他的会议思考
总而言之,Splunk举办了一次非常好的会议。一切都组织得很好,每个人,从初学者到最高级的数据挖掘工程师,都会有相关的议题研讨。我唯一的抱怨是,议题研讨没有记录。因为有这么多的内容,人们势必会因为冲突错过一两个重要的议题。
即使你对Splunk本身不感兴趣,但对大数据、机器学习以及相关主题感兴趣的任何人来说,这都是一次重要的会议。
查看英文原文:Splunk Conference Recap: The Key to Big Data is Machine Learning

MySQLとSQLiteの主な違いは、設計コンセプトと使用法のシナリオです。1。MySQLは、大規模なアプリケーションとエンタープライズレベルのソリューションに適しており、高性能と高い並行性をサポートしています。 2。SQLiteは、モバイルアプリケーションとデスクトップソフトウェアに適しており、軽量で埋め込みやすいです。

MySQLのインデックスは、データの取得をスピードアップするために使用されるデータベーステーブル内の1つ以上の列の順序付けられた構造です。 1)インデックスは、スキャンされたデータの量を減らすことにより、クエリ速度を改善します。 2)B-Tree Indexは、バランスの取れたツリー構造を使用します。これは、範囲クエリとソートに適しています。 3)CreateIndexステートメントを使用して、createIndexidx_customer_idonorders(customer_id)などのインデックスを作成します。 4)Composite Indexesは、createIndexIDX_CUSTOMER_ORDERONORDERS(Customer_Id、Order_date)などのマルチコラムクエリを最適化できます。 5)説明を使用してクエリ計画を分析し、回避します

MySQLでトランザクションを使用すると、データの一貫性が保証されます。 1)StartTransactionを介してトランザクションを開始し、SQL操作を実行して、コミットまたはロールバックで送信します。 2)SavePointを使用してSave Pointを設定して、部分的なロールバックを許可します。 3)パフォーマンスの最適化の提案には、トランザクション時間の短縮、大規模なクエリの回避、分離レベルの使用が合理的に含まれます。

MySQLの代わりにPostgreSQLが選択されるシナリオには、1)複雑なクエリと高度なSQL関数、2)厳格なデータの整合性と酸コンプライアンス、3)高度な空間関数が必要、4)大規模なデータセットを処理するときに高いパフォーマンスが必要です。 PostgreSQLは、これらの側面でうまく機能し、複雑なデータ処理と高いデータの整合性を必要とするプロジェクトに適しています。

MySQLデータベースのセキュリティは、以下の測定を通じて達成できます。1。ユーザー許可管理:CreateUSERおよびGrantコマンドを通じてアクセス権を厳密に制御します。 2。暗号化された送信:SSL/TLSを構成して、データ送信セキュリティを確保します。 3.データベースのバックアップとリカバリ:MySQLDUMPまたはMySQLPumpを使用して、定期的にデータをバックアップします。 4.高度なセキュリティポリシー:ファイアウォールを使用してアクセスを制限し、監査ロギング操作を有効にします。 5。パフォーマンスの最適化とベストプラクティス:インデックス作成とクエリの最適化と定期的なメンテナンスを通じて、安全性とパフォーマンスの両方を考慮に入れます。

MySQLのパフォーマンスを効果的に監視する方法は? MySqladmin、ShowGlobalStatus、PerconAmonitoring and Management(PMM)、MySQL EnterpriseMonitorなどのツールを使用します。 1. mysqladminを使用して、接続の数を表示します。 2。showglobalstatusを使用して、クエリ番号を表示します。 3.PMMは、詳細なパフォーマンスデータとグラフィカルインターフェイスを提供します。 4.mysqlenterprisemonitorは、豊富な監視機能とアラームメカニズムを提供します。

MySQLとSQLServerの違いは次のとおりです。1)MySQLはオープンソースであり、Webおよび埋め込みシステムに適しています。2)SQLServerはMicrosoftの商用製品であり、エンタープライズレベルのアプリケーションに適しています。ストレージエンジン、パフォーマンスの最適化、アプリケーションシナリオの2つには大きな違いがあります。選択するときは、プロジェクトのサイズと将来のスケーラビリティを考慮する必要があります。

高可用性、高度なセキュリティ、優れた統合を必要とするエンタープライズレベルのアプリケーションシナリオでは、MySQLの代わりにSQLServerを選択する必要があります。 1)SQLServerは、高可用性や高度なセキュリティなどのエンタープライズレベルの機能を提供します。 2)VisualStudioやPowerbiなどのMicrosoftエコシステムと密接に統合されています。 3)SQLSERVERは、パフォーマンスの最適化に優れた機能を果たし、メモリが最適化されたテーブルと列ストレージインデックスをサポートします。


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

SublimeText3 英語版
推奨: Win バージョン、コードプロンプトをサポート!

MinGW - Minimalist GNU for Windows
このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。
