こんにちは!
今日、私はデータ サイエンスとサイバーセキュリティの 2 つのドメインを埋め込むことにしました。
フォローしていただければ、私が何について書いているかがわかります。
私が何をしたのですか?
組織の種類に基づいて攻撃数の分析を実行しました。
Kaggle からデータセットをダウンロードしました。
次に、Jupyter Lab と Python を使用してデータの作業を開始しました。
このノートブックは、データのテストや観察、または操作のための演習用です。
いつものように、まずはデータをインポートしました。次に、データセットをロードしてクリーンアップしました。
EDA (探索的データ分析) は反復的で非順次的なプロセスであるため、データのクリーニングは何度でも実行できるステップです。したがって、その後、有意義な洞察を明らかにするために、このプロセスを続けました。
統計について一言
攻撃の数に基づいて、どの組織がサイバー攻撃を受けやすいかを調べるために、n=40 の単純なランダム サンプリングを選択しました。単純なランダムサンプリングは、母集団のすべてのメンバーが平等に選択される可能性があることを意味します。
仮説
帰無仮説 (H0): さまざまなタイプの組織が経験したサイバー攻撃の数に大きな違いはありません。
対立仮説 (H1): サイバー攻撃の数は、組織の種類によって大きく異なります。
攻撃の最大数によると、ヘルスケア業界は6回の攻撃でより危険性が高いと結論付けられました。反対に、銀行は攻撃数が最も少なく、つまり 1 でした。
最後に、Shapiro-Wilk テストを実行して、データセットの分布の正規性を確認しました。帰無仮説が拒否されたため、データは正規分布していないようでした。私はクラスカル・ウォリス検定を適用しましたが、帰無仮説を棄却できませんでした。これは、グループ間に有意差がないことを意味します。簡単に言うと、ある組織タイプが他の組織タイプよりもサイバー攻撃を受けやすいと自信を持って言える十分な証拠がなかったということです。
制限事項と将来の考慮事項
信頼水準、誤差の範囲、信頼区間は設定されていません。サンプルサイズが小さいため、統計的に有意な差を検出するのが難しくなります。将来的には、サンプルの選択ではこれらの手順が尊重され、より大規模なサンプルが考慮される予定です。
私の GitHub ページで、全体を見つけることができます。 ?
ボーナス?
私が指定したように、この記事にはおまけが付いています。データ サイエンスとサイバーセキュリティの組み合わせはさらに進んでいます。TryHackMe ルームの攻撃ディレクトリ用の記事を作成しました!
一見すると、これらのトピックは無関係であると言えるでしょう。実は、これは、どのように侵害が発生するのかを示すデモンストレーションです。 ?データ侵害は何らかの理由と何らかの理由で発生するからです。
興味がありますか?私の GitHub ページから私の記事をチェックしてください。
あなたはどう思いますか?
以上がデータ侵害に関する応用データ サイエンス + ボーナスの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

Arraysinpython、特にvianumpy、arecrucialinscientificComputing fortheirefficienty andversitility.1)彼らは、fornumericaloperations、data analysis、andmachinelearning.2)numpy'simplementation incensuresfasteroperationsthanpasteroperations.3)arayableminablecickick

Pyenv、Venv、およびAnacondaを使用して、さまざまなPythonバージョンを管理できます。 1)Pyenvを使用して、複数のPythonバージョンを管理します。Pyenvをインストールし、グローバルバージョンとローカルバージョンを設定します。 2)VENVを使用して仮想環境を作成して、プロジェクトの依存関係を分離します。 3)Anacondaを使用して、データサイエンスプロジェクトでPythonバージョンを管理します。 4)システムレベルのタスク用にシステムPythonを保持します。これらのツールと戦略を通じて、Pythonのさまざまなバージョンを効果的に管理して、プロジェクトのスムーズな実行を確保できます。

numpyarrayshaveveraladvantages-averstandardpythonarrays:1)thealmuchfasterduetocベースのインプレンテーション、2)アレモレメモリ効率、特にlargedatasets、および3)それらは、拡散化された、構造化された形成術科療法、

パフォーマンスに対する配列の均一性の影響は二重です。1)均一性により、コンパイラはメモリアクセスを最適化し、パフォーマンスを改善できます。 2)しかし、タイプの多様性を制限し、それが非効率につながる可能性があります。要するに、適切なデータ構造を選択することが重要です。

craftexecutablepythonscripts、次のようになります

numpyarraysarasarebetterfornumeroperations andmulti-dimensionaldata、whilethearraymoduleissuitable forbasic、1)numpyexcelsinperformance and forlargedatasentassandcomplexoperations.2)thearraymuremememory-effictientivearientfa

NumPyArraySareBetterforHeavyNumericalComputing、whilethearrayarayismoreSuitableformemory-constrainedprojectswithsimpledatatypes.1)numpyarraysofferarays andatiledance andpeperancedatasandatassandcomplexoperations.2)thearraymoduleisuleiseightweightandmemememe-ef

ctypesallowsinging andmanipulatingc-stylearraysinpython.1)usectypestointerfacewithclibrariesforperformance.2)createc-stylearraysfornumericalcomputations.3)passarraystocfunctions foreffientientoperations.how、how、becuutiousmorymanagemation、performanceo


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

Video Face Swap
完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

人気の記事

ホットツール

SublimeText3 Linux 新バージョン
SublimeText3 Linux 最新バージョン

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

EditPlus 中国語クラック版
サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ホットトピック









