你好!
今天我决定嵌入两个领域:数据科学和网络安全。
跟随我的脚步,你就会明白我在写什么。
我做了什么?
我根据组织类型对攻击次数进行了分析。
我从 Kaggle 下载了数据集。
然后,我开始使用 Jupyter Lab 和 Python 处理数据。
笔记本用于练习、测试和观察或处理数据。
像往常一样,我首先导入了数据。然后,我加载并清理了数据集。
清理数据是一个可以重复多次的步骤,因为 EDA(探索性数据分析)是一个迭代且非顺序的过程。因此,后来我继续这个过程,以发现有意义的见解。
关于统计的几句话
我选择了 n=40 的简单随机抽样,根据攻击数量找出哪个组织更容易受到网络攻击。简单随机抽样意味着总体中的每个成员都有平等的被选中的机会。
假设
原假设(H0):不同类型的组织遭受的网络攻击数量没有显着差异。
替代假设(H1):不同类型组织的网络攻击数量存在显着差异。
根据最大攻击次数,得出医疗行业较易发生,共发生6次攻击。相反,银行业 的攻击次数最少,即 1。
最后,我执行了 Shapiro-Wilk 检验,以检查数据集的分布正态性。零假设被拒绝,因此数据看起来不呈正态分布。我应用了克鲁斯卡尔-沃利斯检验,从中我未能拒绝原假设——这意味着组之间没有显着差异。简而言之,这意味着没有足够的证据可以自信地说一种组织类型比另一种组织类型更容易受到网络攻击。
局限性和未来考虑因素
未设置置信水平、误差幅度和置信区间。样本量很小,因此很难检测到统计上显着的差异。未来样本的选择将遵循这些步骤,并考虑更大的样本。
您可以在我的 GitHub 页面上找到整个作品。 ?
奖金 ?
正如我所指定的,本文有一个奖励。数据科学和网络安全的结合仍在继续:我为 TryHackMe 房间攻击目录创建了一篇文章!
乍一看,人们可能会说这些主题是不相关的。嗯,这实际上是如何违规发生的演示! ?因为不知何故并且出于某种原因出现了数据泄露。
好奇吗?好吧,请从我的 GitHub 页面查看我的文章。
你有什么想法?
以上是应用数据科学解决数据泄露+奖金的详细内容。更多信息请关注PHP中文网其他相关文章!

Linux终端中查看Python版本时遇到权限问题的解决方法当你在Linux终端中尝试查看Python的版本时,输入python...

本文解释了如何使用美丽的汤库来解析html。 它详细介绍了常见方法,例如find(),find_all(),select()和get_text(),以用于数据提取,处理不同的HTML结构和错误以及替代方案(SEL)

本文比较了Tensorflow和Pytorch的深度学习。 它详细介绍了所涉及的步骤:数据准备,模型构建,培训,评估和部署。 框架之间的关键差异,特别是关于计算刻度的

本文指导Python开发人员构建命令行界面(CLIS)。 它使用Typer,Click和ArgParse等库详细介绍,强调输入/输出处理,并促进用户友好的设计模式,以提高CLI可用性。

在使用Python的pandas库时,如何在两个结构不同的DataFrame之间进行整列复制是一个常见的问题。假设我们有两个Dat...

本文讨论了诸如Numpy,Pandas,Matplotlib,Scikit-Learn,Tensorflow,Tensorflow,Django,Blask和请求等流行的Python库,并详细介绍了它们在科学计算,数据分析,可视化,机器学习,网络开发和H中的用途

文章讨论了虚拟环境在Python中的作用,重点是管理项目依赖性并避免冲突。它详细介绍了他们在改善项目管理和减少依赖问题方面的创建,激活和利益。


热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

ZendStudio 13.5.1 Mac
功能强大的PHP集成开发环境

安全考试浏览器
Safe Exam Browser是一个安全的浏览器环境,用于安全地进行在线考试。该软件将任何计算机变成一个安全的工作站。它控制对任何实用工具的访问,并防止学生使用未经授权的资源。

适用于 Eclipse 的 SAP NetWeaver 服务器适配器
将Eclipse与SAP NetWeaver应用服务器集成。

WebStorm Mac版
好用的JavaScript开发工具

Atom编辑器mac版下载
最流行的的开源编辑器