为什么看到数据胜过阅读数据：数据可视化案例-Python教程-PHP中文网

首页

后端开发

Python教程

为什么看到数据胜过阅读数据：数据可视化案例

Susan Sarandon

Dec 06, 2024 pm 08:35 PM

在当今数据驱动的世界中，原始数据充斥着每个部门。从复杂的业务指标到日常生活中的简单数据。每天有多少辆车经过道路，有多少学生通过数学考试，甚至您每天消耗多少鸡蛋？所有这些问题的答案都是数据。

原始数据通常充满了编号的行和列或电子表格。它们势不可挡且难以解释。为了解锁可操作的见解，我们需要将这些数据转换为更容易理解的东西——这就是数据可视化发挥作用的地方。

可视化为何有效：其背后的科学

数据可视化是以图形方式表示信息和数据的过程。它可以是图表、图形或地图。通过这种视觉媒体，我们可以从多个角度查看数据，例如使用线图查看趋势，使用直方图查看分布。

数据可视化的有效性在于人脑处理视觉刺激的方式。视觉感知的格式塔原理解释了人脑如何处理视觉信息。

格式塔原则

邻近度：物理上靠近的对象属于一个组的一部分。
相似性：具有相似颜色、形状、大小或方向的物体被视为相关或属于同一组。
连续性：自然遵循平滑路径，使线图能够直观地跟踪趋势。
连接：物理连接的对象是一个组的一部分。

Why Seeing Data Beats Reading It: The Case for Data Visualization

封闭：物理上封闭在一起作为属于一个组的一部分的对象。
结束语：我们的大脑会填充缺失的信息以创建完整的形状，帮助理解碎片化的视觉效果，例如虚线趋势线。

Why Seeing Data Beats Reading It: The Case for Data Visualization

数据可视化的主要好处

研究表明，传输到大脑的信息 90% 是视觉信息。使用数据可视化作为沟通工具是利用大脑视觉处理信息的自然能力的有效方法。

1。视觉模式更容易识别
人类大脑具有识别模式、趋势和关系的能力。当数据以图表、曲线图或图表的形式呈现时，上升趋势、集群或异常等模式就会立即显现出来。例如，看下面的图片。例如，考虑 2024 年美国 7 月至 8 月的选举趋势。视觉表现显示民主党和共和党候选人之间的竞争非常激烈，他们的支持水平不相上下。这种可视化传达了结果的不确定性，强调特朗普和卡马拉·哈里斯仍然是胜利的有力竞争者。

Why Seeing Data Beats Reading It: The Case for Data Visualization
来源：独立报

2。异常检测更快发现
可视化可以帮助用户快速发现异常值。例如，散点图和热图等工具可以更轻松地查看原始数据中隐藏的相关性或异常情况。识别此类模式对于金融、营销和医疗保健领域的决策至关重要。

Why Seeing Data Beats Reading It: The Case for Data Visualization
来源：https://sites.chem.utoronto.ca

3。简化复杂性
读取原始数据意味着给大脑增加认知负荷。通过聚合或总结数据，它们可以减轻认知负担并帮助观看者专注于最重要的方面。下面的可视化说明了从 2001 年到 2024 年，美国人如何确定自己的政治立场。以原始格式分析 23 年的数据对于大多数人来说几乎不可能进行有效解释。然而，通过数据可视化，复杂的模式立即变得清晰。例如，该图表突出了一个一致的趋势：女性往往更倾向于自由主义意识形态，而男性则倾向于保守观点。这是数据可视化如何将数十年的信息浓缩为易于理解的故事的一个典型示例。

Why Seeing Data Beats Reading It: The Case for Data Visualization
来源：纽约时报

4。提高保留率
人们更有可能记住来自视觉的见解。图表或信息图表中呈现的数据的保留率可能明显高于文本数据。

5。时间效率
麦肯锡进行的一项研究显示，采用数据可视化的公司中有 28% 倾向于及时做出决策。在时间就是金钱的领域，数据可视化可以通过提高效率来帮助企业发展。

数据可视化力量的另一个例子可以在 2024 年美国大选中看到。一张图表显示了对摇摆选民、特朗普忠诚者和哈里斯忠诚者来说重要的问题。一旦政治顾问看到图表，他们将制定下一个计划来影响摇摆选民，并向雇主提出战略计划以赢得选举

Why Seeing Data Beats Reading It: The Case for Data Visualization

6。非技术受众的可访问性
不同领域的专家经常在同一组织内合作开展项目。然而，技术术语可能会给有效沟通造成障碍并导致误解。数据可视化通过以简单的格式呈现复杂的信息来弥补这一差距。这确保非技术利益相关者能够掌握关键见解，促进更具包容性和有效的决策。

避免这些常见的数据可视化错误

虽然数据可视化是一个强大的工具，但它也有其缺陷。最常见的情况之一是操纵轴或挑选数据，这可能会导致误解。如果 y 轴不是从零开始，则显示两个值之间差异的条形图可能会显得夸张。例如，如果一个条代表 40，另一个条代表 50，则将 y 轴从 36 缩放到 50 将使差异看起来很明显，从而误导观看者高估差异。

Why Seeing Data Beats Reading It: The Case for Data Visualization

另一个陷阱是将太多数据塞进单个图表中，因为它会让观众不知所措并选择错误的图表类型。

数据可视化的工具和技术。

如今，数据可视化工具已广泛使用。 Tableau、Power BI 等工具以及 Seaborn 和 Dash 等 Python 库可根据需要进行自定义。对于开发者来说，像 Seaborn 和 Dash 这样的库是一个很好的选择。特别是在处理机器学习或人工智能中的数据分析时，Seaborn 提供了多种类型的图表，借助 Pandas 和 NumPy 等其他强大的库来分析数据。