python数据可视化步骤
如今,许多组织正在采取步骤,通过将模型,分析,数据可视化和仪表板作为决策的组成部分,来驱动数据驱动。 这在许多情况下都在发生,例如商业领袖改善客户体验 ; 技术领导者分析敏捷,开发和网站指标 ; 应用团队将分析嵌入到他们的应用中 。
这意味着将有更多的开发人员,分析师,工程师和经理参与开发数据可视化和仪表板。 随着许多组织采用Tableau和Microsoft Power BI等自助服务BI工具 ,在某些时候您可能想要开发仪表板,或者被要求作为优先事项的一部分。
[InfoWorld的要点: 如何为您的应用选择正确的数据可视化工具 。 • 如何验证数据,分析和数据可视化 。 • 数据可视化:显示并不总是很有意义 。 | 通过InfoWorld大数据和分析报告时事通讯深入了解分析和大数据。 ]
这些工具易于学习,但避免了设计不被使用的复杂数据可视化的诱惑。 您需要设计和开发策略,而组织则需要已建立的数据可视化标准。
从战略实践到设计策略,再到针对Tableau和Power BI的特定于平台的标准,这里有很多建议。 我想分享一些开发人员应该考虑的实用标准。
1.使用发现仪表板准备数据
在处理数据的过程中,开发人员,业务分析师或数据科学家通常会开发图表和仪表板,使用户能够查看和发现基本见解。 当您对数据,数据的质量以及哪些见解可能一无所知时,这些仪表板就成为开发过程的一部分。 在此过程中,重要的是要问一些问题:
- 数据是否足够有用,还是需要与其他数据源结合使用以讲述更完整的故事?
- 数据是相对干净的还是在进行决策之前需要进行一些数据准备和清理 ?
- 为了简化分析,是否需要分组维度,合并度量,计算聚合和其他分析?
这些问题是非常有用的。 每当数据需要其他操作时,根据需要重复。
2.回答特定受众的问题
准备好进行第一次数据可视化后,请考虑以下事项:
- 可视化将解决什么问题?
- 谁会使用它?
- 他们将从可视化中获得的见解如何处理?
第一个问题应该帮助您定义可视化的标题。 我已经看到许多人忘记了这一关键步骤,使消费者不了解为什么以及如何使用可视化。
第二个问题有助于定义细节和复杂程度。 高管希望获得绩效指标和趋势,而经理经常希望深入挖掘并了解分析背后的原因。
第三个问题有助于确定需要哪种类型的信息以及与其他系统集成是否有用。 例如,如果您的仪表板正在分析来自Jira的敏捷指标,则允许用户单击Jira发行版,史诗和故事可能会有用。 了解最终用户是谁,可以帮助确定他们需要在任何集成系统中执行的活动类型。
3.建立一致的布局,图表类型和样式
试图创建完全反映最终用户可能要回答他们的问题并查看分析结果的所有维度,层次结构和过滤器的仪表板布局是很诱人的。
但是在太多的仪表板中执行此操作,并且跨不同设计学习和工作的复杂性将关闭最终用户。 这等效于设计一个在每个屏幕上都具有不同导航栏的网站。
这意味着要提供一致的布局,图表类型和样式。 来到您的新仪表盘的用户应该放心,因为它与他们已经使用的其他仪表盘具有相同之处。 搜索界面和过滤器应位于一致的位置。 当在不同的仪表板上显示时,主要维度应使用一致的图表类型。 尺寸和尺寸还应使用一致的颜色,字体和格式。
4.利用视觉元素推动故事讲述
一旦有问题并根据布局标准设计了仪表板的结构,下一步就是确保视觉效果有用且有见地。 不要指望最终用户能够独自拥有aha时刻。 最好的仪表板使用显式和隐式线索来吸引他们的注意力。
整本书和许多有关数据和视觉设计的讲故事的文章,但是这里有一些基础知识:
- 为钻取数据的维度使用更多的视觉效果和更少的过滤器。 视觉效果通过颜色,大小和趋势来提供上下文,并通过上下文和过滤器添加。
- 获得通过标记,定位和样式轴,刻度线,颜色图例和数据点实现的基本制图标准。
- 离群值可能很重要。 避免过滤掉它们,并突出显示可能有意义的那些。
- 用户通常了解基本的图表类型,但对散点图,箱形和须状图,雷达图,多层饼图和其他更复杂的图表类型可能不太熟悉。 仅当它们增加价值并突出见解时,才使用复杂的视觉效果。 使用它们时,请减少这些仪表板上的其他元素,以免它们淹没最终用户。
- 许多BI工具都有注释数据或捕获一系列仪表板交互事件的方式。 学习利用这些工具。 在大多数公司环境中,清晰,直接是使人们看到见解的最实用方法。
- 讲故事需要上下文。 数据可视化可以通过趋势,基线,比较,基准,方案,预测以及其他为分析或决策提供背景的元素来实现。
- 个性化体验。 例如,如果您的最终用户仅对欧洲性能指标感兴趣,则让他们在全球范围内设置该首选项,以便仪表板在此上下文下打开。
如果您对此感兴趣,可以考虑通过阅读诸如讲故事和数据之类的书来学习更多有关数据可视化的知识,从Tableau Public的顶级视觉效果中汲取灵感,回顾2018年这些顶级数据可视化 效果 ,向这些专家学习,或者关注这些可视化博客 。
5.迭代数据和设计
使用仪表板后,将需要不断进行改进。
新的仪表板通常会暴露潜在的数据质量问题,尤其是从新数据集开发时。 第一个仪表板版本应解决可能会阻碍明智决策的主要数据质量问题。
数据可视化就像软件应用程序一样。 可用性改进是另一种增强功能。 仪表板开发人员应在最终用户手中获得最低限度可行的产品,观察产品的使用情况,并收集可推动改进的反馈。
最后,仪表板还必须反映决策和数据的当前状态。 当今的见解变得可行,并且随着时间的流逝将变得不那么重要。 出现了需要分析和数据可视化的新业务目标和利益相关方问题。 有时,这需要创建新的仪表板; 有时,改进现有方法是更有效的选择。
数据可视化实践通过标准化版本控制,测试和发布管理作为开发和部署仪表板的一部分来解决这些更改。
随着越来越多的人开发仪表板或参加商业智能计划,组织应建立并改善其开发和设计标准。
python数据可视化步骤