随着数字化时代的快速发展,数据已经成为企业运营和决策的重要依据。然而,处理和分析大量复杂数据是一个具有挑战性的任务,特别是在数据清洗和加工环节。为了满足这一需求,JVS-BI提供了一套高效、简洁的数据处理和分析解决方案。

JVS智能BI通过创新性的数仓式存储、流程化加工、直观模拟化配置和用户友好的界面化管理等特性,使数据分析变得触手可及,同时也极大地提高了数据处理和分析的效率。

JVS-BI特点介绍

数据应用的基本流程大致分为三个步骤,数据的集成接入(多种数据源)、数据的清洗加工(关联、筛选、分组聚合等),最后再是数据的应用(数据报告、趋势图表、大屏展示、统计报表等)。

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_数据

其中数据清洗是最考验技术能力的过程。JVS-BI提供了可视化数据加工的工具---数据加工引擎,特点:

  • 数仓式存储,以集中式、整合的方式管理数据,实现数据的统一清洗、转换和加载,为数据分析提供独立且高效的数据环境;
  • 流程化加工,屏蔽底层不同数据源的差异,技能门槛降低,不论是excel还是hive 或者mongodb ,用户只需要简单通过流式数据加工配置即可;
  • 模拟化配置,透明化数据建模过程,通过拖拉拽的方式,构建数据处理流程,简单清晰明了;
  • 界面化管理,提供快速任务管理工具,原始数据、模型化加工、周期化更新,更加简单高效。

数仓式存储

数仓(Data Warehouse)是一个用于集中存储和管理企业中各种数据的方式,在JVS-BI中,数仓式存储模式是一种将企业各种数据进行整合、清洗、转换、加载,然后存储在一个中心化的数据仓库中的存储模式,它是独立于各个业务平台的独立数据分析系统,对数据的存储、数据的加工用自有平台的服务能力,数据分析加工是需要消耗大量的计算资源,这种模式不会消耗生产系统的计算性能,从而避免统计分析过程影响生产业务。

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_建模_02

分析统计尽量不影响生产系统,特别是大量的分析所需的计算资源一定不能依赖于生产系统。

流程化加工

JVS-BI采用流程式数据加工方式,通过“算子”的形式将数据 一步一步的进行加工处理,通过每个算子的界面化配置,如下图所示:

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_数据分析_03

算子是数据加工过程中的核心能力,算子通过内存计算与数据库能力引用相融合的模式,实现了数据加工的配置化,系统提供了各种处理算子,在配置引擎中可以快速实现,数据过滤、多表关联(跨库)、数据拓展(函数计算)、追加合并......各种各样的处理方法,通过简单的拓展,下图展示了一个配置算子的过程示例:

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_建模_04

模拟化配置

系统通过对模拟数据进行自动化构建,我们在构建流程化建模的过程中,数据所需要的各个环节的模型都是系统自动构建,那么系统构建各个环节模型的来源是什么呢?是在我们模拟引入了一部分真实表结构的部分数据,作为加工的模拟数据,通过每一步,系统去构建每个环节的数据模型(类似于零代码开发的模式),无需关注所需要建模的物理表结构,只关注每个环节我们要的业务数据结果,这样大大降低了对操作者的技术门槛,也实现了所见即所得的配置清洗建模的过程

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_数据分析_05

界面化管理

数据清洗加工建模是构建数据加工清洗的流程,通过采用模拟获取一部分数据进行建模(快速高效),那么任务调度就是管理真实数据通过建模所得到的加工数据结果,任务调用如何管理,如下图所示:

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_建模_06

系统提供了自动化执行的配置界面,其中包括快速的周期化配置,有按小时、按天等多种方式

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_数据_07

也可以采用con表达式进行周期化执行配置,可以更加灵活与自定义。

执行的过程我们也有对应的任务管理界面,系统对当前计算执行的任务,执行的进度都提供了界面化的管理,如下图所示

JVS-BI数据加工引擎:高效、可视化、易用的数据清洗工具_数据清洗_08

在线demo:http://bi.bctools.cn

gitee地址:https://gitee.com/software-minister/jvs-bi