如何利用永洪自服务数据集,构建强大的数据处理能力?



一、什么是自服务数据集?


自服务数据集可以通过简单的拖拽和可视化的操作,构建复杂的数据集,同时提供各种数据转换功能,轻松实现强大的数据处理。

在自服务数据集中,通过添加不同类型的节点,并且添加连线做数据处理,便可构建出复杂的数据集。

使用自服务数据集的好处:

1.可视化操作简单便捷,容易上手;
2.当数据量复杂时,可通过自服务数据集的强大功能进行数据治理,整合。



二、为什么要使用自服务数据集?


 什么情况下需要用到自服务数据集?


在进行报表制作时,当遇到数据库的数据较为复杂不能直接使用的时候,可以通过自服务数据集的数据处理功能先对数据进行处理,整合

例如,在某一个组件需要需要用到两个有关联关系的数据集时,而一个组件又不能绑定两个数据集,需要先对两个数据集进行联合,这个时候可以使用自服务数据集的联接功能对两个数据集进行联接后再进行报表制作。
 
自服务数据集可进行一个或多个数据集之间的联接,联合,逆透视,去重以及分组和汇总等操作,只需要通过拖拽和可视化操作就可以进行数据处理和整合,十分简单便捷,能够很大的提高效率,无论是 IT 人员还是业务人员都可以很快上手操作。



三、如何使用自服务数据集?


用户可通过添加数据节点的方式,将来自不同类型的数据集数据作为输入节点,例如 Excel 数据集,内嵌数据集,SQL 数据集 ,Mongo 等各种任意数据集。在输入节点之后接入各种联接和转换节点,各个节点之间可以任意组合和编辑,最后连线数据集结果节点,就可以完成数据的准备工作。

通过自服务联接数据为例,介绍如何进行联接数据,形成新的数据集。

1.可以通过拖拽的方式将要处理的数据集添加到自服务的空白画布区域。

图片


2.添加好数据后,通过操作选项里的节点功能可以对数据进行处理,包含以下功能:

(1)联接和联合节点。通过关联节点,可将多张不同的表,组合成为一张表。关联节点可以连接多个输入节点。只能有一个输出,镜像节点除外,能连接的镜像节点可以是(n>1)个

(2)转换节点:分为 抽样,排序,透视表,逆透视表,分组和汇总,自循环列,镜像,去重。通过转换节点,可对表中的数据进行相应的处理

(3)关联和转换节点的右键菜单包含,编辑节点,重命名,删除,刷新(镜像节点除外,镜像节点右键菜单没有编辑节点选项)。关联,转换节点第一次连接其输入节点时会自动弹出编辑框。

图片


3.以联接功能为例,将需要连接的数据集拖拽到编辑区,拖拽“联接”操作到编辑区,系统将自动对数据集和联接节点进行连线。如果系统没有自动连线,也可以对数据集和操作进行手动连线。默认状态自动布局是置灰状态

当数据集结果节点有输入时,自动布局才可使用。点击自动布局,节点和节点之间的布局会根据既定算法优化,布局会更加合理美观。

(1)自动布局前:
 

图片


(2)自动布局后:
 

图片


4. 两个数据集进行联接操作时,默认的是“内部联接”的联接方式,并会自动匹配联接列。本例中,联接方式为“内部联接”,联接列为“订单ID”,即将两张表订单ID相同的数据组合在一起,如下图所示。如果需要使用左联接等其他的联接方式,只需在联接对话框中,设置所需的联接方式和联接列。
 

图片


5.数据集结果展示

数据集结果节点 ,数据集结果节点是所有节点数据处理的终结点,数据集结果节点只能有一个输入。刷新元数据后,新数据集的关联数据显示在右侧
 

图片


以上就是自服务数据集联接的使用方法,通过简单的几步操作就可以将两个数据集进行联接,省去了写代码的繁琐,还可以实时看到操作过程中的数据细节。除了联接之外,还可以根据需求实现联合、去重、自循环、逆透、分组和汇总等功能,处理数据能力强大,使用方便高效。

 

(完)