应用表是面向具体业务场景时,用于组织相同时间周期、相同维度的多个原子指标、派生指标或统计粒度的统计数据,为后续的业务查询,OLAP 分析,数据分发等提供基础。本文为您介绍如何创建应用表。
前提条件
背景信息
应用表是将一个数据集市或主题域中的多个原子指标或派生指标,通过时间周期及关联维度整合在一起,关联的维度、时间周期、原子指标、派生指标,用于生成应用表中的统计字段,帮助您进行报表等分析展示。您可以使用应用表呈现相同时间、相同维度下,多个指标所统计的业务情况。
创建应用表
-
进入智能数据建模页面。
登录 DataWorks 控制台 ,切换至目标地域后,单击左侧导航栏的 ,在下拉框中选择对应工作空间后单击 进入数据建模 。
-
在 智能数据建模 页面的顶部菜单栏,单击 维度建模 ,进入 维度建模 页面。
-
创建应用表。
-
在 维度建模 页面,鼠标悬停至
图标,单击 。
-
配置应用表的基本信息。
参数
描述
数仓分层
挂载应用表的数仓分层。默认选择 应用层 分层归属的 应用数据层 。您也可以根据业务需求,选择将应用表挂载至其他数据层。创建数据分层,详情请参见 创建数仓分层 。
集市/主题
粒度
选择已创建的维度。详情请参见 创建概念模型:维度 。
时间周期
用于确定应用表需要整合的统计数值的时间范围。例如,近一天,近一周。
您需要从已创建的时间周期中选择。如果已创建的时间周期中没有符合您业务需求的时间,则您可以参考 时间周期 新建。
修饰词
用于确定统计数据的业务范围。
您需要从已创建的修饰词中选择。如果已创建的修饰词中没有符合您业务需求的修饰词,则您可以参考 修饰词 新建。
表名规则
选择用于检查表命名规则的检查器。此处可选择您在数仓规划时,在各个数据分层中已创建的检查器,操作详情请参见 配置及使用数仓分层检查器 。
表名
应用表的表名称。若配置了表名规则,则应用表的表名称需按照相应规则配置。
表中文名
表显示的中文名称。
生命周期
表存在的时间周期,单位为天。应用表最多支持保存 36000 天。
责任人
当前应用表的责任人。默认为创建应用表的用户。
描述
表的描述信息。
-
-
单击左上角的 保存 按钮,保存配置的应用表信息。
添加表字段
您可以通过 快捷模式 或 代码模式 为表添加字段,其中 快捷模式 支持如下导入方式:
-
从表/视图导入 :从计算引擎已存在的物理表或视图导入字段,即在 查找已有表/视图 下拉列表搜索并选择已存在的物理表或视图进行字段导入。
说明当前仅支持从 MaxCompute、Hologres、EMR Hive 引擎的表或视图导入。
-
从指标导入 :从数据指标所有派生指标中选择所需指标作为模型字段。
快捷模式 : 从表/视图导入
-
单击 快捷模式 下, 从表/视图导入 后的 展开 。
-
在 查找已有表/视图 的输入框中输入相应名称,即可选择对应的表或视图,并在已引用的表后选择导入表或视图的全部字段或部分字段。
说明-
输入名称时支持模糊匹配,即输入关键字便可搜索到所有名称中包含关键字的表或视图。
-
仅支持搜索生产环境的表,不支持搜索开发环境的表。
-
图标表示导入全部字段。
-
图标表示导入部分字段。
-
-
当选择导入部分字段时,在弹出的窗口中,会为您展示所选表的字段,您可选择需要添加至模型的字段,完成后单击界面下方的 导入 。
说明如果已导入字段中存在 字段显示名 为空的字段,您可根据界面提示将字段描述填充为字段显示名。
快捷模式 : 从指标导入
-
单击 快捷模式 下, 从指标导入 后的 快速导入 。
-
在弹出的窗口中,会为您展示当前已创建的派生指标,您可以在派生指标中选择需要添加至汇总表、应用表的字段。同时,您还可以使用 时间周期 、 业务过程 、 修饰词 、 原子指标 筛选指定派生指标。
-
完成后单击界面下方的 导入 。
代码模式
代码模式
为您提供代码输入的操作方式,单击
代码模式
后,弹窗中会根据已配置的模型信息自动生成建模语言,您可以在此基础上修改模型信息,完成后单击下方的
确定
。
设置表字段信息
完成上述操作后,模型所需字段即已被添加至该模型中,此时您可以根据业务需求设置模型各字段的 关联字段 、 冗余字段 、 关联粒度/指标 。
-
设置字段属性。
字段属性默认展示 字段名称 、 类型 、 字段显示名 、 描述 、 主键 、 非空 、 度量单位 、 操作 等基础属性。您可以在展示已添加字段的右上方单击 字段显示设置 ,选择需要展示出来的字段属性,并根据需要进行修改。
-
设置字段的 关联字段标准 、 关联标准代码 。
用于为已添加的字段选择关联的字段标准,规范字段的取值内容及范围。
关联字段标准 :统一规范管理含义相同但字段名称不同的数据,定义字段的取值范围、度量单位等内容。
-
设置字段的 冗余字段 。
在已添加字段的 操作 列,单击 冗余字段 ,即可设置字段的关联字段。
-
设置字段的 关联粒度/指标 。
汇总表、应用表的各字段数值的统计类型可通过设置字段的 关联类型 来指定,包括 统计粒度 、 派生指标 和 原子指标 三种。
-
统计粒度 :用于关联维度表和维度表中的字段。例如,商品维度、商家维度。
-
派生指标 :指定汇总表字段需要整合的统计数值的派生指标。例如,近 7 天盒马 App 支付下单的金额数。
-
原子指标 :指定汇总表字段需要整合的统计数值的原子指标。例如,支付下单的金额数。
说明从表导入的字段、代码模式添加的字段无默认关联类型,您可以手动设置字段的关联类型为哪种类型。
如果您想设置或修改字段的关联类型,可以参考以下步骤进行修改。
单击字段管理右侧的 关联粒度/指标 ,在弹出的窗口中,修改字段关联的类型和关联的内容,完成后单击 确定 。
-
-
完成设置后单击左上角的 保存 。
后续步骤
表创建完成后,您仍需为表配置字段管理、关联关系、分区设置等内容,并将表发布至对应环境,详情请参见 发布模型至引擎 。