主题域
主题域比较抽象,可以理解成我们要分析业务的范围,实际开发中接触更多的是主题,一个主题对应一个单独的模型,一个模型则有多个实体,多个维度、多个度量。
主题
主题就是我们要分析的对象,业务关心数据实体,比如我们的订单主题、用户客户主题、渠道主题、流量主题、企业主题、产品主题、销售主题、财务主题、活动大赛主题等
一个主题:包含要统计的度量、分析度量的维度、数据调度周期、存放时间等,举个例子:
比如:销售主题:度量就是销售额度;分析维度:日期(日月季年)、地区维度、渠道维度、销售方维度
再比如:订单主题:度量就是订单金额;分析维度:日期维、区域维、渠道维、商城维、产品类型维、订单类型维
调度周期按天、永久存储。
如何进行数据建模
数据建模实际上就是数据分析、业务梳理的过程,搞清楚两个东西、第一、我们有哪些数据?存在哪些地方,第二我们用这些数据干啥?分析哪些方向的数据,从哪些角度来分析?分析清楚之后模型基本就明确了。
对对象属性、公有的属性进行提取,保障模型的兼容性和灵活性,上层业务变更不会影响我底层模型的调整。
数据仓库建模方法
维度建模、星型建模、多维建模
以业务为中心,充分分析数据、对业务划分、确定主题以及主题分析的度量,然后在确定分析度量的角度或者维度,
举个例子:以订单金额为度量,通过多个维度对金额进行分析,度量+维度构成了我们的主题
好的书模型可以减少计算成本、提高数据链路的执行效率
如何应对业务逻辑频繁变更?
模型灵活性兼容性设计了
设计模型的时候提取公用的属性、不变的属性,同时减少模型间的耦合、减少模型之间的重合