实时计算中一般用实时数据 T 关联 T-2 的维表数据,原因如下:
-
数据无法及时准备好:T-1 的维表不能再 0 点就准备就绪。
-
无法准确获取全量的最新数据:维表一般是全量数据,当天的最新维表需要 T-1 日的数据 + 当天的变更,这样维表也变成实时流,由于实时数据的无序性,因此会产生歧义。
-
数据的无序性:维表作为实时流输入,获取维表数据困难,因为实时应用永远也不知道什么时候是最新的。
欢迎关注公众号。
在16年8月份至今,一直在努力学习
大数据
大数据
相关的技术,很想了解众多老司机的学习历程。因为
大数据
涉及的技术很广需要了解的东西也很多,会让很多新手望而却步。所以,我就在自己学习的过程中总结一下学到的内容以及踩到的一些坑,希望得到老司机的指点
和
新手的借鉴。
目前正在结合机器学习理论学习MLlib源码
在学...
这本书也算是二刷了,推荐可以看看。对
大数据
整体有一定的了解。
1.OLTP(Online Transaction processing)
和
OLAP (Online Analytical Processing)
从命名上就可以看出轻微的区别,一个是事物型,一个是分析型。2.
2.数据建模,最近刚好在做这方面的工作。以我司为例,用的是维度建模。维度建模客观世界分为度量
和
上下文。度量简单的说就是一...
最近有很多人问我如何学习
大数据
?我也是思考了很多时日才动笔写下此文。一方面我自己还只是
大数据
学习中的一个小学生,贸然动笔怕贻笑大方;另一方面
大数据
本身领域博大精深,其涵盖领域之广技术种类之多确实很难用一篇文章囊括。怎奈“下雨天打孩子,闲着也是闲着”,况笔者一直坚持写技术类的博客,今天也请允许我写一点务虚类的东西吧。
本文的目的是希望给所有
大数据
初学者规划一条比较清晰的学习...
阿里的《
大数据
之路》记录了阿里的
大数据
系统的产生,演化
和
设计思路。是
大数据
进阶的经典书籍。
本篇
读书笔记
会按照《
大数据
之路》的目录结构,记录我在阅读这本书的时候,
结合电商业务场景的思考
第一章:总述
概述:本章由马云的"人类已进入DT时代",所有行业都离不开数据的赋能切入,简单介绍了阿里的,数据采集层,数据计算层,数据服务层,数据应用层...
强烈推荐
大数据
开发
工程师读一读阿里的《
大数据
之路》这本书。读完这本数之后会对整个
大数据
体系有一个更深入的理解。目前
读书笔记
还在更新中。关注公众号回复 802 可获取 pdf。
下面给出书籍的目录
和
读书笔记
。