数据血缘是指数据的全生命周期中,数据从产生、处理、加工、融合、流转到最终消亡,数据之间自然形成一种关系。
其记录了数据产生的链路关系,这些关系与人类的血缘关系比较相似,所以被成为数据血缘关系。
比如,数据A经过ETL处理生成了数据B:
- 那么我们就说数据A与B有着血缘关系,且数据A是数据B的上游数据,同时数据B是数据A的下游数据。
按血缘对象来分,可分为系统级血缘、表级血缘、字段(列)级血缘。
不管是结构化数据还是非结构化数据,都必定存在数据血缘关系。
数据血缘
如果文章对你有帮助,欢迎点击上方按钮打赏作者!
如果文章对你有帮助,欢迎点击上方按钮打赏作者!