Amundsen中怎么实现数据血缘功能
本文主要介绍"Amundsen中如何实现数据血缘功能",希望能够解决您遇到有关问题,下面我们一起来看这篇 "Amundsen中如何实现数据血缘功能" 文章。
新的概念
Lineage:这是一个术语,代表了数据流的传递过程,从一个实体到另一个实体。特别是ETL的过程,重点关注表到表,列到列的数据流转过程。
Upstream:数据从上游流向下游,Upstream就代表着当前的数据来源。
Downstream:代表了使用了当前数据的相关实体。
表级别
页面分为Upstream以及Downstream两个选项卡。
每个选项卡将包含从中继承或使用数据的表的列表。这允许用户以非常简单的方式查看。
列级别
和表级别相似,可通过扩展列的元数据来查看。
当然这还只是初步的设计,未来可能会有更多的变化,我们会持续关注~
附一张Apache Atlas此功能的实现图
关于 "Amundsen中如何实现数据血缘功能" 就介绍到这。希望大家多多支持编程宝库。
本文主要介绍"Namespace的作用是什么",希望能够解决您遇到有关问题,下面我们一起来看这篇 "Namespace的作用是什么" 文章。Namespace 概念Namespace 是 Linux 内核的一 ...