Amundsen中怎么实现数据血缘功能

本文主要介绍"Amundsen中如何实现数据血缘功能",希望能够解决您遇到有关问题,下面我们一起来看这篇 "Amundsen中如何实现数据血缘功能" 文章。

新的概念

Lineage:这是一个术语,代表了数据流的传递过程,从一个实体到另一个实体。特别是ETL的过程,重点关注表到表,列到列的数据流转过程。

Upstream:数据从上游流向下游,Upstream就代表着当前的数据来源。

Downstream:代表了使用了当前数据的相关实体。

 

表级别

页面分为Upstream以及Downstream两个选项卡。

每个选项卡将包含从中继承或使用数据的表的列表。这允许用户以非常简单的方式查看。

Amundsen中怎么实现数据血缘功能

 

列级别

和表级别相似,可通过扩展列的元数据来查看。

Amundsen中怎么实现数据血缘功能

当然这还只是初步的设计,未来可能会有更多的变化,我们会持续关注~

附一张Apache Atlas此功能的实现图

Amundsen中怎么实现数据血缘功能


关于 "Amundsen中如何实现数据血缘功能" 就介绍到这。希望大家多多支持编程宝库

本文主要介绍"Namespace的作用是什么",希望能够解决您遇到有关问题,下面我们一起来看这篇 "Namespace的作用是什么" 文章。Namespace 概念Namespace 是 Linux 内核的一 ...