使用 Apache Atlas 进行数据治理 (2)

Atlas 允许用户为他们想要管理的元数据对象定义一个模型。该模型由称为 "类型" 的定义组成。被称为 "实体" 的 "类型" 实例表示被管理的实际元数据对象。类型系统是一个组件,允许用户定义和管理类型和实体。由 Atlas 管理的所有元数据对象(例如Hive表)都使用类型进行建模,并表示为实体。要在Atlas中存储新类型的元数据,需要了解类型系统组件的概念。

Types

Atlas中的 "类型" 定义了如何存储和访问特定类型的元数据对象。类型表示了所定义元数据对象的一个或多个属性集合。具有开发背景的用户可以将 "类型" 理解成面向对象的编程语言的 "类" 定义的或关系数据库的 "表模式"。

与 Atlas 本地定义的类型的示例是 Hive 表。 Hive 表用这些属性定义:

Name: hive_table MetaType: Class SuperTypes: DataSet Attributes: name: String (name of the table) db: Database object of type hive_db owner: String createTime: Date lastAccessTime: Date comment: String retention: int sd: Storage Description object of type hive_storagedesc partitionKeys: Array of objects of type hive_column aliases: Array of strings columns: Array of objects of type hive_column parameters: Map of String keys to String values viewOriginalText: String viewExpandedText: String tableType: String temporary: Boolean

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zwdzfw.html