数据的创造是由用户和其业务决定的,他们是创造数据的甲方。数据库承载了数据的管理职责,是否数据库系统也可以参与到数据的创造环节中来呢?
在TDSQL团队看来,全时态这一概念,正是数据库系统参与到数据创造环节的最佳契机。数据库系统为数据赋于了事务时态、赋于了DML操作过程中的事件源,甚至可能为数据之间赋于关联关系(如下图中的5W、Lineage),这使得数据库系统也成为了数据的创造者。
这就是我们、TDSQL团队在技术和业务背后的驱动要素:“为数据赋能”的理念。
在“为数据赋能”这个理念的支撑下,基于TDSQL的T-TDSQL因此而诞生。为数据赋能,因而能让数据拥有更多的价值,让数据库变成数据的生产者,参与数据的创造。下图表明,为数据赋能,T-TDSQL从5W角度,让数据拥有了时间(双时态,WHEN)、地点(存储的历史表,WHERE)、人物(用户ID,WHO)、对象(全态数据,WHAT)、原因(DML等操作,WHY)等要素,使得数据不再仅仅是用户使用CREATETABLE语句所创建的数据,而是包含了多种由数据库系统所创造的数据、且在数据的生命周期中融入了数据历史使其富有纵深的有价值的全部数据。
有了这些,数据库系统能够更加主动地追溯数据的历史,推演数据的变迁,预测数据(世界)的未来。
六、致谢本项目在腾讯立项,研究内容和实现过程得到中国人民大学教育部数据工程和知识工程重点实验室和腾讯公司的参与和支持,特别向项目参与人、支持者致谢。
为从思维、理念、技术等多个角度为本项目做出贡献的人致敬!
[1]不受时限、任意对账:对账的SQL语句中指定快照差即可,FROM子句中涉及的表名等不发生变化,即对账使用的数据源没有改变,故不影响对账流程。
[2]试算(Spreadsheet)为会计程序中其中的一个流程,它简单的定义就是在检查日记簿的所有交易分录的借方、贷方金额是否有错误之情形。但是在做试算检查时,应每笔交易分录纪录后即做此一动作。
[3]试算(Spreadsheet)为会计程序中其中的一个流程,它简单的定义就是在检查日记簿的所有交易分录的借方、贷方金额是否有错误之情形。但是在做试算检查时,应每笔交易分录纪录后即做此一动作。