马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
前一段时间看到几个金融客户的数据管控(治理)平台邀标书,功能需求都包括:元数据管理、标准管理、质量管理、数据模型管理,其中模型管理的功能如下: 数据模型导入; 数据模型编辑; 数据模型展示; 数据模型导出。
一、数据模型管理概述 数据是对客观事物的数字符号表示,模型是对现实世界的抽象。数据模型是对现实世界的数据特征的抽象。数据模型按不同的应用层次分成概念数据模型、逻辑数据模型、物理数据模型三种类型。 数据模型是伴随着关系型数据库发展起来的,先后有s-designer、Powerdesigner、ERWin等建模工具。这些建模工具都具有上面的四项功能,部分产品还支持版本比对、数据库反向工程。 十多年前,盗版的建模工具几乎是每个项目组,特别是模型设计人员的标配软件。最近几年,建模工具在各项目组逐渐绝迹,在一些IT合规要求较高的银行,明令禁止使用上述建模工具。原因大致有下面几个: 太贵。 作用有限。建模工具最大的特点是图形化,可以直观地展示模型的整体性及相互关系,这点对一个全新系统或新人特别有吸引力。同时,当今全新系统越来越少,大多是已有产品基础进行定制化开发。此时,对于熟练老手来说,数据模型已经烂熟于心,模型工具就有点鸡肋的味道。 建模工具的天然局限。数据模型包含:数据结构、数据操作及完整性约束条件三要素。站在加工的视角,数据表是数据流的“存储节点”,节点之间的数据加工规则设计同样重要。目前市面上的建模工具主要关注存储节点的数据结构,而对数据加工规则无能为力,只好推给了开发环节,推给了程序员,这自然造成模型、ETL的隔离,为以后的BUG、变更混乱留下了隐患。 EXCEL的广泛使用。当前越来越多厂商采用EXCEL类工具进行模型管理及数据加工规则管理,同时,利用VAB等程序,把模型及加工规则自动生成代码。
二、数据治理“新平台” 金融业内开展数据治理有十多年历史,而治理平台也早打上了“数据标准、元数据、数据质量”三大功能模块。 大多治理项目的咨询和推进,最后都落在治理平台上。所以,平台常常成了治理效果不显甚至失败的背锅侠。 这两年,数据治理随着数据时代的到来而又重新火热起来。同时,又有几家厂商杀入治理领域,推出了新平台。有意思的是,这些厂商不约而同地宣扬“基于数据模型的治理平台”, 具有下面新功能: 显然,这些所谓的新平台并不新,和十年前的建模工具相比,主要是强调了模型管理体系。 之前的建模工具在国内水土不服,“新治理平台”的实际效果也很难让人乐观。 三、理想的数据治理治理平台 数据治理之前的不成功,本质原因在于治理体系的不完整、不深入。成功的数据治理应该和数据开发、数据服务彻底融合,不仅建立组织流程类管理体系,更要完善长效治理机制,以及相关工具平台以提高治理效率。 传统的标准、质量、元数据三大模块并不过时,而是缺少一个抓手将三者串联起来,这就是数据资产的作用。 理想的治理平台应该能够回答下面的问题: 我有什么数据? 这些数据在哪里? 这些数据的质量如何? 这些数据从哪里来? 又到哪里去?
同时,治理平台在生命周期过程中,不断与其他平台交互,比如软件开发平台: 显然,治理平台就是一个协调平台,而不是一个替换建模平台、分析设计平台、开发测试平台的大杂烩平台。 四、立场 治理涉及企业方方面面的责权利,远比普通管理问题复杂,遑论依靠一个**平台来完成企业的数据治理蓝图。 但市场上充斥各种声音,每个厂商都有立场,都会选择性地强调一部分,忽略一部分,遮盖一部分。 另外,这也是我选择个人公众号的原因,初衷就是采用客户的视角,尽量保证一定的独立性和客观性。 作者:李杰林举 来源:数据管理及应用
|