马上注册,结交更多数据大咖,获取更多知识干货,轻松玩转大数据
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
一、文章概述 从实践角度出发,如果想把公司的大数据搭建完善,数据治理这一步至关重要,这里面涉及到了架构、安全等诸多方面。不过,起步阶段是不断提升数据质量,其中数据指标是数据质量建设中的重中之重。指标的建设只是走完数据治理的第一步,为了确保指标库能够保持长期可用,必须有一套严格个管理和执行流程,否则建设的结束就意味着混乱的开始。
二、报表梳理
指标的一个直观的表现形式是报表,公司的报表可以说是浩如烟海。首先我们可以根据报表的使用率、查看报表人员性质、同化报表值等诸多方面找到核心报表链接。结合产品经理、数据分析师、运营经理等诸多角色会商,定义出“第一关键指标”。第一关键指标这个名词来源于《精益数据分析》第六章。
对于产品经理来说,最关键的指标是什么?不同的员工对第一关键指标的认知不一样,甚至有些员工对第一关键指标没有概念。同时,伴随着各个部门报表系统的指标越来越多,指标口径不尽相同,数据重复计算等问题不断涌现。尤其是大家对第一关键指标不明确,并且大家朝着自己的方向发力。 第一关键指标是指公司在每个发展阶段,都有一个现阶段高于一切、需要集中精力做的数据,这就是“第一关键指标”。当然,随着公司业务的发展,这个指标会发生变化。
三、指标整合 埃里克·莱斯提出了驱动创意增长的三大引擎:黏着式增长引擎、病毒式增长引擎、付费式增长引擎。但是他也提示创业者,最好在一个阶段只关注于某一个引擎。 第一关键指标可能是KPI、销售额、DAU、用户留存等。第一关键指标法和绩效管理中的KPI等理念比较接近,就是要寻求现阶段整个公司最需要关注的指标,以此加大火力想目标前进。 在APP业务疯狂发展阶段,留存分析直接能反应用户等活跃度,帮助公司证明APP能够吸引用户。 在APP营收阶段,例如像新浪微博、支付宝、微信这种产品形态已经相对成熟,公司的关注点聚焦在如何快速盈利,关键指标主要是LTV(Life Time Value,生命周期总价值)、CAC(Customer Acquisition Cost,用户获取成本)、渠道分成比例等。 各类的报表以及相关的表达方式千差万别,梳理之前应该给出一个描述指标的基本框架。包括大类、子类、维度、归属、命名规范等等。曾经由于架构漏了一些要素导致返工,因此这个顶层设计一定要做好。 命名规范:业务限定词+业务名称+量值限定词+量值描述。 归纳总结指标结构,以业务为基础创建原子指标,再确定原子指标等几大属性。
业务分类:根据报表业务体系梳理,例如用户、流量、运营等。 指标维度:指标的详细层次,例如区域维度、渠道维度、路径维度等。 数据粒度:指标的统计周期、包括日、月、年等。 衍生指标:基于指标等计算指标,例如同比、环比、目标值、完成率等。
四、指标库建设 1 信息维护
1.1 指标定义
信息维护主要包括业务方的指标定义(业务方&数据RD) 需求方:指标缺失 需求部门 | 需求方&Leader | 指标大类 | 指标名称 | 指标描述 | 原子指标 | 状态 | 原因分析 | 详细方案 | 前置条件 | 投入成本 |
|
|
|
|
|
| 缺失 |
|
|
|
|
数据RD维护后的指标关键字段 需求部门 | 需求方&Leader | 指标大类 | 指标名称 | 业务描述 | 原子指标 | 计算口径 | 脚本名称 | 出数时间 | 波动范围 | 开放负责人&Leader | 版本上线时间 | 状态 |
|
|
|
|
|
|
|
|
|
|
|
| 下线/在用/不准确 |
1.2 指标维护 针对指标的大类、小类、指标名称、指标标签进行维护;考虑到不同的数据依赖源可以输出相同指标值,需要对脚本进行维护,并上线脚本进行多种结果进行匹配(数据质量监控)。
1.3 指标查询 主要是针对指标的大类&小类&指标名称&指标标签进行查询。
2、指标开发 2.1 脚本配置 保证脚本的可执行,另外保证数据库中存在多个版本的脚本,方便追溯。
2.2 运行调度 定时输出指标报表,业务方以及RD同学,进行查看。
2.3 运行监控 和数据报表的数据进行匹配,做数值上质量监控。以促进指标库长期可用。如果数据指标和报表长期不一致,或者关键报表中不包含的指标需要定期维护。包括但是不限于(新增、下线、维护)
3、生命周期管理 3.1 指标上线 3.2 指标下线 3.3 使用评估 需要出评估报告 3.4 版本管理 指标本身需要有版本控制
4、质量管理 4.1 相关性检查 4.2 脚本校验 4.3 阈值设置 4.4 监控预警 作者:清和 来源:大数据漫路求索
|