缘奇科普-奇怪的知识又增加了

怎么才有数据分析思路?

原创版权 未知作者:缘起 字体大小选择: [ ]

 
  数据分析,要带着目的去推进。
  
  我们需要将数据分析待解决的问题按照 MECE 法,以「不重叠、不遗漏」的方式将数据分析的目的拆解成多个子问题,再通过我们标注出的数据情况来逐个儿回答各个子问题。
  
  今天我以徒弟阿聪做的一个短视频数据分析为案例,来为大家展示下如何做出一份合格的数据报告。
  
  数据分析的基础是标注、清洗,阿聪基于清洗后的数据给我讲解了自己的分析思路,从综合视频网站(优酷、爱奇艺、腾讯视频)、短视频应用(美拍、秒拍)再到垂直领域视频应用(抹茶美妆、花卷)的短视频内容方都有涵盖,整体结构清晰明了。
  
  「好的,产出结果后约个组内会议吧,可以跟大家同步一下数据分析的结果。」当天下午,阿聪带着准备好的数据分析 PPT 开始向大家同步:第一页,综合视频网站的数据表格;第二页,垂直视频引用的数据表格;第三页,搞笑、体育、娱乐视频播放量,占比对比的表格;第四页,几大主要 MCN 和内容方的播放量、占比对比的表格;第五页,……表格、表格,都是数据表格,讲的人脑子里清楚,可没有背景知识的观众甚是糊涂,一个十页的 PPT 生生讲了一个小时。
  
  好不容易散会了,阿聪主动拽住我问道:「阿呆老师,我明明整理得挺清楚的,可是为什么大家都没搞明白呢?」「产品经理面向用户,强调的是站在用户的角度来考虑问题。你这份数据报告啊,从分析层面来看是合格的,但是从表现的层面来看,可是不合格产品。」我说道,「好看的皮囊太多,有趣的灵魂太少。」对于数据分析而言,我们既需要通过完整的分析逻辑支撑,使得数据分析的灵魂有趣,也要通过恰当的表现形式做出一个好看的皮囊,让受众能够更快、更准确地明白我们想要传递的意思。
  
  数据分析的灵魂数据分析,要带着目的去推进。
  
  我们需要将数据分析待解决的问题按照 MECE 法,以「不重叠、不遗漏」的方式将数据分析的目的拆解成多个子问题,再通过我们标注出的数据情况来逐个儿回答各个子问题。
  
  以本次的短视频覆盖分析为例,我们要解决一个父问题、两个子问题:我们自有业务对于视频内容的覆盖情况是否完善?
  
  如果覆盖完善的话,我们的类目表现如何?
  
  如果不完善的话,需要补充哪些品类和哪些内容方?
  
  围绕主要问题,我们开始对题干进行拆解:覆盖情况 → 类目的覆盖、内容方的覆盖。
  
  类目表现 → 类目下内容提供方的数量丰富度和内容丰富度;类目内容在不同平台上的播放和互动情况。
  
  内容方表现 → 内容方在不同网站的收录情况,在不同网站的表现情况。
  
  我们可以将自身服务中所覆盖的内容方与标注出的结构化数据做对比,得到父问题的答案:如果我们自身服务能够覆盖各大平台各类目下的 TOP20~50 的内容方,就可以说内容覆盖基本合格了。
  
  如果某些类目没有覆盖,则需要看一下这些类目是否需要覆盖,是否能覆盖。
  
  比如,主要面向男性的视频服务,美妆类内容是不需要覆盖的。
  
  比如,NBA 这样重版权的体育内容,是需要,但是不能覆盖到的。
  
  在得到父问题的回答后,我们可以进一步拆解子问题的答案。
  
  1. 覆盖完善的类目,表现如何?
  
  首先,要看这个类目的播放规模和主要竞品的对比。需要指出的是,播放规模同 DAU(日活跃用户)相关。一个 100 万 DAU 的产品,去和优酷比绝对播放量是无意义的,需要归一化后才具有可比性。
  
  其次,要看类目下典型节目的互动表现。由于各家平台播放数注水情况不一,有字数评论这样门槛较高的互动数据才相对可信,同样,「互动数/播放量」能够帮我们更好地对比这个类目在自家平台和其他平台上的表现情况。
  
  2. 对于覆盖不完善的情况,需要补充哪些内容方?
  
  综合竞品网站的数据,我们可以统计出哪个内容方是在多平台上都有良好表现的。优先引入这样的内容方,一方面,能够让我们快速覆盖优质内容,对用户进行口味的验证;另一方面,可以通过与优质内容方的沟通,获悉其他平台的动作。
  
  如上提供的是一种分析的逻辑线。不同的人会有不同的逻辑拆解,最终都需要满足能够逻辑自洽的要求。
  
  当然,在核心目标以外,我们还会基于数据发现其他题外的现象,如:平台表现出了很强的内容品类倾向性:某家平台上的美妆类短视频整体播放量比较高。
  
  某些内容品类的粉丝数和评论数(互动量)显著高于其他品类,某些平台上的粉丝互动规模高于其他平台。
  
  从全网来看,不同视频品类的消费量呈现出影视综艺类 > 体育赛事类 > 歌曲 MV 类的特点。
  
  全网单日播放量过千万的头部内容提供方共有几十家。
  
  此外,我们还可以进一步提出自己的思考:内容品类倾向性究竟是用户偏好使然,还是平台利益使然?以美妆类视频为例,是不是因为其可变现属性,从而获得了更多的流量倾斜?
  
  粉丝规模和互动规模对于内容创作者一定是正向激励,那么,互动量高的平台,内容出品方是否表现出了更高的参与度(如内容更新频率和粉丝的互动等)?
  
  自身平台的品类消费情况和全网呈现出的品类消费情况是否匹配,有没有明显的短板类目需要弥补,又或是有明显的长板类目可以关注?
  
  全网的头部内容提供方,目前是否已经覆盖完整?综合品类特点和内容提供方的排名,是否可以拟定出内容提供方的引入顺序?
  
  这些思考,应该视作数据分析的拓展结论而非核心结论。
  
  数据分析的皮囊在阿聪的这个案子上,数据分析是没有问题的,但是分析结果呈现出了大问题。我们会进一步拆分为:PPT 或文档的组织顺序和数据的不同图表诠释方式。
  
  1. PPT 或文档的组织顺序基于个人经验,我会推荐新人参照「麦肯锡写作法」来完成 PPT 或文稿,这一写作法的基础思路如下图所示。
  
  首先,说明结论。
  
  其次,分述能够佐证结论的几个主要理由。
  
  再次,在每个主要理由之下,详述支撑这个理由的案例。
  
  以这个 Case 为例,可以拆分为如下结构,然后按照深度遍历的方式来组织 PPT。
  
  2. 数据的不同图表诠释方式另一个值得注意的问题是,尽管数据最能客观地描述现象,但人们对于满屏的表格和数字是不敏感的,可以适当用颜色和粗体标明数字中需要被关注的部分。
  
  而在图表之上,用折线图、饼图等图表来呈现信息更能够为人接受。不同的图表有不同的应用场景。
  
  柱状图和条形图:适用于较小规模的二维数据集(每个数据点包括 x 和 y),且只有一个维度需要比较的情况。两种类型的图表都可以用来表达项目间的对比状况。其中,柱状图更适合反映在时间维度上的对比,比如,最近半年以来搞笑类和音乐类视频在平台上的逐月播放量情况。条形图更适合放大信息之间的对比程度。
  
  折线图:适合二维的大数据集,用来体现趋势、频率,还常用于表现多个二维数据集之间的比较。比如,展示 Papi 酱和何仙姑夫在同一视频网站上某月的播放情况。
  
  饼图:适用于子项目不多的情况,可以显示不同子项目的比例和权重。用户可以更直观地看到哪些子项目是更重要的。比如,每个网站的视频分类内容占比可以用饼图表示。
  
  散点图:多用于表现不同数据源之间的相关性特点。
  
  阿聪若有所思地点点头,对我道:「阿呆老师,我调整一下。」重新整理后的资源数据分析 PPT,描述如下:目录页:罗列整份数据分析的大纲。
  
  前言页:交代了背景,我们做数据抓取和标注是为了了解全网的视频资源情况,以此来判断我们是否需要做资源的补充。
  
  结论页:列出了中心思想,目前我们的产品数据在类目覆盖上完善,但部分类目需要补充内容方。
  
  子结论页:类目覆盖相对完善。
  
  ■ 用饼图表明了抓取参考的几家视频网站,占据了视频网站消费大盘的 80%,具有足够的可信度。以表格形式罗列了整理出的主要视频分类,并说明我们的服务将这些视频分类都已经覆盖了。
  
  ■子结论页:部分类目需要补充内容方。
  
  ■ 用百分比条形图逐个儿分类,表明我们的服务已经接入的内容出品方 VS 全局热门的内容出品方,在体育、动漫、创意、鬼畜四个视频分类上,我方对头部内容出品方的覆盖率不足 60%。
  
  ■ 以词云的方式展示我们的用户画像特点和鬼畜视频用户的特点,通过对比,说明二者受众重叠较小,故鬼畜视频属于不需要覆盖的视频分类。
  
  ■ 通过列表详述需要覆盖的两个分类的后续动作:体育和动漫重版权,短期无法提高覆盖率;创意类视频可进一步提升覆盖率,按照播放量从高到低的顺序对内容出品方进行排列。
  
  「这次调整完就清晰多了。多积攒分享、汇报的经验,才能在跨部门沟通时更好地应对挑战,更好地传递自己的意图。」熟识核心报表,更好地认知产品。
  
  「阿呆老师,我要报一个大漏洞。」一大早,阿聪就捧着手机来找我了。
  
  「会员页面购买按钮失灵,对吧?」我道。
  
  「你怎么知道的?」阿聪惊讶道。
  
  「喏。」我指指屏幕上的监控图,「实时会员购买量跌了 1/8,触发警报了,研发已经定位了,是由新上线的组件导致的,正在回滚修复。」「哇!」望着显示器上繁复的曲线图和指标,阿聪由衷地赞叹道,「太高科技了吧,这么多指标,一定得有技术背景才读得懂吧?」「错!流量图是每个产品经理的入门必修课。选定指标、监控指标异常,应该是产品经理驱动研发执行的,而不是研发自驱完成的。」我道。
  
  「好吧,阿呆老师小课堂开课了。」阿聪耸肩道。
  
  用户是产品优劣最终的裁判,只有充分了解服务对象的行为特点,才能辅助我们更好地认知和改进自身产品。
  
  个体对象的特点,可以通过用户访谈、问卷投放的方式来收集;群体对象的特点,则势必需要通过统计服务来获得更大规模的数据量,基于此来了解用户是怎么使用我们产品的,是否符合设计的预期,并酌情调整产品设计,进行引导。前面的章节,在数据标注和数据分析一环,举得更多的是竞品调研、市场摸底的例子,这一节则更多是向内而观,来看看如何通过数据剖析自家的产品。
  
  业务核心指标监测从初识产品到逐步上手改造优化,产品经理对于自身产品越来越熟悉,越来越心里有数。这里所说的「数」,就是业务核心指标的「数」。
  
  如果提及一款应用要关注什么指标,「日活、时长、留存」自然是标准答案,但又不全对。这三个指标其实是所谓的「结果指标」,是依赖产品服务内不同的环节协作后交出的最终答卷。对于各个子业务线,如果只看着全局的那个结果目标,必然会导致传导链条太长无法发力(比如,上一个功能是否就能影响留存),不如先聚焦自身子业务线的目标,才好有的放矢,知道如何下手。
  
  那么,不妨首先从自己的业务着手,看看业务想要达到的目标愿景是什么,如何用少数几个数据指标来衡量目标的达成程度。
  
  以短视频 App 的内容建设为例,想要达成的目标是平台能够囊括用户感兴趣的内容,让内容生产方都选择自家平台作为内容分发平台。那么,为了衡量这个目标,可以参考全局指标:品类覆盖率、各品类头部内容方覆盖率,日常指标:每日新增的视频内容、有发文行为的内容方等。
  
  而对于短视频 App 的分发业务来说,想要达成的目标就是让用户在应用内更多地消费感兴趣的内容。那么衡量这个目标,最直接的指标就是人均满意点击规模和人均时长规模。
  
  作为产品经理,只有熟知自身业务线的核心指标是什么,日常波动范围是怎样的,才会对所执行的产品运营动作有把握,有效评估各个动作的效果。除了业务的核心指标之外,可以进一步构建外围辅助指标,以一周一次的频率去监测,帮助构建起更立体的业务生态。
  
  构建一张流量分布图如果说核心指标关注的是结果的点,那么流量分布关注的就是线和面。流量图的本质是记录了特定时空下整个产品内的用户行为流,我们可以将其拆分为空间流量分布和时间流量分布。
  
  产品场景就像一条河,用户从启动主屏开始,按着自己的使用习惯在不同的页面和功能间进行流转,形成了所谓的用户路径。空间流量分布就是为了描述用户在应用内是如何流动的,即哪一个场景是用户使用的主场景,在各个场景中,用户对于各个功能的使用情况是怎样的。以简书 App 为例,应用的前两个 Tab 分别为「首页」和「关注」。
  
  我们选取一周的平均数据,能够得到如下流量图(数据仅用来举例):在上图中,我们将入口拆分为一级入口和二级入口,并对应标注了各级入口的用户数据和总曝光情况。了解了流量的空间分布,能够更好地指导我们优化产品设计。
  
  对于新功能来说,你需要将其植入大的应用场景,才能在早期获得比较客观的应用内启动流量。比如,我们希望加强用户间的关注关系密度,可以从日活规模最大的二级入口「推荐」入手,向用户推荐「你关注的某某最近关注了某某」,从而获得更大的收益面。
  
  对于已有功能优化,你同样需要知道目前用户的使用特点是怎样的。占据了更好位置的功能,是否提供了更大的使用量?还是没有物尽其用,给用户造成了认知障碍?比如,上一页的图表中,你会发现「小岛」Tab 尽管排在了「专题」前面,有更高的日活数,但是其总曝光数是小于「专题」的。这是为什么?可能是因为用户的消费习惯中,专题的占比较高;也可能是专题作为一个收录容器,内容有更高的更新频率,从而带来了更大的消费价值。
  
  时间流量分布空间流量分布其实是时间流量分布的一个切面。在空间流量图上,我们关注的是业务的具体逻辑。在时间流量图上,我们更关注各个数据指标(如特定功能使用量)的变化情况等,从而形成了日常的监控报表。
  
  通常,时间流量图具有潮汐效应,如每周一到周日有固定的波动幅度;在节假日或系统故障的情况下,会出现较大幅度的涨跌。
  
  个人通常建议新入门的产品经理去关注空间和时间流量分布,这些数据会逐步构成产品经理对于业务特点的理解。在数据波动发生时,才能更快地定位问题所在,并按图索骥,找到解决方案。
  
  举个例子,某小时订单数据环比跌了 20%,那么我们需要同时从内部和外部找原因:·我们可以首先回溯订单产生的几个主要的上游途径(以及当时的日活数据),观察这几个上游渠道是否发生了流量下跌。
  
  ·如果上游渠道没有发生流量下跌,那么很可能是服务稳定性问题,那就该给研发打电话了。
  
  如果上游渠道发生了流量下跌,那么就要考虑一下当天是否发生了什么别的事情导致应用的日活数据下跌了。(比如发生了什么热门事件,比如哪个地方断网了,这么坑的事情,还真的遇到过。)
  
  「哦,原来监控数据和流量图有这么多学问啊。」阿聪道。

发表评论 (已有 条评论)

  

评论列表

    快来评论,快来抢沙发吧~