一篇蛮有思想的文章,转发一下。
作者简介
林峰,蚂蚁金服数据可视化团队负责人,AntV 产品架构师,前百度 ECharts 创始人。
引子
“
用「道术法器」为题写这个分享有着极大的风险,一是这个被各种领域用烂的话题很容易被视为套路水文,二是老祖宗传承下来的这个哲学理解蕴含着大智慧,害怕自己理解尚浅,不仅对这个哲学理解尚浅,对数据思维的理解也尚浅,何能有深刻的感悟呢?但话说回来,so what?每一份沉淀都是一种成长,欢迎指正。
”
图片来自网络
道法术出自老子《道德经》,道,是规则、自然法则,上乘。法,是方法、法理,中乘。术,是行式、方式,下乘。“以道御术”即以道义来承载智术,悟道比修炼法术更高一筹。“术”要符合“法”,“法”要基于“道”,道法术三者兼备才能做出最好的策略。
—— 百度百科
知乎:中国哲学概念“道、法、术、器”怎么理解?
网络上有大量关于道术法器的解读,我就不转摘了,用“御术”同学的花名由来体会一下:
道术法器。天道崩而地裂陨,仁道灭而妖魔起,以道御术,御术之人御水行医,御金可防,御火能攻,借摧星搬月之力,举苍天而行大道,救九州于业火中……
—— 御术
天崩而地裂、仁灭则妖起……
此为道,自然法则,规律,常识,内在客观逻辑,……
御水行医,御金可防,御火能攻……
此为术,行式、方式、技术,技能,本领,……
借星月之力,举苍天行大道……
此为法,法理,方法论,策略,套路,……
水、金、木、火、土……
此为器,工具,……
道生一,一生二,二生三,三生万物
是的,道术法器间的关系貌似跟阴阳冲气没啥联系,或者是我还未悟到,这个纯属标题党,但道术法器间确实有着紧密的本源关系:
道法自然道生术,以道御术道生法,因道全法器为道之具象
数据思维用道术法器怎么讲?别急,容我慢慢道来,但入主题前先得过一个基础的数理统计概念:回归分析。
回归分析
在统计学中,回归分析(regression analysis)指的是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。
—— 百度百科
图片来自网络
在数据分析中,回归分析是一种预测性的建模技术,它研究的是因变量(目标,y)和自变量(预测器,x)之间的关系,通过对大量历史数据的数学处理后拟合出一个相关性较好的回归方程(函数表达式,f),并加以外推,用于预测今后的因变量变化的分析方法。
道法自然
“人法地、地法天、天法道、道法自然”,那数据思维的“自然”是什么?
数据源于事实,商业环境中最重要的事实则是业务,所以商业环境中数据思考的“自然”正是业务思考。而思考的目的是为了获得相关性、因果性的洞见,从而带来引领业务增长的行动指引,这正是回归分析的洞见。北大光华管理学院商务统计与经济计量系主任王汉生教授,狗熊会公众号创始人“熊大”,他对数据思维的解读为在回归分析思维指导下使用回归分析技术实现“数据分析”到“商业价值”的转变,着实是学术理论与产业实践的真知灼见。所以,窃以为所谓数据思维的“道”正是业务的回归分析思维,大道至简,然而知易行难。
图片来自《精益数据分析》
回归分析是一种思维方式,正如《精益数据分析》中所描述各种商业模式的数据分析模型一样,深入业务模型理解的过程正是把“业务问题”定义成“数据可分析问题”的过程,在乱成一锅粥的业务问题中准确定位业务的核心诉求(因变量 y),并找到影响核心诉求的相关因素(自变量 x)。上图每一个指标如“消费率”、“免费用户流失率”本身既可以是核心诉求(因变量、目标,y),也可以是更高目标里的相关因素(自变量、预测器,x),这过程充分体现了数据分析者对业务的洞见。
道生术,以道御术
“有道无术,术尚可求也,有术无道,止于术”,既然数据思维的“道”正是业务的回归分析思维,那么数据思维这种可御之术是什么?
道生术,道的层面,回归分析是一种思维方式,而术的层面,回归分析是一种可以运用的数据分析技术:
回归分析按照因变量的多少,分为一元回归和多元回归分析;按照自变量和因变量之间的关系类型,分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析……
—— 百度百科
之于业务理解的回归分析技术正是数据思维的术,回归分析技术可以帮助我们探寻获得业务中纷繁指标(核心诉求与相关因素)间千丝万缕的显性或者隐性关系(函数、回归模型,f),洞悉规律从而“操控”业务增长。
图片来自网络,《增长黑客》
“操控”!是的,这是坑,老生常谈 相关性 ≠ 因果性 ,但我们经常会混淆这一对概念,甚至有些时候连相关关系都不算的两个事件,由于它们常相伴发生,我们便迷信地以为两者具有因果关系,闹下不少的笑话。统计学研究中包括了大量的相关关系,其中只有极小一部分非常稀有的因果关系,但是因果关系的重要性依旧无法取代。
产品体验上的方方面面都有可能影响到业务的发展,大到定价、核心功能,小到一句话术、一个按钮的尺寸,如何找到因果性规律,如何量化这些大小不同的因素对业务的影响?这里面或许存在一些通用方法可以跟大家一起探讨。
道生法,因道全法
《黄帝四经》开篇曰“道生法。法者,引得失以绳,而明曲直者也。故执道者,生法而弗敢犯也,法立而弗敢废也。”韩非说:“因道全法,君子乐而大奸止。澹然闲静,因天命,持大体。”且不言黄老学派与法家本体论,以天道推演人事为百家公认的原则,那何为数据思维之“法”?
法为法理,方法论,策略,讲人话,“套路”!实施数据思维的“套路”是什么?始于“道”为业务的回归分析思维,窃以为实施数据思维的“套路”需要:深入业务理解,获得可量化的业务指标以及指标间的相关性、因果性假设,产生可影响业务的行动指引,回到业务中加以验证,实现“数据分析”到“商业价值”的转变。在这个“套路”过程当中可归纳为最重要的四个关键步骤:
业务理解:从业务中来,找到业务链路 F’上最重要的哪些 Y’ 与 X’;
量化思考:洞见最重要的哪些 Y’ 与 X’ 背后可量化的的 Y 与 X,完成业务诉求的量化转换;
逻辑推理:在业务链路 F’ 上把 Y 归因至 X 得到逻辑合理的 F,完成业务逻辑的归因转换;
行动建议:到业务中去,给出可控 X’ 的行动建议,执行并验证 Y’ 的变化。
实施数据思维的“套路”是个整体的方法框架,在执行这方法的每一关键步骤里,有一个很有用的数据分析技巧,“细分看对比”。常言道数据分析三板斧“看趋势、看分布、看对比”,窃以为只有一条,“细分看对比”,这条技巧几乎可以幻化出我们常用的所有数据分析方法:
时间维度上的细分看现在与过去的对比就是趋势;类目维度上的细分看类目间的对比就是分布;同期群分析(Cohort Analysis)正是各种维度细分下看对比的抽象方法;A/B测试(ABTest)的结果分析则是细分看实验组和对照组的对比;……
细分看对比之所以有效,是因为细分更易于产生行动指引,优秀的数据洞察一定包含行动建议,这是最为重要的一步但也是最常被忽略的一步。从业务中来,完成业务诉求的量化转换与业务逻辑的归因转换,得到可回到业务中去的行动建议,实现从数据分析到商业价值的转化谓数据思维之“法”,从业务中来,回到业务中区,因道而全法。
器为道之具象
“形而上者谓之道,形而下者谓之器”出于《易经·系辞》,故有器为道之具象,大道无形而器有形,数据思维的“器”为何物?
器为工具,抽象的数据思维要具象为可操作的数据工具并不是一件容易的事情,对数据思维的不同理解会造就不一样的数据产品,特别对于一个数据工具的产品经理来说,如果把数据思维理解为数据分析的理论与方法,则可能成就一个功能强大的分析工具,但不贴具体业务场景就无法给出行动建议,无谓对错,在我看来只是数据思维上的“大题小做”与“小题大做”,各有所属。
求索
我们正在尝试具象我们对数据思维的理解,在一个我们擅长的数据域内提供有行动建议的数据分析服务。
我们相信「体验科技」,相信人机交互过程中人、机、人与机所产生的「体验数据」中蕴含巨大商业价值,而这也恰是我们擅长的数据域,我们希望以分析即服务(A3S)的方式提供体验度量去协助产品改进用户体验,从而实现商业价值。
是的,我们的“器”就是九色鹿!(内部开发代号,暂未对外发布)
未完待续……
“形而上者谓之道,形而下者谓之器”出于《易经·系辞》,这是上半句,还有下半句“化而裁之谓之变;推而行之谓之通,举而措之天下之民,谓之事业”。
数据思维道化为器,“化而裁之”中求变,“推而行之”中寻通,“举而措之天下之民”,是我们正在做的事业。我们的事业才刚刚开始,还有很多未完成的事情,欢迎内部试用反馈,更欢迎您的加入,数据可视化设计师、前端工程师、数据研发、数据产品经理,求贤若渴。
未完,待你续写……