数据科学进化论:和鲸CEO范向伟解读“数据科学
  时间:2020-01-09 07:22  点击量:   
【字体:

  “几乎所有和商业相关的重要问题,都可以在物种起源中找到思路,如何构建竞争力、如何理解竞争对手、如何寻找发展空间、如何看到自己的不足等等。” 人工智能行业创业者范向伟,一直保持用进化的角度去看待自己所投身的事业。

  19世纪提出生物进化论学说的达尔文,对唯心的造神造论和物种不变论提出根本性挑战, 自此 , 一切自诩永远伟大光荣正确的上帝与神灵不再神秘而永恒。人类,Homospaiens , 翻身做起了自己的主人。

  然而进化的脚步从未停下。2016年,AlphaGo战胜了李世石,IBM用统计学习技术做出的Watson在Jeopardy上打败了所有的人类对手。达尔文给我们最大的启示,或许是只有变化才是不变的。想要生存,就必须要适应新环境,就需要有新能力,而构建新能力的过程,就是进化与创新。

  在范向伟看来,进化的胜负,取决于是否能看到环境中的新资源、新机会、新空间,并且找到从旧世界到新世界的路劲。在数据智能的时代,这个资源就是数据、算力、算法。于是在2015年,他创立了「和鲸科技」(原“科赛网” ),2017年便获得AI领域的专业投资机构线性资本和翊翎资本的联合投资, 2018年入选为福布斯「30 Under 30 精英榜」,比一般创业者步伐更快的他 , 目前已将「和鲸科技」打造为国内领先的数据科学协同创新平台。

  据英国「金融时报」近期报道,摩根大通集团约1/3的分析师和员工被强制参与编程学习计划,并且未来还会进一步扩大培训规模;2018年5月开始,四大会计事务所也积极宣布将AI技术运用到审计领域,德勤率先推出财务机器人产品,紧接着马威、普华永道、安永也推出属于自己的财务机器人解决方案。数据科学的应用,从金融和高科技行业,正向着每一个行业扩散、普及。

  范向伟对于数据科学平台的定位,是下一代的生产力平台。被Office占领的上一代白领,所使用的生产力工具是Excel + PPT + Word。摩尔定律告诉我们,信息的密度和流通速度仍然会不断提高,当信息的密度、质量、计算效率高到一定程度,人们将无法再按照传统的方式与信息交互。Excel的表格交互、PPT的展示方式,效率上已经难以满足人们的办公、决策、协作的需求,企业迫切需要更高效率的方式来利用信息,也就是代码、算法、模型、数学,类似于是2G网络到5G网络的升级。

  范向伟的团队所推出数据科学平台K-Lab,就是希望成为数据时代下,最具价值的生产力工具,帮助数据科学家、数据分析师提高在个人、团队、组织层面的工作效率、工作体验、工作价值。从而,企业可以通过算法、模型、可视化的手段,把数据用来,形成观察、知识、判断、想法,进一步应用在沟通、协作、决策中,以及信息化、智能化产品的开发中,从而实现数据的业务价值、商业价值、社会价值。

  和鲸数据科学平台同时是一个可以支持私有化部署的第三方SaaS平台,可满足数据科学家、人工智能工程师、商业分析师等数据工作者在线完成算法建模、数据分析、数据可视化、报表展现等任务,并支持私有化部署和云端协同,帮助企业、高校、科研机构开展工业级数据科学应用与人工智能研发。

  麦特卡菲定律说,一个网络的价值,正比例于用户的数量的平方。也就是说,如果信息不能够被组织成一个网络,那么信息的价值是无法被释放的。同样的道理,如果人与人不能够被组织成一个网络,人的潜力就会被压抑,无法创新。网络效应的价值,在数据科学项目有着更集中的展现。

  如果一个数据科学的任务不够开放,无论是可视化、分析报告、统计建模,最终的项目成果都是不够客观、不够全面的,分析师的主观经验、判断,以及分析团队的领导、协作、激励制度,总是在为结果添加各种各样的“Bias”。

  所有的数据分析,本质上都是在进行降维,都有信息的主观过滤,也就存在与人的判断相关的不确定性。不同的人,基于同样的数据、同样的目标,也会得出不一样的策略、模型、结论。同一个的问题,可以选择的数据源的数量和范围,数据源的排列组合,可以采用的分析方法,进而得到的结论、可以做出的解释,都是发散的、模糊的,没有唯一的答案。

  “我想做的,就是能够用社区化的方式,将数据资源连接起来,将人的知识与想法连接起来,形成一个流动的网络,协同创新,就能够释放出几何级数的价值来。”范向伟说。

  为了更好地进行协同创新,和鲸从2015年就已经开始致力于打造中国最大的数据科学社区(原kesci科赛网),专注于挖掘商业数据和数据人才的价值,连接全世界的数据科学工作者。企业通过在和鲸社区举办“数据竞赛”项目,发起“协同研发”任务,撬动社区甚至是整个数据科学家群体的聪明才智,来帮助自己验证想法、设计算法、打造原型,加速业务的数字化,加速创新的规模化。

  数据智能的时代,就是协同创新的时代。数据科学已不再是某一个团队或者某一个部门的工作,而是如何最大化的利用数据资源,创造价值、构建竞争力的系统性工程。

  回顾过去的几千年,人类从最初的原始人,摘取野果、捕获猎物、饮毛茹血,到学习种植小麦,定居建房,再到轻工业、现代的重工业和科技的发展,合作使得人类社会的不断进化,协同使我们有人类的语言,使我们称之为人的原因。

  达尔文认为,遗传变异经过自然选择,优胜劣汰,实现进化。数百万年过去,狮子和羚羊生生不息、奔跑不止,猿却进化成人,发展出更高级的技术和社会进步,走兽中跑地最快的猎豹也跑不过汽车和子弹。这个寓言更耐人寻味。

  约6亿年前,在几百万年“很短”的时期内进化出绝大多数无脊椎动物门,被称做寒武纪生命大爆发。另外一些时期则发生大灭绝,比如人们熟知的约6500万年前,恐龙消失了。过去十年我们见证了全球网络公司的大爆发大灭绝,未来也许可以期待中国企业的某种突变,比如「和鲸科技」。

  2006年,Kevin Kelly在TED上一则惊动世界的演讲「How Technology Evolves」中,他的结论是:技术与生物世界的进化史一样,最终将逐渐蔓延至世界各地的任何一个角落,人们的未来生活将无处不存在技术的渗透。13年之后,我们今天的世界已经被数据、传感器和服务器所层层覆盖,那么再之后的未来呢?

  超越技术?超越语言?超越个体?人类有限的智商或许猜不到这场进化的尽头。就像《未来简史》中,对于人类命运的预测,得算法者得天下,主导这场长期进化的主宰者,可能正是像范向伟这样的数据科学家们,他们发掘数据的价值、攫取机器的潜能,彰显着属于人类的创造与可能。



地址:北京市石景山区石景山路20号

邮编:100040

电话:010-51885980

传真:010-68680177     邮箱:scyxb@ztjs. cn

官方微信
友情链接
Produced By