去年底,马化腾开始把数字经营的理念引入腾讯门户网站的运营管理中,“原来广告就有点粗放,往往都是季度末才开始冲业绩、找代理,今年开始就每天都有一封信,上面有广告资源的消耗、黄金位置消耗了多少等。为什么会这样?过去他们还没有建立这样的体系,今年我们就开始要求他们每天要看,所有的网络媒体,广告销售部门的领导班子,每人一封信全部都会看到这个数字,培养这种运营数字的感觉,很重要的。大家就不会人浮于事,到最后找各种理由来推托。有什么事应该早知道,要多问。希望靠这种思路能够把我们每一块业务都带起来。”
数据是每一家互联网公司安身立命的基础之一,不过像腾讯这样长期坚持以数据为导向的公司并不多。1999年,腾讯刚刚成立不久,当时天使投资人刘晓松决定向腾讯注资的一个主要原因就是因为他发现,“当时虽然他们的公司还很小,但已经有用户运营的理念,后台对于用户的每一个动作都有记录和分析。”
在成为用户最多的互联网公司后,腾讯所掌握的用户数据量日益丰富,挖掘这些数据成为腾讯后来在多元业务扩展时屡试不爽的重武器。有分析人士甚至说,“数据挖掘”才是腾讯最具门槛性质的技术。
2007年,腾讯成立了腾讯研究院,研究院共有6大研究方向,数据挖掘正是其中之一,
“什么样的人作了这个动作,这个用户作了哪些动作,用了哪些东西你一定要知道。以用户为中心,如果你对用户什么都不了解,那是空话。”腾讯研究院院长郑立战说。
“用户一尝试,用一两秒钟就退出来了,我们也能监测到,说明这个可能没做好,而不是他不想用。或者他连光顾都不光顾,没这个需求。这些通过我们后台都可以看出来。我们也有对竞争产品相同功能的一些也监测,这样的话我们可以有个比较,比如一个功能用户(在竞争产品上)停留了20分钟,我们这边只有5分钟,那说明我们的性能有问题。”郑全战介绍。
数据挖掘还有一个特种部队,T4专家组。T4就是专家工程师,在腾讯的技术职业路径里,一共6级,从T1(工程师)到T6(首席科学家),T4是一个中流砥柱般的存在,必须做过亿次级的用户量级才能当选,目前不到50人。一旦遇到重大的产品难题,由T4组成的特别小组就会加入,他们亿次级用户量级的经验将发挥作用。
对用户的数据挖掘后来在腾讯网络游戏的崛起中也发挥了大作用。
腾讯从2003年开始运营网络游戏,曾遭遇挫折,直到2008年,腾讯才在多个细分市场找到了合适的韩国游戏作品。在代理韩国游戏的过程中,腾讯提出来要介入所代理游戏的研发,例如对《穿越火线》中子弹射出后的弹道设置,腾讯根据对用户的挖掘数据认为,韩方原本设计的逼真效果对中国用户并不合适,用户对腾讯设计出的“比较爽快的,节奏快的,鲜明的”的弹道设计更加兴奋。最后的结果表明,腾讯是对的。
对数据的挖掘不仅可以用来进行用户研究,还大大提升了腾讯的运营效率。早期,腾讯曾经过度使用群发广告来推广产品,这样的大规模推送广告不仅“大部分是浪费掉的,而且还引起很多人的反感”。这两年,腾讯开始进行推广资源的控制。
比如,公司分配给业务单位的群发数保持恒定,同时公司的战略发展部门派出一个小组来专门管控群发广告的效率,这个小组会先给业务部门作测试,比如业务部门要发几千万条广告,就会被要求先发几万条试一下,一旦发现效果不好,必须进行修改,或者是更换广告发送的用户群,如果广告发送后的点击率和用户满意度下降,下个月分配给这个业务的推广预算就会被扣除;反之,如果效率高,这个产品就会得到更多的营销资源奖励,这一模式逼迫得业务部门对用户数据挖掘得更加精细后才会进行广告群发。“要靠这个奖惩来控制营销的资源”。
这一制度执行的结果是,“起码把四分之三的水分挤掉了,只有以前四分之一的推广量,但是效果其实没有变化太大。”马化腾说。
最年轻首富的数据挖掘术
Facebook创始人扎克伯格是《福布斯》2010年最年轻亿万富豪榜的冠军,以40亿美元的身价领衔,要知道,他才25岁。
他创立的Facebook已经超越Google成为全美访问量最大的网站,有4亿的用户每个月至少登录一次 Facebook,而其中有一半的用户每天都登录。
更让人惊讶的是,他对人性、对用户体验的深刻洞察。比如,扎克伯格认为,“爱的反义词不是恨,而是默然(indifference)”。最近Youtube改版,就取消了原先的五颗星评分制度,只要选“喜欢”或“不喜欢”就可以。换而言之,爱和恨都是对用户体验的反馈和互动,而漠然则是更大程度上的恨,用户非常非常不喜欢你的网站,最常见的反应就是不搭理你。
虽然年轻,但是,扎克伯格对数据挖掘运用得确实炉火纯青。
Facebook的创意就来自于扎克伯格高中时的经历。扎克伯格2000年至2002年就读于菲利普埃克赛特学校,这是一所私立寄宿学校,也是美国的十大名校之一。在入学的第一年,与所有新生和返校学生一样,扎克伯格收到了菲利普埃克赛特学校的同学录。这本同学录的名字叫做“The Photo Address Book”(附着每个人的照片和地址),而学生们则亲切地将它称作“The Facebook”。
对学生而言,“The Facebook”不仅是他们获取彼此联系方式的一种手段,还成为了同学和好友之间的关系纽带,因为学生们可以从“The Facebook”上找到彼此。这与如今的Facebook网站如出一辙!
百姓网CEO王建硕曾经去考察过Facebook,还跟扎克伯格聊了一会儿,让王建硕印象最深的是Facebook对数据挖掘的痴迷。
Facebook的数据挖掘,是从一开始就建立的。Facebook刚刚诞生时,并没有完全开放给所有的大学校园,而是先从扎克伯格的母校哈佛大学开始,扎克伯格说自己创办Facebook,只是为了让哈佛大学更开放:
这就是我要讲的故事,我在期末考试的前一周捣鼓Facebook,当时有一门课程,要求必须学会所有的艺术作品。我本应该学习,但我在学习 Facebook,在考试的前几天我糟糕透了。我收集了所有图片,做成网页,你可以在上面加笔记,或者加图片,它是一个学习工具,其他人可以补充,而我需要通过考试。后来,教授说这届的成绩是历来最高的。这是我的第一个社交尝试。至于Facebook,我希望做些事情让哈佛大学更开放些。
Facebook先获得了哈佛大学的3000个用户,3000个用户对一般网站而言,并不值得一提,但对于哈佛这个拥有5 000个本科生的大学而言,Facebook等于占据了60%的哈佛市场。这就是一个比较高的数字,扎克伯格通过对哈佛大学的观察,掌握了搞定大学的秘笈。
在哈佛大学占据了绝对优势之后,Facebook才开始有节奏地向波士顿周边的大学扩展,比如斯坦福、哥伦比亚、耶鲁等,并缓慢向其他常春藤大学扩展。Facebook仔细分析这些用户的数据,优化用户体验,成为这个细分市场的一哥。
后来Facebook才谨慎地加入了高中,之后是公司,直到后来,才允许所有的用户注册。
数据挖掘对Facebook的扩张也起到了至关重要的作用,以大学的扩张为例。早期,Facebook在哈佛大学有着压倒性的优势,但对于西海岸的斯坦福大学却鞭长莫及。Facebook通过数据挖掘发现,高中的校友网络是连接这两所大学的纽带。
王建硕发现,Facebook通过有策略的开放高中校友录,哈佛的学生带动了他们的高中的其他高中同学,而这些高中同学有些就在斯坦福读书,并且由此渗透进一个新的疆土。同样的道理,跨国公司和国际的经常旅行者就是这样的暗流,把Facebook从一个国家带入另外一个国家。
而Facebook是如何发现并且掌控这些暗流的呢?是数据!Facebook的杀手锏就是他们贡献给阿帕奇基金的项目Hadoop Hive。Facebook每天产生250T(25万G)的数据,这些数据进入上千台电脑组成的Hive集群计算,并且快速地产生对于所有问题的回答。一个大的惊人的数据处理能力让他们可以在海量的数据中获得信息,并且用信息指导作战。Facebook在设计暗流的流动,其实就是口碑传播的渠道。通过口口相传的方式传遍了世界。
在扎克伯格看来,Facebook庞大的用户数据就是一个大金矿。他无时无刻不在想如何开发这一金矿。
2008年,扎克伯格发布了一项向广告客户开放用户数据的“Beacon”商业计划,通过“Beacon”,Facebook用户还可以追踪其Facebook好友在第三方网站的活动。但是,此举遭到用户和隐私保护组织的广泛批评。扎克伯格专门在Facebook官方博客发帖致歉:“在制定这项服务时,我们的确犯了很多错误,但在如何使用这些功能时,我们犯下了更大错误。”
2009年,扎克伯格又打起用户数据的主意。Facebook对用户服务协议进行了修改,称Facebook对用户上传的资料拥有“永久”的许可授权,即使用户删除账号。此外,虽然不拥有用户的照片、状态更新等信息,但为了广告创收Facebook却可以使用这些资料和图片。此举又引发部分用户的强烈不满,扎克伯格出来道歉,称不拥有用户数据。
数据挖掘是如此重要,是因为,数据挖掘才是应用创新的灯塔,指引方向,纠正错误。
比如,Facebook的CEO马克·扎克伯格最近发明了一套算法,可以预测在一个星期内的时间里你将会和谁约会。扎克伯格发现把用户数据按不同的形式归类的话会变得非常有趣。这个算法的最大的用途就是分析用户未来一周时间内将会和谁约会。
要知道,所有的用户一个月花费83亿个小时在 Facebook 上。Facebook 上活跃的应用程序超过55万个,并且在不断增加。
谁是真正的创新明星?谁是未来的杀手级存在?
数据挖掘就像是微杀手的“未来之水”,让你洞悉一切。