当前位置:首页 > 名人专访 > 正文

小米宋强:生态化大数据平台的深度应用实践2016-10-27 11:08:22 | 编辑:hely | 查看: | 评论:0

时下大数据市场越发火爆,各行各业趋之若鹜投入其中。然而随之产生的问题也越来越多,除去数据清洗、整理、存储等枯燥的事情外,大数据变现是厂商们最为关注的难点之一。

时下大数据市场越发火爆,各行各业趋之若鹜投入其中。然而随之产生的问题也越来越多,除去数据清洗、整理、存储等枯燥的事情外,大数据变现是厂商们最为关注的难点之一。实际上大数据很难通过直接途径来变现,业务智能化抑或是内容推荐都是一些间接的变现场景,而广告则是大数据能够真正变现的场景之一。

依托于强大的MIUI系统、2亿手机用户和完善的生态链布局,小米在过去几年积累了海量用户数据。本次请到小米商业产品部技术总监宋强,请他来分享大数据在小米广告平台的各种实践。

 

\

 

小米商业产品部技术总监 宋强

以下为采访实录

问:请介绍下自己和目前从事的工作,以及关注哪些技术领域?

宋强:我是宋强,2014年加入小米,目前在小米商业产品部担任架构师和研发主管,主要负责小米自有流量和移动网盟业务的变现,包括系统架构、算法策略和数据平台相关的工作。之前在微软中国必应广告部门从事大数据分析、反作弊相关工作。再之前在IBM中国开发中心从事数据库和查询优化相关的工作。我个人比较关注的技术包括分布式高并发的系统架构、海量数据分析与处理、数据挖掘和机器学习等。

问:依托于强大的MIUI系统、2亿手机用户和完善的生态链布局,小米在过去几年积累了海量用户数据。那么与社交网络、搜索和游戏等网站相比,小米的用户流量有哪些特点?

宋强:小米是一家硬件公司,也是一家移动互联网公司,但我更愿意把小米看成一家大数据公司。硬件方面,在过去几年中,小米一共售出了超过两亿部手机和1500万台电视和盒子,另外路由器和手环等生态链产品的销量也非常好。软件方面,深受用户喜欢的MIUI是一个深度定制的安卓系统。依托于强大的硬件销量和MIUI等软件系统,小米在过去几年积累了大量的用户数据,包括APP使用、搜索、购物、社交、娱乐等。小米是一家真正的大数据公司,小米的大数据和其他公司相比,最大的特点和优势是“全生态、多样性”。

 

\

 

问:在时下这个业务变更频繁的背景下,可否为我们分享下小米大数据的实践经验?

宋强:小米大数据在小米多个业务中得到了充分的应用和实践。首先是广告营销,通过点击预估算法提升广告收入,通过营销DMP帮助广告主进行精准营销等等。其次,大数据在小米金融业务中也广泛应用,包括风控和征信分析、反欺诈等。在搜索和推荐业务中,大数据对各种算法的提升也起到了至关重要的作用,包括查询理解、相关性模型和点击预估等。

问:目前小米广告大数据已发展较为成熟,您觉得未来会朝着哪些趋势发展?

宋强:未来的趋势应该是更加智能化。首先是算法的智能化,随着机器学习和人工智能的进一步发展,大数据的价值将得到更加充分的挖掘。其次是营销的智能化,通过多维立体的用户标签数据,从性别、年龄等基础数据,到APP使用频次和时长、运动轨迹、手机信号等数据形成的兴趣标签,再到精准的时间、位置、场景化标签,帮助广告主进行更加智能化的广告营销。

问:数据应用场景是数据商业化过程中重要的方面之一。小米的广告大数据有哪些应用场景?

宋强:小米广告大数据的应用场景有很多,首先是广告算法优化,包括点击率预估、反作弊、用户体验优化、广告主ROI优化等多个方向。其次是营销DMP,小米的营销DMP通过整合媒体、投放平台以及广告主的各方数据,使用大数据技术对用户的特征进行挖掘,为广告主提供了20多个维度、上百个标签的实时用户画像管理。

问:与搜索的基础架构相比广告平台要求更高的实时性反馈,小米广告平台的架构是怎样的?

宋强:小米广告平台负责小米应用商店、浏览器、一点资讯、小米电视等全线软硬件几十个业务的变现。支持应用游戏下载、信息流、搜索、开屏、视频贴片、电视画报等十余种主流和创新的移动广告形式。总的说来,小米广告的业务比较复杂和多样化,小米广告平台的架构也是随着业务的发展不断的迭代和优化。

目前整个系统架构包括接入层、服务层、算法层和存储层。接入层负责流量的接入、管理、配置和运营。服务层是广告检索的核心,包含广告选取、过滤、排序等核心逻辑,主要的服务有广告交易平台、效果和排期广告服务等。算法层负责点击率预估、预算平滑、精准定向等算法,存储层则是各种广告和用户数据访问层。

 

\

 

广告平台架构在演化过程中,我们一直秉承以下几个思路:

首先,架构为业务服务,每一次架构的迭代都是业务驱动的。我们的团队也是按照业务进行划分的,每个业务团队有明确的目标,通过目标驱动架构的微调和迭代,也许架构并不是完美的但却是最有效的。

其次,业务逻辑配置化+公共逻辑服务化。不同广告业务在产品形态、素材规格、竞价方式方面会有所不同并且会随着时间不断变化,架构必须足够灵活来支持业务的变化和差异化。通过资源管理平台对广告位进行自动化的管理,使得业务逻辑配置化。同时,不同业务总是有一些共性的需求,通过对公共逻辑的模块化和服务化,减少耦合和重复建设,提高系统的稳定性和可靠性。

上一篇:百度首席科学家吴恩达:计算机不会统治世界 《Spark GraphX in Action》书评及作者访谈下一篇:

公众平台

搜索"raincent"或扫描下面的二维码