中国掀开人工智能新篇章 无监督学习算法成为创新热点
2017-08-01 湾区城市群
今年被誉为人工智能的元年。7月20日,国务院正式印发了《新一代人工智能发展规划》,从战略态势、总体要求、资源配置、立法、组织等各个层面阐述了我国人工智能发展规划。
值得注意的是,在《规划》中提出的智能经济,其中包括人工智能的战略性新兴产业、让传统产业智能化以及对企业进行智能化升级。
在这一场新的智能经济来临之时,传统企业已经准备好迎接互联网转型,提升智能化水平了吗?而对大多数企业来说,这场智能化升级之路才刚刚开始。面临未来诸多不确定性,网络欺诈就是其中最典型的绊脚石。而应用人工智能技术,则可以从第一步确保企业拥有大量、高质量的用户,从而展开智能经济之旅。
网络欺诈是全球性问题
这一次中国提出人工智能的发展规划,着眼于新技术的发展,包括模式识别、人脸识别、智能机器人、智能运载工具、增强现实和虚拟现实、智能终端、物联网基础器件,这是人工智能发展本身创造的新领域。
如果从应用范围看,在这两年中国诸多政策法规中(比如在互联网+、中国制造2025等)都提到人工智能对产业的升级带动作用。而随着现在越来越多的传统企业转型互联网+,应用互联网手段提升生产效率,提高竞争力,应用人工智能的领域也越来越多,风险控制和反欺诈是其中的热门领域。
这是由于欺诈行为是线上企业面临最头疼的问题。
比如像传统金融领域,越来越多的银行、保险和证券依靠互联网拓展新业务,在线评估用户的信用,依据用户的行为轨迹和使用习惯、背景信息展开金融服务。如果这些用户的信息虚假,或者是成为“肉鸡”、被利用,那么,给这些金融企业带来的损失不可估量。
再以互联网企业为例,游戏、电商、社交、O2O等互联网企业基于大量用户提供服务。这些注册用户中有相当部分是虚假、僵尸用户。如果这些大量虚假注册用户利用审核机制漏洞“薅羊毛”、发布虚假信息、恶意灌水、刷帖等会如何?
在国际国内,欺诈行为已经形成“黑产”,是一条利益紧密关联的产业链。在这条产业链中,有专门负责注册、负责“养号”;有专门负责提供终端机器,提供云服务模拟真实IP地址;还有负责寻找“买家”,发起攻击;还有寻找企业漏洞,随时准备“薅羊毛”等等。
这就是如今风险控制和反欺诈面临的问题,往往伴随着网络犯罪。据统计,网络欺诈给中国、美国这样的互联网大国每年带来的损失高达数千亿元、数万亿元美金。
无监督学习算法是趋势
面对网络欺诈,业内一直引用最先进的技术与之斗争。
当前,反欺诈领域的技术已经进入第三代。传统的第一代依据规则系统判定,是人工制定规则;第二代在第一代规则的基础上,引入更多信号源,如黑白名单、设备指纹等;当前则进入第三代,以人工智能为核心。在这一代中,又划分为有监督学习算法和无监督学习算法两个分支,两者的核心在于是否有大量的训练样本(数据)进行训练,两者的算法完全不同。
传统的有监督学习算法需事先对大量数据进行归类和扫描,也是一种“打标签”的方式。问题在于,欺诈行为并非一成不变,而是动态演变的,监督学习算法则力不从心。而无监督学习算法也是建立在对大量数据的学习和训练中,但学习的不是数据源,而是针对数据的行为动态做出规则判断。
通俗来说,从学习方式来说,监督学习算法是在“老师”监督下进行学习,有规则才有预判;而无监督学习算法则是边学习边建立规则,随时调整,“更智能”。
从全球范围来说,无监督学习算法是人工智能相对聚焦的技术领域,应用范围也聚焦,多用在银行、保险、证券等金融领域以及互联网领域、拥有大量线上用户的企业。基于无监督学习算法的产品和解决方案可以针对个体欺诈和分布式的群体欺诈 ,为这些企业提供最先进的反欺诈检测服务,确保用户的真实性。
当然,在实际应用中,两者不是割裂的,而是相融合的。很多解决方案中,这两者的算法均有,都是建立在大数据平台之上。不过相比较当前网络欺诈的趋势而言,无监督学习算法更符合这样的场景。
DataVisor成为明星企业
当前,聚焦于人工智能领域,应用无监督学习算法技术的公司不多,原因在于该算法有一定的技术壁垒,需要深入了解人工智能前沿的理论知识和基础算法。同时,需要结合一定的场景,开发出跨行业的产品和解决方案,需要了解企业的真实需求;第三,需要保持技术敏感性,与业内的大数据、安全、开源等平台、技术相结合,了解企业的平台特性、用户的使用习惯等。
在这种情况下,DataVisor这家公司脱颖而出,成为全球无监督算法成功应用到反欺诈领域为数不多的技术创新公司。甚至可以说,在网络反欺诈领域,DataVisor是全球第一家大规模成功应用无监督学习算法的公司。
正如DataVisor CEO兼联合创始人Yinglian Xie(谢映莲)所说,“创新是我们的工作”。这间公司在2013年成立之前,两位华人女性Yinglian Xie与现任CTO兼联合创始人Fang Yu(俞舫)一直从事研究工作。Yinglian Xie 拥有卡内基梅隆大学计算机科学系的博士学位,Fang Yu则拥有加州大学伯克利分校EECS系获博士学位,两位都是计算机相关的技术出身。
DataVisor CEO兼联合创始人Yinglian Xie(谢映莲)
Yinglian Xie与Fang Yu毕业后,曾经在微软硅谷研究院共事,是资深研究员;当时的想法是做出一流的学术研究。两者合作在国际顶级的刊物中发表众多的论文。以Yinglian Xie为例,在学术界是大数据安全领域的资深专家,拥有网络安全领域50多篇专业研究论文和20多项专利,获得多项最佳论文奖。同时,还担任多个顶级网络安全及安全学术会议评审委员,多位知名大学博士生评审委员(密歇根大学、UIUC等)。
Yinglian Xie和FangYu在微软工作期间,研究方向是互联网安全和反欺诈技术创新,曾为微软产品开发出一系列成功的产品,包括基于微软Hotmail社交图以对用户进行认证的系统架构,及大幅度降低信用卡实时交易风险的算法。
正由于在安全领域以及反欺诈领域的杰出表现,有行业内的用户找到她们,希望帮助他们解决安全和反欺诈的问题。两位在一些领域开发过产品之后,决定开发出一套全新的通用的产品,应用到各行各业中。于是,2013年底,两人在美国硅谷山景城成立公司。两年后,在2015年10月,DataVisor宣布获得由GSR与New Enterprise Associates领投的A轮融资;2016年5月,获得元生资本的B轮投资;并且在2016年成立中国分公司。
说起投资的一个小故事,当时滴滴的投资人彭志坚在美国初见到谢映莲时,没聊多久就和另一位合伙人许良决定投资,但Yinglian Xie的反映是“我们不需要融钱”。后在投资人的耐心和分析之下,DataVisor决定拿这笔钱去中国发展业务。
会不会成为下一个独角兽?
为什么DataVisor成为资本热捧的对象?核心在于专注于人工智能反欺诈细分领域,并拥有一套完整的AI解决方案,涵盖无监督机器学习,有监督学习、深度学习和自动规则引擎。除此之外,DataVisor拥有专业人才,在DataVisor的研发人员中,超过一半拥有名校的博士学位。
据统计,人工智能大热之后,全球顶尖的人工智能人才稀缺,大概70%的人才被Google、Facebook、微软、AWS等公司垄断。一方面是行业在快速发展中,前沿技术的积累和趋势判断尤为重要,有实力和远见的公司会形成人才壁垒,自然形成技术壁垒。另一方面,理论落地还需要结合行业属性,比如像论文中常常说大数据对数据的分析,一般跑小部分数据没有问题,一旦数据量超大,应用就尤为困难。
在这种情况下,DataVisor建立了自己的优势。两位创始人自身的研究背景和在大企业工作的经历,有助于在理论和实践中搭建桥梁,无障碍应用。正由于在无监督学习算法中的表现,可有效解决客户问题,每小时可分析数10亿用户事件,广泛应用在美国Yelp点评网、美国游戏公司IGG、图片社交软件Pinterest以及中国阿里巴巴、陌陌科技、猎豹移动等在内的多家大型互联网公司。
2016年,安全创新网络(SINET)指导委员会每年从上百家信息安全公司评选出16家网络安全技术创新企业,其中就有DataVisor的身影。DataVisor被誉为是“基于独特的大数据分析方法”的在线欺诈检测服务。
从当前的发展来看,DataVisor极有可能成为人工智能的创业明星企业。原因在于,创始人资深的技术背景、有实践经验、了解具体的应用场景,用户需求巨大,当前行业应用深度;这些综合起来,为DataVisor建立天然的技术壁垒和护城河。
接下来就看DataVisor这家公司如何运营,迅速成长。我们也期待这样的公司能帮助传统企业进入互联网+,推进我国人工智能的发展,也同步带动一批公司成长。