人工智能大会在京开幕,DataVisor受邀演讲指出反欺诈新思路
4月11日,由O’Reilly与Intel AI共同举办的人工智能大会在北京召开。
这几年,人工智能火爆,最终从大学实验室的圈子走出,成为软件开发人员工具集的重要组成部分,也成为主流公司的关注点。相对于学术会议中展示的研究成果,业界对于人工智能的应用有紧迫的需求。这也是本届人工智能大会举办的目的,即如何让人工智能技术落地在现实场景。
本届大会邀请到了众多知名人工智能科学家、学者、教授、企业代表等知名业内人士。这些专家专注于人工智能的不同领域,并分享自己领域内专业的成果,现场思想火花碰撞。DataVisor作为领先的人工智能科技创新公司也受邀参加,并分享了“在欺诈检测中的应用人工智能”的主题。
演讲中,DataVisor解决方案架构师崔宏宇(Hongyu Cui)从四个方面详细分析了在线欺诈领域的一些状况,包括欺诈现状、欺诈技术手段、反欺诈面临的挑战,以及最新的反欺诈技术。
欺诈无处不在、技术也日益多变
总体而言,欺诈正愈演愈烈。从起初的电商领域,如我们熟知的刷单、薅羊毛,攻击者一般是个人,发展到现在,欺诈几乎无处不在,社交、游戏、电子商务、搜索……只要在互联网上就有可能发生欺诈。与此同时,攻击行为也发生了巨变,它们有组织、有预谋、掌握各种先进技术、面向各个业务环节。
崔宏宇(Hongyu Cui)重点列举了当前应用非常广泛的三大攻击手段,包括设备刷机、IP造假和养号。刷机是通过各种技术手段,为设备创建新的标识符,从而充当多台设备来使用。弊端显而易见。举个例子,一个App开发商,想通过一些市场推广促进用户下载,如果遇上刷机这种情况,那营销费用就浪费了,因为这并不是真实的用户。
IP造假与设备刷机有些类似。最常见的就是一台设备通过不断变更IP地址来躲避相应的检测系统,来谋取非法暴利,比如虚假点击。而云计算服务商的出现,又给了欺诈者可趁之机进行IP造假,数据显示,18%来自云服务商的账户是欺诈性的。更棘手的是,IP造假和设备刷机经常结合使用。
养号,从单个的用户行为来看,与我们自己使用的账号并没有什么差异,但看似正常的这些账号可能会潜伏几天、几个月甚至几年,一旦被唤醒时,它们就是一个个攻击者。DataVisor统计数据显示,44%的欺诈账户在7天甚至更长时间保持睡眠状态,37%的账户在三个月甚至更长时间内都不会采取行动。
毫无疑问,欺诈者变得越来越狡猾,反欺诈正面临更多挑战。在崔宏宇(Hongyu Cui)看来,挑战主要集中在三点,一是欺诈者越来越像正常用户,这导致传统基于规则、黑名单、IP等的反欺诈解决方案失效;二是欺诈变化太快,没人会告诉你明天的欺诈是什么样子,这使得反欺诈相对滞后;三是需要检测的数据量太大,原有系统难以招架。
DataVisor一招制胜
基于对欺诈现状的理解和认识,DataVisor独有的无监督反欺诈算法,其最大的特点是无需人工干预,就能自动识别恶意账户、事件之间的细微关联,并自动建立相应的规则和应对机制。
崔宏宇(Hongyu Cui)举例,一个欺诈团伙利用从各种渠道获取的信息申请新的信用卡,这个过程中填写的各种信息。如果只分析图一的信息,都是合法用户,基于规则的一些反欺诈系统根本无从判定。即便加上第二张图的信息,常见的以IP黑名单、邮箱黑名单为检测机制的反欺诈系统也几乎没什么作用。
图一、姓名、年龄、住址、邮箱等
图二、姓名、IP、设备类型、浏览器等
事实上,这些账户都是欺诈账户。申请相同的卡片类型、所有IP都来自数据中心、一样的手机且都是旧版本的、一样的操作系统、一样的浏览器,这些在传统单个查看的反欺诈系统里都会被定义为正常用户,而在DataVisor无监督机器学习算法中均能成功检测,并自动形成相应的规则和应对机制。
除此之外,DataVisor无监督机器学习平台基于Spark、Hadoop、HBase、ES等多种大数据处理框架,拥有超高的处理计算效率,可同时处理数十亿事件的数据分析工作。
综上,DataVisor反欺诈解决方案能充分应对当前的挑战。也正因为此,DataVisor在全球受到了多家中大型企业的认可。截至当前,DataVisor已经覆盖全球超过20亿终端用户,其客户包括Pinterest、Yelp、阿里巴巴、大众点评、今日头条、猎豹移动、饿了么和Tokopedia等全球最大的金融机构和互联网企业。
同时,DataVisor多次获得行业认可,比如,荣获Frost &Sullivan 2017技术创新奖,在IFPI2017上获得金融科技反欺诈杰出方案奖,在2017中国财经峰会上被评为2017年最具成长性公司,品途集团2017年度商业影响力大数据领域新锐企业TOP10,美国SINET安全领域2016创新奖等。
关于DataVisor
DataVisor是提供在线欺诈和金融犯罪检测服务的领先企业,致力于利用最先进的人工智能技术, 尤其是无监督学习算法以及大数据应用,最大程度保护用户和企业。DataVisor总部位于美国加州山景城,在中国北京和上海设有办公室。2015年10月,DataVisor宣布获得由GSR与New Enterprise Associates领投的A轮融资;2016年5月,获得元生资本的B轮投资,并同年成立中国分公司。2018年2月,获得由红杉资本中国基金领投的四千万美元C轮融资。
崔宏宇(Hongyu Cui)
现任DataVisor高级算法工程师,自2015年起,负责使用分布式无监督机器学习算法进行欺诈分析,负责过如Pinterest、Yelp、阿里巴巴和猎豹移动等世界上最大的互联网企业上的大规模注册、虚假内容、垃圾邮件、欺诈交易和虚假应用安装等场景 。目前主要的经验领域有模型调整、特征工程和算法开发。崔宏宇拥有在爱荷华州立大学的博士学位,在博士期间的研究方向为数据分析和结构 – 性能建模等。