京东安全策略分析: 黑产 AI 用得 666,怎么怼回去

无人机送货、叮咚家庭助手、智慧物流、智慧供应链……近两年,主打“技术开启商业智能化”概念的京东,落地了众多相关产品和实际应用,其中大数据成为重要的助推力。

当大数据渗透到越来越多的智能应用场景中时,安全的重要性不言而喻。比如,给我送货的无人机会被劫持吗?叮咚会不会被黑客利用花我的钱为他买东西?在12月21日举行的京东安全峰会中,来自京东硅谷研发中心安全实验室的架构师杨锦,对网络安全攻防双方使用 AI 的情况与应用,进行了讲解。

杨锦此前曾在安全公司 FireEye 和谷歌都有过工作经历,她为何选择加盟京东?目前 AI 在攻防对抗中是一个怎样的状况?京东安全未来将在何处发力?在演讲之后,她接受了雷锋网(公众号:雷锋网)的独家专访。 

为何弃谷歌,选京东

随着近年来安全事件的频发,中国各大互联网公司都在满世界挖人。

此前,雷锋网就报道过硅谷安全教父弓峰敏加盟滴滴的消息,其中提到弓峰敏团队加盟原因,正是看上了滴滴所能提供的“大数据集”。 

其团队的技术要求与业务数据密切交互,而利用滴滴的框架和资源,团队能更方便地去展开技术研究。

“拥有大数据”这个理由,同样也是杨锦加入京东的原因之一。

京东目前有 2 亿多的活跃用户,16 万第三方卖家,每天能产生 20 Petabytes的数据,这个数据无论从数量还是质量上来说,都很吸引人。

杨锦告诉雷锋网,海量精准的大数据和丰富明确的应用场景,是 AI 在安全产生价值的两个重要条件。无论是语音交互、图像感知还是自然语言识别,其实都是通过机器对于大数据的学习。

京东安全策略分析: 黑产 AI 用得 666,怎么怼回去

与此同时,目前京东的智能音箱、无人车、无人机、智能供应链等新技术和产品也提供了明确的应用场景,这对于搞安全的人来说,非常有吸引力。 

与国内近两年兴起的“安全热”不同,由于美国的互联网公司起步较早,遭受网络攻击的“经验”也多,多年来对网络安全都非常重视,积累了很多安全人才。杨锦说,在硅谷做安全很多就是中国人。从这点来说,随着国内互联网公司的快速发展,去硅谷“挖人”的也越来越多。 

与此同时,由于国内庞大的市场和丰富的应用数据,尤其是人工智能方面的飞速发展,安全研究人员在这片“土壤”中,也能挖掘出更多 AI 安全的价值。

攻击者对 AI 运用得 666

人工智能在攻防对抗中究竟处于什么阶段?在峰会现场,杨锦以一个简历网站的反爬虫为例,讲了安全人员同黑产过招的几个回合。

对于基础的爬虫行为,安全人员先开始只看对方的 IP、请求量、User Agent(用户代理,简称 UA,是一个特殊字符串头,使得服务器能够识别用户使用的操作系统及版本、CPU 类型、浏览器及版本、浏览器渲染引擎、浏览器语言等信息),根据这三个特征制定规则,封掉异常行为。

黑产在判断出这些简单的防守规则后,改变了进攻套路。把 User Agent 伪装成正常的百度爬虫,让防守方无法识别,并且通过 IP 代理的方式进行下一步的爬取。

接下来安全人员开始用频率进行限制去拦截异常行为,并且写了一个小脚本来把白名单加进去,来判断爬虫是不是来自百度的服务器。

随着防守方的规则变化,黑产也继续出新招,运用云端多IP的能力进行无规律的随机慢爬,从而规避掉之前用频率做防守的规则。

要防黑产这招,可能导致防守方对正常用户的“误杀”。所以防守方干脆推一个验证码,来识别你到底是人还是机器在做爬取的工作,但在这方面黑产也有相应的对策。 

对于验证码的识别,雷锋网此前也报道过一秒分辨出杨臣刚、王大治和孙楠,这个黑产居然用AI 来"打码",当 AI 赋能黑产,智能爬虫的威力也显现出来。据杨锦透露,这些打码平台识别一次验证码的收费大概在0.15分左右,但有的打码平台在被端掉之前的 3 个月内做过 250 多亿次的识别,收入可观。

在攻防对抗快速升级的情况下,今天行之有效的防守措施,可能明天就失效了,没有一种简单方式是能够一招制敌的。杨锦认为,对于防守方来说,未来使用 AI 深度学习的策略和框架,可以对攻击行为进行全方位的识别,以至于达到实时辨别和封杀的效果。

安全人员怎么办

在演讲现场,杨锦重点提到去年 DARPA 举办的一场 CGC 比赛,雷锋网此前也进行过报道走近首届DARPA网络安全大赛,其展现了基于AI的攻防对抗的,揭示出未来安全极有可能是攻防机器人之间利用AI的自主自动对抗。

京东安全策略分析: 黑产 AI 用得 666,怎么怼回去

简单来说就是机器之间的CTF比赛,AI VS AI,通过一系列的可视化指标,机器展示了在快速识别和利用对手的弱点的同时,发现并修补有缺陷的代码的能力。除了机器人之间的比赛,此后冠军队的 Mayhem 系统还参加了与真人战队的CTF比赛。 

虽然在最后人机混合的CTF比赛,冠军是由真人战队 CMU PPP 获得,不过由 CMU PPP 主力参与开发的机器人 Mayhem 在比赛中还是打败了其他几支真人队伍。

这次CGC比赛欧美安全圈引起的震动非常大,很多新闻媒体的报告都是以未来机器人是否能代替安全研究人员为焦点讨论。

杨锦告诉雷锋网,真正了解安全且能够合理运用AI技术的安全研究人员,将有能力建造强大的机器系统,这才是AI安全威力升级关键所在,也是安全人员的事业发展方向。

AI安全在京东

由于AI技术对于攻防双方来说都是新的赋能,如果不重视 AI 在防守方的发展,攻击方在AI方面的进展会造成全新的威胁,而这些新威胁却是传统安全手段完全无法防范的。

在这种情况下,杨锦透露,AI安全已经成为京东安全重点发力的方向,目前主要在京东硅谷安全实验室开展。

京东安全不同于 BAT 安全,由于有着充分大量的 B2C 情景,需要重视B端风险。 不同于传统安全,AI安全关注京东新零售情景下的各项业务,以及IOT发展中的综合风险问题,强调采用系统观点,使AI技术与业务安全深入结合,为业务健康开展保驾护航。

AI安全的原理是,正常业务或内外部的技术行为都会留下数据信息痕迹,利用这些信息痕迹,采用AI等分析手段,可以揭示出数据背后的客观事实,消除风险,对抗来自对手的AI攻击。 

杨锦所讲的例子其实换句话说就是,当 AI 赋能攻击方时,安全研究人员所面对的挑战将会非常大。该如何应对?她从业务安全开始讲起。

京东是一个电商平台,涉及业务安全有8个主要流程,用户的注册、登录、实名认证、商品浏览、下单、支付、评价和推广营销,这些领域都有攻击方的窥探和攻击。

以抵抗羊毛党为例, 杨锦和团队会先搜集信息,主要有对黑产的活动监控信息,和对内部重要数据的联合打通。通过自然语言理解以及各种聚类算法,抽出重要的信息。 

在这个过程中,如何能提供给 AI 切实有效的数据是关键点,这时候同业务部门的配合就会非常重要。

在提取出黑产活动的信息后,他们会根据这些信息进行预警和拦截,在拦截完毕以后,会得到业务部门的反馈,此次拦截正确与否,再反馈到数据中进行打标,这时候的数据才可以运用到 AI 的算法中进行深度学习。通过这样的循环,来提高防守能力,拦截黑产订单。

相比于人工,这样可以达到智能化、完全化和零配制的目的。

杨锦说,类似这样的方式同样可以运用到防止对公司进行整体经营情况的窥探和利用。与黑产的相关的攻防对抗一直在不断的演进当中。 

写在最后

今年5月,京东 CEO 刘强东曾在自己的媒体账号上为即将上市的智能冰箱打 call 。其可通过内置双摄像头和图像识别技术,知道冰箱内部的情况,并管理其中的食材,比如提醒食材的有效期,根据食材推荐食谱,学习用户的饮食和购物习惯,并提供在京东快速下单购买材料的通道。

对此,财经作家吴晓波曾预言,未来大数据将是京东最值钱的资产。

窥一斑而知全豹,智能冰箱的背后,是京东在 AI 和 IOT 等方面的大力布局,当互联网公司在掌握了用户、商家、生产等方面的数据后,安全也称为智能化环节中重要的一环。

在采访杨锦时,她也告诉雷锋网,目前京东在硅谷的研发中心、大数据、AI、智慧供应链、平台产品研发、智慧物流、安全等部门都在密切协作, AI 使用于安全,已经是一个现实了,因为攻击方已经在使用各种技术,防守方也在利用 AI 新的利器,与攻击方进行较量。

部分内容来自2017京东安全峰会

雷锋网原创文章,未经授权禁止转载。详情见转载须知

京东安全策略分析: 黑产 AI 用得 666,怎么怼回去

(完)