截止到2016年,全球网民数量已经突破30亿,且对很多人来说互联网在生活中已经如同空气一般的存在。但在我们享受便利的同时,互联网的另一面也开始逐渐显现,与日俱增的垃圾信息以及由此导致的经济损失,已经让很多网民难堪其重。
作为一家拥有19年反垃圾经验的互联网公司,网易在9月20号的云战略发布会上正式发布了易盾智能反垃圾云服务,将互联网内容反垃圾服务带入人工智能的时代。
网络垃圾已经无处不在
互联网在国内发展了20几年,产品形态的丰富度令人惊艳,与之同时垃圾内容存在的形式也更加多样。据网易易盾总经理周森介绍,从1978年第一封垃圾邮件开始,互联网反垃圾的斗争便由此展开,并从垃圾邮件蔓延到论坛、社交媒体以及社群形态下的ugc。垃圾信息的内容也从广告演变成了恶意链接、谣言、欺诈性评论、诱骗点击等等。
有数据显示,仅2016年上半年,我国网民平均每周收到垃圾邮件高达18.9封、垃圾短信数量约为20.6条、骚扰电话更是多达21.3个,紧跟其后的还有恶意电脑广告弹窗和app推送。而这些只是在网民层面的影响,对互联网服务尤其是ugc类产品来说,网络垃圾的泛滥无疑加重了运营风险。
周森介绍说,网络垃圾为运营带来的风险主要集中在两个方面:一是在内容上触碰法律法规的红线,比如敏感信息、暴恐信息、淫秽色情等等。就目前来看,文化部、公安部、广电总局近期纷纷加强了对直播等产品的内容管控,未来的政策形势将更加严峻;另一方面对用户体验造成不可挽回的影响,内容审核不完善带来的广告推广、人身攻击、灌水、刷屏等,事实上很多ugc产品为此付出了巨大的人工投入。
企业该如何解决这些问题?
从规模只有几个人的小团队到巨头级的互联网企业,无不面临着反垃圾的考验。如何处理这些问题,不只是简单的人工审核,还有成本控制、用户体验、控制风险等等。
“创业型公司处于发展初期,团队规模较小,尽管垃圾信息相对较少,由于缺少专业的审核团队,内容审核的负担落在了运营人员的身上,在很大程度上拖延了团队的运营效率。”在反垃圾领域深耕数十年的周森对此深有感触。“到了产品发展的中期阶段,用户数量迅速上升,垃圾信息也徒然增长,这时候企业很难在短期内建立起高效的审核团队,产品运营的风险被无限扩大。”
众所周知,从最早的博客到一些社交网站,再到微博、微信的兴起,每一个社交类的产品都有一个周期。比较残酷的事实是,拥有巨头背景的互联网产品往往能在短期内占据风口,而很多创业型的ugc产品往往昙花一现。除了资本层面的原因,很多ugc产品的弊病之一是,产品在爆发期吸引了大量的用户,正如周森所言,随着用户规模的扩大,垃圾信息也随之徒增,缺少有效的内容审核机制,最终导致用户体验下降,早期积累的用户逐渐流失。
反观成熟的互联网产品,多数公司配备了专业的审核团队,建立起7*24小时的审核机制。尽管自身也面临着成本压力,和中小企业相比却也在一定程度上解决了垃圾信息的困扰。
人工智能如何助力反垃圾?
周森分享了这样一组数据,网易云音乐的用户规模已经突破2亿,仅2016年上半年过滤的垃圾信息就高达3200万条。而网易易盾又是如何处理这么庞大的信息量?
网易易盾给出的答案是人工智能技术。
据周森介绍,目前人工智能技术在内容审核方面的应用已经实现了对文本、图片、语音、视频的监测。以智能文本过滤为例,不同于传统的关键词技术和规则引擎,网易易盾采用了语义分析技术,可轻松应对各种垃圾信息的变种。而在图片识别技术方面,最早是哈希匹配的至尊全讯大全官网的解决方案,正确识别率只有5%;第二阶段是肤色识别技术的应用,识别的准确率提升到了60%;如今人工智能的深度识别技术将正确率提高到了99.8%,可以轻松解决当下的内容安全问题。
“我们团队将人工智能技术引入反垃圾服务中,同时利用海量大数据做用户的行为分析,进行用户画像,甚至可以评估出用户是一个垃圾用户还是一个正常用户。”周森坦言。据了解,基于网易云强大的计算能力,网易易盾能够处理单日十亿次的请求。目前已经服务了网易邮箱、网易新闻、网易云音乐、网易考拉海购等亿级规模的产品,并拥有17173,春雨医生,足记,七牛等大批外部至尊全讯大全官网的合作伙伴。
周森认为,人工智能技术极大地提升了反垃圾云服务的覆盖范围,在较少的人力投入下实现7*24小时的内容审核,这对净化互联网环境提升产品的用户体验有着革命性的意义。此外,相比于企业自建的内容审核体系,网易易盾能够帮助企业降低80%的运营成本。
每个人都应该拥有一个更纯净的互联网,这不只是网民的愿景,更是每个互联网产品的使命。人工智能技术和反垃圾云服务的结合,或将加速这一天早日到来。