音频产品因为使用场景多元、伴随性和碎片化,在当下快节奏的社会中,受到越来越多的用户欢迎。然而对音频的内容审核存在多个难点,比如说语音识别和声纹识别难、数据标注成本大等,给很多音视频平台的发展带来困扰。
如何检测上,可以考虑使用第三方的检测服务。网易易盾在2018年推出了音频检测服务,通过业内领先的语音识别技术,精确、高效地帮助音频平台分析和识别出各类违规音频。2019年5月,网易易盾又对音频检测服务进行迭代升级,在点播音频过检的基础上,开始支持直播音频,实现实时音频检测。
音频实时检测上最大的难题是背景噪声的动态变化,导致违规音频和背景噪声的重叠更加复杂,让模型分类难度变大。
因此易盾一方面通过人工构造一些特定场景的背景噪声,和违禁数据相混合,用这些数据训练模型,提高模型对动态背景环境的鲁棒性。另一方面,通过对数据进行归一化的方法,减少客观因素对模型分类造成的影响。
领先技术的应用,使得网易易盾音频检测能够高效识别色情语音、渉政、娇喘语音、asmr、谩骂等违规语音;在应用场景上,也能完美覆盖im通讯、点播音频和直播音频。
相关阅读: