图片实测:智能鉴黄,哪家强?
当下,UGC内容量的爆发超出所有人的想象。据粗略统计,每天上传到YouTube的视频可以连续播放98年,Facebook每天发布的照片量堆起有80个埃菲...
当下,UGC内容量的爆发超出所有人的想象。据粗略统计,每天上传到YouTube的视频可以连续播放98年,Facebook每天发布的照片量堆起有80个埃菲尔铁塔那么高,有200万篇文章在网上发布,相当于美国《时代》刊发770年的总量…… 面对如此庞大的内容量,如何筛选内容,确保内容符合法律法规,成了很多内容平台首要解决的问题。
在智能鉴黄领域,国内名气较大的第三方平台有阿里绿网和网易云易盾、腾讯云万象优图、图谱科技等。内容平台尤其是直播平台在面对这些第三方服务时,往往“一头雾水”,因为不知道这些企业提供的服务到底怎么样?能否解决他们的需求。
抱着对技术发展的好奇心,笔者从一个内容审核外包公司获取了一些图片,在这些平台上做了一下测评(为了保证文章能够顺利发出,一些图片做了打码处理),把结果呈现给大家,供各位参考。
第一张图片:
不用多说,这种类型的是犯罪图片(已打码处理),人工审核:黄色图片一张!那么人工智能鉴黄平台会如何评判呢?结果请见下图。
结果显示分别是:腾讯云、阿里绿网、图谱科技、网易云易盾
从测试结果来看,个别智能识别系统的检测结果不尽人意(检测结果百分比越高代表违规越严重,反之,百分比低则可能被当做为正常性感图片)。总体来看,网易云易盾和阿里绿网的结果还是比较不错的。
第二张图片:
这张图片没打码之前,属于典型的擦边球图片,鉴黄服务平台会是什么反应?我们一起来看看。
结果显示分别是:腾讯云、阿里绿网、图谱科技、网易云易盾
这张图片有打擦边球的嫌疑,对于人工审核来说,这些擦边球基本上不可能通过。但是,对于智能系统来说,还是有通过的可能性的。在识别这张图上,图谱科技和网易云易盾的系统表现不错。
第三张图片:
这是一张正常的美女图片,在智能鉴黄平台这会是什么结果?
结果显示分别是:腾讯云、阿里绿网、图谱科技、网易云易盾
这张图片的检测结果出乎笔者的意料,三家鉴黄平台评判出的百分比都不低,有一家给出“疑似”,真的不知道这些AI工程师到底喂给它什么样的图片,这样的图片都“招架不住”!
第四张图片:
每个父母都希望在某些平台上晒一下自己的萌娃,作为一个正常人,我们也非常乐意看到这样的图片——天真无邪类型。这些图片比上面的三张图片可视性要高,对于这类图片,智能鉴黄平台会如何批判?
结果显示分别是:腾讯云、阿里绿网、图谱科技、网易云易盾
从测试结果上来看,有2家智能鉴黄平台都给出的评判百分比并不低,不得不承认,这个时代晒个萌娃都有可能要被某些服务干掉。为了避免个别图片存在的样本差异,笔者再测一组。
第五张图片:
这张图片虽然是婴儿全裸,但是,在我们大多数人的眼里,小家伙挺可爱,准裸。
测试结果:
结果显示分别是:腾讯云、阿里绿网、图谱科技、网易云易盾
这张图片测试结果大体上几个平台的系统测试结果勉强能够接受,没有出现很离谱的测试结果。
总体测试结果分析:
第一张图片:内容审核员评判:色情图片;平台表现:阿里绿网>网易云易盾>腾讯云>图谱科技。
第二张图片:内容审核员评判:色情图片;平台表现:网易云易盾>图谱科技>阿里绿网>腾讯云。
第三张图片:内容审核员评判:美女图片;平台表现:图谱科技>网易云易盾>阿里绿网>腾讯云。
第四张图片:内容审核员评判:萌娃图片;平台表现:网易云易盾>图谱科技>阿里绿网>腾讯云。
第五张图片:内容审核员评判:萌娃图片;平台表现:网易云易盾>图谱科技>腾讯云>阿里绿网。
从总体的测试结果看,阿里绿网的结果过于似是而非,第一张图片鉴定的还算可以,之后的图片却都是疑似?疑似这个评判的面太大了!图谱科技作为一家创业型企业,在缺少数据的情况下,做到这个程度也是可以理解的。网易云易盾的测试结果还是不错,但是也有误判的时候。腾讯云就不多评价了,测试结果不是很好,后续还需要数据训练。
结束语
虽然说人工智能这几年发展很快,不过站在客观的角度去看内容安全领域,笔者觉得也不能完全依赖人工智能,智能鉴黄+人工应该是目前最稳妥的方案。
但也非常期盼人工智能的技术进步能够让鉴黄服务变得更加聪明,这既能减轻内容审核员的工作负担,又能快速地净化互联网环境。
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新