2019-07-30 21:26  最新动态
7 月 30 日今日头条宣布正式推出新版灵犬反低俗助手,同时支持对图片和文本识别,这是时隔半年后,今日头条“灵犬”的又一次重要升级。用户目前可以在今日头条内,搜索“灵犬”进行试用。

据了解“灵犬”建立在今日头条反低俗模型上,是一款检测内容健康度的辅助小工具。字节跳动人工智能实验室总监王长虎介绍称, 2012 年以来,今日头条内部搭建了反色情、反低俗、反标题党、反虚假信息、反低质等数百个模型,并投入近万人专业审核团队。王长虎称,新版“灵犬”重点拓展了反低俗识别类型和模型能力,现已覆盖图片识别(反色情低俗、反血腥暴力)和文本识别(反色情低俗、反暴力谩骂、反标题党),后续灵犬反低俗助手还将支持语音识别和视频识别。
灵犬反低俗助手上线
此前一年时间内,灵犬反低俗助手已陆续完成两次迭代, 2018 年 3 月 28 日,今日头条首次上线灵犬反低俗助手,支持检测文字和文章链接。 2018 年 5 月 16 日,今日头条灵犬反低俗助手完成服务能力升级,增加反色情短文本模型和反谩骂模型,将准确率从73%提升至82%。 2019 年 2 月 20 日,“灵犬2.0”正式上线,除了反色情低俗模型,加入反暴力谩骂和反标题党模型,覆盖了主要的低俗低质内容类型,整体识别准确率接近85%。

用户只需要在今日头条灵犬反低俗助手内输入一段文字或文章链接,灵犬反低俗助手就可以帮助其检测内容健康指数,返回一个鉴定结果。对于用户输入的内容,“灵犬”会先进行提取、分词和语义识别,然后根据相关规则, 输出对应的分数、评级和结论。这一切都在短短几秒内完成。图片和图片链接检测同理,用户在灵犬反低俗助手内上传图片或图片链接,即可快速获取鉴定结果。据王长虎介绍,灵犬反低俗助手背后的文本分类模型,已经经过了三次迭代。每个新版本相对于旧版本,在技术和数据集层面,都有一个明显的跃升。这一代“灵犬”训练数据集总量是1. 2 个T,相当于 20 倍百度百科或 100 倍维基百科的数据总量,包含 920 万个样本,准确率提升至91%。在图片识别层面,“灵犬”采用深度学习作为解决方案,在数据、模型、计算力等方面均做了针对性优化。数据层面,“灵犬”已累积上千万级别的训练数据。灵犬反低俗助手在模型层面针对许多困难样本做了模型结构调优,尝试解决多尺寸、多尺度、小目标等复杂问题。计算力层面,灵犬反低俗助手利用分布式训练算法以及GPU训练集群,加速模型的训练和调试,截至 2019 年 6 月,灵犬反低俗助手的使用人次已经超过了 300 万。 
 
扫一扫左侧二维码,添加微信个人号沟通

上一篇:百度正式推出CRM工具-爱番番 下一篇:微信推出小程序全新加速审核机制

发表评论

说点什么吧
  • 全部评论(0
    还没有评论,快来抢沙发吧!