https://gallery.windowsazure.cn/artifact/20161101/datagrand.textauditstandard.1.0.3/Icons/Large.png

文本鉴黄鉴政识别

达观数据
自动判别文章内容是否政治违规和是否情色违规,同时给出违规的严重程度。
https://gallery.windowsazure.cn/artifact/20161101/datagrand.textauditstandard.1.0.3/Screenshots/Screenshot1.png
https://gallery.windowsazure.cn/artifact/20161101/datagrand.textauditstandard.1.0.3/Screenshots/Screenshot1.png
服务商
服务专线
400-175-9889

文本鉴黄鉴政识别

达观数据

自动判别文章内容是否政治违规和是否情色违规,同时给出违规的严重程度。

达观智能文本审核系统提供智能审核、管理平台、灵活定制、自学习系统等4大功能模块。为客户提供高质量的文本内容审核服务的同时,与客户一同优化现有智能审核系统,由于机器学习算法迭代更新是自学习体系,当通过人工复审帮助纠正问题时,可以实现打造属于客户独有的语料库及模型,并且通过管理后台实现基于数据统计分析的科学化自主管理和运营。

为了克服标注样本不足的难题,垃圾信息过滤可以引入半监督学习方法来增强信息处理的能力。半监督学习方法的优势是能够在只有少量标注数据的条件下,综合利用已标注数据和未标注数据的信息,达到较好的过滤效果。

达观的多语种文本挖掘系统在多个模块里面都使用到了半监督学习的方法,主要方式是通过外部知识来对训练样本进行语义扩展,然后结合数量较多的未标注样本选取预测置信度高的子集作为新样本加入训练集进行模型训练。

       达观内容审核系统提供对多语种言论内容进行检测并反馈检测结果的服务,返回结果必须包含检测异常类型(涉黄,涉政,违禁,广告,灌水,诈骗等,会详细提供以上异常类型的细分类型)、检测分值(0-1的数值)、涉及各异常类型的内容(词组或语句)及内容所在位置。


https://gallery.windowsazure.cn/artifact/20161101/datagrand.textauditstandard.1.0.3/Screenshots/Screenshot1.png
https://gallery.windowsazure.cn/artifact/20161101/datagrand.textauditstandard.1.0.3/Screenshots/Screenshot1.png