公告摘要
项目编号10341516
预算金额4.1万元
招标联系人-
标书截止时间-
投标截止时间-
公告正文
项目基本信息
需求描述:3.1功能要求:
1、检测类型:支持领导人姓名、领导人官职搭配、领导人排序、落马官员、港澳台主权、国际关系、政治敏感、时政表述、常见字词错误、成语错误、标点符号错误、句子查重、多字少字错误、叠词错误、地域错误、日期错误等18种错误类型检测。
2、训练内容覆盖2万多家政府网站和2000多个官方媒体,训练数据量达到十亿级别。
3、检测效率:1w字/秒
4、系统运行可不依赖互联网,不保存检测内容,确保内容安全
5、支持麒麟系统的软件运行
6、服务期内,不限检测字数、不限检测次数
7、支持导入word、wps、pdf、txt等常用文件格式的检测,保留原文样式
8、支持用户自定义重点词词库(包括重点词、领导人等),对重点词潜在的音、形等错误,自动进行重点检测。
3.2查错和纠错能力要求:
1、错别字校对
1.1支持同音字错误、同音词错误、音近字错误、音近词错误、漏字错误、多字错误、重叠字错误、字、词顺序错误、成语错误、词语搭配关系错误、的地得混用错误、英文单词拼写错误、标点符号错误等。
1.2能够以新华网、人民日报、各大中央部委官网等主流政务媒体的新闻报道为汉语资料库,自动学习常用的规范化表述,基于这个标准,检测文本中不规范的内容并做提示建议。
1.3支持误报忽略功能,忽略后的错误不再重复报告,并可根据需要对忽略的错误进行接受或拒绝处理。
1.4具备用户自主添加完善校对库,添加后的数据库能够同步更新;用户可以快速自定义词库,并能够汇总每个人的词库并共享。
1.5用户可自行配置规则库,快速解决误报、漏报的问题。
1.6能够记录更改过的正确和错误信息,并可按时间排序,供后续学习使用。
1.7能够对甲方已有数据进行统计学习,实现领域重点词的高召回率检测。
2、敏感信息校对
2.1支持新华社报道中的102种禁用词和慎用词。
2.2
支持媒体报道不规范、主权错误、法律法规、不文明用语、暴力和国家关系的检测。
2.3能够针对落马官员、领导人姓名、领导人官职搭配、领导人排序等错误信息进行检查,覆盖全国5000+领导人,3400+落马官员。 对领导人信息可实现自动提取及更新机制。
2.3
具备重点词监控功能,具备多种字符组成的敏感词校对功能。
2.4支持动态脚本引擎添加和自定义DSL语言。
2.5
支持自动生成人名误报词和误报拼音的触发词。
3、插件应用
提供Word、WPS的插件安装,可以快速调用查错接口。
3.3关键性能指标
2.1敏感词查全率>90%
2.2错别字查全率>85%
2.3落马官员全率>80%;
2.4敏感词误报率<10%,错别字误报率<25%;
2.5并发可支撑同时在线>1000,并发请求>100;
2.6支持单机多CPU环境下单篇文章的并行查错,能够将单篇文章快速拆分进行并行检测;
3.4部署和存储安全要求:
3.1支持快速便捷的本地部署和运行方式。
3.2支持MySQL、Oracle、H2、SQL Server、SQLite、DB2、以及各类提供了JDBC驱动的国产数据库。
3.3可快速切换数据库类型,无需提前创建表结构,无需更改源代码或重新打包部署。
3.4支持飞腾、龙芯、华芯等国产自主可控服务器,支持金仓、达梦、神通等国产自主可控数据库,支持金蝶、东方通、中创等国产自主可控中间件,支持银河麒麟、中标麒麟、深度等国产自主可控操作系统。(具体见标书)
预算金额:41000元
采购编号:10341516
采购人信息
九龙坡区消防救援支队

详情请访问原网页!
返回顶部