招标
【电子信息】【人工智能】20240805039面向自然语言处理通用对话领域的“活字”大模型(计算学部)
金额
-
项目地址
黑龙江省
发布时间
2024/08/05
公告摘要
项目编号-
预算金额-
招标公司-
招标联系人-
标书截止时间-
投标截止时间-
公告正文
区块链已存证
存证时间:
存证哈希值:
区块高度:
【电子信息】【人工智能】20240805039面向自然语言处理通用对话领域的“活字”大模型(计算学部)
【成果简介】
针对大规模语言模型在自然语言处理的通用领域取得的成功及该技术在广泛的应用场景中展示了强大的潜力,团队自主研发并开源了通用对话大模型“活字”。该模型在BLOOM-7B基础上,通过指令微调后在标准的中/英文基准与主观测评上均取得优异的效果,同时支持多语言对话能力;人工构造了更多指令微调模板,使得指令微调的数据更加丰富;基于多轮对抗攻击,以SFT形式手动设计安全数据,强化模型回复的安全性和合规性;通过人类反馈的强化学习(RLHF)进一步优化了模型回复质量,使其更加符合人类偏好。
【技术指标】
“活字”大模型拥有70亿参数,可以处理长度为2048的中/英文序列。C-Eval中文知识指标为38.19%,MMLU英文知识指标为37.05%。
【应用前景】
“活字”大模型的多语言支持和强大的对话能力使其在多个领域显示出广泛的潜力。该模型可被应用于提高客户服务效率,通过自动化和即时响应减轻人工负担。在教育领域,它可以作为学习工具,辅助语言学习和练习。其跨语言交流的功能促进了国际旅游和商务中的沟通。此外,“活字”大模型拥有处理和分析大量文本的能力,可以用于研究和数据分析,帮助从复杂的文本中提取有价值的洞见。
存证时间:
存证哈希值:
区块高度:
【电子信息】【人工智能】20240805039面向自然语言处理通用对话领域的“活字”大模型(计算学部)
【成果简介】
针对大规模语言模型在自然语言处理的通用领域取得的成功及该技术在广泛的应用场景中展示了强大的潜力,团队自主研发并开源了通用对话大模型“活字”。该模型在BLOOM-7B基础上,通过指令微调后在标准的中/英文基准与主观测评上均取得优异的效果,同时支持多语言对话能力;人工构造了更多指令微调模板,使得指令微调的数据更加丰富;基于多轮对抗攻击,以SFT形式手动设计安全数据,强化模型回复的安全性和合规性;通过人类反馈的强化学习(RLHF)进一步优化了模型回复质量,使其更加符合人类偏好。
【技术指标】
“活字”大模型拥有70亿参数,可以处理长度为2048的中/英文序列。C-Eval中文知识指标为38.19%,MMLU英文知识指标为37.05%。
【应用前景】
“活字”大模型的多语言支持和强大的对话能力使其在多个领域显示出广泛的潜力。该模型可被应用于提高客户服务效率,通过自动化和即时响应减轻人工负担。在教育领域,它可以作为学习工具,辅助语言学习和练习。其跨语言交流的功能促进了国际旅游和商务中的沟通。此外,“活字”大模型拥有处理和分析大量文本的能力,可以用于研究和数据分析,帮助从复杂的文本中提取有价值的洞见。
返回顶部