招标
中日友好医院疑难病症诊治能力提升工程项目(呼吸系统方向)呼吸疾病临床研究大数据平台应用系统开发和IT服务项目招标公告
疑难病症诊治能力提升呼吸系统疾病专病队列研究应用系统开发IT服务呼吸学科临床大数据服务医生临床研究数据采集数据存储平台抽取标准化清洗和处理转换生成统计分析结果的图表大数据综合开发与利用慢阻肺呼吸系感染呼吸疾病临床研究大数据中心应用与共享临床研究项目管理平台临床研究方法学培训科研大数据平台电子数据采集平台临床研究质控平台临床研究数据的标准化采集科研数据的标准化采集科研闭环管理教学课程呼吸专病医生的科研能力研究方案设计CRF表设计呼吸相关的数据资源可拓展的存储生物样本数据临床诊疗数据中心大数据应用系统开发应用服务医院管理运营疾病临床数据呼吸疾病临床研究数据类基础标准呼吸疾病临床研究数据进行分析和挖掘呼吸疾病病因病理分析疾病图谱分析医疗质量改进建议基于统计模型的智能化可视化分析系统多中心临床研究大数据收集与存储块存储文件存储服务临床研究数据应用和共享平台数据使用申请及审批在线统计大数据分析队列数据共享伦理在线规范化审核系统呼吸疾病科研数据治理呼吸疾病专病队列研究数据仓库呼吸疾病相关临床检查数据组学数据仓库网络安全连接通过划分DMZ区网络应用服务器DMZ服务器应用软件系统增量存储动态扩容海量数据的存储非结构化数据访问权限每日自动备份快速回滚容灾能力对数据进行多层面的数据分析中等规模数据集实时分析交互式分析大规模数据集进行复杂分析离线计算交互设计主流浏览器移动设备住院医嘱门诊处方EMR接口对接病程记录查房记录LIS接口对接前后端程序数据备份恢复容灾计划安全审计应用程序高危端口数据有效性检验功能恶意代码防范动态可信验证计算设备系统引导程序系统程序重要配置参数校验技术密码技术鉴别数据重要业务数据重要审计数据重要配置数据重要视频数据重要个人信息异地实时备份重要数据实时备份数据处理系统针对指定账号的权限控制用户身份系统资源配置系统加载异常处理信息量估算伦理审查异常访问影像数据影像检查格式化处理数据存储量科研病例基础服务层数据中心多台服务器Docker容器系统调度工具容器管理工具Kubernetes大数据关键信息基础设施软件服务层系统设计储存虚拟云平台虚拟化虚拟云管理平台虚拟设备虚拟机存储配置管理常规管理操作快照运行信息热迁移磁盘资源配额磁盘资源进行部分回收磁盘监控信息集群规划互联网出口的统一管理网络管理云资源管理报告管理运维监控基础业务服务运维系统短信网关服务邮件服务主数据管理服务运维相关服务账号和权限功能运维操作日志的记录运维配置动态修改自动化部署可用性稳定性性能指标参数故障现场保留可分析的信息故障智能处理系统自动恢复故障分析故障原因并修复基础业务管理功能基本管理主备管理基础业务的代码的自动发布发布记录跟踪基础业务的自动发布一般性更新用量管理基础的使用量进行规划管理邮件发送数量短信发送数量资源监控相应的告警策略支持数据统计操作行为管理统一安全管理对外接口可以采用授权加密协议监控功能健康监控健康状态监控调度功能运维管理数据仓库管理系统多源数据收集整合系统异构系统异构医疗数据结构化采集患者主索引管理分析患者其他外部资源的数据数据检索诊疗系统患者信息整合患者诊疗事件汇集管理异构数据源读取解构异构数据源数据通过交互接口进数据通信数据获取医疗科研呼吸疾病专病队列资源呼吸专病队列诊疗研究疾病转归呼吸疾病临床检查胸部X线胸部CT呼吸疾病影像及肺功能数据库支气管镜生物样本大数据仓库全序列基因检测数据分布式存储系统呼吸疾病相关数据分布式文件系统医疗影像分布式文件存储Hadoop中的HDFS分布式结构化关系型数据库分布式并行计算架构软硬件分离硬件部件存储节点应用系统的性能需要进行相应的配置和部署多存储介质冗余存储数据一致性事务性节点的分布策略顺序分布多节点的负载均衡自动负载均衡自动容错节点发生一般性故障不间断业务自动故障探测自动将服务切换到其他副本节点主副本备副本强同步复制异步复制数据的复制数据错误的问题增加节点业务不中断的容器总控节点工作机管理数据定位全局调度数据读取性能数据写入内存IOPS界面工具系统关键事件日志记录对日志的检索便于排错事件日志的导出重要事件的告警信息发送系统配置管理呼吸疾病相关的医疗数据共享呼吸疾病诊疗数据库呼吸疾病发病情况与风险因素监测数据库病例数据库查询检索系统数据清洗数据变量查询检索常规检索组合条件检索通用指标检索基础数据分析系统基本的描述性分析标准差分类数据的构成比对两组比较采用独立样本t检验配对卡方检验描述性统计图表直方图组间差异分析组间设计单因素方差分析组内设计配对样本t检验统计分析方法对多组比较采用单因素重复测量方差分析混合设计对统计分析结果进行保存或下载变量关联性分析流行病学研究在线分析工具Pearson相关Spearman相关简单线性回归Logistic回归Mante-Haenszel卡方检验大数据关联分析机器学习模式学习聚类决策树标准化数据采集模板预测模型公共卫生数据的国际主流预测分析方法临床研究数据进行挖掘分层随机整群抽样广义回归神经网络时间序列模型逻辑回归广义线性模型广义估计方程Cox比例风险模型社区人群队列卫生经济学模型预防策略数据共享系统临床试验伦理在线审查角色和组织管理临床研究管理与实施伦理委员伦理审核呼吸科研数据治理大型队列研究安全保密设计重要信息系统安全防护能力核心系统容灾备份信息安全与保密工作机制信息安全保障体系网络区域之间一般采用单向网络访问平台安全平台的建设多种身份认证信息安全防护访问策略统一权限管理系统的安全规则数据访问控制结构化数据访问权限数据防泄漏各类敏感数据业务环境隔离实时监测流量监测异常流量趋势分析数据加解密规则动态定制事前审计主动防卸扣应用安全访问控制功能用户登录访问控制角色权限控制修改时也应备份各业务应用中的重要操作也应采用数字签名系统补丁安装调试相关培训软件模块后续服务软件开发医疗信息化科研信息化产品分析服务
金额
669.5万元
项目地址
北京市
发布时间
2020/05/29
公告摘要
项目编号tc200v04p
预算金额669.5万元
招标代理机构中招国际招标有限公司
代理联系人梅建伟010-62108274
标书截止时间2020/06/05
投标截止时间2020/06/19
公告正文

招标公告
招标公告
项目名称:中日友好医院疑难病症诊治能力提升工程项目(呼吸系统方向)呼吸疾病临床研究大数据平台应用系统开发和IT服务项目
项目编号:TC200V04P








































































采购人名称:中日友好医院
采购人地址:北京市朝阳区樱花东路2号
采购人联系方式:010-84206087
采购代理机构全称:中招国际招标有限公司
采购代理机构地址:北京市海淀区学院南路62号
采购代理机构联系方式:010-62108274、62108225
采购用途:自用
公告期限:自招标公告发布之日起5个工作日
项目预算金额:669.5万元
数量:一项
招标项目基本概况介绍:中日友好医院疑难病症诊治能力提升工程项目(呼吸系统方向)呼吸疾病临床研究大数据平台应用系统开发和IT服务项目
采购需求、数量、服务要求:为行政部门和卫生经济决策提供数据支持,为制定卫生政策和建立临床质量评价体系提供证据。(详见附件)
投标人的资格条件:
(1)在中华人民共和国境内注册,具有独立承担民事责任的能力及经营许可,向采购人提供服务的法人、其他组织或自然人。
(2)具有良好的商业信誉和健全的财务会计制度。
(3)具有履行合同所必需的设备和专业技术能力。
(4)有依法缴纳税收和社会保障资金的良好记录。
(5)在参加政府采购活动前3年内在经营活动中没有重大违法记录。
(6)本项目不接受联合体。
(7)供应商不得将本项目采购内容以任何方式进行转包。
(8)符合法律、行政法规规定和招标文件中规定的供应商的其他要求。
需要落实的政府采购政策:《关于中国环境标志产品政府采购实施的意见》(财库【2006】90号)、《国务院办公厅关于建立政府强制采购节能产品制度的通知》(国办发【2007】51号)、《关于开展政府采购信用担保试点工作的通知》(财库【2011】124号)、《关于印发《政府采购促进中小企业发展暂行办法》的通知》(财库【2011】181号)、《财政部、司法部关于政府采购支持监狱企业发展有关问题的通知》(财库【2014】68号)、《三部门联合发布关于促进残疾人就业政府采购政策的通知》(财库【2017】141号)。
招标文件发售时间:
2020年5月29日至2020年6月5日 (节假日除外),上午9:00至11:00;下午1:30至4:00(北京时间)
招标文件发售地点:http://www.365trade.com.cn(线上发售)
招标文件售价:300元人民币/包
投标截止时间及开标时间:2020年6月19日09:00(北京时间)
投标、开标地点:中招国际招标有限公司六层会议室(北京市海淀区学院南路62号)
评标方法和标准:综合评分法
项目联系人:梅建伟、曹武宁
联系方式:010-62108274、62108225
招标公告期限:自公告发布之日起5个工作日

中招国际招标有限公司
2020年5月29日
附件1:
 
各潜在投标人:
本项目接受网上发售、下载电子版招标(采购)文件/资格审查文件(下简称“标书”),现将有关注意事项特别告知如下:
(一)  网上注册:凡有意在线获取电子版标书的潜在投标人,请务必在本项目电子版标书发售截止时间前,登录中招联合招标采购平台(http://www.365trade.com.cn;下简称“交易平台”)或在中招国际招标有限公司网站主页进行免费注册。潜在投标人只需注册一次,不同的经办人可建立多个账户。交易平台负责对投标人注册信息与其提供扫描件信息进行一致性检查。
(二)  标书下载:经办人凭获得的用户名、密码验证身份登录、上传《招标(采购)公告》要求的报名资料(如有)、购买并下载电子标书,逾期将无法下载获取。
(三)  电子版标书下载收费:如在线购买并下载电子版标书,除标书款外还需通过网银支付标书下载服务费,收费标准为每标包200元,由中招联合信息股份有限公司出具增值税电子普通发票,标书购买人可登录“中招联合招标采购平台”自行下载增值税电子普通发票。标书下载费一经收取不予退还。
(四)    潜在投标人成功下载电子版标书后,标书款发票可与中招国际招标有限公司本项目联系人确定领取方式。
(五)     其它事项
1、交易平台首页帮助中心提供操作手册,潜在投标人可以下载并根据操作手册提示进行注册、登录、网上购买下载电子版标书及下载费支付、发票开具领取等操作。
2、如遇平台操作问题,可拨打交易平台统一服务热线:010-86397110、62108037进行咨询,热线服务时间为工作日上午9点到12点,下午1点30分到5点。
 
   
附件2:
服务需求
一、项目简介
1、项目背景
呼吸系统疾病是我国的常见、重大疾病,其发病率、死亡率长期居我国城乡居民各系统疾病发病率、死亡率前三位,疾病负担巨大,已成为国家极为突出的公共卫生与医疗保健问题。现阶段我国呼吸疾病防治与研究体系建设严重滞后,难以应对日趋严重的发病形势,整体防治能力急需加强。这一严峻形势赋予了我国呼吸学界历史使命,也为呼吸学科发展提供了极其宝贵的机遇。
依托国家呼吸系统疾病临床医学研究中心,统筹本领域我国最具优势的人群研究资源、专病队列资源及诊疗研究协同网络资源,打造覆盖主要呼吸疾病全过程、具有全国代表性、良好研究协同性与延续性的呼吸疾病临床研究大数据平台,开发应用系统,提供IT服务,实现临床研究数据采集、存储、抽取、清洗、转换、分析和开发应用过程的全覆盖,积极开展临床大数据服务医生、服务患者、服务科研、服务医院管理运营、服务医疗卫生决策等方面的探索,为全国医学临床研究大数据综合开发与利用打造示范标杆。
2、建设依据
ž   《国家卫生健康委关于中日友好医院疑难病症诊治能力提升工程(呼吸系统方向)可行性研究报告(代项目建议书)的批复》(国卫规划函〔2018〕289号)
ž   《中日友好医院疑难病症诊治能力提升工程(呼吸系统疾病方向)可行性研究报告(代项目建议书)》
ž   国家发展改革委办公厅 国家卫生计生委办公厅《关于印发疑难病症诊治能力提升工程项目遴选工作方案的通知》(发改办社会〔2017〕1513号)
ž   国家发展改革委办公厅 国家卫生计生委办公厅《关于印发疑难病症诊治能力提升工程项目储备库的通知》(发改办社会〔2018〕347号)
ž   中共中央、国务院《“健康中国”2030规划纲要》
ž   国务院《关于印发“十三五”卫生与健康规划的通知》(国发〔2016〕77号)
ž   国务院《关于印发“十三五”深化医药卫生体制改革规划的通知》(国发〔2016〕78号)
ž   国务院办公厅《关于推进分级诊疗制度建设的指导意见》(国办发〔2015〕70号)
ž   《全民健康保障工程建设规划》
ž   《国务院办公厅关于印发全国医疗卫生服务体系规划纲要(2015-2020年)的通知》(国办发〔2015〕14号)
ž   《卫生部关于做好区域卫生规划和医疗机构设置规划促进非公立医疗机构发展的通知》(卫规财发〔2012〕47号)
ž   《国家信息化发展战略纲要》
ž   《国务院促进数据发展行动纲要》
ž   《关于印发深化医药卫生体制改革2017年重点工作任务的通知》
ž   国务院办公厅《关于促进和规范健康医疗数据应用发展的指导意见》(国办发〔2016〕47号)
ž   《国家卫生计生委办公厅关于加快推进全民健康信息平台互联互通工作的通知》
ž   《国家卫生计生委关于印发“十三五”全国人口健康信息化发展规划的通知》
ž   《中日友好医院疑难病症诊治能力提升工程项目(呼吸系统方向)初步设计概算》
ž   项目单位提供的有关资料
ž   其它相关国家规范标准和地方条例。
 
二、需求分析
2.1 基本现状
中日医院为国家呼吸疾病临床医学研究中心依托单位,同时也是国家临床呼吸重点专科单位,近年来已经联合多个国家级、省部级科研/学术平台,在呼吸疾病领域承担多项国家重大科研项目及课题,在慢阻肺、间质性肺疾病、哮喘、肺血管病、呼吸系感染、烟草病等亚学科开展了多项全国大规模、多中心以及国际合作研究,已汇集大量呼吸疾病临床研究数据。
但是,目前各项研究、各个地区、各个单位间的临床研究数据资源仍较为分散,不同来源的数据异构性大,难以整合,同时缺乏统一的数据储存-提取空间及路径,临床研究数据开发、分析和应用也不足,尚未形成数据共享模式。既往的呼吸疾病临床研究项目缺乏系统管理,尤其是研究者发起的研究,项目实施全程缺乏监督。此外,许多呼吸疾病临床诊疗协作组单位及呼吸专科医联体单位,特别是基层医疗机构,在开展高质量的临床研究方面有着迫切需求。
中日医院作为国家呼吸疾病临床医学研究中心依托单位,需要建立呼吸疾病临床研究大数据中心,搭建相应的数据收集与存储、应用与共享、项目管理、临床研究方法学培训等平台,在呼吸疾病临床研究领域提供模范与标杆。
目前已初步建成呼吸疾病临床研究大数据平台,包括电子数据采集平台、临床研究项目管理平台、临床研究质控平台、临床研究方法学培训平台,服务呼吸系统专病临床与科研医生,实现临床研究数据的标准化采集,提升呼吸领域医生的临床研究能力,以标准化的科研项目管理流程,提高临床研究的效率。目前,已主要实现以下几个方面的功能:
实现科研数据的标准化采集。大数据平台已实现呼吸疾病临床研究项目的标准化电子数据采集,将原有的纸质版文件转换为线上电子化数据,解决了临床医生在采集数据过程中数据采集不准确、人工录入错误、数据清洗困难等关键问题,为数据治理、数据共享、数据交换传输标准等奠定了基础。
实现科研闭环管理。通过在平台上建设科研管理规则,实现基于科研项目驱动的临床研究全流程闭环管理,同时在闭环过程中以完整性、时效性、规则性建立对时间、人物、角色、流程、权限等的监控,达到临床研究的精细化管理目标,促进临床研究管理工作的规范化、专业化、标准化、精细化,不断提高科研质量,保证科研过程中的透明与合规,改善科研管理水平,提高整体服务水平与服务能力。
提升临床研究能力。依托中日医院及中日呼吸疾病医联体,通过呼吸疾病临床研究培训平台,针对医生在临床研究中遇到的关键问题,推出系列教学课程,有效提升呼吸专病医生的科研能力,规范化科学研究的研究方案设计、CRF表设计,加强统计分析能力,为科研成果的落地与转化提供必要的条件。
在前期建设的应用系统的基础上,仍存在尚待解决的问题,如下:
(1)临床研究数据存储困难
随着科研病例、影像数据和基因组学数据的大量增加,亟需构建呼吸疾病临床研究数据存储平台,汇聚整合呼吸相关的数据资源,对异构数据进行标准化清洗和处理,实现安全、高性能、可拓展的存储,为我国呼吸疾病相关临床研究提供高质量的临床、生物样本和组学信息,能够为上层应用提供稳定的基础和快速高效的数据调度。
(2)存在信息孤岛现象
大量患者数据分散在HIS、CIS、LIS、RIS/PACS 等各应用系统中,数据源格式不统一,元数据描述混乱,缺少标准化手段,存在数据孤岛,不利于科研工作人员全面了解患者的完整医疗活动情况以及历史诊疗信息。需要在数据层面实现临床与科研数据的互联和共享,及时调用和读取所需数据,有利于加快科研进程,实现数据的共享。
(3)决策过程缺乏数据驱动
目前临床诊疗、决策制定均与实际数据和研究存在一定的断层,无法真正意义上实现数据驱动的决策。需要运用新一代的信息技术,支持开展各类呼吸疾病临床研究项目和数据分析,将汇聚的数据资源进一步挖掘,发现关联性,将分析得到的成果能够用于修正临床指南,为医生提供可参考的诊疗意见,为患者提供精准优化的医疗方案。为行政部门和卫生经济决策提供数据支持,为制定卫生政策和建立临床质量评价体系提供证据。
(4)科研流程亟需优化
目前各家临床试验机构都在建立自己的信息化管理系统,缺乏完整、大规模的信息平台,临床研究的开展进度常因此受到影响。需要在信息化的基础上,以数据资源规划和管理流程优化的手段,对科研管理流程进行持续优化和再造。建立针对关键流程中各里程碑节点(例如伦理审核)的全程实时管理,进行合理、有效地调配资源。
2.2 建设目标
本项目统筹本领域我国最具优势的人群研究资源、专病队列资源及诊疗研究协同网络资源,基于呼吸疾病临床研究大数据平台建设成果,持续优化基础设施,构建实现先进的临床研究大数据应用系统,实现临床研究数据采集、存储、抽取、清洗、转换、分析和开发应用过程的全覆盖,积极开展临床大数据服务医生、服务患者、服务科研、服务医院管理运营、服务医疗卫生决策等方面的探索,为全国医学临床研究大数据综合开发与利用打造示范标杆。呼吸疾病临床研究大数据平台应用系统开发和IT服务主要目标包括:
(1)  规范化收集、储存呼吸疾病患者及风险人群的临床数据及生物样本,并建设具备国际标准水平的管理共享平台;
(2)  制定呼吸疾病临床研究数据类基础标准,形成标准体系,规范数据格式,把控数据质量,进行数据治理,确保科研数据标准化、规范化;
(3)  对收集存储的呼吸疾病临床研究数据进行分析和挖掘,包括呼吸疾病病因病理分析、疾病图谱分析、医疗质量改进建议等,建立基于统计模型的智能化、可视化分析系统,加速科研成果的产生;
(4)  为更好的支持在全国范围内开展的多中心临床研究,加速和规范化流程管理,实现高效、规范、线上、便捷的伦理审批过程。
2.3 建设内容
本次建设内容主要为以下五个部分:
1、研究大数据收集与存储平台
临床研究大数据收集与存储平台需支持块存储、对象存储和文件存储,满足可扩展、高性能、易用等基本特性。针对数据的使用情况,平台的建设要考虑数据持久性、分布性、一致性、延时控制、吞吐率、容错、负载均衡、事务与并发、压缩/解压缩、空间利用率等技术能力。
2、研究数据应用和共享平台
为充分挖掘呼吸疾病临床研究大数据平台的数据价值,更好地帮助呼吸领域研究者应用数据产出科研成果,通过搭建呼吸疾病临床研究数据应用和共享平台,为研究者提供数据使用申请及审批、在线统计、大数据分析、队列数据共享等系统服务,智能高效地分析数据,合规安全地使用数据结果。
3、伦理在线规范化审核系统
伦理在线规范化审核系统将针对大型多中心临床研究,建立一套科研信息规范,以及信息的采集、审核和归档机制。建设高质量的集中统一的科研信息数据库,降低在不同研究中心逐一接受伦理审查带来的时间成本,优化临床研究流程,并实现在线或异地伦理审核,优化现有的工作流程,提高科研工作效率。
4、呼吸疾病临床研究标准规范编制
元数据类标准是呼吸疾病临床研究标准体系中的基础标准,依据通用数据标准规定的元数据格式,分析数据差异,采集和整理各个病种的元数据,分类形成各病种的元数据和术语集,建立基础数据库。指导呼吸疾病临床研究后续的临床数据库建设,使其少走弯路,在高起点上沿着标准化、规范化的轨道有序、高效、快速、健康地发展。
5、呼吸疾病科研数据治理
对收集和存储的多源异构数据进行数据治理,该平台主要采集的数据源包括:高危人群和社区人群研究数据、呼吸疾病专病队列研究数据、呼吸疾病相关临床检查数据、生物样本数据、组学数据等,分别依据标准进行转换和清洗,存储形成各自的专有数据仓库。
2.4 网络系统功能需求
网络连接首先要符合医院总体网络规划,在医院网络架构的基础上,根据项目业务需求,提出项目的网络连接需求。
目前,医院的内外网是隔离的,相关系统都是部署在院内网络上的,安全问题比较容易得到保障。本次项目的科研大数据平台的建设将部署外网、内网和内外网数据交换区,内外网有数据的交互,而数据安全是大数据平台的重中之重,所以大数据平台的网络需要按等保要求进行相应的安全建设。
传统网络安全最关注的问题是边界安全的问题,在纯物理网络的情况下,其边界是清晰的,通过严防死守就能消除绝大部分安全隐患,如漏洞扫描、渗透测试、防病毒、终端安全等配合网络边界的传统安全防护就可以万事大吉。但是在云计算的环境下则发生了变化,从传统单一的物理安全边界演变为两种边界:物理网络边界和云内区域边界。
根据项目业务需求,项目与医院临床数据中心、医院汇聚数据存在数据采集交互,业务涉及院前、院中、院后,且与医联体、专科联盟之间存在数据交互,从数据安全角度考虑,需要划分出不同的网络连接区域。
网络安全连接需求如下:
1、科研数据中心与医院临床数据中心部署在同一网络区域,或单独设置和网卡绑定的物理网络区域,通过指定IP段的端口访问控制连接临床数据中心的数据库;
2、通过划分DMZ区网络,在科研数据中心内网与互联网应用区域外网之间设置数据缓冲隔离带,实现三网段安全网络拓扑结构:外网、内网和DMZ;
3、内网用户可以被授权访问外网和DMZ中的服务器;
4、外网用户只能访问到DMZ中的相关服务器,不能访问内网;
5、DMZ可以放置各种应用服务器,这些服务器允许有限制的被各种用户使用,一般不允许DMZ服务器主动访问内网服务器。
 
2.5 应用软件系统需求
2.5.1 存储需求
(1)平台具备增量存储和动态扩容的能力,支持海量数据的存储;
(2)具备存储结构标准,支持存储非结构化数据和结构化数据;
(3)支持每日自动备份,具备快速回滚和容灾能力。
2.5.2 数据分析需求
(1)支持对数据进行多层面的数据分析;
(2)具备对中等规模数据集实时分析的能力,以支持交互式分析;
(3)具备对大规模数据集进行复杂分析的能力,以支持离线计算。
2.5.3 交互设计需求
本平台服务均需通过各种交互应用供呼吸领域临床研究相关的用户使用,让用户获得最好的交互体验,交互技术需要满足以下要求:
(1)便捷性:用户群体复杂,交互应用应根据应用场景选择适合的应用载体,如浏览器、移动设备等,方便用户使用;
(2)实用性:应以实用为目标,真正帮助用户解决问题;
(3)易用性:平台用户量庞大,交互应用应当简单易用,减少用户的学习成本。
2.5.4 软件接口需求
(1)支持Restful接口协议规范,满足平台软件数据交互需要;
(2)支持Web服务描述语言(WSDL)和XML;
(3)支持Web Service接口协议,规范、约束和满足其他系统的对接需要;
(4)支持与HIS接口对接,可抽取或接收患者基本信息、住院医嘱和门诊处方等数据;
(5)支持与EMR接口对接,可抽取或接收入院病例、病程记录、查房记录等数据;
(6)支持与LIS接口对接,可抽取或接收患者检验结果数据。
2.5.5 性能需求
平台性能影响着业务人员开展各类业务的效率,是评价平台可用性的重要指标,因此,平台规划设计时需充分考虑性能要求,并且需在平台建设和运维过程中通过各种手段对平台进行不断的优化和调整,以达到各类业务使用要求。为提升用户体验,系统应支持:
(1)支持千人以上同时在线,并发数不小于100;
(2)服务器端平均响应时间不超过300ms,千兆局域网的网络状态下,客户端平均响应时间不超过3s(含有大文件、大音频、大视频业务操作除外);
(3)平均吞吐量应不小于600QPS,峰值吞吐量不小于2000QPS;
(4)支持系统的7x24小时正常运行,如果出现单节点崩溃的情况下,5分钟内能自动切换其他对等节点;
(5)如出现服务器崩溃的情况下,故障节点自动隔离,1小时内能保证系统低速正常运行,为故障应急响应争取时间。
2.5.6 安全需求
2.5.6.1整体安全要求
(1)保证系统中的数据安全:保证系统中的数据不被非法阅读、篡改,确保非法用户不能进入本系统,数据必须加密存储和传输;
(2) 数据的变更需有历史记录及相关人员操作记录,以及单独的审核记录;
(3)涉及患者隐私的信息,必须进行加密,保证数据存储和传输过程中的信息安全;
(4)具备完整的安全访问策略,针对多中心多用户自由灵活的分级权限配置方式,具有严格控制数据访问权限的能力;
(5)在网络故障、服务器故障等特殊情况下,系统应能确保数据不丢失;
(6)前后端程序、数据备份简单方便,出现异常情况可快速恢复系统,具有完整的数据备份和容灾计划;
(7)支持阻止非法篡改数据的操作并对非法操作行为及时预警。
2.5.6.2 身份鉴别要求包括
(1)应对登录的用户进行身份标识和鉴别,身份标识具有唯一性,身份鉴别信息具有复杂度要求并定期更换;
(2)应具有登录失败处理功能,应配置并启用结束会话、限制非法登录次数和当登录连接超时自动退出等相关措施;
(3)当进行远程管理时,应采取必要措施防止鉴别信息在网络传输过程中被窃听;
(4)应采用口令、密码技术、生物技术等两种或两种以上组合的鉴别技术对用户进行身份鉴别,且其中一种鉴别技术至少应使用密码技术来实现。
2.5.6.3 访问控制要求包括
(1) 应对登录的用户分配账户和权限;
(2) 应重命名或删除默认账户,修改默认账户的默认口令;
(3) 应及时删除或停用多余的、过期的账户,避免共享账户的存在;
(4) 应授予管理用户所需的最小权限,实现管理用户的权限分离;
(5) 应由授权主体配置访问控制策略,访间控制策略规定主体对客体的访间规则;
(6)访间控制的粒度应达到主体为用户级或进程级,客体为文件、数据库表级;
(7) 应对重要主体和客体设置安全标记,并控制主体对有安全标记信息资源的访问。
2.5.6.4 安全审计要求包括
(1)应启用安全审计功能,审计覆盖到每个用户,对重要的用户行为和重要安全事件进行审计;
(2) 审计记录应包括事件的H期和时间、用户、事件类型、事件是否成功及其他与审计相关的信息;
(3) 应对审计记录进行保护,定期备份,避免受到未预期的删除、修改或覆盖等;
(4) 应对审计进程进行保护,防止未经授权的中断。
2.5.6.5入侵防范要求包括
(1) 应遵循最小安装的原则,仅安装需要的组件和应用程序;
(2) 应关闭不需要的系统服务、默认共享和高危端口;
(3) 应通过设定终端接入方式或网络地址范围对通过网络进行管理的管理终端进行限制;
(4) 应提供数据有效性检验功能,保证通过人机接口输入或通过通信接口输入的内容符合系统设
定要求;
(5) 应能发现可能存在的已知浦洞,并在经过充分测试评估后,及时修补漏洞;
(6) 应能够检测到对重要节点进行入侵的行为,并在发生严重入侵事件时提供报警。
2.5.6.6 恶意代码防范
应采用免受恶意代码攻击的技术措施或主动免疫可信验证机制及时识别入侵和病毒行为,并将其有效阻断。
2.5.6.7可信验证
(1)可基于可信根对计算设备的系统引导程序、系统程序、重要配置参数和应用程序等进行可信验证,并在应用程序的关键执行环节进行动态可信验证,在检测到其可信性受到破坏后进行报警,并将验证结果形成审计记录送至安全管理中心。
2.5.6.8 数据完整性要求包括:
(1)应采用校验技术或密码技术保证重要数据在传输过程中的完整性,包括但不限千鉴别数据、重要业务数据、重要审计数据、重要配置数据、重要视频数据和重要个人信息等;
(2) 应采用校验技术或密码技术保证重要数据在存储过程中的完整性,包括但不限于鉴别数据、重要业务数据、重要审计数据、重要配置数据、重要视频数据和重要个人信息等。
2.5. 6.9 数据保密性要求包括
(1) 应采用密码技术保证重要数据在传输过程中的保密性,包括但不限于鉴别数据、重要业务数据和重要个人信息等;
(2) 应采用密码技术保证重要数据在存储过程中的保密性,包括但不限千鉴别数据、重要业务数据和重要个人信息等。
2.5.6.10 数据备份恢复要求包括
(1) 应提供重要数据的本地数据备份与恢复功能;
(2) 应提供异地实时备份功能,利用通信网络将重要数据实时备份至备份场地;
(3) 应提供重要数据处理系统的热冗余,保证系统的高可用性。
剩余信息保护要求包括
(4) 应保证鉴别信息所在的存储空间被释放或重新分配前得到完全清除;
(5) 应保证存有敏感数据的存储空间被释放或重新分配前得到完全清除。
个人信息保护要求包括
(6) 应仅采集和保存业务必需的用户个人信息;
(7) 应禁止未授权访问和非法使用用户个人信息。
2.5.6.11 系统管理要求包括
(1) 应对系统管理员进行身份鉴别,只允许其通过特定的命令或操作界面进行系统管理操作,并对这些操作进行审计;
(2) 应通过系统管理员对系统的资源和运行进行配置、控制和管理,包括用户身份、系统资源配置、系统加载和启动、系统运行的异常处理、数据和设备的备份与恢复等。
2.5.6.12 审计管理要求包括
(1)应对审计管理员进行身份鉴别,只允许其通过特定的命令或操作界面进行安全审计操作,并对这些操作进行审计;
(2)应通过审计管理员对审计记录应进行分析,并根据分析结果进行处理,包括根据安全审计策略对审计记录进行存储、管理和查询等。
2.5.6.13 安全管理要求包括
(1) 应对安全管理员进行身份鉴别,只允许其通过特定的命令或操作界面进行安全管理操作,并对这些操作进行审计;
(2) 应通过安全管理员对系统中的安全策略进行配置,包括安全参数的设置,主体、客体进行统一安全标记,对主体进行授权,配置可信验证策略等。
2.6 信息量估算
本项目需要从院内系统、其他机构连续收集大量的数据,形成统一的数据仓库系统。根据今年来实际的临床诊疗情况和相关科研项目实施情况,对各种需要处理的数据规模估算如下。
2.6.1 数据处理量
科研病例数据,按照每年新增10万病例相关数据,平均每日增加274例,处理峰值按平均值10倍估算,则每小时录入峰值114例,每病例原始数据加上相关附件、日志等,约5MB数据量, 约570MB。对数据进行清洗、审查、清洗、访问等操作,实际写入量约为原始数据量的5倍,读取量约为10倍,即峰值时每小时需写入2.85GB数据、读取5.7GB。
影像数据,按照初始处理3万病例数据,每年新增1万病例数据,每病例每年进行1.5次影像检查,以每次数据量300M计算,每年将新增影像数据(3万+1万)x1.5=6万份,每日增加165例,每天的峰值按平均值5倍估算,则每小时录入峰值35份,约10.5GB。对数据进行格式化处理、分析,实际写入量约为原始数据量的2倍、读取量约为5倍,即峰值时每小时需写入21GB、读取52.5GB。并且由于病例每年持续新增,每年的影像数据处理量峰值也预计增长25%左右。
组学数据,按照3年内达到记录5万例病例组学数据,每例数据约100G测算,每日增加46例,约4.6TB,每日处理峰值按照平均值的2倍估算,则每小时产生的原始数据量约383GB。对数据进行处理、分析、访问等操作,实际写入量约为原始数据量的2倍,读取量约为5倍,即峰值时每小时需写入766GB,读取1.9TB。
2.6.2 数据存储量
科研病例数据,按照初始病例30万,每年新增10万,每病例原始数据加上相关附件、日志等,约5MB数据量测算,初始状况下需要存储原始数据1.5TB,每年新增0.5TB。考虑到该部分数据的安全和重要性,存储量采用双倍准备,即初始状况下需要3TB的存储,并且每年新增1TB,同时考虑到投资效益比,目前按照三年计算,共需要5TB。
影像数据,按照初始3万病例、每年新增一万病例,每病例每年检查1.5次,每次数据300MB测算,初始影像数据按照4.5万份算,初始数据量为18TB,第一年新增24TB,后续每年新增量每年增长约25%左右。在存储时,需要对数据进行结构化处理,按30%冗余量计算,即初始状况下需要23.4TB的存储,每年新增量增长25%,同时考虑到投资效益比,目前按照三年计算,第二年年新增31.2TB,第三年新增39TB,三年的总量约为94TB。
组学数据,按照3年内达到2万例,每例数据约100GB测算,总存储容量为1.9PB,只考虑一倍冗余和兼顾数据增长曲线的情况下,预计要先配备3PB以上存储空间。
综上,病例和影响数据存储量需配置大约100TB的SSD存储阵列,组学数据需配置约3PB以上存储空间。
2.6.3 传输流量
传输流量是指用户访问服务器后,服务器在1秒时间范围内做出回应,并假设在线人数即是并发人数。按照网域,传输流量分为医院业务网区域、医院办公网区域和数据综合交换区域三个网域的传输流量,各网域估算情况如下:
1.医院业务网区域流量(详见表):
表 网络入口数据传输量估算表



















群体
描述
需求
患者群体、
医疗培训人员
同时约100人在线,假设峰值为400人并发,每个页面平均100Kbps,占用带宽为400×100K≈40Mbps。
40Mbps
总计
40Mbps

考虑到冗余和安全加密等对带宽的消耗,取30%。因此,加上冗余后的网络入口传输量为40×1.3=52Mbps。
2.医院办公网区域流量(详见表):
 
 
表  网络入口数据传输量估算表



















群体
描述
需求
临床科研研究者
同时约400人在线,并发约300人在线,每个页面平均100Kbps,占用带宽300×100Kbps≈30Mbps。
30Mbps
总计
30Mbps

考虑到冗余和安全加密等对带宽的消耗,取30%。因此,加上冗余后的网络入口传输量为30×1.3≈39Mbps。加上原有业务需要使用的带宽为40Mbps,共需要70Mbps,需扩容到100Mbps左右。
3.数据综合交换区域流量
综合交换区域由于涉及到影像数据和组学数据的深度学习,数据传输量巨大,必须采用万兆核心交换机。
2.7 系统设计原则
系统建设遵循标准化开发,软件设计严格执行国家有关软件工程的标准,应用设计符合国家、医疗卫生行业相关标准、规范以及尽量贴合医院自身的发展规划。
(1)规范性
平台的设计和开发应遵循国家、卫计委及有关医疗行业通用的标准和规范。
(2)先进性
平台的建设应使用成熟、具有国内先进水平、并符合国际发展趋势的技术。
(3)可靠性和可维护性
软件应能有合理的稳定运行时长,极少因为系统自身的原因发生系统崩溃的情况,在应用系统崩溃的情况下可以在有效时间内及时自动恢复或手工恢复,且可重新恢复或重新启动。
(4)兼容性
软件应该能兼容目前市面上主流的浏览器且不影响使用者的体验 。
(5)可用性
在设计上要充分考虑用户界面应方便、友好、灵活,需要方便用户在权限范围内于各子系统之间切换。有良好的整体化设计,且性能满足一般应用需求,不能由于系统性能原因影响用户的使用体验和感受。
(6)扩展性
考虑未来技术与业务发展,在设计上应定义一个开放的系统架构,具备适应业务变化和构建更多新型业务的能力。
(7)安全性
保证数据不被非法入侵者破坏和盗用,并保证数据的一致性。系统应选用可靠性高的产品及技术,充分考虑系统出现异常情况时的应变能力和容错能力,确保系统的安全性。 
(8)前瞻性
该平台架构应满足当前国内呼吸疾病领域临床研究业务需求,并兼顾因能力提升所带来的业务升级需求。
2.8 体系结构
系统架构应具备基础设施层、基础服务层和软件服务层三层架构,支持基于Linux核心的服务器端操作系统,支持主流浏览器。
基础设施层应满足整个系统平台的基本环境需要,保证数据中心多台服务器的统一管理、软件的统一部署,使用Docker容器等轻量级虚拟化技术,采用系统调度工具和容器管理工具,例如Kubernetes和Nginx等来实现基础设施(计算、存储、网络、GPU等)的统一管理,简化管理的复杂性,降低硬件投资。
基础服务层应满足整个软件平台的运营需要,将基础能力抽象成服务对外提供接口。其他软件可以通过灵活组合接口,实现能力的复用和数据的统一管理。
软件服务层应满足整个系统平台的业务使用需要,实现相同业务的聚合、不同业务的解耦和用户界面的展示。除满足呼吸疾病临床科研的业务需要外,还能满足第三方系统的对接和对未来业务的更新迭代能力。
三、系统设计
3.1 呼吸疾病临床研究大数据收集与储存平台
随着信息化时代的推进,尤其是各类影像数据资料的普及,医疗大数据的数据量和数据规模呈现出了爆炸式的增长,数据的数量单位从 TB 到 PB 到 EB,再到 ZB不断突破新的记录。基于此产生的海量数据的存储问题急需解决。
目前医院内的各医疗信息化业务系统仍较为分散,使得各个系统之间存在信息孤岛和标准不统一的问题。本建设项目实施过程中需要支持多种数据来源,包含中日医院院内系统的诊疗数据(HIS、LIS、PACS等)以及其他中心机构导入的诊疗数据和其他数据,再加上相关数据种类复杂:结构化数据包括病人电子病历、诊疗和临床数据等信息,非结构化数据包括医学影像、生物样本、组学数据等,所以平台需要支持获取各个独立系统的数据,以及结构化和非结构化数据、分布式的大数据存储和整合。
基于上述情况,临床研究大数据收集与存储平台需支持块存储、对象存储和文件存储,满足可扩展、高性能、易用等基本特性。针对数据的使用情况,平台的建设要考虑数据持久性、分布性、一致性、延时控制、吞吐率、容错、负载均衡、事务与并发、压缩/解压缩、空间利用率等技术能力。
3.1.1 虚拟云平台
虚拟化是一种将功能与硬件分离的技术,而云是建立在这种分离技术之上,从私有云平台的建设来看,虚拟主机的采用能够有效的逻辑分离软硬件建设,具备良好的扩展性,能够通过以物理硬件系统为基础创建多个模拟环境或专用资源,从而将硬件系统划分为不同的、单独安全环境,虚拟云管理平台系统可以有效的对划分出的虚拟环境进行管理和监控,从而保证应用系统的正常运行。
3.1.1.1 基本功能
虚拟云管理平台系统是重要的运维系统,规划和管理着虚拟设备,其基本功能点需要满足如下:
具备与呼吸疾病临床大数据平台的账号、权限以及其他必要的相关系统对接能力,保证账号和权限的统一;
针对运维的需要,要求支持按账号进行功能模块的授权或者禁权操作;要求有简单易用,信息展示充分的资源管理界面。
3.1.1.2 虚拟机管理
虚拟机是所有应用运行的底层设备,需要由运维人员持续进行管理,虚拟机的管理需要具备以下功能。
ž  具备概要性看板,一览虚拟机状态,方便快速获取虚拟机汇总性信息;
ž  可以对虚拟机进行基本管理,创建、修改、更新虚拟机;
ž  支持虚拟机生命周期管理,包括开机、休眠、关机、删除、重启、迁移等常规管理操作;
ž  可以支持对虚拟机进行完整克隆;
ž  支持对虚拟机创建快照;
ž  支持分组虚拟机、快照进行完整的管理;
ž  可以支持给虚拟机分配资源,例如硬盘空间、内存空间、CPU和GPU分配;
ž  支持虚拟机占用资源情况的监控,例如CPU、内存、网络、磁盘IO等运行信息;
ž  支持对虚拟机规则和属性的配置;
ž  支持虚拟机的热迁移;
ž  支持虚拟机的主备关系设置;
ž  在虚拟机机主服务故障时,能够自动进行主备切换;
ž  支持对虚拟机运行异常情况进行告警设定,并在触发告警条件时生成告警;
ž  能够在虚拟机崩溃时生成告警。
3.1.1.3 虚拟机存储配置管理
在整个虚拟机的运维过程特别是虚拟机初始创建时,特别需要对虚拟机所需要的存储空间进行规划和设置,需要有完整的对虚拟机存储相关进行配置的管理功能。
ž  能够为已有的虚拟机额外增加磁盘资源配额;
ž  支持磁盘资源绑定虚拟机;
ž  支持为不同分组的虚拟机统一分配磁盘资源;
ž  支持对已分配给虚拟机的磁盘资源进行部分回收;
ž  能够为虚拟机分配非持久性存储资源,在合适情况下可以自动回收;
ž  支持在不影响应用系统的前提下,彻底回收虚拟机的磁盘资源占用空间;
ž  支持磁盘监控信息,了解存储使用状况;
ž  能够对虚拟机进行集群规划,实现集群层面上的统一管理;
ž  能够对所有可用存储空间和已用存储空间进行统一管理;
ž  能够设定虚拟机的存储空间设定使用阙值,并在触发门限时生成告警信息。
3.1.1.4 网络管理
一般情况下,虚拟机需要具备多个能物理隔离的网段,可以方便对虚拟机更好的进行统一规划和分配,可以支持必要的虚拟机安全访问策略。
ž  支持划分多个隔离的网络,不同的虚拟机可以运行在隔离的网络内,保证数据传输不受干扰,增强数据传输安全性能;
ž  提供虚拟机整体网络运行信息,能够对虚拟机的网络状态进行管理;
ž  能够查看和监控虚拟机的整体网络流量使用情况;
ž  能够对单个虚拟机的网络流量使用情况进行监控,并可以体现为动态变更图表;
ž  能够对虚拟机的网络使用设定阙值,并在触发门限时产生告警;
ž  支持对上下链路流量进行自定义网络限速。
3.1.1.5 云资源管理
ž  支持虚拟机主机资源手工和自动的动态调度,达到计算资源的合理分配;
ž  支持虚拟机的资源回收机制,并能以邮件或短信通知回收流程;
ž  支持对应用进行动态伸缩(增加或减少应用的虚拟机)。
3.1.1.6 报告管理
为保证虚拟机的长期稳定运行,需要持续对虚拟机运行数据进行持续跟踪和分析,以便运维人员可以通过分析报告及时发现和排查可能存在的故障或者进一步的资源分配需求。
ž   能够提供虚拟机运行状态的周期性报告;
ž   能够提供虚拟机磁盘使用情况周期性报告;
ž   能够提供虚拟机网络使用情况周期性报告。
3.1.1.7 运维监控
ž   具备运维概要性看板,提供告警、通知等概述性信息;
ž   具备对告警信息进行分类查看和检索;
ž   支持告警信息的分级管理,对不同警告级别的信息可以进行不同的处理流程;
ž   支持查看告警信息和虚拟机节点的关联信息;
ž   能够记录和检索告警信息的处理流程;
ž   支持对告警的级别不同、类别不同设置通知方式并提供通知模板,通知方式可以包含短信、邮件等;
ž   支持查看和检索指定虚拟机完整运行日志;支持对日志进行关键词搜索定位故障原因。
3.1.2 基础业务服务治理调度运维系统
本项目的建设过程中有众多基础业务服务,包括但不限于短信网关服务、文件存储服务、邮件服务、主数据管理服务、运维相关服务等,这些基础服务有的需要对第三方服务封装;有的使用频率高,有性能压力;有的提供了外部接口交互能力,所以需要有对这些基础业务服务进行统一治理和调度的应用系统。
3.1.2.1 基本功能
ž  具备账号和权限功能;
ž  支持针对指定账号的权限控制;
ž  支持对运维操作日志的记录;
ž  支持关键运维配置的动态修改;
ž  支持应用系统的自动化部署;
ž  提供整体服务的可用性、稳定性和性能指标参数,并可根据需要进行调整;
ž  具备故障现场保留能力,能够详细记录现场状态和可分析的信息;
ž  具备故障智能处理能力,部分故障可以由系统自动恢复,对不能自动恢复的故障,可以快速定位故障分析故障原因并修复。
3.1.2.2 基础业务管理功能
ž  支持对基础业务服务的配置和基本管理;
ž  可以对基础业务服务进行主备管理,确保在单一服务节点故障时可以快速切换到其他服务节点;
ž  支持基础业务服务调用情况的记录和跟踪;
ž  支持对基础业务服务使用阙值设定;
ž  支持基础业务的代码的自动发布和发布记录跟踪;
ž  基础业务的自动发布一般性更新需保证业务使用不会中断或者中断时间极小,不能影响用户的使用体验;
ž  基础业务的重大发布需能及时通知用户,并具备服务快速回滚能力。
3.1.2.3 用量管理
ž  支持对基础的使用量进行规划管理,例如邮件发送数量,短信发送数量等;
ž  支持对有磁盘空间容量要求的基础业务服务进行相应的资源监控和管理;
ž  支持对基础服务使用量的门限设置和相应的告警策略。
3.1.2.4 异常访问
ž  具备基础业务服务异常访问的配置策略;
ž  支持基础业务服务异常访问后的操作策略,例如限流、禁用等。   
3.1.2.5 数据统计
ž  支持对基础业务服务使用情况的周期性数据统计,例如按周、月;
ž  支持数据统计以报表形式展示。
3.1.2.6 操作行为管理
ž  支持运维人员对基础业务服务操作记录;
ž  支持对基础业务服务运维操作的审计。
3.1.2.7 安全管理
ž  支持监控非法访问基础业务服务;
ž  支持对外接口可以采用授权加密协议。
3.1.2.8 监控功能
ž  具备基础业务服务的健康监控,例如流量、错误、延迟等,能够观察和分析服务的流量大小、错误率以及延迟等关键事件日志信息;
ž  提供服务后台线程的健康状态监控功能;
ž  提供服务所在服务器节点和网络的健康状态监控;
ž  支持健康监控的线性可视化展示。
3.1.2.9 调度功能
ž  支持基础业务服务节点的手工切换;
ž  支持基础业务服务节点的自动切换规则并可在满足规则时自动切换;
ž  支持对基础业务服务并发的管理和调度;
ž  支持基础服务节点数量的动态调整;
ž  提供基础服务节点的负载均衡。
3.1.2.10 运维管理
ž  满足对业务服务的警报设定,可以支持在不同级别的进行不同告警操作并及时通知运维人员;
ž  支持多种告警级别,包含缺陷级、异常级、故障级和事故级别;
ž  具备告警日志和对警报处理跟踪记录,能够根据需要调整警报的信噪比;
ž  支持不同告警级别的不同通知方式和处理流程;
ž  支持有多种通知方式告知不同级别的运维人员;
ž  支持周期性运维报告;
ž  具备完整的中断和事故管理流程和管理功能。
3.1.3 呼吸疾病临床研究数据采集和数据仓库管理系统   
3.1.3.1 多源数据收集整合系统
由于医疗信息化领域信息孤岛现象严重,标准化程度低,数据的互联互通基础较为薄弱,且代价较为高昂,可以通过对各单位和数据库的实际情况进行评估,充分考虑可行性与复杂度,采取系统接口对接、数据主动抓取、人工填报等三种技术手段,对来源不同、信息系统基础不同、开放程度不同的非结构化呼吸疾病临床研究数据进行收集。
(1)医院或原有数据库系统具备成熟的数据接口,基于安全协议和共享机制,可以与院内原有系统进行对接,实现数据及时的传输与共享;
(2)对没有成熟的数据接口数据源,可以通过数据库直连方式抓取异构系统的数据;
(3)能够通过清洗、转换等手段对异构医疗数据进行标准化和结构化采集。
患者主索引管理功能
ž   支持为患者创建临床诊疗数据中心主索引;
ž   支持关联和分析患者其他外部资源的数据,必要时可存储备份;
ž   支持患者主索引数据检索;
ž   支持院内其他诊疗系统的患者信息整合,例如HIS、EMR、PACS等;
ž   支持患者诊疗事件的汇集管理。
异构数据源读取和解构功能
ž   支持多种方式对异构数据源数据的直连读取;
ž   支持通过交互接口进数据通信,且保证数据的完整性、一致性和连续性;
ž   支持读取院内其他异构数据源,例如HIS、EMR、PACS、LIS等。
结构化数据获取、存储和管理功能
ž   支持从HIS、EMR、LIS 等院内系统获取医疗科研所需的临床诊疗数据;
ž   支持对获取的患者临床诊疗数据进行整合、存储。
非结构化数据获取、存储和管理功能
ž   支持从PACS获取影像数据文件,例如CT、MR、CR、DR等;
ž   支持影像数据文件的冗余存储;
ž   支持影像数据生命周期的管理和清理;
权限安全策略和隐私保护功能
ž   具备权限安全策略,例如:用户权限安全、应用系统安全、数据安全、网络安全等。
ž   支持用户的隐私信息不被非法访问和下载,包含医生信息、病例信息和重要资源信息。
3.1.3.2 数据仓库管理系统
该平台主要采集的数据源包括:高危人群和社区人群研究数据、呼吸疾病专病队列研究数据、呼吸疾病相关临床检查数据、生物样本数据、组学数据等,经过采集过程,分别存储形成各自的专有数据仓库,详见下图。
 
图. 呼吸疾病临床数据采集来源
 
高危人群和社区人群研究数据仓库
平台能整合我国具有呼吸疾病高危人群的大型社区人群研究的数据(覆盖中国慢性病前瞻性研究队列(51万人)、中国成人肺部健康研究队列(5万人)、中国居民慢阻肺监测网络、开滦队列(10万人)、东风队列(3.7万人)、泰州队列(20万人)、武汉-珠海队列、广州居民队列等研究)。人群研究数据的结构化程度较高,数据类别包括研究人群的基本人口和社会学信息、危险因素暴露情况、呼吸疾病发病情况等,未来可用于获取我国居民呼吸疾病患病率、危险因素流行率等一系列重要流行病学群体水平指标。
呼吸疾病专病队列研究数据仓库
平台能整合我国呼吸疾病专病队列资源,包括间质性肺疾病、慢阻肺、儿童和成人哮喘、肺栓塞、肺炎等呼吸专病队列及诊疗研究协同网络资源(包括间质性肺病、慢阻肺、哮喘、肺栓塞、烟草依赖临床研究协作组和呼吸研究院及呼吸专病医联体等),获取其中呼吸疾病患者的危险因素、发病情况、临床诊疗、疾病转归、医疗费用等相关信息。数据结构化程度高,可基于标准对已有数据进行标准化转换和分类存储,用于获得呼吸疾病患者的自然病程和真实诊疗情况。
呼吸疾病相关临床检查数据仓库
平台将设定固定储存区域用于呼吸疾病临床检查,主要存储内容为来自各医院及研究机构的胸部X线、胸部CT、肺功能以及支气管镜的影像资料。影像数据虽然产生的设备不同,但是具备较好的一致性,能够支持以该平台的海量影像资料为基础,用来对影像进行人工标注,训练基于卷积神经网络、循环神经网络以及聚焦模型机制的深度学习模型,完成机器判读及报告生成,并对上述检查结果进行质量控制。
生物样本大数据仓库
整理呼吸疾病常见及珍贵生物样本的信息,包括人体器官组织、全血、血浆、血清、痰、组织、生物体液或经处理过的生物样本(DNA、RNA、蛋白等),支持保存这些生物样本相关的临床、病理、治疗、随访、知情同意等资料,可以用来开展长期随访,追踪呼吸疾病的发生发展过程,并可关联研究对象的人群调查数据和对应的生物样本数据进,实现数据和样本信息的统合管理。
组学数据仓库
支持对患者的生物组学检测数据存储,例如:全序列基因检测数据等,实现海量数据的存储和整合。
3.1.4 呼吸系统疾病临床数据、生物样本和组学数据的分布式存储系统
本项目建设中,需要汇集大量呼吸疾病相关数据,这些数据的体量巨大,而且数据的种类各不相同,包含结构化的病历数据和生物样本数据,非结构化的医学影像和基因组学数据,还有其他的半结构化数据。这些数据在不同的业务中使用方式也有所不同。所以从数据存储层面上需要能够提供多种具备分布式能力的数据存储模式来支撑这些业务的需求。
分布式存储系统需要提供分布式文件系统来存储医疗影像、视频、音频、文本等非结构化数据。例如典型的分布式文件存储系统是Hadoop中的HDFS,文件存储需要能够将同一份文件存储在不同的服务器节点中,少量的磁盘故障或者服务器故障不会导致数据的缺失和丢失,在文件读取时能够在多个存储节点并行操作,提高数据读取效率。同时可以通过简单的增加新的存储服务器的方式,达到对文件存储扩容的目的。
分布式存储系统还需要提供分布式结构化关系型数据库来存储大量的结构化数据,结构化数据对事务性要求和并发读取要求比较高,这就需要分布式存储系统能够将结构化数据按照数据模型和应用特点划分到多存储节点中,提高并发读写能力,同时要有足够的分布式存储副本,在单节点的磁盘故障、服务器故障和数据库故障的情况下,能够保证数据的健全性。采用分布式并行计算架构(MPP)还可以提高应用系统的数据的实时处理和计算效率。
3.1.4.1 基础要求
ž  采用软硬件分离的解决方案,要求硬件不能限定产品品牌,能够在异构品牌和国产品牌服务器商部署,升级、扩容的过程中可以选择自行增加硬件部件;
ž  具备分布式并行计算架构;
ž  具备存储节点采用多节点冗余设计,性能按节点数量线性增加;
ž  具备数据加载的高效性,能够结合应用系统的性能需要进行相应的配置和部署;
ž  能够支持多存储介质,在空间扩容时可以不限指定的介质类型,可以多种存储介质混用;
ž  支持分布式存储系统在Linux环境下部署,无需定制操作系统;
ž  关系型数据库支持标准SQL操作规范;
ž  满足数据的持久性要求。
3.1.4.2 分布式存储要求
ž  非结构化数据可以进行分布式多节点冗余存储;
ž  结构化数据可以进行分布式多借点冗余存储,并且保证数据一致性和事务性;
ž  数据在节点的分布策略需要能够支持哈希分布、顺序分布等;
ž  数据的分布需要保证多节点的负载均衡,能够实现自动负载均衡;
ž  数据的分布和迁移时需要能满足透明性的要求;
3.1.4.3 容错要求
ž  支持节点发生一般性故障,可在不间断业务的情况下进行修复;
ž  支持自动故障探测和管理,故障检测时间要能控制在秒级;
ž  数据存储节点出现故障时,可以自动将服务切换到其他副本节点,从而实现自动容错;
ž  主副本(Primary)复制到备副本(Backup)的过程中,需要能够支持强同步复制和异步复制;
ž  数据的复制过程需要能够被记录且被查看;
ž  磁盘故障时,支持采用校验和机制解决数据错误的问题。
3.1.4.4 一致性要求
ž  支持应用系统的数据一致性要求,包括强一致性、弱一致性和最终一致性;
ž  支持数据副本的数据一致性和更新顺序一致性;
ž  结合应用系统的需要,支持读写一致性、会话一致性。
3.1.4.5 性能要求
ž  支持本项目的整体性能QPS要求,能够通过增加节点进一步提高数据的吞吐量;
ž  满足本项目三个九的可用性。
3.1.4.6 扩容要求
ž  支持在不停机情况下,通过向存储系统增加存储节点的方式实现业务不中断的容器和性能扩展;
ž  支持分布式存储系统的总控节点能合理的执行工作机管理、数据定位等全局调度工作;
ž  对数据能够支持垂直拆分和水平拆分到多个存储节点;
ž  支持通过调节副本数量提高数据读取性能;
ž  支持根据需要提高数据写入性能。
3.1.4.7 监控要求
ž  支持对存储节点的CPU、内存、网络、负载均衡、IOPS的监控;
ž  支持提供界面工具监控存储节点各项指标数据;
ž  支持存储节点异常情况的告警。
3.1.4.8 运维管理
ž  支持系统关键事件日志记录;
ž  支持对日志的检索,便于排错、审计和跟踪;
ž  支持事件日志的导出;
ž  支持重要事件的告警信息发送,例如邮件通知、短信通知等;支持系统配置管理功能。
3.2 呼吸疾病临床研究数据应用和共享平台
数据只有经过分析和加工才能发挥出其价值,越庞大的数据量所包含的无用信息更多,所以更需要深入的挖掘。对于呼吸疾病临床研究大数据平台上的数据,需要经过基本的、关联性的统计分析和加工以及实际的应用,才能更好地帮助呼吸领域研究者应用数据产出科研成果。
传统的科研是单一项目组收集和整理数据,而后完成数据分析和文献发表,相关研究计划和数据通常仅限于课题组内部使用,外部无法接触。这对研究结果的可重复性、可追溯性和研究效率都会造成一定程度的影响。而项目组间的数据共享则能够提供另一种具有同等科学性且更加高效和高性价比的研究方式。呼吸疾病相关的医疗数据共享,可以使研究人员访问不同类型的数据集,产生更多的成果,对于改善医疗质量和推进医学科研具有重大意义。
呼吸疾病临床研究数据应用和共享平台在临床研究数据的清洗、转换、分析、应用和开放共享中提供一体化的基础解决方案。
平台将通过建立高性能、高效率的信息资源大数据服务系统,实现对数据中心内海量诊疗数据的秒级实时查询、更新和调用,并有能力对基于真实世界的呼吸疾病诊疗数据库、呼吸疾病影像及肺功能数据库、呼吸疾病发病情况与风险因素监测数据库等进行深入分析。
此外,为了充分挖掘临床研究数据库的价值,平台还将建立基于研究协作网络的数据共享系统。病例数据库的相关课题负责人可对数据进行共享,邀请有意愿开展临床研究、拥有研究灵感的研究者加入课题,发表更多研究成果。
3.2.1 查询检索系统
为了支持大数据平台的基本功能及数据治理的需求,基于通用数据模型和数据清洗及结构化过程,本平台内的各个系统将建立同一逻辑的数据变量查询检索工具。用户通过使用该工具,在对应授权下即可查看相应项目的变量数据信息。
(1)支持基于共享数据进行变量名的查询检索;
(2)支持常规检索、组合条件检索等检索方式;
(3)支持通用指标检索和研究者专业领域科研指标检索;
(4)支持浏览检索历史和检索结果;
(5)支持保存和复用检索条件;
(6)支持智能的查询推荐机制,根据数据分析结果预测研究者感兴趣的查询指标集,为研究者提供个性化的查询推荐;
3.2.2 基础数据分析系统
通过对临床研究数据进行基本的统计描述,可帮助研究者和相关参与方了解研究的总体特征、变量和基本数据情况,并及时准确做出判断和调整。具体方法包括应用预编程的数据分析方案整理结构化后的临床研究数据,进行基本的描述性分析,如连续性数据的均值、标准差,分类数据的构成比,或进一步对分组后的数据采用t检验、卡方检验等简单统计方法获取更多信息。
在实际应用中,该系统将解决下列痛点问题:
(1)描述数据分布,可发现异常数值并及时处理;
(2)获知频数分布情况、数据的集中趋势等;
(3)自动识别变量类型,并针对连续变量和分类变量得到不同的统计描述结果;
(4)对于连续变量,可支持均数、中位数、标准差、四分位间距等统计量的计算;
(5)对于分类变量,可支持构成比、率等统计量的计算;
(6)根据数据特征生成准确直观的描述性统计图表,如直方图等;
(7)根据研究所关注的数据特征,生成疾病图谱。
为了支持简单的组间差异分析,在组间设计的研究中,系统还将支持:
(8)对两组比较采用独立样本t检验、比值比(OR值)、相对风险(RR值)、卡方检验等分析方法;
(9)对多组比较采用单因素方差分析、Kruskal-Wallis H检验等分析方法。
在组内设计的研究中,系统还将支持:
(10)对两组比较采用配对样本t检验、配对卡方检验等分析方法;
(11)对多组比较采用单因素重复测量方差分析等分析方法。
在混合设计的研究中,系统还将支持:
(12)对组间比较采用广义估计方程(GEE)等分析方法;
除了上述痛点外,为了满足统计结果在文章、报告或其他离线场合中的应用需求,系统还将支持:
(13)生成统计分析结果的图表;
(14)对统计分析结果进行保存或下载。
3.2.3 关联性分析系统
关联性分析是流行病学研究中的常用统计分析方法。
1、面向用户的在线分析工具
由于关联性分析较为复杂,使用门槛较高,普通临床医生往往需要花费大量时间精力系统性学习,或邀请方法学专家参与研究,成本较高。为了解决这一痛点,简化临床研究流程,本系统将通过预编程方式加入以下解决方案:
(1)可运行Pearson相关、Spearman相关等相关分析类统计分析方法;
(2)可运行简单线性回归、Logistic回归等回归分析类统计分析方法;
(3)可运行Mante-Haenszel卡方检验、Cochran-Armitage趋势检验等统计分析方法。
除了上述场景外,为了帮助研究者对统计结果在文章、报告或其他离线场合中的应用,系统还将支持:
(4)生成统计分析结果的图表;
(5)对统计分析结果进行保存或下载。
2、大数据关联分析
大数据关联分析是从海量的研究数据中发现隐含在其中有价值的、潜在有用的信息和知识,经临床专家进行判断后,做出归纳性的推理,从中挖掘出潜在的研究点,为下一步研究提供数据支持。
本系统将充分利用机器学习、模式学习、大数据等技术手段,通过运用聚类、回归、决策树等模型,实现下列功能:
(1)对呼吸疾病临床研究数据进行变量关联性分析;
(2)发现人口学特征、暴露或治疗干预措施等特征与疗效安全性等终点指标可能存在的关联,输出结果。
利用以上关联分析模型产生的结果,可以反馈优化其他前置数据处理阶段和相关系统的工作,例如矫正或优化标准化数据采集模板。
3.2.4 预测模型系统
预测模型是流行病学和卫生经济学中各类研究和政策制订的重要参考依据。本系统将整合临床数据和公共卫生数据的国际主流预测分析方法,对临床研究数据进行挖掘,根据疾病诊断、人群、地域等进行分组,估计和预测患病率、发病风险、卫生经济学负担等。
(1)支持基于监测数据估计患病率。对基于分层随机整群抽样等复杂抽样的监测数据,使用广义回归神经网络、时间序列模型、MarKov等模型估计一般人群的发病率或患病率。
(2)支持基于队列数据识别高危人群、危险因素及保护因素。使用逻辑回归、广义线性模型、广义估计方程、Cox比例风险模型等方法,分析社区人群队列以及慢阻肺、哮喘、间质性肺病、肺炎、肺结节、肺栓塞等呼吸专病队列,识别高危人群、危险因素及保护因素。
(3)系统提供卫生经济学模型,用以提出预防策略,评估疾病负担和政策收益。结合人口普查数据和先期研究得到的患病率、发展趋势、高危人群、危险因素及保护因素,评估疾病负担,并探讨公共卫生政策的预期收益。
3.2.5 数据共享系统
临床试验开展过程中,研究者将会获得大量的研究数据。这些数据通常会由研究者团队分析使用,但有时课题负责人会一定程度地公开研究数据,并希望有其他研究者加入课题,产出更多成果。
为了支持以上需求,并最大程度保证课题信息、研究数据的安全,本系统将通过严格的申请流程对申请者的权限范围进行控制。
系统将具备以下基本功能:
(1)展示参与共享的课题或数据库信息;
(2)根据不同的数据分享类型设置,展示课题或数据库的研究设计、病例报告表、已发表的成果信息等,部分较为宽松的课题可以向参与课题的申请者开放数据库;
(3)数据使用申请表的填报和审批功能;
课题负责人将可通过本系统使用以下功能:
(1)填写数据库基本情况,包括课题名称、类型、简介,以及启动时间、参与中心、病例总数等信息;
(2)填写变量说明,包括变量总数、变量列表等信息;
(3)上传附件文档,如病例报告表等;
对于希望使用数据库、参与课题的研究者,可以使用以下功能:
(4)查看数据库基本情况、变量说明和附件文档;
(5)填写并提交数据使用申请表;
(6)在申请表中上传简历附件;
系统还将为用户提供以下功能:
(7)课题负责人可以查看本人负责的全部课题中收到的数据使用申请表,并通过或驳回申请;
(8)申请通过后,申请者可以根据不同类型课题的权限设置,获得更多的数据库信息。
3.3 伦理在线规范化审核系统
伦理审查是对涉及人的生物医学研究项目进行科学性、伦理合理性审查,旨在保护受试者尊严、安全和合法权益,促进生物医学研究规范开展。随着医学研究的项目日益增多,伦理审查问题也伴随着逐渐浮出水面,缺少规范的伦理审查的临床研究成果遭遇了越来越多的问题。要解决这些问题,必须坚持不断深入发展伦理审查工作,实行信息化、统一化、标准化,让伦理审查工作符合日益严格的监管要求,如国家卫计委于2016年修订试行办法,新出台《涉及人的生物医学研究伦理审查办法》,为涉及人的生物医学研究伦理审查工作制定了法律规范。
目前很多伦理审查工作仍限于手工记录、纸质存档等传统方式,使得审查人员无法及时审批,申请者无法实时掌握项目审查进度,跟踪重要审查环节,因此导致协同工作困难,以及消耗大量人力资源,工作效率低。
因此,针对临床研究,尤其是大型多中心临床研究,建立一套临床研究伦理在线审查系统,支持多角色多组织参与,建立和运行规范的伦理审查的申请、审核、持续审查和归档机制。建设高质量的集中统一的科研信息数据库,降低在不同研究中心逐一接受伦理审查带来的时间成本,并实现在线或异地伦理审核,优化现有的工作流程,提高科研工作效率。
3.3.1 账号管理
(1)支持多种途径(如手机号、邮箱)的用户注册,用户注册时需填写医院、科室、职称等基本信息
(2)支持对用户手机号、邮箱等的真实性进行验证;
(3)支持多种途径的用户登录功能,如手机号、邮箱、微信第三方登录等;
(4)支持用户查看和编辑个人信息,修改手机号或邮箱等账号信息;
(5)支持用户通过手机或邮箱重置登录密码。
3.3.2 角色和组织管理
(1)根据临床研究管理与实施的需要,进行功能操作角色的配置。分管理员、伦理委员、研究者、申办方、CRO等角色,每人分配系统账号,以自己的账号登陆工作,分工明确。
(2)可动态管理伦理委员会成员,生成、更新、展示委会的介绍信息
3.3.3 信息发布与查阅
(1)通知公告:基于临床研究管理需要,支持发布通知公告、工作流程、法律法规、指南等信息或文件。
(2)通知查阅:支持用户在线浏览信息,并可在线下载临床研究各类模板文件、法律法规等指导性文件。
3.3.4 伦理审核
(1)项目在线申请:支持伦理委员会依据SOP指定文档目录模板,方便申请者依据模板准备充分的申请资料;
(2)提交申请资料:支持各类研究项目和伦理审核类别的申请提交、审核文件上传与修改。支持将文件按照指示的文件位置进行上传,便于信息查询、留档、溯源。
(3)审核受理与处理:支持管理员对各类申请的在线形式审查、快审、会审、备案等伦理审查受理与处理业务,可在线审阅申请资料,满足以投票等方式生成审核结果;
(4)表格和函件打印:系统需满足伦理审查各流程节点的申请表、审查工作表、审查意见函、伦理批件等各类文件的生成与打印。
(5)会议安排:支持伦理会议流程的会议通报项目、会议审查项目的会议议程,系统支持向参会者发送会议通知的功能;
(6)查询功能:支持在各个时间、审核单位、项目名称、项目编号等条件下,快速查询项目审核信息的总体情况,方便实时掌握伦理审核进度。
(7)通知提醒:主要保证审核信息通知的及时性,通过审核反馈功能,快速及时地将审核信息提交给研究人员。
3.3.5 文件管理
(1)支持临床研究实施过程中的各类备案文件、补充材料的上传、存档管理。
(2)支持管理伦理审查过程文件,如暂停/终止研究审查、研究完成审查、复审、重新审查、重新开始研究审查等文件的管理,以项目的方式集中化管理;
(3)支持设置符合规范要求的文件夹,满足合规的管理要求。
3.4 呼吸疾病临床研究标准规范编制
标准化是一切信息化手段的基础,而数据元标准是医疗卫生信息标准化的基础,是实现信息共享和利用的重要保证。元数据提供的是理解和精确解释数据元所需要的信息,是数据元标准的载体。基于相关元数据规范和国际标准ISO/IEC11179—信息技术/元数据注册,医疗卫生信息领域主要元数据包括数据元,对象类,特性,数据元概念,表示,值域,术语,数据集等,各类元数据及其相互关系可用元数据结构图表达.以元数据结构为基础,可对数据元的若干方面属性进行结构化描述,实现数据元从概念到形式的标准化。
利用大数据等信息化手段,在更快速和有效的提升呼吸疾病的防控、临床研究、诊疗等方面的同时呼吸疾病领域的标准作为一系列研究的基础,凸显其地位更为重要,而目前我国针对呼吸疾病领域的标准极其匮乏,在开展通用数据集标准的研究基础上,对呼吸疾病的分类元数据标准规范也需不断完善,《呼吸疾病临床研究 慢阻肺 元数据规范》、《呼吸疾病临床研究 哮喘 元数据规范》、《呼吸疾病临床研究 间质病 元数据规范》、《呼吸疾病临床研究 肺梗塞 元数据规范》等标准的研制,为呼吸疾病基础病种的临床数据采集和分类提供了标准依据。
标准研制分类列表




























序  号
名  称
类  别
1
《呼吸疾病临床研究 慢阻肺 元数据规范
呼吸疾病
2
《呼吸疾病临床研究 哮喘 元数据规范》
呼吸疾病
3
《呼吸疾病临床研究 间质病 元数据规范》
呼吸疾病
4
《呼吸疾病临床研究 肺梗塞 元数据规范》
呼吸疾病

3.5 呼吸疾病科研数据治理
国家重点研发计划“呼吸系统疾病专病队列研究”已获国家科技部立项支持,按项目拟定的任务计划,我国将建成慢阻肺、哮喘、肺栓塞和肺间质病4个较为完备的大型队列。由于项目各队列的研究目的、调查内容、调查方法、数据标准和生物样本信息之间存在较大差异,造成各队列数据之间呈“孤岛式”分布的现状。
为构建我国的大型呼吸疾病专病队列,需要系统整合现有数据与资源。建立标准化数据模型,将不同来源的异质性数据进行统一治理,能够重新挖掘和使用已收集数据的固有信息,支持更精细化的分层分析及亚组分析,并为未来开展多中心研究扫除因数据标准不一导致的数据共享障碍,节约研究成本。
3.5.1 评估呼吸专病临床队列资源
评估主要内容包括:
(1)队列基本特征,如调查地区、调查人群及其人口学特征、队列起始时间、已随访次数、患者数量、诊断标准、研究对象纳入标准及排除标准、等;
(2)呼吸疾病相关信息,如呼吸疾病史、诊疗过程、患者预后及结局、家族史、吸烟史、二手烟暴露史等;
(3)临床诊疗数据相关信息,如诊断、用药信息、实验室检查、病理学检查、影像学检查等。
(4)生物样本采集情况,如样本类型、样本数量、采集方式、运输方式、存储方式等。
3.5.2 制定数据治理标准操作规范(SOP)
根据各呼吸专病队列的数据特点和治理需求,参考国际、国内医疗健康档案以及信息交换等方面的标准,依据呼吸专病队列研究通用数据模型,制定呼吸科研数据治理SOP。包括:建立多源受试者主索引,形成调查对象在整个专病队列数据库中的唯一标识;关联患者的生物样本信息、基线数据、随访数据和临床诊疗相关信息等。
3.5.3 呼吸专病队列研究数据治理
在评估现有队列研究数据的完整性、一致性的基础上,根据呼吸科研数据治理SOP,将现有队列的数据格式、数据类型、数据名称、数据环境、标识符、数据引用关系等进行统一和标准化,实现各队列资源的数据治理,进一步实现各队列资源的数据统一与信息共享。
治理过程应当:
(1)将队列数据符合通用数据标准的部分整合到通用标准数据库中,便于数据挖掘及进一步分析。各专病队列特有的、无法列为通用数据标准的问题及研究变量,按照呼吸疾病特异数据标准汇总形成分类。
(2)提供数据处理记录与报告。要求对数据治理过程、依据和结果进行详细的记录,并提供报告和存档。
(3)保护数据隐私。根据伦理学和保护数据隐私的要求,通过加密和其他安全措施,保护研究对象的基本利益。
(4)保证数据治理过程的稳定和数据安全。大型队列研究数据量较大,数据的安全和稳定是项目实施的基本保障。数据治理过程要求从基本技术、操作规范、存储和备份等环节,确保数据治理的安全和稳定。
四、安全保密设计
依据国家网络安全等级保护体系,搭建符合要求的网络安全环境,加强大数据相关系统安全保障机制建设,提升关键信息基础设施和重要信息系统的安全防护能力,确保大数据关键信息基础设施和核心系统的安全性。搭建大数据平台的容灾备份系统,构建有效的信息安全与保密工作机制,实现互联网出口的统一管理,建立具有预警预测、快速响应能力的信息安全保障体系。建立有效的信息安全与保密工作机制,严格执行有关法律法规和规章制度,加强对重要信息产生、复制、流转、使用等各环节的管理,做好数字化、网络化条件下信息内容的安全保密工作。
(1)网络安全
ž   对于大数据平台,应当实现二级以上的安全通信网络所要求的通信机密性、完整性保护、网络设备安全性保护、网络设备冗余等内容。
ž   区分不同的网络区域, 如内网区(包含业务内网区、备份区、数据区、内网管理区)、DMZ区、外网区(包含互联网区、外网管理区)等。
ž   网络区域之间一般采用单向网络访问,并定义和物理网卡绑定的IP端口级访问策略。。限制互联网区访问内部区域。
(2)数据安全
数据是整个大数据平台的核心,是存储的内容和灵魂,任何形式的数据丢失、出错都将带来无法估量的损失,因此必须保证数据的安全性和隐私性,平台的建设充分考虑以下安全措施:
ž   为防止患者隐私信息泄露,针对敏感数据,平台应在数据传输及处理前,参考国家法律法规对相关数据进行脱敏。
ž   在存储与传输过程中应使用相应技术对数据加密,以保证数据安全性和完整性。
ž   为防止数据丢失,平台需要支持在数据库设置预定的备份策略以进行备份。
ž   严格规范不同等级用户的数据接入和使用权限,并确保数据在授权范围内使用。
ž   关键数据的修改记录都记录详细的操作日志和有痕修改,以备追查。
(3)平台安全
平台的建设充分考虑以下安全措施:
统一安全管理
支持大数据平台组件的统一配置,对其安全管理措施进行统一配置,规范平台安全配置管理。
身份认证
身份认证作为信息安全防护的第一关,承担了至关重要的角色,使大数据平台的访问策略能够可靠、有效地执行。根据信息安全的要求,采用多种身份认证方式建立身份认证。
权限管理
合理设置系统的安全规则,确保用户可以访问且只能访问到自己被授权的资源。通过访问控制措施,进行结构化数据访问权限、非结构化数据访问权限的管理。
数据防泄漏
防止各类敏感数据有意或无意泄露与获取,通过业务环境隔离、数据访问控制、实时监测、流量监测、异常流量趋势分析、数据加解密、规则动态定制等达到事前审计、阻断的主动防卸扣,并提供可追溯信息的统计、查询和分析等。
(4)应用安全
大数据平台上的应用级安全包括:统一的身份认证,统一权限管理等,要求应用软件具有访问控制功能,例如:用户登录访问控制、角色权限控制文件属性安全控制等;应用软件应定期进行备份,修改时也应备份并做好相应的记录文档;和公共卫生相关的数据采集应当使用电子签名和时间戳,各业务应用中的重要操作也应采用数字签名等功能。
五、一般要求
1.投标人须制定维保服务方案。所投产品厂商需承诺在服务期内主动升级系统补丁,以确保系统安全可靠运行。
2.投标人免费提供安装和调试及相关培训服务。
3.投标人承诺项目质保期不少于三年,原有软件模块功能均享受免费升级服务。
4.维护期内,投标人提供7×24小时电话技术支持,接到故障通知后1小时内响应,24小时内到达现场维修,按国家及行业标准对故障进行及时处理。
5.验收标准,由投标人代表和采购人组成验收小组对项目进行验收。验收标准按照招标文件技术规格书的要求,经检验系统正常运作后签署验收报告,系统保修期自验收合格之日起算。
六、投标团队要求
1.投标团队应具有本项目全部相关的开发、实施及后续服务能力,符合、承认并承诺履行本招标文件各项规定。
2.投标团队需要通过相关行业认证,实现根据质量管理的理论对软件开发进行过程管理,以使其满足工程化、标准化的要求,使企业能够更好地实现建设目标。
3.投标团队应在医疗信息化领域有丰富的项目经验,具有成熟的科研信息化产品。
4.投标团队应具备临床研究数据管理、分析服务的能力和经验。
5.投标团队具有自主研发的信息化产品成果,并有相应的标准研制经验。
 
七、报价要求及免费维保期满后收费标准
需有明细报价及总价,如有折扣需注明,免费维保期满后,针对软件部分(不含数据治理等服务内容)需提供有偿维保服务报价。
 
 
202005252105515175929395815
返回顶部