招标
高维格研究应用基础平台(清设比选20232166号)采购公告
金额
-
项目地址
-
发布时间
2023/12/12
公告摘要
项目编号清设比选20232166号
预算金额-
招标公司-
招标联系人-
标书截止时间-
投标截止时间-
公告正文
项目名称:高维格研究应用基础平台 |
项目编号:清设比选20232166号 |
公告开始日期:2023-12-12 16:26:02 |
公告截止日期:2023-12-15 17:00:00 |
付款方式:货到付款100% |
签约时间要求:成交后5个工作日内 |
到货时间要求:签订合同后3个工作日内 |
预算总价:True |
收货地址:北京市清华大学 |
采购商品:高维格研究应用基础平台 |
采购数量:1 |
计量单位:套 |
技术参数及配置要求:1 总体要求表1 总体技术规格要求指标项总体技术规格要求1.硬件部分管理服务器1台,配置要求:双12核2.1GHz处理器,64G内存,两块600G SAS 10K硬盘,RAID1无缓存,双电源,双千兆双万兆网口含光模块,导轨计算服务器3台,配置要求:双32核2.8GHz处理器,1536G内存,二块2.4TSAS 10K硬盘,RAID1无缓存,双电源,万兆网口含光模块,导轨磁盘阵列1台,配置要求:32GB 缓存,8*1Gb ETH,4*10Gb ETH(含多模SFP+),8TSAS*4块企业级交换机1台,配置要求:24个万兆SFP+,6个40GE QSFP,含1个600W交流电源;交换容量(背板带宽):2.4T/24Tbps ; 包转发率:720M/792Mpps2.软件部分软件提供:门户模块、负载监控与作业调度模块、资源监控与报表模块,同时安装各类开源数值分析组件,包括各类数学库、并行环境、编译器等基础中间件。3.售后服务提供三年原厂商售后服务,服务期从平台完成正式验收之日起开始计算。4.兼容性系统支持兼容各类不限品牌、主流X86计算通用服务器: 2 系统组成2.1 软件部分软件组成和功能模块配置清单如下:序号模块名称用途数量配置1.★门户模块统一用户访问提供XX个并发用户访问能力永久许可2.★负载监控与作业调度模块资源管理和作业调度。提供本项目所有服务器调度管理能力,CPU数量XXX个。永久许可3.★资源监控与报表模块资源实时监控和基于监控数据的统计分析报表提供本项目所有服务器组成集群的资源监控和统计分析能力。永久许可3 指标要求配置指标说明:应针对本节各表所列的各项技术要求进行逐项应答;“★”代表关键指标,所提供产品必须满足。3.1 软件部分3.1.1 门户模块① ★应用门户同时支持通用仿真任务、GPU加速仿真计算任务的统一提交、监控、中止以及数据管理和文件传输等操作;用户可查询和管理作业及相关数据,如输入数据、中间结果和最终结果。② ★支持多机冗余和多机负载均衡。保证服务的高可靠性和可扩展性。③ 支持作业计算过程中日志文件的动态查看功能,可通过门户打开作业的计算日志文件,并动态查看计算日志输出。④ 提供基于门户的用户管理功能,支持用户添加、删除、修改等功能,支持组织机构管理功能。⑤ 提供文件上传下载组件,支持拖拽式操作,支持同时上传、下载多个文件和文件夹,上传下载一次可高达100GB的单个文件。支持断点续传,支持加密传输。★支持下载单向禁止,避免保密数据被下载。⑥ ★支持数据共享功能,用户可基于共享组(项目)对远程个人仿真、设计数据进行共享设置。并可以按单位、研究室选择共享用户。⑦ 支持消息功能,系统可定制自动发送消息给用户,系统管理员也可以手工给指定用户或所有用户发送消息,用户也可以向系统管理员发送消息。3.1.2负载监控与作业调度模块① ★支持Linux和Windows混合集群架构。② ★提供统一调度管理功能,支持通用计算服务器、GPU计算服务器统一调度管理;支持将通用仿真任务、GPU加速仿真计算任务,资源动态分配。③ 提供多种调度算法,包括FCFS,公平共享,抢占,独占等。④ 提供GPU绑定功能,支持Linux和Windows的GPU绑定功能,可根据需要将用户可视化任务或计算任务和指定GPU进行绑定,实现GPU独享。⑤ 提供CPU绑定功能,可根据需要将用户可视化任务或计算任务与指定CPU核进行绑定,避免用户间任务互相干扰,避免单个应用超请求占用资源。⑥ ★提供资源访问限制:可限制用户可以启动的会话数量,限制用户可以访问的最大资源量(如:CPU数、内存大小、图形卡数量等等)。⑦ 提供作业的动态安全设置功能,作业计算相关的节点ssh等安全设置仅在作业运行期间,对该作业生效。以增强系统的安全性。⑧ ★支持断点续算(Checkpoint/Restart)机制,在所运行软件支持的情况下,可以将长时间运行作业断点保存和恢复,从而保证关键作业的正常运行。支持通过门户界面实现一键Checkpoint/Restart,方便用户使用和操作。⑨ ★支持多级容错,包含系统级容错、作业级容错,即系统发生故障(如网络中断、系统宕机)或作业因为偶然故障(如磁盘空间不足,获取许可证失败)引起的作业失败时,该作业能被重新调度到其它机器上执行。3.1.3资源监控与报表模块① 提供资源总览的监控页面,在一个页面上展示系统总体运行情况。② 支持对Intel Xeon CPU温度和功率进行监控③ 支持对主机状态(CPU利用率、显卡利用率、内存利用率、显存利用率、IO、页交换、网络流量等)进行监控。④ 支持根据各种监控数据,生成统计分析报表。⑤ 支持对仿真作业的统计分析,包括作业数量分析、作业吞吐量分析、作业CPU占用时间分析、按用户和应用对作业排名等。⑥ 支持基于主机利用率、可用性分析、状态分析、CPU使用率、显卡利用率等的统计报表。⑦ 支持资源使用计费,支持费率设定,可按用户、研究室、单位对仿真计算作业和可视化作业进行统计并生成计费账单。3.1.4数学库、并行环境、编译器① 编译器与数学库:支持Intel、GNU编译器,支持C/C++/Fortran/Java/Python;支持MKL、BLAS、LAPACK、ScaLAPACK、FFTW等数学库。② 并行环境:支持Open MPI、MVPAICH2等MPI并行环境。③ GPU开发环境:具备CUDA驱动、编译器、调试器、工具包、SDK等;支持cuFFT、cuBLAS等开发库。3.2 系统实施① 系统实施:提供详细的系统实施方案,包括实施人员安排、实施计划等。3.3 售后服务和质量保证① 软件须提供三年原厂商售后服务和软件升级服务,服务期从平台完成正式验收之日起开始计算。并提供原厂商售后服务承诺函。② 提供详细的售后服务方案,包括人员安排、巡检计划等。3.4 培训① 提供软件原厂商不限人次的现场培训,包括用户使用培训和系统管理培训。② 所有培训教材由软件原厂商提供。 |
返回顶部