招标
高性能计算集群(XF-WSBX-2000623)采购公告
金额
-
项目地址
浙江省
发布时间
2020/12/08
公告摘要
公告正文
项目名称:高性能计算集群
项目编号:XF-WSBX-2000623
公告开始日期:2020-12-08 09:27:11
公告截止日期:2020-12-15 11:00:00
采购单位:浙江大学
付款方式:货到付款。境内供货的,甲方在到货验收后15日内向乙方一次性支付本项目的总款项。 境外供货需要由甲方办理进口减免税业务的,也必须以人民币报价,且包含货送到用户指定实验室前的所有费用。甲方指定的外贸代理公司在甲方到货验收后15日内向乙方指定的外方公司一次性支付款项。支付方式在《技术参数及配置要求》栏内另有约定的,从其约定。
联系人: 中标后在我参与的项目中查看
联系电话: 中标后在我参与的项目中查看
到货时间要求:成交后3天
预 算: ¥ 450000
收货地址:紫金港校区西4教学楼B301-1
供应商资质要求: 符合《政府采购法》第二十二条规定的供应商基本条件
采购商品:高性能计算集群
采购数量:1
计量单位:台
所属分类:计算机与网络设备
品牌:Nettrix宁畅
型号:B5000
预算: ¥450000
技术参数及配置要求:一、计算硬件系统
1.1计算节点:
(1)刀箱(1套):Nettrix B5000
▲机型:机箱高度≥4U;
▲刀片类型:刀片机箱支持8片双路刀片服务器;
▲IO网络交换模块:配置HDR Multi-Host IB模块;
PCIe 扩展:支持8个PCIe x16半高半长标准槽位(前置),且支持8个PCIe x8半高半长标准槽位(后置);
电源模块:配置≥4个金牌效率的热插拔电源模块,可实现电源模块的N+N或N+M冗余;
风扇模块:配置≥5组冗余热插拔风扇模块;
管理模块:配置≥1个热插拔管理模块,支持前置的刀片管理接口,可实现远程虚拟介质、KVM OVER IP、刀片状态、故障定位、开关机等全方位管理控制监视功能,监控系统可实时测内部主要部件的状态,能够提供准确的状态指示和错误报警;基于WEB浏览器的管理方式,全中文界面;
▲绿色节能:可支持液冷散热方案;
工作温度:支持5℃-40℃环温正常工作;
(2)刀片部分(7台):Nettrix BX50
刀片计算节点:外观结构为全高型刀片,与刀箱同一品牌;
▲CPU:每节点配置≥2个Intel Xeon6226R处理器,每处理器≥16核,处理器频率≥2.9GHz;
▲内存:每节点配置≥192GB DDR4 2933MHz ECC REG内存;
▲硬盘:每节点配置≥1块480G 2.5英寸热插拔ssd硬盘;
▲网络:每节点集成≥1个HDR Multi Host IB子卡,集成双千兆网卡
互联:保证与原有系统的互联
1.2 管理节点(1台):Nettrix R620
品牌要求:与计算节点同一品牌;
机型 机架式服务器,高度2U;
▲处理器和内存:配置Intel Xeon 4214R*2,配置192GB DDR4 2933MHz ECC REG内存,支持≥24个内存插槽;
▲硬盘:配置6块8TB SAS硬盘,RAID5,支持≥12个前置热插拔3.5硬盘或24个2.5硬盘,可支持2*后置SAS/SATA/SSD硬盘,板载支持≥4个NVMe U.2 SSD,不需PCE-E转接卡,支持2个内置M.2 SSD;
▲网卡:配置1块MX 单端口100G EDR HCA网卡;提供板载I350芯片高端双口千兆网卡,支持NCSI、网络唤醒,网络冗余,负载均衡等网络高级特性;
扩展插槽 支持10个PCI-E 3.0插槽;
▲液晶监控屏:配置双按键监控屏,提供服务器信息,CPU温度、风扇转速、当前使用功率等状态,管理接口 IP 地址,监控服务器工作状态,显示硬件故障报警,快速定位故障部件,迅速排查故障,降低宕机损失
▲电源:配置热插拔铂金1+1冗余电源,单个电源功率550W;支持400W BBU电池单元,提供二次备援功能支持400W BBU电池单元;
SD卡:主板支持双SD卡插槽,可实现存储系统日志及BMC日志;
管理:集成系统管理芯片,提供iKVM和KVM Over IP高级管理功能,本地固件更新、错误日志,提供系统状况的可视显示;配置独立的远程管理控制端口,支持远程监控图形界面, 可实现与操作系统无关的远程对服务器的完全控制,包括远程的开机、关机、重启、虚拟设备挂载等操作;可实现监控服务器内部主要部件的状态,包括CPU、内存、硬盘、风扇、电源;
故障诊断:支持黑匣子日志、故障截屏、开机自检代码,有效判断分析软硬件故障;
服务器导航软件:集成磁盘擦除、本地和远程备份还原、Raid配置、虚拟磁盘管理、无人值守安装操作系统、智能驱动安装等功能;
安全:可同时支持TCM和TPM安全模块;
服务:三年原厂整机质保,三年原厂免费上门服务。
1.3 HDR IB 交换机(1台)MX MQM8790-HS2F 40端口HDR IB交换机。
二、软件系统
2.1 软件系统:
2.1.1作业调度软件:Nettrix SIMS
▲软件架构:采用主流最新版本商业版作业调度软件,提供与计算系统硬件数量相匹配的调度系统许可,实现全系统的统一管理和高效调度使用,提供所有节点的软件许可授权,提供调度调度软件厂商原厂实施服务,与原有系统实现无缝连接,三年现场运维服务,中标后提供原厂授权服务承诺函;
▲监控热图:提供热图方式集中展现集群中所有服务器的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换;
应用软件集成:提供本地软件仓库,集成HPC集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI数学库、Infiniband驱动)和硬件诊断工具(如hpl、stream、iozone),允许管理员或普通用户通过Web页面进行查询、安装或卸载软件;提供截图证明
应用Portal:支持常见高性能应用(如Gaussian、Vasp等)的作业提交Portal,整合文件管理、VNC等功能;
作业提交核查:提供串行、OpenMP、MPI作业的Web提交界面,能够实时检查用户输入的合法性(比如申请资源超出权限等),支持2D交互式可视化作业的集成,支持作业Checkpoint/Restart功能;
▲调度引擎:集群调度系统同时支持PBS和Slurm调度系统,提供截图证明;
交互式作业功能 支持批处理作业、命令行交互式作业以及GUI图形交互作业,支持通过浏览器打开VNC会话进行操作;支持设置多个专门的VNC服务节点,统一VNC会话的管理;支持作业VNC会话在不同VNC服务节点上的负载均衡;
分组视图:支持按预定义或自定义的角色分组展现服务器状态信息,以及相关联的告警信息;
集群性能测评 提供针对集群整体(或者部分)进行各项指标(如CPU、磁盘、内存等)的性能测评功能,图形化的结果展示测试结果;
负载均衡调度:支持将作业均衡的分配到所有计算节点上,避免任务堆积在个别节点,因争抢CPU、内存等资源导致计算变慢;
随机调度策略:支持随机选择作业的计算节点,解决特定场景和固定调度算法下某些计算节点被频繁使用的问题;
一键配置集群:提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登陆、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项;
节点分区 支持对节点进行分区,不同的分区进行不同的访问控制和调度策略;
容错处理 作业资源限额控制 支持对资源占用量超过自身资源请求的作业进行自动清除,如运行时间超时、内存使用量超过限额;
作业异常自动重启 支持对于因为系统临时错误导致的异常作业进行自动重新入队和调度;支持当作业返回特定退出码时进行自动重新调度;
残留进程和非法进程清理 支持对作业残留进程和非法作业(即未提交调度系统、手动运行的作业)进程的自动清理。支持基于节点、用户、进程等不同维度的白名单和黑名单设置,支持多维复合过滤条件设置,支持对残留作业进程、非法作业进程的自动清理;
▲队列功能:队列管理 支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略;
用户管理 支持NIS和本地passwd用户管理(包括认证和增删改查),支持LDAP、AD,NIS,Local用户认证。多认证服务可以同时使用;
节点管理 支持基于Web的节点管理,监控计算节点的状态,支持节点的启用和禁用,支持节点服务的重启;
作业管理 支持基于Web的作业管理,支持对运行作业的输出进行实时监控,支持输出文件的下载,对VNC图形作业提供基于浏览器的远程访问功能;
▲统计和计费 预付费支持 支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业;
多视角统计 支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费;
计费详表 支持导出作业粒度的计费详表,供用户核对;
报表导出 支持PDF和EXCEL格式导出;
2.1.2 HPC软件自动部署工具 :Nettrix Clusconf
HPC软件自动部署工具 提供常用MPI、数学函数库、HPC基准测试程序的一键部署工具,可选择性或一键安装配置;
2.2 软件服务:
▲售后服务 全系统3年软硬件原厂质保,原厂7*24小时技术服务响应和免费上门服务,中标后提供原厂盖章授权服务承诺函。提供服务器原厂工程师的硬件和软件集成调试服务,包括集群管理软件系统进行安装调试,软件系统包括集群软件系统、操作系统、并行环境、编译器、数学库等;提供用户专业应用软件的安装和调试服务,保证用户应用软件的高效率并行使用;
投标人项目经验和实施能力 投标人具有本地专门的售后服务团队,投标人提供全程的维修服务和系统保障,投标时提供工程师团队社保证明函。提供与原有系统的整合。
在线运维系统 EasyOP
数量1套,与服务器同一品牌;
完成对存储系统7*24小时远程在线监控、异常告警通知等工作;
在线运维服务监控采购方存储及配套节点、网络等相关资源状态信息,如发现异常信息、故障信息,则将此类信息第一时间通知用户方,并采取相关措施;
系统应具备告警策略设置、告警联系人设置功能,并提供至少三种以上的自动触发告警通知服务;
用户可通过微信服务号、APP等手段,向运维方反馈在线运维服务相关问题或建议;
集群的运行情况可通过不同维度的相关信息进行统计,并可以根据使用者需要自定义时间范围;
系统可提供面向管理者的管理员账户功能,管理员可以通过web和移动端登陆账户并具备集群状态查询、监控状态查询、资产查询、告警查询、报表统计、告警策略设置、告警联系人及告警方式设置等功能;
系统可提供面向使用者的普通账户(非管理员)相关功能,使用者(普通用户)能通过本服务新注册或绑定已有账号,使用者(普通用户)可以通过web和移动端登陆账号并具备账户概览查询、系统状态查询及相关报表统计等功能;
配置专门的运维服务人员;具有成熟的运维服务平台;
远程在线监控、运维管理软件或平台应出具相关软件著作权登记证明文件。
售后服务:电话支持:7x24小时;服务年限:3;服务时限:报修后8小时;商品承诺:原厂全新未拆封正品;
详情请访问原网页!
项目编号:XF-WSBX-2000623
公告开始日期:2020-12-08 09:27:11
公告截止日期:2020-12-15 11:00:00
采购单位:浙江大学
付款方式:货到付款。境内供货的,甲方在到货验收后15日内向乙方一次性支付本项目的总款项。 境外供货需要由甲方办理进口减免税业务的,也必须以人民币报价,且包含货送到用户指定实验室前的所有费用。甲方指定的外贸代理公司在甲方到货验收后15日内向乙方指定的外方公司一次性支付款项。支付方式在《技术参数及配置要求》栏内另有约定的,从其约定。
联系人: 中标后在我参与的项目中查看
联系电话: 中标后在我参与的项目中查看
到货时间要求:成交后3天
预 算: ¥ 450000
收货地址:紫金港校区西4教学楼B301-1
供应商资质要求: 符合《政府采购法》第二十二条规定的供应商基本条件
采购商品:高性能计算集群
采购数量:1
计量单位:台
所属分类:计算机与网络设备
品牌:Nettrix宁畅
型号:B5000
预算: ¥450000
技术参数及配置要求:一、计算硬件系统
1.1计算节点:
(1)刀箱(1套):Nettrix B5000
▲机型:机箱高度≥4U;
▲刀片类型:刀片机箱支持8片双路刀片服务器;
▲IO网络交换模块:配置HDR Multi-Host IB模块;
PCIe 扩展:支持8个PCIe x16半高半长标准槽位(前置),且支持8个PCIe x8半高半长标准槽位(后置);
电源模块:配置≥4个金牌效率的热插拔电源模块,可实现电源模块的N+N或N+M冗余;
风扇模块:配置≥5组冗余热插拔风扇模块;
管理模块:配置≥1个热插拔管理模块,支持前置的刀片管理接口,可实现远程虚拟介质、KVM OVER IP、刀片状态、故障定位、开关机等全方位管理控制监视功能,监控系统可实时测内部主要部件的状态,能够提供准确的状态指示和错误报警;基于WEB浏览器的管理方式,全中文界面;
▲绿色节能:可支持液冷散热方案;
工作温度:支持5℃-40℃环温正常工作;
(2)刀片部分(7台):Nettrix BX50
刀片计算节点:外观结构为全高型刀片,与刀箱同一品牌;
▲CPU:每节点配置≥2个Intel Xeon6226R处理器,每处理器≥16核,处理器频率≥2.9GHz;
▲内存:每节点配置≥192GB DDR4 2933MHz ECC REG内存;
▲硬盘:每节点配置≥1块480G 2.5英寸热插拔ssd硬盘;
▲网络:每节点集成≥1个HDR Multi Host IB子卡,集成双千兆网卡
互联:保证与原有系统的互联
1.2 管理节点(1台):Nettrix R620
品牌要求:与计算节点同一品牌;
机型 机架式服务器,高度2U;
▲处理器和内存:配置Intel Xeon 4214R*2,配置192GB DDR4 2933MHz ECC REG内存,支持≥24个内存插槽;
▲硬盘:配置6块8TB SAS硬盘,RAID5,支持≥12个前置热插拔3.5硬盘或24个2.5硬盘,可支持2*后置SAS/SATA/SSD硬盘,板载支持≥4个NVMe U.2 SSD,不需PCE-E转接卡,支持2个内置M.2 SSD;
▲网卡:配置1块MX 单端口100G EDR HCA网卡;提供板载I350芯片高端双口千兆网卡,支持NCSI、网络唤醒,网络冗余,负载均衡等网络高级特性;
扩展插槽 支持10个PCI-E 3.0插槽;
▲液晶监控屏:配置双按键监控屏,提供服务器信息,CPU温度、风扇转速、当前使用功率等状态,管理接口 IP 地址,监控服务器工作状态,显示硬件故障报警,快速定位故障部件,迅速排查故障,降低宕机损失
▲电源:配置热插拔铂金1+1冗余电源,单个电源功率550W;支持400W BBU电池单元,提供二次备援功能支持400W BBU电池单元;
SD卡:主板支持双SD卡插槽,可实现存储系统日志及BMC日志;
管理:集成系统管理芯片,提供iKVM和KVM Over IP高级管理功能,本地固件更新、错误日志,提供系统状况的可视显示;配置独立的远程管理控制端口,支持远程监控图形界面, 可实现与操作系统无关的远程对服务器的完全控制,包括远程的开机、关机、重启、虚拟设备挂载等操作;可实现监控服务器内部主要部件的状态,包括CPU、内存、硬盘、风扇、电源;
故障诊断:支持黑匣子日志、故障截屏、开机自检代码,有效判断分析软硬件故障;
服务器导航软件:集成磁盘擦除、本地和远程备份还原、Raid配置、虚拟磁盘管理、无人值守安装操作系统、智能驱动安装等功能;
安全:可同时支持TCM和TPM安全模块;
服务:三年原厂整机质保,三年原厂免费上门服务。
1.3 HDR IB 交换机(1台)MX MQM8790-HS2F 40端口HDR IB交换机。
二、软件系统
2.1 软件系统:
2.1.1作业调度软件:Nettrix SIMS
▲软件架构:采用主流最新版本商业版作业调度软件,提供与计算系统硬件数量相匹配的调度系统许可,实现全系统的统一管理和高效调度使用,提供所有节点的软件许可授权,提供调度调度软件厂商原厂实施服务,与原有系统实现无缝连接,三年现场运维服务,中标后提供原厂授权服务承诺函;
▲监控热图:提供热图方式集中展现集群中所有服务器的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换;
应用软件集成:提供本地软件仓库,集成HPC集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI数学库、Infiniband驱动)和硬件诊断工具(如hpl、stream、iozone),允许管理员或普通用户通过Web页面进行查询、安装或卸载软件;提供截图证明
应用Portal:支持常见高性能应用(如Gaussian、Vasp等)的作业提交Portal,整合文件管理、VNC等功能;
作业提交核查:提供串行、OpenMP、MPI作业的Web提交界面,能够实时检查用户输入的合法性(比如申请资源超出权限等),支持2D交互式可视化作业的集成,支持作业Checkpoint/Restart功能;
▲调度引擎:集群调度系统同时支持PBS和Slurm调度系统,提供截图证明;
交互式作业功能 支持批处理作业、命令行交互式作业以及GUI图形交互作业,支持通过浏览器打开VNC会话进行操作;支持设置多个专门的VNC服务节点,统一VNC会话的管理;支持作业VNC会话在不同VNC服务节点上的负载均衡;
分组视图:支持按预定义或自定义的角色分组展现服务器状态信息,以及相关联的告警信息;
集群性能测评 提供针对集群整体(或者部分)进行各项指标(如CPU、磁盘、内存等)的性能测评功能,图形化的结果展示测试结果;
负载均衡调度:支持将作业均衡的分配到所有计算节点上,避免任务堆积在个别节点,因争抢CPU、内存等资源导致计算变慢;
随机调度策略:支持随机选择作业的计算节点,解决特定场景和固定调度算法下某些计算节点被频繁使用的问题;
一键配置集群:提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登陆、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项;
节点分区 支持对节点进行分区,不同的分区进行不同的访问控制和调度策略;
容错处理 作业资源限额控制 支持对资源占用量超过自身资源请求的作业进行自动清除,如运行时间超时、内存使用量超过限额;
作业异常自动重启 支持对于因为系统临时错误导致的异常作业进行自动重新入队和调度;支持当作业返回特定退出码时进行自动重新调度;
残留进程和非法进程清理 支持对作业残留进程和非法作业(即未提交调度系统、手动运行的作业)进程的自动清理。支持基于节点、用户、进程等不同维度的白名单和黑名单设置,支持多维复合过滤条件设置,支持对残留作业进程、非法作业进程的自动清理;
▲队列功能:队列管理 支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略;
用户管理 支持NIS和本地passwd用户管理(包括认证和增删改查),支持LDAP、AD,NIS,Local用户认证。多认证服务可以同时使用;
节点管理 支持基于Web的节点管理,监控计算节点的状态,支持节点的启用和禁用,支持节点服务的重启;
作业管理 支持基于Web的作业管理,支持对运行作业的输出进行实时监控,支持输出文件的下载,对VNC图形作业提供基于浏览器的远程访问功能;
▲统计和计费 预付费支持 支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业;
多视角统计 支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费;
计费详表 支持导出作业粒度的计费详表,供用户核对;
报表导出 支持PDF和EXCEL格式导出;
2.1.2 HPC软件自动部署工具 :Nettrix Clusconf
HPC软件自动部署工具 提供常用MPI、数学函数库、HPC基准测试程序的一键部署工具,可选择性或一键安装配置;
2.2 软件服务:
▲售后服务 全系统3年软硬件原厂质保,原厂7*24小时技术服务响应和免费上门服务,中标后提供原厂盖章授权服务承诺函。提供服务器原厂工程师的硬件和软件集成调试服务,包括集群管理软件系统进行安装调试,软件系统包括集群软件系统、操作系统、并行环境、编译器、数学库等;提供用户专业应用软件的安装和调试服务,保证用户应用软件的高效率并行使用;
投标人项目经验和实施能力 投标人具有本地专门的售后服务团队,投标人提供全程的维修服务和系统保障,投标时提供工程师团队社保证明函。提供与原有系统的整合。
在线运维系统 EasyOP
数量1套,与服务器同一品牌;
完成对存储系统7*24小时远程在线监控、异常告警通知等工作;
在线运维服务监控采购方存储及配套节点、网络等相关资源状态信息,如发现异常信息、故障信息,则将此类信息第一时间通知用户方,并采取相关措施;
系统应具备告警策略设置、告警联系人设置功能,并提供至少三种以上的自动触发告警通知服务;
用户可通过微信服务号、APP等手段,向运维方反馈在线运维服务相关问题或建议;
集群的运行情况可通过不同维度的相关信息进行统计,并可以根据使用者需要自定义时间范围;
系统可提供面向管理者的管理员账户功能,管理员可以通过web和移动端登陆账户并具备集群状态查询、监控状态查询、资产查询、告警查询、报表统计、告警策略设置、告警联系人及告警方式设置等功能;
系统可提供面向使用者的普通账户(非管理员)相关功能,使用者(普通用户)能通过本服务新注册或绑定已有账号,使用者(普通用户)可以通过web和移动端登陆账号并具备账户概览查询、系统状态查询及相关报表统计等功能;
配置专门的运维服务人员;具有成熟的运维服务平台;
远程在线监控、运维管理软件或平台应出具相关软件著作权登记证明文件。
售后服务:电话支持:7x24小时;服务年限:3;服务时限:报修后8小时;商品承诺:原厂全新未拆封正品;
详情请访问原网页!
返回顶部