招标
深圳大学-竞价公告(CB105902022000845)
金额
17.3万元
项目地址
广东省
发布时间
2022/09/05
公告摘要
公告正文
首页 采购需求 竞价需求
深圳大学 - 竞价公告 (CB105902022000845)
发布时间:2022-09-05 17:24:35 截止时间:2022-09-14 12:00:00
基本信息:
申购明细:
序号
1
采购内容
集群管理软件
数量
1套
预算单价
173030
品牌
宝德
型号
Powercloud
规格参数
1、整体要求 1.1、此高性能计算平台是一套集资源监控、管理以及分布式应用作业调度为一体的云计算基础架构管理中间件,使用它可以快速地建立起一套完整的企业级应用服务平台。 1.2、▲提供对应的HPC平台计算机软件著作权登记证书,不接受开源产品 1.3、支持最新版的64位企业级Linux操作系统。 2、集群监控管理 2.1、直观的集群物理拓扑视图,显示节点的占用状态和节点温度。可配合作业调度系统,显示本地作业排队情况,方便动态掌握用户作业信息。 2.2、★通过WEB界面监控并展示集群当前节点各部件的状态,包括CPU平均使用率、内存使用率、硬盘利用率、GPU利用率在内的多种参数。 2.3、集群网络视图中用户可以查看集群整体网络运行情况,包括总体网络吞吐率、单节点网络吞吐率在内的多种参数。 2.4、▲支持对单机或批量节点进行操作,包括:远程开机、关机、重启、删除节点、允许节 点提交作业、拒绝节点提交作业、执行并行命令等操作。 3、作业调度 3.1、采用主流作业调度方式,支持多种作业提交方式,包括GUI一件提交、命令行、作业脚本和可执行文件等。支持通过浏览器进行集群使用操作。支持作业计算过程图形界面的交互操作。 3.2、★资源调度支持对CPU、GPU、FPGA等进行统一调度,支持异构集群作业调度模式。 3.3、▲支持用户组和用户任务配额管理,支持配置最大运行作业数、最大排队作业、最大处理器核心数等资源限制。 3.4、作业调度支持多队列管理,支持对队列设置不同管理策略,管理员用户可自定义队列策略。 4、可靠性:集群节点自动热备份,发生故障时不影响调度业务的正常运行。支持多级容错,包含系统级容错、作业级容错,即系统发生故障(如网络中断、系统宕机)或作业因为偶然故障(如磁盘空间不足,获取许可证失败)引起的作业失败时,该作业能被重新调度到其它机器上执行。 5、用户管理 5.1、提供web界面进行用户/组管理,包括集群用户/用户组的创建,显示,修改和删除。 5.2、★具备3层组织架构管理,如集群管理员、账户管理员、成员等,通过设定对组织及用户进行资源配额。 6、存储管理 6.1、支持各种分布式文件系统:Lustre, NFS等;平台存储可提供提供AES-256级别加密强度来加密待传输的数据,实现用户通过Web方式上传数据的方式隐私安全;支持断点续传、文件搜索、下载、压缩、解压、新建和删除等功能。 6.2、★集群软件支持对用户组和用户使用存储空间进行配额管理,支持分别设定用户组或用户最大可使用存储空间,支持对单一目录进行存储空间管理。 6.3、存储管理模块支持对用户组和用户存储文件数量进行配额管理,支持设定用户组或用户最大可存储操作文件数量。 7、深度学习作业调度 7.1、支持多种AI计算框架:支持TensorFlow,Caffe,Pytorch等AI框架。 7.2、集成众多开源数据集,便于提取进行训练。 8、集群登录 8.1、★支持通内部集成webSSH登录或者使用第三方登录软件putty、Xshell登录集群。 8.2、支持B/S架构的远程可视化,显示远程应用窗口。 9、作业报表 9.1、 提供导出单日报表、某用户单日报表、日期范围报表、某用户日期范围报表。 9.2、▲支持灵活、可自定义的计费策略;支持按照CPU、GPU、存储使用情况计费或者自定义计费策略。管理员可按需对所有用户产生计费报表,并通过Excel输出报表。 9.3、▲支持虚拟充值,在后台管理系统上由运营人员进行充值;也支持免费使用。 10、开发环境 10.1、GNU C/C++/Fortran编译器。 10.2、JAVA、python开发环境。 10.3、ntel MKL、BLAS、LAPACK、ScaLALACK、FFTW等函数库。 10.4、并行环境Intel MPI、MPICH、OpenMPI等。 10.5、 提供多种高性能计算软件安装服务,如Gaussian、Vasp、Amber、Pytorch、Anaconda、alphafold2、等以及基于各种 MPI 的自研软件等应用的集成,并提供后续安装的计算软件集成服务,支持自定义软件模板,通过模板快速提交训练任务。 11、培训要求:*建设完成后,对用户进行培训,包括初级培训、高级培训。培训内容应包括调度系统的所有功能,同时针对系统管理员进行深层次的培训,培训完毕后,系统管理员可对该系统进行独立的维护或定制开发工作。 12、数据交换设备 12.1.★数据中心强三层交换机,千兆电口数≥24个,千兆光口数≥4个,交换容量≥128Gbps,包转发率≥95.2Mpps; 12.2、实配150W电源和固定风扇;设备最大功耗不高于55W; 12.3、▲路由:支持IPv4/IPv6的静态路由BGP、OSPF;支持IPv6 Static Tunnel / ISTAP Tunnel / 6to4 Tunnel;所有物理端口必须支持直接配置为三层路由端口,不能借助于vlan interface 12.4、▲支持802.1AB LLDP;支持802.1Qbb基于优先级的流量控制PFC;支持Explicit congestion notification(ECN);支持VxLAN,支持NvGRE,支持GENEVE tunnel;支持VxLAN/NvGRE Bridge, VxLAN/NvGRE Route;支持>=4000 VxLAN/GRE/GENEVE tunnel;支持>=2000 VNI;支持>=1000 VxLAN peer; 12.5、可靠性协议:支持VRRP、支持网关双活转发,支持Smart Link,支持BFD和sBFD,支持环网保护协议ERPS; 12.6、▲可视化功能:支持大象流检测(Elephant Flow Detection),支持基于大象流检测的粗粒度DDoS检测,支持监控交换机buffer利用率,支持监控交换机报文latency,支持ACL过滤vxlan/nvgre内层报文 12.7、负载均衡:支持ECMP和端口聚合,支持基于hash的负载均衡、轮询模式的负载均衡和动态负载均衡; 12.8、组播:支持IGMPv1、v2,支持IGMP 监听;支持独立组播协议 (PIM) 稀疏模式 (PIM-SM); 12.9、▲安全和统计:支持硬件ACL,ACL表项≥2K,支持给予MAC/IP和端口的ACL;支持sFlow;支持IPFIX;支持MacSec硬件加密 12.10、网管功能:必须支持SNMP v1、v2和v3, 支持CLI;支持1个带外管理端口;支持Console; 12.11、▲端口镜像:支持SPAN、RSPAN;支持CPU抓包功能; 12.12、▲可编程性:支持JSON RPC API接口;支持OVSDB; 12.13、国产化要求:要求核心网络芯片是国产; 12.14、★,为保障设备间的最大兼容性,方便后期统一管理维护,要求与使用集群管理软件为同一品牌 13、数据备份软件:提供数据备份软件一套,支持数据实时备份及恢复,恢复内容包括操作系统+数据+应用,恢复时间不得超过4T/10分钟,具备自动接管功能,可指定带宽,连入系统后原有服务器CPU利用率提高不得超过1%; 14、售后服务:*提供软件系统原厂商五年售后服务保证包括软件升级,提供7*24小时在线的技术支持,2小时内响应,4小时上门,协助安装各种科研软件,在24小时内处理相关技术需求。 15、安装调试服务:中标方负责将原有设备(10台服务器、1台存储、2台交换机)组成一套高性能运算集群,满足作业调度、统一管理登录、文件共享、远程登录等功能,并安装不限于3款应用软件。硬件搭建不限于设备的互联互通,还需负责强电的接入,机房的装修、气体消防、弱电布线等相关事务。 16、中标公告发出后3天内签订合同,7个自然日内供货,如无法按照规定时间内完成,我单位有权取消中标资格,如未能按时完成交货实施我单位有权按照合同金额的万分之一/天进行处罚。
质保及售后服务
按行业标准提供服务
附件
源文地址:https://www.easyjcx.com/#/purchase/detail/2721b0fdab3342f496c052e8499798de
返回顶部