公告摘要
项目编号bh202407090448
预算金额26.5万元
招标公司武汉大学
招标联系人-
标书截止时间-
投标截止时间-
公告正文
项目概况
项目名称 A10四卡大内存服务器 项目编号 BH202407090448
开始时间 2024-07-10 09:41 结束时间 2024-07-15 09:41
供应商资格要求 参照《中华人民共和国政府采购法》第二十二条规定的资格条件。 预算金额(元) 265000.00
采购方式 竞价

采购货物信息列表
序号 货物(服务)名称 数量 计量单位 预算单价
1 A10四卡大内存服务器 1 265000
技术参数 1、GPU 计算服务器货物名称:
深度学习计算服务器
采购预算:人民币26.5万元
技术参数:
一线品牌GPU计算服务器(非组装) 外形高度:4U高度机架式服务器(含上架导轨)提供针对本次项目的授权及服务承诺函;合同签订前需提供相同配置测试机测试,必须原厂工程师上门安装调试,本次采购设备由厂商直接发货至武汉大学,为保证货物的原装性,所有的配件必须是原厂整机出厂,保证包装不开封,包装箱上注明采购用户名称武汉大学。详见配件及附件技术参数附件:序号 品名 参数需求 数量 单位
1 GPU计算节点 (1)GPU计算服务器1套。
1) ★CPU:≥2颗,Intel最新至强铂金系列,每处理器≥96核心,睿频主频≥4.0GHz,本项目对图片渲染要求比较高,主频要求必须响应。
2) ★内存:≥32根64GDDR5 ECC REG 4800频率内存,傲腾(可扩展,至少提供32根内存插槽,最大支持8TB内存),支持RDIMM、LDIMM、NVDIMM内存,支持主流厂商内存颗粒,提供内存稳固套件。
3) ★系统盘:≥Intel 3.84T NVME SSD企业级 *1,(行货非OEM 序列号可查)。
4) ★数据盘:≥Intel 3.84T NVME SSD企业级 *1,(行货非OEM 序列号可查)
5) ★RAID:支持SATA/SAS硬盘,选配支持RAID:0、1、5、10*1,1G缓存。
6) ★扩展槽:11个PCI-E5.0 X16单宽插槽。
7) ★网卡:≥2个10G网络接口。≥1个管理局域网接口。
8) ★提供GPU卡片≥4片, NVidia 具有563亿个晶体管、6912 个CUDA核心和24GB DDR6 HBM2e显存,具备72MB二级缓存,单精度19.5TFlops、双精度9.7TFlops,INT8推理1248Tops理论算力1177 TOPS(NV)(支持官网查询,GPU内存带宽:每秒 600 GB,非拆机组装显卡,否则做退货处理),后期还可以扩展6块GPU计算卡。
9) 管理端口:提供IPMI 2.0智能管理平台,1 IPMI管理端口。
10) 电源≥4,金牌冗余高效电源,单个电源≥2.0kw。
11) 预装操作系统(OS):Ubuntu操作系统。
12) 产品尺寸:4U机架式,含机架套件。
13) 投标公司必须有工程师会操作并行计算节点设置和熟悉相关HPC经验,需要把GPU计算节点并入现有集群。
14) 保修:显卡配置信息与招标参数要求一致,拒绝第三方配件、水货、二手货。交付时逐项核对验收,不符合竞价要求的一律做退货处理,同时追究相关责任,并赔偿以此造成的一切损失, 原厂提供随机三年的(24*7)4小时武汉本地化上门服务的人工+备件免费白金质保服务。
15) 交货周期:3天内交货,服务器提供1个月GPU压力测试服务,免费安装含GPU计算卡驱动和深度学习软件:Caffe, CNTK, TensorFlow, Theano, Torch,配套安装CUDA驱动,CUDA工具包,CUDA SDK。
(2) ★提供CPU和GPU集群管理套件,支持license注册信息,与硬件品牌一致。
16) 提供原厂著作权证明材料,能够通过网页页面提交任务。提供证明文件。
17) WEB管理功能:用户和组的集中管理,硬件监控,配置资源管理和任务调度程序参数,监控界面提供集群节点,硬件监控,实时监控集群和单个节点的CPU负载、内存使用率和网络流量等状态。
18) 提供用户管理,可以添加的系统用户,根据不同用户所属组的不同属性,用户可以管理系统或是使用任务提交功能。
19) 提供可以通过web界面提交CPU和GPU的混合作业。提供截图。
20) 支持交互式图形作业的提交及图形作业VNC登录查看。提供截图。
21) 支持用户自定义报警阈值设置;提供邮件报警方式,支持用户自定义报警策略,定义报警方式,报警次数及报警时间间隔。提供截图。
22) 可对任务队列设置执行及资源占用参数。并对已经执行完的任务,查看输出结果、任务的执行属性,可以重新执行,查看任务执行完成情况。
23) 支持用户校园网内部远程任务配置与执行。
(3) 深度学习应用软件。
1) 深度学习框架TensorFlow。
2) NVIDIA GPU虚拟化。
3) NVIDIA Virtual GPU软件。
4) NVIDIA Docker。
5) 提供高度优化GPU的代码、调优和测试。
6) 提供并行编译环境:GNU C/C++编译器;Python;Java等。
7) 提供高性能计算函数库:ACML LAPACK;Blacs;ScaLAPACK;BLAS等。
8) 提供GPU软件:cuBlas cuFFT;cuSparse;cuRand;npp;OpenCL。
(4) 深度学习攻防对抗系统。
1) 深度学习脆弱分析系统:提供不少于5个面向图像领域的分类模型,并提供接口用于拓展分类模型训练使用,用于测试模型面临对抗样本攻击时的脆弱性
2) 深度学习对抗攻防分析系统:提供不少于3种人脸识别模型,并提供相应的接口用于拓展人类识别模型训练使用,用于测试模型的公平性
(5) 资质及证书服务。
1) 生产原厂商通过3C认证(要求现场盖章给出)。
2) 提供原厂售后服务承诺函(原件)。
3) 深度学习工作站:提供完备的售后方案,至少包括如下内容:
提供使用本套集群系统所必须的各种软硬件培训,提供详细的培训方案与培训内容)(需提供纸质盖章详细方案)。
4) 原厂工程师上门安装调试。 1 台
2 性能可视化 ☆为保证软件系统的兼容性,涉及信息采集、分析的软件产品需要正式发布5年以上,并经历过多个版本迭代;提供软件著作权证书;提供生产厂家售后服务授权书原件;
技术要求:
1). 可针对应用程序计算求解过程进行应用运行特征数据秒级频率采集,采集功能应包含系统级、微架构级、函数级、应用信息、作业运行信息采集功能。提供系统界面截图证明
2). 时采集和显示系统级信息,包含CPU整体利用率、CPU系统利用率、内存利用率、SWAP利用率、磁盘读速率、磁盘写速率、网络接收/发送速率、Infiniband流量等系统级基本性能数据;提供系统界面截图证明
3).实时采集和图形显示每个CPU核上所运行的进程名称,同时采集和显示进程所对应的用户名称;提供软件界面截图证明
4). 采用C/S架构,关键性能指标(CPU、内存、磁盘、网络)采集间隔要求达到1秒,采集间隔可以自定义;提供软件界面截图证明。
5). 函数级信息:实时采集和显示节点函数级性能数据,给出热点函数占比;
6). 作业运行信息:实时显示基于LSF、Torque、Slurm作业调度系统作业运行状态,支持按照作业粒度实时图形显示作业系统级、应用级运行信息;
7). 进程管理:实时并行显示集群中所有的进程信息,支持按条件的快速搜索进程,支持授权模式下的进程管理操作。
8). 规模要求:在同一界面内清晰、准确显示系统级、微架构级和应用级的性能数据;可支持1000节点以上规模集群使用,提供合同或实际案例截图;为保证本台GPU加入以前集群,方便管理投标人必须满足此软件功能再应标,不符合竞价要求的一律做退货处理,同时追究相关责任,并赔偿以此造成的一切损失 1 套
相关材料 GPU计算服务器 (2).doc
返回顶部