招标
超算集群租赁(济大采〔2024〕275号)采购公告
金额
4.95万元
项目地址
山东省
发布时间
2024/11/14
公告摘要
公告正文
项目名称 | 超算集群租赁 | 项目编号 | 济大采〔2024〕275号 |
---|---|---|---|
公告开始日期 | 2024-11-14 01:19:22 | 公告截止日期 | 2024-11-18 02:00:00 |
采购单位 | 济南大学 | 付款方式 | 货到验收合格后付100% |
联系人 | 成交后在我参与的项目中查看 | 联系电话 | 成交后在我参与的项目中查看 |
签约时间要求 | 成交后2日内 | 到货时间要求 | |
预算总价 | ¥ 49500.00 + NaN + NaN | ||
发票要求 | 增值税普通发票 增值税专用发票 | ||
含税要求 | |||
送货要求 | |||
安装要求 | |||
收货地址 | |||
供应商资质要求 | 符合《政府采购法》第二十二条规定的供应商基本条件 ; 国际和国内的产品认证证书 (必选) | ||
公告说明 |
采购清单1
采购商品 | 采购数量 | 计量单位 | 所属分类 |
---|---|---|---|
服务器模拟计算 | 495000 | 项 | 网络接入服务 无 无 |
品牌 品牌1 | |
---|---|
型号 | |
品牌2 | |
型号 | |
品牌3 | |
型号 | |
品牌4 | |
型号 | |
品牌5 | |
型号 | |
品牌6 | |
型号 | |
预算单价 | ¥ 0.10 |
技术参数及配置要求 | 采用INTEL C621A芯片组,最大支持两颗英特尔? 至强? 可扩展系列处理器;采用DDR4 ECC Register内存,以更低密度的DIMM支持更高的内存带宽, 最大支持4T DDR4 MEM;默认支持8个3.5/2.5寸SSD/SAS/SATA硬盘;可选支持12个3.5/2.5寸SSD/SAS/SATA硬盘(直连/扩展版本),或24个3.5寸SSD/SAS/SATA硬盘(扩展版本);集成双口万兆网卡具有负载均衡,链路汇聚及冗余特性,可有效减少网络延迟; 支持1个1000M IPMI专用远程管理网口,可选KVM OVER IP带外管理;标配1个2000W铂金电源模块,默认1+0模式,可选配2个电源模块 ?2 X Intel Xeon Platinum 8370 Processor 2.8G/32C/64T/ ?16 X 16GB/DDR4/3200/ECC/REG ?1 X SSD/1000GB/NVME/2280/企业级(系统加速) ?1 X HDDD/8TB/SAS/3.5寸/企业级(系统加速) ?1 X 8口/SAS 12Gb/半高/PCIe 3.0 x8/2GB缓存/支持RAID 0,1,5,6,10,50,60,JBOD ?1 X 2000W铂金电源模块 ?网络 2*10GE,;支持OCP3.0网络模块,支持1Gb/10Gb/25Gb/40Gb/100Gb/200Gb速率,支持1/2/4个以太网或光纤网络接口 ?原厂商3年保修及上门服务,原厂3年7*24小时电话支持服务;保证原厂原配,保证厂家直发用户指定地点 系统要求: 实现集群系统的统一管理,保证加入并兼容原有集群系统。 1)并行文件系统: 1.扩展性:支持在线扩展,可扩展存储节点或存储设备,对应用透明;全局文件系统软件涵盖所有计算节点的许可。 2.配额管理:本文件系统必须提供用户权限管理、配额管理功能;并支持在线对配额进行设置。 3.高速文件系统:支持快速文件系统,可利用计算节点的SSD硬盘快速创建高速并行文件系统,可集成在作业调度系统中。 4.兼容性:并行文件系统能够兼容各厂家主流硬件设备,包含存储服务器及磁盘阵列。 2)集群部署和管理功能:实现系统的并行安装和配置;管理和同步节点的配置文件;提供系统远程运行命令操作,允许以命令或脚本方式运行在集群中的所有节点上;支持用户帐户统一管理;提供远程硬件控制,如:节点的远程开机、关机和重新启动、动态监视系统资源使用情况。 3)集群资源管理和作业调度功能: 调度器配置和管理:可以支持IBM Platform LSF、Torque+Maui、PBS Pro等多种调度系统。即可满足中小型集群用户的成本优化需求,也可以满足大型集群系统的性能要求。 作业管理:包括作业的提交(脚本提交和命令行提交),作业状态显示,修改,移除,挂起(hold),释放,重新运行等; 队列管理:包括队列创建,显示,修改,移除;路由队列; 4)用户和账户管理功能: 可以统一用户/组管理和账户汇率管理;用户/组管理包括集群用户/用户组的创建,显示,修改和删除;账户的管理包括账户的创建,显示,修改和删除 5)集群监控功能: 可以对CPU、内存、网络,I/O系统性能指标进行实施监控。 6)分布式训练:实现分布式并行训练功能;可以动态申请分布式训练所需要的GPU数量和节点数量;平台可以实时监控每个节点的运行情况。 7)深度学习计算服务:平台管理员可在管理端界面自主新建开发、训练框架类型或版本;管理员可以定义用户对于训练框架模板和资源分配模板的查看及使用权限,可设置部分或全部可见/使用;支持快速创建深度学习环境,应用程序及硬件资源相互隔离,以容器的方式运行任务;用户按需申请深度学习环境,包括深度学习框架,网络模型,GPU及CPU资源;训练完成销毁运行环境,释放计算资源;支持对训练环境做快照;支持环境框架、资源配置动态调整;提供Jupyter lab和jupyter notebook的集成,支持AI相关数据集成到Jupyter中,支持一键添加代码和数据集,提供在线编程及部署,教学和科研;支持web及shell提交训练任务;支持用户可以实时查看自己任务的运行结果。 8)模型训练:支持可视化作业管理、版本管理、克隆任务(参数管理)等功能,基于参数管理可以快速创建任务,提升模型训练任务的迭代效率;基于常用的AI算法框架及准备好的算法可以进行多版本任务参数调优,优化并增强机器学习全生命周期管理流程。 9)模型管理:支持统一的模型管理功能,可以集中管理所有在模型训练中得到的模型,导入并管理在本地开发的模型,满足模型需要不断迭代和调试的管理需求;支持对模型进行多版本管理,可以将模型发布为服务。支持将训练好的AI模型部署成在线服务(Web Service),提供在线UI预测推理能力,为用户提供可调的用API接口。支持设置模型服务自动停止时间,避免不必要的资源浪费。 |
参考链接 | |
售后服务 | 服务网点:当地;电话支持:7x24小时;服务年限:五年;服务时限:报修后48小时;商品承诺:原厂全新未拆封正品;质保期:五年; |
2024-11-14 01:19:22
返回顶部