金额
600万元
项目地址
广东省
发布时间
2020/12/17
招标产品
高性能计算管理平台计算模拟HPC集群高性能计算平台CPU服务器公共计算服务平台计算支撑服务高性能计算集群管理软件深度学习管理软件高速大容量存储系统高速IB计算网络GPU服务器校级计算平台领先级超算平台学校各类科研平台大规模科学计算基础运算环境高效节能高性能计算研究服务中心高性能校级超算平台新型材料地球物理生物医药健康计算机辅助工程仿真数学统计学物理学量子化学生物信息学计算机科学高性能计算集群管理调度软件应用特征分析工具并行环境并行存储系统千兆管理网络HDR100计算网络深度学习计算集群管理调度软件人工智能高效处理复杂运算登录节点6TBSATA硬盘光模块IPMI专用千兆管理口单端口HDR100GHCA卡支持按需申请CPU核数和GPU卡数OCP扩展插槽双机互备管理模式高效冗余热插拔电源主机安全加固模块支持网络访问控制服务端口监控系统自我保护功能计算机软件商业版软件集群资源监控集群资源整体监控集群性能监控集群作业规模分析统计提供最近四周的作业完成情况统计扩展监控支持用户动态配置监控集群报警提供邮件及短信报警方式集群物理拓扑视图集群节点进行管理支持自定义集群物理视图通过物理视图查看各计算节点的开关机远程桌面工具GPU及MIC作业WEB页面提交作业集成常用应用模板交互式图形作业作业流机制算例生成提供大数据处理的环境及相关的管理功能计算结果处理先进先出资源回填公平共享作业抢占用户循环调度用户作业均衡作业调度用户缴费及余额管理支持批量用户缴费用户缴费记录查看提供欠费提醒功能支持按组对用户的作业数及资源进行统计用户详单查询集群运行情况统计分析报表集群运行情况分析统计报表集群完成作业数分析统计集群的可用节点支持通过IPMI对节点电源进行管理通过设置缓冲节点对动态调整粒度的设置实现学校/单位内部用户帐号的统一管理HPC计算平台Hadoop管理spark计算资源管理分配访问资源任务提交提供功能截图CPU资源监控CPU节点监控GPU整体监控GPU节点监控AI作业提交AI作业管理报表统计x86服务器告警CPU集群实时特征数据CPU利用率MEM利用率内存带宽PCI-E带宽浮点计算速度AVX向量化率整体分析节点分析展示单个计算节点各指标的运行曲线指标分析对比分析数据统计数据去噪正态分布图雷达图导出用户和用户组账单功能节点特征数据监控基础资源支持用户和用户组优先级设置提供任务排队机制支持GPU多任务共享平台存储新建和删除等功能训练开发环境容器服务创建多版本多框架的容器开发环境和容器的创建和删除编辑并保存pycharmIDE开发工具深度学习框架AI多机并行加速性能测试使用ImageNet图片集多种任务框架的任务模板节点缓存数据配置云存储编辑用户组相关信息删除用户组维护用户的角色变更修改配额不同权限管理启动停止自己的代码私有模型普通用户组用户系统管理员机时时间查询功能集群统计集群利用率节点利用率作业规模统计作业数量统计GPU数量统计框架统计用户统计曲线统计支持将用户选择的样本数据预读到计算节点训练I/O瓶颈问题缓存自动清理数据更新缓存管理策略任务调度到已缓存数据的计算节点四种任务调度任务优先级模式用户组轮询模式用户轮询模式Gangscheduling调度网络拓扑亲和调度PCIE亲和调度设备类型亲和调度历史资源优先调度资源调度支持用户通过选择硬件资源训练脚本模型训练全生命周期管理任务创建进度查看日志查询过程可视化历史任务模型保存分布式训练模型可视化数据加速缓存数据管理策略支持计算节点缓存数据的记录与统计清理计算节点未在用的缓存数据资源组管理FIFO调度用户优先级调度紧急任务调度开发环境管理环境搭建AI框架开发环境配置映射端口开发环境生命周期管理并行文件系统全局文件系统并行存储体系元数据节点集群存储节点集群配额管理HDR100IB线缆HDR100HCA卡AI调参调优高性能相关培训Gaussian等离子物理EPOCH维修1HPC基础安装调试故障处理安装交换机高性能集群AI集群管理2HPCAI应用优化应用培训HPC应用特征分析HPC应用优化并行程序设计并行编程计算物理材料科学气象气候工业仿真领域应用分析GPU架构优化AI模型模型优化相关课程全英文培训课程备品备件应用并行调优验收检测图纸
返回顶部