金额
800万元
发布时间
2022/06/23
招标产品
进化效果评估SMAC在线IDE开发批量计算能力数据读取SSD外部专有存储结构化数据存储优化算法缓存副本组件服务应用协同编排训练容器加速计算过程航空器在线组件实际占用RDMA类型网络组件资源管理智能规划基础软件文件存储多网卡AI任务同时配置多类型的网络HDD底层缓存进化策略岸基着陆SAC多目录存储对象存储DOP仿真服务规划结果验证平台实时存储存储池系统监控可视化任务场景编辑AI训练Openspiel地面车辆实时数据处理训练管理平台基于SR-IOV技术数据预热加载进化式强化学习算法物理模型设计缓存数据的可观测性在线测试最小化算法基础公共服务规划数据管理平台读取加速训练配置管理Ceph仿真数据进行统一存储与管理物理仿真引擎缓存容量并行训练缓存数据配置导航计算机与软件弹性分布式训练公共域名解析管理数据应用协同调度基于Ray的数据集流水线处理加速主机训练过程管理基础环境管理平台规划算力管理平台单机训练训练调度IPPO可迁移性CFR+训练可视化管理规划算法应用及案例管理虚拟设备高性能网络公共存储服务运行时总存储多客户端读写针对SR-IOV网络资源缓存数据服务流水线任务在线开发IDE公共镜像仓库行动规划推理服务GPU并行计算算法组件管理平台网络实现智能算法服务器存储卷的权限配置低时延网络训练节点容错缓存不同来源的底层数据典型算法运动规划平台监控采集多智能体博弈典型应用异构计算资源平台JAVAAPI等方式调用资源抽象剩余存储智能组件评估分析结果数据内存状态数据缓存容器KVM虚拟化管理并发采集日志OpenEBS水平扩展A3C数据预加载调度任务git仓库NFS文件数据访问存储资源分布式组件训练岸基起飞日志查询物理仿真可控形态表达以太网类型网络调度算法MCCFRGoogleFootballHDFSNPU自动流水线作业基于梯度优化QMIX进化算法
金额
600万元
项目地址
广东省
发布时间
2020/12/17
招标产品
高性能计算管理平台计算模拟HPC集群高性能计算平台CPU服务器公共计算服务平台计算支撑服务高性能计算集群管理软件深度学习管理软件高速大容量存储系统高速IB计算网络GPU服务器校级计算平台领先级超算平台学校各类科研平台大规模科学计算基础运算环境高效节能高性能计算研究服务中心高性能校级超算平台新型材料地球物理生物医药健康计算机辅助工程仿真数学统计学物理学量子化学生物信息学计算机科学高性能计算集群管理调度软件应用特征分析工具并行环境并行存储系统千兆管理网络HDR100计算网络深度学习计算集群管理调度软件人工智能高效处理复杂运算登录节点6TBSATA硬盘光模块IPMI专用千兆管理口单端口HDR100GHCA卡支持按需申请CPU核数和GPU卡数OCP扩展插槽双机互备管理模式高效冗余热插拔电源主机安全加固模块支持网络访问控制服务端口监控系统自我保护功能计算机软件商业版软件集群资源监控集群资源整体监控集群性能监控集群作业规模分析统计提供最近四周的作业完成情况统计扩展监控支持用户动态配置监控集群报警提供邮件及短信报警方式集群物理拓扑视图集群节点进行管理支持自定义集群物理视图通过物理视图查看各计算节点的开关机远程桌面工具GPU及MIC作业WEB页面提交作业集成常用应用模板交互式图形作业作业流机制算例生成提供大数据处理的环境及相关的管理功能计算结果处理先进先出资源回填公平共享作业抢占用户循环调度用户作业均衡作业调度用户缴费及余额管理支持批量用户缴费用户缴费记录查看提供欠费提醒功能支持按组对用户的作业数及资源进行统计用户详单查询集群运行情况统计分析报表集群运行情况分析统计报表集群完成作业数分析统计集群的可用节点支持通过IPMI对节点电源进行管理通过设置缓冲节点对动态调整粒度的设置实现学校/单位内部用户帐号的统一管理HPC计算平台Hadoop管理spark计算资源管理分配访问资源任务提交提供功能截图CPU资源监控CPU节点监控GPU整体监控GPU节点监控AI作业提交AI作业管理报表统计x86服务器告警CPU集群实时特征数据CPU利用率MEM利用率内存带宽PCI-E带宽浮点计算速度AVX向量化率整体分析节点分析展示单个计算节点各指标的运行曲线指标分析对比分析数据统计数据去噪正态分布图雷达图导出用户和用户组账单功能节点特征数据监控基础资源支持用户和用户组优先级设置提供任务排队机制支持GPU多任务共享平台存储新建和删除等功能训练开发环境容器服务创建多版本多框架的容器开发环境和容器的创建和删除编辑并保存pycharmIDE开发工具深度学习框架AI多机并行加速性能测试使用ImageNet图片集多种任务框架的任务模板节点缓存数据配置云存储编辑用户组相关信息删除用户组维护用户的角色变更修改配额不同权限管理启动停止自己的代码私有模型普通用户组用户系统管理员机时时间查询功能集群统计集群利用率节点利用率作业规模统计作业数量统计GPU数量统计框架统计用户统计曲线统计支持将用户选择的样本数据预读到计算节点训练I/O瓶颈问题缓存自动清理数据更新缓存管理策略任务调度到已缓存数据的计算节点四种任务调度任务优先级模式用户组轮询模式用户轮询模式Gangscheduling调度网络拓扑亲和调度PCIE亲和调度设备类型亲和调度历史资源优先调度资源调度支持用户通过选择硬件资源训练脚本模型训练全生命周期管理任务创建进度查看日志查询过程可视化历史任务模型保存分布式训练模型可视化数据加速缓存数据管理策略支持计算节点缓存数据的记录与统计清理计算节点未在用的缓存数据资源组管理FIFO调度用户优先级调度紧急任务调度开发环境管理环境搭建AI框架开发环境配置映射端口开发环境生命周期管理并行文件系统全局文件系统并行存储体系元数据节点集群存储节点集群配额管理HDR100IB线缆HDR100HCA卡AI调参调优高性能相关培训Gaussian等离子物理EPOCH维修1HPC基础安装调试故障处理安装交换机高性能集群AI集群管理2HPCAI应用优化应用培训HPC应用特征分析HPC应用优化并行程序设计并行编程计算物理材料科学气象气候工业仿真领域应用分析GPU架构优化AI模型模型优化相关课程全英文培训课程备品备件应用并行调优验收检测图纸
返回顶部