招标
深圳大学-竞价公告(CB105902022001102)
服务器综合集群管理系统智能开关机集群监控实时调度直观的物理视图机柜远程开关机直观的展现各类设备的告警信息基于多维度运维视图指挥视图基础运维视图关键服务视图交换机刀片机箱GPU资源集群负载共享存储统计分析模块化设计分布式架构部署SaaS模式服务上千种采集指标本地软件仓库各种开源免费软件集群基础软件编译器MPI数学库Infiniband驱动硬件诊断工具集群配置能力检测网络可用性配置ssh/rsh无密码登陆停止系统冗余服务配置NFS同步集群时间同步集群用户告警管理运维服务监控报表集群性能分析报告运维报表生成模块系统管理员安全保密管理员安全审计管理员配置系统运行参数实时分析实时采集秒级采集秒级频率采集运行信息秒级监控队列作业统计作业规模统计异常作业统计集群作业趋势分析原始数据的导出可做二次分析支持节点镜像基于BT模式的镜像分发快速批量安装光盘ISO镜像操作系统安装系统自动部署镜像管理模块监控指标应用运行性能的状态报警作业提交模板整合文件管理HPC集群支持最大瞬时大规模作业智能监控作业管理调度策略定制集群资源限制作业调度资源弹性伸缩专业应用软件计算资源自动部署功能资源使用状况划分和调整删除计算节点固定调度实时监控输出文件的下载VNC图形作业远程访问节点管理基于Web的用户管理基于Web的队列管理作业热图批处理作业命令行交互式作业GUI图形交互作业作业VNC会话VNC服务节点计算数据计算结果极速上传下载快传断点续传TB级文件大文件远程传输文件管理功能在线编辑权限设置文件批量上传和打包下载调度系统状态分析视图
金额
19.99万元
项目地址
广东省
发布时间
2022/10/14
公告摘要
公告正文
深圳大学-竞价公告(CB105902022001102)
发布时间:2022-10-14 15:51:49
截止时间:2022-10-22 12:00:00
申购单号:CB105902022001102 签约时间:发布竞价结果后7天内签约合同
申购主题:服务器综合集群管理系统 送货时间:合同签订后7天内送达
采购单位:深圳大学 安装要求:免费上门安装(含材料费)
报价要求:国产含税 收货地址:广东省/深圳市/南山区/****
发票类型:增值税专用发票
币种:人民币
预算:199900.0
付款方式:货到验收合格后付款
备注说明:
申购明细:
序号:1
采购内容:服务器综合集群管理系统
数量:1
预算单价:
品牌:宁畅
型号:SIMS
规格参数:总体基础要求 1. 软件界面必须实现完全中文化。 2. 基于B/S架构实现,支持主流浏览器(IE、Firefox、Chrome)。 3. 提供开发接口API及文档,允许在该套系统基础上做二次开发。
质保及售后服务:按行业标准提供服务
附件: SIMS技术参数.docx SIMS技术参数.docx
更多咨询报价请点击:
https://www.easyjcx.com/#/purchase/detail/e81efda4d38a4c3986edd267612a669a
可以根据集群不同节点的预定义角色,进行智能开关机以及批量开关机支持对服务器的IPMI配置的管理,如IPMI地址、IPMI掩码、用户名、认证密码;支持批量导入服务器的IPMI配置;支持资产分组管理,允许添加、删除和修改分组;支持服务器等设备型号的管理,允许用户添加新机型,允许修改已有机型(如图片、高度等);支持资产(如服务器、机柜、刀箱、交换机等)的Excel批量导入导出功能,提供模板和示例;资产管理功能
提供服务器详细状态监控视图,分类展示该节点的静态信息和运行状态。静态配置信息包括CPU型号、内存大小、管理IP、操作系统版本等,动态信息包括磁盘分区状态、网卡状态、进程状态、IPMI传感器状态、GPU/MIC状态等。★支持大规模监控和调度,管理节点资源占用不超过50%,计算节点代理资源占用率不超过4%。★支持大规模监控管理,系统采集节点规模支持15000多节点,采集指标数量1000多种,采集秒级反馈,查询秒级响应。★提供直观的物理视图,如实展现机柜、服务器等设备的物理分布和相对位置关系;支持远程开关机、Putty/Winscp客户端登陆等操作;直观的展现各类设备的告警信息。提供基于多维度运维视图,包括指挥视图、基础运维视图、告警视图、关键服务视图等集群监控功能
支持自定义告警策略,实现页面预警、邮件告警等通知方式;符合告警策略条件将会产生相应告警信息并通过邮件、短信方式通知负责人支持服务器、交换机、刀片机箱等不同设备的告警,支持集群、机柜和刀片机箱等不同层次的告警;支持热图方式集中展现集群中所有服务器的关键指标,如CPU利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换。支持按预定义或自定义的角色分组展现服务器状态信息,以及相关联的告警信息。支持监控GPU资源总量/使用量、核心平均利用率、显存平均利用率、温度、显存频率、核心频率、型号、SN号、负载进程、功耗、风扇转速、PCIE宽度、PCIEgen、PCIE接收与发送速率、GPU驱动版本等指标支持集群负载,集群功耗,健康度,共享存储等统计分析;
★真正模块化设计、分布式架构部署、SaaS模式服务平台;采集方式多样,采集效率高;技术创新,完全自主开发;上千种采集指标。★提供本地软件仓库,集成HPC集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI数学库、Infiniband驱动)和硬件诊断工具(如hpl、stream、iozone)。★提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络可用性、配置ssh/rsh无密码登陆、停止系统冗余服务、配置NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项。集群配置和管理系统统一告警管理功能,符合策略将会产生告警信息;支持统一的Dashboard展现系统资源的告警汇总;支持按照告警级别、告警资源、资源类型等过滤条件检索告警信息;支持自定义告警级别;已处理的告警可以进行处理,处理过的告警信息归类到已处理告警中支持聚合通知,可自定义聚合策略,以防告警通知风暴
提供内容丰富的运维服务报告,包括系统资源利用情况、作业队列用户使用分析等;提供丰富的服务器(或服务器组)报表指标,包括CPU平均利用率、内存使用率、内存使用量/剩余量、磁盘(或磁盘分区)使用率、磁盘(或磁盘分区)使用量/剩余量、网卡接收/发送速率、磁盘读写速率等;支持针对服务器(或服务器分组)和交换机的监控报表,支持按照时序或排名展现数据;集群性能分析报告和运维报表生成模块三员管理模块(系统管理员、安全保密管理员、安全审计管理员),实现三种管理员权限分离,提供三种管理员不同的页面视图。系统管理员角色主要功能包含:配置系统运行参数;账户和账户组的创建、删除、修改、查询和导入。安全保密管理员角色主要功能包含:账户授权与管理;查看系统管理员和安全审计员及用户操作日志,监控操作行为。安全审计员角色主要功能包含:查看系统管理员和安全保密管理员及用户操作日志,对系统管理员和安全保密管理员的操作行为进行审计分析。支持NIS和本地passwd用户管理(包括认证和增删改查),支持LDAP、AD,NIS,Local用户认证,多认证服务可以同时使用
实时分析:实时采集和图形显示每个CPU核上所运行的进程名称,同时采集和显示进程所对应的用户名称;秒级采集:基于典型科学应用进行应用运行特征秒级频率采集,采集功能应包含系统级、函数级、应用信息、作业运行信息采集功能;能收集所有节点和应用的运行信息,秒级监控集群和应用的系统级、微架构级以及函数级等性能指标,分析性能异常,实时告警,是确保集群稳定、高效运行。实现作业统计、队列作业统计、作业规模统计、异常作业统计、集群作业趋势分析等报表,从不同维度满足用户统计分析需求,支持报表及原始数据的导出,可做二次分析支持预定义和自定义的时间条件,自定义条件中允许设定统计的时间区间(如统计上一个月每天早八点到晚八点间服务器负载);支持PDF、Excel、Html等不同的导出格式;
节点镜像方式,基于BT模式的镜像分发,快速批量安装;光盘ISO镜像方式,支持Redhat和Suse系列操作系统安装;基于网络启动的远程批量操作系统安装,支持节点镜像和光盘ISO镜像两种部署方式;系统自动部署和镜像管理模块以插件方式扩展监控指标,节点规模支持无限扩展。在统一窗口中图形显示当前集群中所有关机、离线、高温等异常状态的节点信息,应用运行性能的状态报警;
Web页面自带多种作业提交模板,扩展可支持所有常见高性能应用(如Ansys、MS、Abaqus、Gaussian、Vasp等)的作业提交Portal,整合文件管理、VNC等功能,有效降低工程应用人员使用HPC集群的门槛。支持定制化的作业提交模板;支持通过命令行提交作业。★支持大批量作业的实时调度,支持最大瞬时大规模作业(超过3000个)的同时提交;支持大批量作业的动态优先级调动并发瞬时吞吐率峰值(超过2000个)★支持10000+节点的智能监控与调度提供全方位的作业提交、作业管理、调度策略定制,集群资源限制等功能;作业调度功能支持资源弹性伸缩,根据专业应用软件需求,动态分配计算资源,利用自动部署功能动态调整服务器等资源使用状况。功能包括:计算队列定义和调整;服务器群服务器的添加和删除;存储空间的划分和调整
★支持将作业均衡的分配到所有计算节点上,避免任务堆积在个别节点,因争抢CPU、内存等资源导致计算变慢。支持随机选择作业的计算节点,解决特定场景和固定调度算法下某些计算节点被频繁使用的问题。支持基于Web的作业管理,支持对运行作业的输出进行实时监控,支持输出文件的下载,对VNC图形作业提供基于浏览器的远程访问功能。支持基于Web的节点管理,监控计算节点的状态,支持节点的启用和禁用,支持节点服务的重启;支持基于Web的用户管理,设置不同用户的用户类型、用户优先级、资源配额、可访问队列等;支持基于Web的队列管理,各队列可设置不同的资源配额、访问策略和调度策略;★提供作业热图,直观展现用户作业在集群的分布情况,以及集群资源的整体使用状况。
支持批处理作业、命令行交互式作业以及GUI图形交互作业,支持通过浏览器打开VNC会话进行操作;支持设置多个专门的VNC服务节点,统一VNC会话的管理;支持作业VNC会话在不同VNC服务节点上的负载均衡;支持计算数据或计算结果极速上传下载,支持快传和断点续传,可一次性高速传输数百个文件以及TB级文件,支持大文件远程传输提供基于Web的文件管理功能,支持文件和文件夹的创建、删除、重命名、在线编辑、权限设置,支持文件的节点间同步,支持文件批量上传和打包下载,支持列表视图和平铺视图的切换。支持基于队列、用户、用户组等多个维度的优先级定义策略,根据作业的静态(如资源请求、所属用户等)和动态指标(如入队时间、公平共享份额等),通过不同的权重设置,灵活控制作业优先级;支持基于队列、用户、用户组等不同维度的资源限额(即可用处理器数、内存数、节点数、作业数、GPU数等),方便管理员控制资源分配;★允许作业独占计算节点,支持集群、队列、作业三级的的节点独占策略设置。支持灵活可配置的节点可用性判定策略。检查作业的可用节点时,需要考虑多种资源请求(如处理器、内存、磁盘)进行判定,允许针对不同的资源使用不同的判定算法(如按照实际使用量、按照调度分配量,或者综合两者进行判定)。
支持导出作业粒度的计费详表,供用户核对;支持GPU、存储计费支持从用户、队列、节点、应用、账号、作业规模等不同角度进行统计计费;支持基于CPU、GPU、存储空间计费支持计费账号管理,允许多个用户使用一个计费账号;支持通过“先充值后扣费”方式使用集群资源,只有账号余额充足时才能运行作业。提供调度系统状态分析视图Dashboard,直观展示集群、队列、用户等不同视角的资源使用信息和作业负载信息,为管理员的调整优化提供决策依据。
联系我们
上海总部:上海市浦东新区纳贤路800号科海大楼2层
无锡分公司:无锡市中国传感网国际创新园F11栋2楼
邮 箱:bd@datauseful.com
给力助理小程序
给力讯息APP
给力商讯公众号
返回顶部