中科曙光Sugon

产品 > 高性能计算机 > 高性能计算软件 > 高性能计算软件 > Gridview 2.6
Gridview
大规模服务器集群管理软件 拥有强大的工作负载管理平台,简化HPC集群管理
为您供全方位的集群监控管理、作业调度等功能,可精细展现当前集群运行状态,动态显示监控信息,记录历史错误信息,及时发现集群的异常状况
主要业务应用: 同时监控超过5000个节点 大规模高性能计算中心或数据中心集群等
核心优势
多种功能模块满足用户对集群性能进行监控的需求
Gridview采用模块化、可插拔的设计理念,产品具备很强的灵活性、可扩展性,能充分满足不同用户的需求,产品升级维护简单。提供资源管理、信息采集、告警管理、报表管理、集群管理、作业调度、功耗管理多个子系统软件,实现了集群系统的全方位管理
对异构集群的监控能力
Gridview完全采用软件技术实现对节点的监控,采用Java虚拟机技术,可以实现对各种平台的兼容。可以对不同品牌,不同操作系统的集群进行完全监控,无需增加额外硬件成本
强大的集群管理功能
支持集群操作系统的整体部署、镜像保存和恢复、指定节点的系统安装和恢复、集群账户管理、文件管理、进行管理、文件系统管理等各种集群管理功能
风险预警机制
对敏感的风险点进行阈值控制,当发现有异常状况发生,迅速触发预警机制,提示管理员对集群的非正常信息及时进行处理,降低故障发生的风险
历史运行状况记录
提供历史告警信息查询的功能,能够呈现选定时间范围内产生的所有历史告警信息,以便掌握选定时间内系统中设备和应用的运行状态。所有告警信息均可以通过关键字排序
强大的作业调度功能
Gridview提供作业管理、队列管理、策略配置等多个功能的软件系统,本系统基于B/S架构,提供友好的用户界面,用户可以通过界面提交作业,同时也可以进行多种管理操作。支持GPU作业调度,可以在GPU和CPU异构的集群环境中进行作业调度。并提供友好的作业提交Portal,简化用户提交作业的方式
VNC远程图像
Gridview系统提供“VNC”管理功能,用户可在作业调度系统中实现图形交互式操作,在作业系统自动分配的计算节点上远程打开CAE等软件的图形界面,方便用户操作
多样的监控效果
Gridview提供多样的监控资源,为服务器的安全运行提供绝对的保障,对于关键性的业务系统进行密切监控
良好的可扩展、可维护性
Gridview是曙光自行研制开发的集群软件,稳定性好,可维护性高,系统前后版本兼容,历史数据统一保存在数据库中,方便备份,减少风险
特别说明:以上信息为产品典配基本参数,仅供参考, 产品实际配置请在购买时向产品销售商咨询,并以实际产品为准。以上内容如有变动,恕不 另行通知。

类别 名称 更新时间 下载
技术白皮书 Gridview集群监控管理系统V2.6技术白皮书 2013-02-21