SothisAI人工智能管理平台
曙光人工智能服务平台SothisAI 系列产品极大的降低了用户切入深度学习领域的经济成本和技术成本,提供一套容器化的集群调度以及深度学习私有云服务方案。SothisAI 采用Slurm、K8S双调度引擎融合容器弹性扩展技术的方式,实现了资源的动态高效调度,应用的快速分发,和进程级隔离。支持多种编译环境及常见深度学习框架,如Caffe、TensorFlow、PyTorch等。提供了丰富的数据集和典型网络模型,同时支持内容分享和应用发布功能,协助构建平台微生态。最终帮助用户将更多的精力聚焦至垂直应用的开发和优化。SothisAI平台目前已在多所高校、研究中心部署使用。
独特优势
-
-
容器化快速部署
基于容器技术,应用容器化,资源动态弹性扩展, 实现深度学习开发和应用环境秒级部署
-
-
AI全流程覆盖
实现深度学习中的数据预处理、模型在线编写、模型训练、超参调优、模型验证和模型发布等流程完全覆盖
-
-
灵活的平台生态
数据集、模型代码、模型权重等多维内容共享; 在线自定义开发环境,并支持镜像固化和自助发布
-
-
支持主流AI框架
支持深度学习领域主流的Caffe、TensorFlow、PyTorch等框架,提供GUI、SSH、Jupyter等多种接入方式
-
-
丰富的行业数据集
面向不同应用行业提供丰富的典型数据集支持, 如ImageNet、MNIST、MTVL等
技术参数
-
多框架支持
支持Caffe、TensorFlow、PyTorch、MxNet、Keras等主流深度学习框架
-
容器化调度
应用容器化;支持容器弹性动态扩展,容器镜像自定义,容器生命周期管理等功能
-
多界面支持
提供Shell命令行、Jupyter脚本和Web图形化三种接入方式
-
在线训练
可在线提交深度学习训练作业,实时查看训练进度和日志,随时接入训练环境进行深度调试
-
模型管理
支持在线编辑和管理模型,并提供模型的超参数自动调优功能
-
推理验证
提供模型的在线保存和推送功能,支持模型的在线实时推理验证
-
分享订阅
支持平台用户的数据、模型、镜像等内容的分享、发布和订阅操作
-
调度策略
支持作业优先级、资源限额、公平共享、作业回填、作业抢占等多种资源调度策略
-
二次开发
提供RestFul格式的二次开发接口,可以在此平台基础上进行二次开发