首页-产品中心-人工智能
AI智算平台
八维通AI智算平台

八维通AI智算平台致力于最大程度地降低企业使用AI算力的门槛,并获得高效、低成本、规范化、可追溯的AI应用开发流程,帮助企业快速使用智算中心的网络、GPU、存储、机器学习框架与模型

产品优势

  • 异构算力高效调度

    多种算力硬件与形式,满足不同场景应用需求

  • 多框架与生态支持

    多种框架、软件栈支持,满足多类模型训练需求

  • 模型训推一体

    数据管理,训练与推理一站式全流程覆盖

  • 自动流水线构建

    图形化低代码、零代码流程组织工具

  • 开箱即用工具链

    专业工具库,降低模型研发成本,提高模型研发效率

  • 分布式并行训练

    千卡、万卡大规模高效模型训练

关键能力

资源整合

整合多种类资源如GPU、CPU、存储、网络等,构建高速并行存储系统和高速InfiniBand网络,形成异构GPU计算资源池。该资源池支持跨区域的灵活调配,构建高效率、低延迟的AI专用网络环境。适应模型参数存储需求,确保大规模数据的高效存取和多机通信需求,显著提高数据传输速率,确保数据传输及任务执行的安全稳定。

分布式调度

基于容器技术,实现了对多种资源类型的高效调度,能够自动进行GPU计算资源的分配与管理,从而提高了资源与任务调度的效率。系统还提供了资源组及优先级设置功能,有效缩短了数据传输的调度路径,以适应大型语言模型的训练与推理需求。此外,平台支持模型微调与推理服务的持续运作。

异构支持

实现多类型的异构计算资源统一管理,融合市场上主流的国内外的GPU、TPU、DPU等资源,打造出一个集中的计算力资源库。根据不同的计算任务需求,系统可以灵活地进行计算资源的调度与分配,提供包括计算力资源组、整机服务器、按卡申请等多种部署选项。

训推一体

提供全方位的AI服务,包括数据标注、数据集管理、算法构建、模型训练、模型调优、模型管理和模型部署推理。平台内置了多种常用的GPU函数库和工具库,支持TensorFlow、PyTorch、PaddlePaddle等训练框架。

AI仓库

平台支持镜像仓库、算法仓库、数据样本库等,保存用户训练推理所需数据与代码。

适用场景
  • 算力租赁

    灵活接入和管理多种类型的计算资源,并根据租赁需求进行动态分配和调度

  • 科研与教育

    支持大规模的科学计算和模拟实验,为科研人员提供充足的计算资源

  • 金融分析与评估

    支持多种金融分析模型和算法,提供精准的风险评估、市场预测和投资决策支持

  • 数据处理与仿真

    支持多种仿真模型和场景设置,为用户提供丰富的仿真实验资源和环境