首云,首都在线,全球一体化平台

通用AI解决方案

方案特点

模型弹性扩缩容

基于云原生弹性调度平台,实现AI推理资源的智能扩缩容,支持高吞吐、低延迟的并发处理,流量高峰时自动扩展集群保障性能,低谷时快速释放资源。

AI算力出海

通过云原生调度平台实现AIGC业务边缘化部署和调度,结合全球智能融合CDN实现边缘业务的加速和推广。

专业服务保障,快速响应业务

拥有流程化、规范化的上云服务体系,为通用AI公司提供7*24小时专项保障、专家支持服务;灵活、快速响应业务。

方案架构

应用场景

云原生分布式多租户推理案例

云原生分布式多租户推理案例

首都在线将推理模型服务部署在不同的算力资源节点上,通过云原生方式统一调度和管理,结合AIGC多租户网关实现终端用户的按需调度,合理使用GPU算力资源。

客户收益

  • 通过云原生方式将业务资源使用效率提升30%。
  • 通过多租户网关提升租户使用体验,降低使用成本。
  • 通过云互联对异构GPU资源进行管理,最大化资源使用效率。
云原生跨云调度案例

云原生跨云调度案例

首都在线在客户面临AIGC出海后的多云部署需求时,通过多云互联产品打通多云之间网络互联,以云原生实现跨云统一调度和管理。

客户收益

  • 通过云原生方式将业务资源使用效率提升30%。
  • 通过多云互联实现客户多云资源互通,降低使用成本。
  • 通过调度使用异构GPU资源提升用户体验,并降低客户成本。
Gen AI 算力出海案例

Gen AI 算力出海案例

为国内AIGC行业用户,提供海内外一体化的算力资源池,支持客户在海内外同时开展AIGC业务,快速提升市场占有率。

客户收益

  • 客户在海外推理的整体成本降低50%。
  • 通过全球云互联专线,使得客户更好地调度和平衡算力资源。
  • 通过首都在线全球节点,更好地在全球拓展AIGC业务。