电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

2025算力网络总体技术要求

18页
  • 卖家[上传人]:职**
  • 文档编号:597862298
  • 上传时间:2025-02-09
  • 文档格式:DOCX
  • 文档大小:415.44KB
  • / 18 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、算力网络总体技术要求目次前言II1 范围12 规范性引用文件13 术语和定义14 缩略语25 总体架构25.1 总体架构25.2 部署架构36 功能要求46.1 概述46.2 资源层46.3 适配层46.4 网络层46.5 调度层56.6 应用层66.7 运营层66.8 安全机制67 接口要求77.1 概述77.2 资源层与适配层间接口87.3 适配层与调度层间接口87.4 运营层与调度层间接口87.5 应用层与运营层间接口87.6 应用层与调度层间接口8附录 A(资料性)无人机监管城市应用案例9附录 B(资料性)智能安防应用案例10附录 C(资料性)3D 实时渲染应用案例11附录 D(资料性)AI 算力产品标准化应用案例12附录 E(资料性)算力网原生的大模型应用案例13参考文献14III算力网络总体技术要求1 范围本文件规定了算力网络的总体架构、功能要求和接口要求。本文件适用于算力网络的总体设计和建设。2 规范性引用文件下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修

      2、改单)适用于本文件。GB/T 41867-2022 信息技术 人工智能 术语YD/T 4255-2023 算力网络 总体技术要求3 术语和定义GB/T 41867-2022界定的以及下列术语和定义适用于本文件。3.1数据中心 data center一种能够提供容纳、互联和操作的结构或结构组。它使用信息技术、电信网络设备提供的数据存储、处理、迁移服务及其它所有功能,并集成能量供应、环境控制和为保证服务可用性而制定的必要的韧性、安全性级别定义。注1:数据中心结构一般包含数个楼宇或空间,用以支撑数据中心主要功能。注2:包含数据中心中信息及通信技术设备及支撑环境控制设备边界或空间,定义于更大的结构或楼宇中。来源:ISO/IEC 22237-1:2021,3.1.83.2计算中心 computing center为多用户提供计算服务的设施。用户的操作通过对计算设备及辅助硬件的操作及中心人员的服务实现。来源:ISO/IEC/IEEE 24765: 2017,3.7413.3人工智能计算中心 artificial intelligence computing center智算中心一种能够为多用户提供

      3、人工智能计算服务、数据容纳的结构或结构组。使用信息技术、电信网络设备提供的数据存储、处理、迁移、人工智能计算加速等功能,并集成能量供应、环境控制和为服务可用性而制定的必要的可靠性组件。注1:人工智能计算中心一般包含数据中心可能涉及的楼宇或空间,用以支撑人工智能计算中心主要功能。注2:人工智能计算中心中的服务器,一般包含人工智能服务器和通用服务器等,服务器称为“节点”。 来源:ISO/IEC 22237-1:2021,3.1.8和ISO/IEC/IEEE 24765:2017,3.741,有修改3.4算力网络 computing network一种为用户提供计算资源的设施。通过网络技术将各地的计算中心连接起来,进而统筹分配和调度计算任务的网络。参考:ITU-T Y.2501,有修改3.5算力感知 computing awareness13算力感知是网络对算力资源和算力服务的部署位置、实时状态、负载信息、业务需求等多维度感知。来源:YD/T 4255-20233.6算网编排管理 computing & network orchestration and management算网编排管理是对

      4、算力资源和网络资源进行统一管理和编排,包括注册、OAM等。来源:YD/T 4255-20234 缩略语下列缩略语适用于本文件。AI:人工智能(Artificial Intelligence) CPU:中央处理单元(Central Processing Unit) DetNet:确定性网络(Deterministic Networking)DNS RR:域名系统资源记录(Domain Name System Resource Record) FCFS:先来先服务(First Come First Served)IP:网际互连协议(Internet Protocol) I/O:输入/输出(Input/Output)OTDR:光时域反射仪(Optical Time Domain Reflectometer) OTN:光传输网络(Optical Transport Network)OXC:光交叉连接(Optical Cross Connect)OMSP:光复用段保护(Optical Multiplex Section Protect) OSU:光服务单元(Optical Service Uni

      5、t)QKD:量子密钥分发(Quantum Key Distribution) QoE:体验质量(Quality of Experience) QoS:服务质量(Quality of Service)QUIC:快速 UDP 互联网连接(Quick UDP Internet Connection) RDMA:远端内存直接访问(Remote Direct Memory Access)ROADM:可重构光分插复用器(Reconfigurable Optical Add-Drop Multiplexer) SDWAN:软件定义广域网(Software Defined Wide-Area Network)SRV6:基于 IPv6 的段路由(Segment Routing over IPv6) TCP:传输控制协议(Transmission Control Protocol) UDP:用户数据报协议(User Datagram Protocol) WDM:波分复用(Wavelength Division Multiplexing)WSON:波分交换光网络(Wavelength Switched Op

      6、tical Network)5 总体架构5.1 总体架构大湾区算力网络连接分散在大湾区域内的智算中心、超算中心以及通用云计算中心,汇聚和共享算力、数据、模型和应用等资源。各类计算中心通过加入大湾区算力网络实现资源共享,并通过算力网络统一调度,提高全网资源利用率,满足算力需求。大湾区算力网络的业务分层和系统设计见图1。图1 大湾区算力网络总体架构5.2 部署架构大湾区算力网络中各计算中心、枢纽节点的互联方式如下:a) 计算中心之间可通过以下三种方式进行互联:1) IP 专网:主要用于路由控制面信令,计算中心间低通量数据交互且对安全防护、网络质量有一定要求的传输场景;2) OTN 高速网络:主要用于计算中心间高通量数据交互且对安全防护、网络质量有一定要求的传输场景;3) 互联网:主要用于计算中心间低通量数据交互且对安全防护、网络质量无要求的传输场景。b) 枢纽节点为某区域内的大型/重要智算、超算或通用云计算中心,枢纽节点之间的互联方式优先级由高到低为:OTN 高速网络、IP 专网、互联网;c) 其它计算中心之间的互联方式优先级由高到低为:IP 专网、OTN 专线高速网络、互联网。d) 大湾

      7、区算力网络平台包括云际管理和调度平台、运营平台,可部署在某个枢纽节点计算中心内,或部署于独立的服务集群。图 2 大湾区算力网络部署架构6 功能要求6.1 概述大湾区算力网络总体架构可分为资源层、适配层、网络层、调度层、应用层、运营层和安全机制,各业务层的具体功能要求如下。6.2 资源层大湾区算力网络资源层包含各计算中心的算力、存储、网络、数据等资源,应具备以下功能:a) 算力资源提供:应提供计算、存储等资源,并支持按需扩缩容;b) 计算中心互联与开放:应实现各计算中心算力和数据资源的互联互通,支持各计算中心算力和数据资源的对外开放;c) 统一数据存储:应在现有计算中心的存储资源上构建统一的支持块/文件/对象的融合存储服务,支持跨计算中心的数据管理和迁移;d) 用户认证:应提供用户创建、删除、修改、鉴定等功能,保障算力网络中授权的用户登录计算中心进行资源使用;e) 作业管理:提供对作业的提交、取消、查询、变更等功能;f) 计算中心内资源管理:对计算中心资源(如CPU、GPU、内存等)进行实时监控,为作业分配资源,并实现资源隔离,以确保敏感数据的安全和不同作业之间的隔离;g) 账号管理:提

      8、供计算中心云化管理调度系统账号创建、删除、修改等功能;h) 计算中心内调度策略:计算中心云化管理调度系统应支持多种调度策略,以面对算力网络复杂需求场景。可根据需要选择不同调度策略,也可以自定义调度策略;i) 稳定性:用户认证系统、云化管理调度系统等均应保障持续稳定运行,从而为算力网络提供稳定可靠的算力资源。6.3 适配层大湾区算力网络适配层通过调度适配器,实现调度层与资源层之间的数据交互。调度适配器部署在各计算中心内,对接各计算中心内异构的云化管理与调度系统,负责异构集群资源采集和上报,实现作业转发和管理。调度适配器应支持从各计算中心采集集群资源、负载、能耗、费率等信息并上报给调度层,由调度层根据这些信息进行作业调度。适配层应包含以下功能:a) 应支持智算中心、超算中心、数据中心三类大型计算中心对外接口的统一适配,屏蔽异构集群技术栈差异;b) 应支持接口扩展,满足其它类型的计算中心接入大湾区算力网络的要求;c) 作业代理:应支持将调度层下发的作业发送到计算中心本地调度系统,周期性采集作业状态的资源使用信息,并上报到调度层;d) 算力资源代理:应支持周期性采集所属计算集群的资源信息并上报给调度层;e) 数据管理与缓存:应支持适配层和调度层之间的数据管理,包括数据上传、下载、断点续传等。支持作业调度时的数据下发,和作业执行结束后的数据取回。应支持缓存作业数据,避免使用重复数据时数据的再次传输,提高数据利用率;f) 账号映射:应支持算力网络统一用户账号到各个计算中心云化管理调度系统的用户账号之间的映射。6.4 网络层6.4.1 概述网络层主要负责多个异构计算中心的网络接入和互联,实现算力数据的路由控制和高速转发。网络层主要包含光层和IP层。6.4.2 光层大湾区算力网络应支持以全光网络为底座,为重要枢纽节点间的数据交互提供低时延、高通量的传输通道。光层具体包含以下能力:a) 应支持100G/400G/800G等WDM/OTN长距离大容量传输能力,实现算力资源互联和海量数据高速传输;b) 应支持ROADM/OXC等全光交换和调度能力,例如9维、20维和32维等;c) 应支持OTN/OSU/WDM等多种方式的全光算力接入能力;d) 应支持基于WSON/OMSP等多种方式的保护和协同机制,提升网络层生存性和可靠性;e) 宜支持光层和IP层跨层协同,包括业务、路径、运维、

      《2025算力网络总体技术要求》由会员职**分享,可在线阅读,更多相关《2025算力网络总体技术要求》请在金锄头文库上搜索。

      点击阅读更多内容
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.