新时代我国网络AI大模型发展与挑战分析
四川省剑阁职业高级中学校 罗春清 2024/4/25 21:35:56
摘 要 本文阐述随作为 6G 的研究热点,网络与 AI 被 ITU-R 正式提出作为 6G 的 6 大场景之一。其一直以来受到学术和工业界的广泛关注,6GANA 也提出了网络 AI 的理念并展开了深入的研究。而随着大模型的兴起以及其在各行业表现出来的强大潜力,可以预见到大模型也将在 6G 网络中扮演重要的角色,相关的研究也将逐渐进入高发期。在新时代下,本文将首先对网络大模型(NetGPT)给出明确的定义,随后从基础理论、场景需求、网络架构、部署管控、数据治理等方面系统阐述 NetGPT 的发展中10 大重点研究问题与挑战,分析潜在的研究路线,希望能够为后续的 NetGPT 的相关工作指引方向。
关键词 新时代 ;网络AI;大模型;发展;挑战
一. 网络大模型的背景
ITU-R WP5D 第 44 次会议正式通过了《IMT 面向 2030 及未来发展的框架和总体目标建议书》, 作为 6G 研究的一个重要的里程碑,代表了全球的 6G 愿景共识,其中 AI 与通信融合被作为 6 大关键场景之一,与 6GANA 提出的 Network AI 理念不谋而合。随着大模型的颠覆性发展, AI 在自然语言处理、计算机视觉、语音识别等领域的任务处理能力得到了极大的突破。特别是大语言模型,如 ChatGPT,能够准确识别并理解用户的意图,为用户提供问题,生成文本等,并在结合多模态技术后不断向更多领域拓展。可以预计,大模型将会成为 AI 通信融合的关键组成部分。在提高网络中 AI 的通用性和多任务处理能力等方面发挥重要作用。然而我们需要意识到,大模型与 AI 在应用上是有着很大不同的。在以往 AI 模型的使用上,是通过收集大量的数据然后从头训练模型,因此需要关注是如何针对具体任务设计模型结构、网络如何收集需要的数据,网络如何为 AI 模型的训练推理提供算力和算法支撑等。
大模型在应用上,是以预训练基础模型为底座,通过各种策略,如 prompt,fine-tune 以及向量库等方式来适配各类具体任务。另外,大模型意图理解和涌现能力,也给大模型的应用带来了更多的可能性,例如可以实现基于意图的编排,调用各种工具实现具体任务等。同时,大模型的巨大参数量和算力需求,也为其在网络中的应用带来了新的挑战。为此,我们需要重新梳理大模型和网络结合这个领域中的关键问题,为后续的研究指明方向。
二. 网络大模型的定义
大模型将在运维、执行、验证等方面为移动网络服务。通过整合通信知识,大模型可以帮助检测故障和生成解决方案。随着网络服务的多样性和复杂性,大模型可以用来编排和调度任务流程,还可以进行性能优化、环境预测、资源分配等。通过出色的生成能力,大型模型有望在验证阶段发挥重要作用,如室外复杂环境的通道生成、高铁场景模拟等。
因此,我们将无线通信网络中使用的大模型定义为网络大模型(NetGPT)。
由于无线通信网络包含 RAN/CN/OAM 这些不同的技术域,他们在功能特性、数据结构、以及性能需求上都有着明显的区别。
基础性指的是能够通过 few-shot 甚至 zero-shot就很好的适配到下游任务上,这一点 NetGPT-L0/1 都要具备,特别是 L1,要能够作为 NetGPT- L2 的基础模型,通过各种策略来快速适配到新的场景中去,不再需要从头开始训练 L2。而在模型规模上,NetGPT-L0/1 的参数量要满足大模型的基准门限,目前业界普遍的看法是,产生智能涌现的最少参数量在 70 亿。NetGPT-L2 的参数量可以小很多,方便其部署在网络边缘和端侧。
三. AI大模型发展的基础问题
3.1 NETGPT 场景和需求问题
NetGPT 的需求是否真实存在,需求程度如何,需要通过研究过程逐步去伪存真,为后续的网络设计和 NetGPT 发展提供必要依据。另外,在 NetGPT 需求和场景研究中,需要结合对未来技术趋势的分析,需求和场景研究可以一定程度适度超前当前科技水平。单从 IT 视角进而 CT 视角看 GPT 技术,从 IT 视角看,GPT 既是一种 AI 大模型,也是超级AI 大应用;从 CT 视角看,GPT 既可以是一种辅助工作的赋能手段,也可是一种创新设计新范式。
而就 6G 网络发展而言,从“需求搜集”到“系统设计“,再到”规范标准“,“研发测试”,“规划,建设,运维,管理,优化,营销”等全生命周期的各个环节,GPT 类技术都可以在其中
发挥重要作用,而从一开始最具价值的毫无疑问是 GPT 赋能网络,即 NetGPT。而无线网络边缘单设备/终端相对于云(未完,下一页)
|