跳过导航

执行摘要

过去几年中人工智能算法和机器学习方法成功应用到实战假设中,如商业、工商和数字服务,但在软件测试和联网中并不普及。软件测试中大多数AI/ML应用因软件复杂性而保持学术性本文简要介绍应用ML法和AI算法软件测试领域最新技术过去三年内AI和ML方法进度分析基于Scopus Elsevier科学网和Google学者数据库软件测试所用算法按测试类型分组论文还试图核心化主要的AI方法以及测试类型,特别是白箱测试、灰盒测试和黑盒软件测试黑盒测试是应用AI时首选软件测试方法黑盒测试即聚类技术常用ML所有三种方法(监督、不受监督加固法)。人造智能和机器学习网络化的机会很多网络自动化和资源优化等使用案例可帮助网络操作者减少网络测试和操作繁琐人工过程(并由此提高效率),为客户提供更多更好的服务

AI对多运算符来说是一个新领域, 关键设计决策需要由输入输出、硬件软件、机器学习模型、模型训练与部署来决定

MicrosoftTeams-image_(20)

图1人工智能网络基础

白皮书试图解答其中一些问题并描述标准机构如何努力将AI和机器学习融入网络测试并解释部分技术提供可帮助为特定使用案例实现AI性能最大化运算符使用此信息可启动或加速网络测试和运维并AI行程

导 言

网络测试是根据定义需求验证网络的主要方式,约占开发成本和时间的一半网络基础设施改善可省下高达三分之一费用。另一方面,在过去几十年中,人工智能概念和机器学习概念成功用于探索不同领域数据的潜力。ML用于教机器如何更高效处理数据,模拟理性生物学习概念,并可用AI算法(或技术)实现,该算法反映逻辑/方程推理特征,即关联性、遗传性、统计概率性、案例性等使用AI算法并基于ML方法,有可能探索并提取信息以便分类、关联、优化、集群、预测和识别模式等

AI技术提供预测模型供多工使用,但仍不是测试系统常用正确性似乎逻辑应用AI软件测试缺少机制辨别正确错误SUT行为目前是一个瓶颈AI迄今很少用于SUT误差检测,因为问题自动化缺失异常点是回归测试,SUT正确性能可以从前版本行为中推导出

产业界对机学习系统持续监控网络的可能性感到疑惑交通产业预计到2025年每年投资367亿美元AI软件、硬件和服务另一项调查显示63.5%操作者投资AI系统改善基础设施

标准机构正稳步努力改善AI和机器学习融入网络架构3GPP引入5G网络数据分析函数函数从网络函数收集网络数据并进行数据分析,帮助改善5G网络管理自动化O-RAN联盟引入无线电访问网络智能控制器,这是一个云型微服务函数,用AI和机器学习算法收集数据并定制RAN功能

shutterstock_1937933428

已知AI技术提供预测模型供多工使用,但仍非测试系统常用正确性网络操作AI应能优化服务保证和基础设施使用,图1提供AIOS系统端对端管道视图

AIOS可应用到网络自动化、资源优化和许多其他领域举例说,自我优化网络对网络运算符来说是一个诱人目标运算符必须回答一些重要问题白皮书讨论网络设计师启动AIOS行程时应探索的一些因素

输入应是什么

AI系统工作方式接收输入数据,使用一个或多个模型分析数据并产生输出电信网络架构师识别适当输入对开发AI系统至关重要,该系统可实现AI5G网络运维优化的允诺确定输入物后,如果其中一些输入物目前不可用,必须采取步骤提供输入物举例说,可能需要新的数据采集工具或访问网络外部数据

对比4G网络,5G网络广泛使用网络切片这种方法虚拟化网络创建虚拟连接,为不同类型交通提供不同资源,而不同类型交通则有不同质量服务需求这对于AIOps构成挑战,因为AI系统必须合并所有相关KPIs并预测成适合网络切片的单服务级目标

下表表示网络本身可能输入

网络测量

5G网络包含跨网络元素多项网络性能度量实例包括物理层信号质量测量图层2数据传输统计图层3无线电链路连接和运动度量

资源用法

从网络功能和微服务收集性能度量值可有助于监控和预测网络整体性能信息可关联计算、存储和联网资源资源主管技术(RDT)为终端缓存和存储带宽等共享资源应用、虚拟机和容器使用带来了新层次可见度和控制详细度可帮助确保AIOS系统精度

图2图2从资料收集到采取行动,人工智能操作系统有许多阶段

流量负载和类型

AIOS系统需要可见度,函数和微服务正在移动数据-和数据量系统使用机器学习推理提高网络效率

故障指标

AIOS的另一信息来源包括网络报警和故障度量信息可用预测故障或瓶颈

数据可以是流数据(如最后15分钟)或历史数据(如最后7天值特定度量)。时间序列预测模型添加历史数据称为模拟扩充模型,并有助于提高模型精度,特别是当试图预测网络质量突变或用户数猛增等事件时。

除网络固有数据外,AIOS系统可用外部数据源丰富可包括日期、时间、天气、地理区域、用户具体位置、缓冲比等网络运算符通过合并网络数据、服务应用数据与客户数据,有一个良好的起始点创建强大的AIOS系统

收集输入的另一个方面与输入收集频率相关答案取决于网络架构的哪一部分正在自动化或优化核心网络干扰决策和执法可基于每15分钟测量数反之,RAN每隔几秒通过管理用户界面测量数据,目标是预测和推理决策时延时小于一秒5GRAN中心单元和分布单元可能需要更快控制,降至小至10ms

AIOS输出

AIOS系统输出取决于使用案例下小节讨论网络自动化和资源优化的潜在输出

开工网络自动化

AIOS系统的某些输出可注入网络函数关键是要确定这些输出和网络函数应注入到哪个网络函数中通用使用模型让网络运算符使用KPI预测正在发生的事情,并基于比较当前值和预测值采取适当行动举例说,如果细胞使用量下降,运算符可关闭一些天线以节能AIOS系统使用临界分析和/或增强学习选择基于使用案例的正确动作

具体输出取决于网络方面举例说,业务支持系统和商业支持系统输出值不同于RIC和NWDAF输出值随着AIOS演化,自动化策略越来越多地应用到这些控制点上。世界各地的运算符和求解提供方正在进行概念测试和证明,以进一步发展网络自动化

二叉资源优化

另一种使用实例是资源优化可提高经验质量和/或qos资源集约性延时敏感应用如云虚拟现实应用,AI可替换传统QOS策略,为用户提供更好的经验右AI模型可帮助预测动态流量和移动无线电传输能力,并近实时通知闭路网络优化(配置变化应用各种策略)。在其他使用方式中,交通拥塞可能导致所有用户服务退化AI可用于执行某些优先用户的QOS策略,即使其他用户QOS调低,也向用户提供令人满意的服务水平

shutterstock_1133982038

AI网络操作性能如何保证

电信行业需要五九可靠性、高模型精度和极佳故障管理此外,每个使用案例都有一个临界KPI这可能是延时训练或更多系统必须提供承载级可靠性并有足够的资源实现SLOAIOS系统设计应包括正确的AI优化技术,如强处理器、硬件加速器、加速库和优化AI框架

哪个机学模型最优

机器学习模型有很多选择其中包括卷积神经网络、循环神经网络-长时存储网-神经变形网络所有这些模型不同工作并做不同事网络运算符如何正确决策

5GRAN基于时间序列预测模型可应用到大多数RAN函数上但其他预测模型正在出现新建模型可能是CNN和RNN层次的组合并适合使用案例,如波束优化和网络调度器另一种模型叫多层感知器(MLP),是向向人神经网络类,可选分类预测和回归预测使用案例增强学习常用于网络配置优化

选择模型使用案例的一项指导规则是所需模型精度举例说,如果选择关闭基站天线以便在低用期间节能(例如夜间),预测精度需要高-否则客户体验会受损但其他使用案例可能没有如此严格精度要求

超出概率推理正确性, 同样重要-很少提及-模型精度范围 离标记错误推理多远万一出错 可能微小或灾难这一点变得更加关键 AI控制从咨询转向不受监督

shutterstock_2284126663

运算符通常先预测分析(使用时序预测),然后随着AIOS系统成熟转指令分析即,如果发现问题,AIOS系统可自动根由并选择动作端端目标完全自动化配置和网络策略,通过不依赖培训数据集的强化学习实现取而代之的是,通过尝试不同行为/决策并选择产生最积极效果的行为/决策实现学习

iops领域快速增长新的使用案例和新模型正在不断发展投资高技能数据科学家可帮助操作者跟上进度并避免在建立AIOS系统时出高成本(时间或金钱)错误

关于AIOS系统设计的一个重要注释是,通过部署灵活服务基础架构使用微服务(不同于传统数据中心AI工作量),必须确保动态网络控制-核心网络、RIC或NWDAF-受监督学习、不受监督学习和(深入)增强学习模块应互为独立部署,提高AIOS系统实用性和弹性

嵌入式软件测试

嵌入式软件测试的目的是验证软件功能性非功能性属性和无故障集成硬件有五级测试嵌入式软件进程

开工软件单元测试

软件单元测试包括测试软件单元判断它是否按预期实现过程分离代码段并验证软件开发阶段的精度单位可以是函数、模块、对象、过程或方法

二叉系统单元测试

要测试,必须开发框架信息软件代码实时操作系统,包括通信细节、机制中断控制点协议通过消息队列发送接收消息开发者下一步会看到系统资源来判断系统能否容纳嵌入式系统执行灰盒测试常用于此进程

3级集成测试

集成测试可进一步划分为两类:软件集成测试和软件/硬件集成测试软件组件与硬件组件并发测试也可以使用此测试分析软件与外围设备交互作用嵌入式测试总是在实战环境进行,像软件开发环境多数测试者发现嵌入式测试至关重要,因为综合测试无法在模拟条件下进行

4级系统集成测试

过程期间,全系统都控制在一个单节点内控制观察组合
通信协议选择、操作系统事件和消息使用黑灰盒测试组合常用于此进程

5级系统验证测试

也叫验收测试测试者确保嵌入式系统子系统完全实现分析外部实体能否匹配产品功能需求是主要目标外部实体可以是人或设备或两者兼有黑盒测试经常使用

人工智能系统培训

AI模型使用前必须先培训在某些行业中,培训数据可能来自公共源码,如航班数据或世界范围疾病感染率网络数据培训AIOS系统通常取自运算符本身并分享网络数据以训练模型数据也可以匿名并分享模型销售商,以便能够训练模型免租

模型培训计算强度高,操作者必须投资于硬件(优化软件),为特定使用案例提供必备性能第二代和第三代Intel Xeon可缩放处理器,IntelDL Boost与VNNI可帮助加速培训同时,AIOS系统覆盖RIC和NWDAF核心到数据中心OSS/BSS,培训还必须包括所有网络方面的数据

shutterstock_1218220324

持续学习的利弊

持续学习(有时称为持续学习或在线学习)将持续集成/持续提供概念带入机场计算云开发广度采信CI/CD, 评审团仍无法理解其在电信环境的价值理论上,机器学习模型持续调整培训结果和预测以稳定数据流为基础比只培训过一次模型更准确持续学习模式有可能忽略或逐步忘记重要但不常见事件,使系统不强健,例如上游流量稀有激增操作者必须平衡持续学习的潜在效率和精度利弊与风险及其运营和资本支出目标是否持续学习决定 与每个运算符投送回算法

实现

应用AIOS系统包括模型评价、硬件和软件采购、整合必要的输入和输出、融入改变管理系统-当然还包括整合操作者物理计算、存储和网络基础设施

O-RAN联盟正在创建新路径,定义标准开关并分解RAN组件这使运算符与系统集成器合作创建AIOS系统,使用多商求解法SI还帮助将AI能力嵌入现有功能以提供更多情报运算符使用API工具箱可搭建AI硬件不可知性基础

英特尔电信行业都关系密切如下段描述案例研究SK电信人工智能流水提高网络质量英特尔与运算符和求解商协作帮助AIOS实现AIOS有斜坡学习曲线,可能不适配传统通信服务提供方集成模型运营商可利用英特尔各种互联网服务提供商、电信设备制造商和平台商际关系-从而创建混合方法以最小化风险和时到市场

案例研究

SK电信公司Intel人工智能流水提高网络质量SK电信英特尔协作建设加速端点网络AI管道,比GPU前置速度快达六倍深入学习案例研究

读更多

结论

网络运营商可利用3GP和O-RAN联盟5G网络架构最新创新,加之AI和机器学习用Intel硬件和软件驱动,探索新服务并改进现有服务智能网络以网络本身通过外部数据源丰富数据为基础(视使用案例而定),可提高操作员操作效率,提高QOS和QoE客户操作效率

设计AIOS系统并配有适当的输入输出、硬件软件和机器学习模型是成功的关键从资料收集到采取行动,英特尔技术协作可帮助操作者在每个阶段微调AIOps

关于作者


阿基尔巴沙

阿基尔帕沙解决方案架构师

Akhil Pasha电子通信BE16年电信联网经验关注数据科学分析网络管理系统Akhil专门建设端端开发集成,部署并操作电讯和网络应用故障、容量、账务和性能管理系统

关于Cyient

Cyient公司(Estd:1991,NSE:CYIENT)是一个全局工程技术解决公司同客户协作设计数字企业,搭建智能产品和平台并解决可持续性挑战我们致力于与利益攸关方一起设计明天,并成为一个文化兼容并包、社会负责任和环境上可持续的组织。

详情请访问m.josiken.com