本实用新型涉及计算机和通信领域,具体涉及一种保障5g网络(imt-2020)服务质量(qos:qualityofservice)的人工智能设备。
背景技术:
移动通信深刻改变了人类社会的政治、经济和生活,每隔10年将产生新一代移动通信技术,我国从1g空白、2g跟随、3g突破到4g实现了并跑,移动通信技术已经成为世界各国高科技竞争的焦点。当前规模应用的4g,应对未来爆炸性的移动数据流量增长、海量的设备连接、不断涌现的各类新业务(工业控制、无人驾驶、远程医疗等)和应用场景捉襟见肘,促使人们对更高性能移动通信的追求,第五代移动通信(5g)系统也就应运而生。世界各国均将5g作为提升社会运行效率、带动社会经济发展的重要驱动力。
和前面四代移动通信主要针对人与人连接不同,5g设立了三大应用场景,分别是:1)针对人与人连接的增强型移动宽带embb;2)针对人与物连接的超高可靠低时延通信urllc(工业控制、远程医疗);2)针对物与物连接的海量机器类通信emtc。5g时代的到来,将会加速社会数字化变革。当人与人、人与物、物与物相互联接之时,一个基于5g的万物互联时代将正式开启。面向2020年及未来,vr/ar、全息通信、工业互联网、远程医疗、无人驾驶等关键任务,都对高速率、低时延、广联接等网络质量提出了明确的要求。5g标准设计之初要求的网络服务质量指标包括:1-20gbps的峰值速率,10-100mbps的用户体验,1-10毫秒的端到端延时,1-100倍的网络能耗效率(每比特能耗)提升。5g新空口方面,大规模天线阵列、密集网络、新型波形复用与信道编译码(如极化码)、以及毫米波接入将成为5g无线空口的核心技术,核心网络架构关键技术包括网络切片slicing、软件定义网络sdn、网络功能虚拟化nfv、网络云化cloud、基于服务的架构sba、人工智能ai等,5g核心网络的资源调度构建在云计算平台上,通过计算资源的隔离、动态调配与迁移,实现网络资源的灵活调配,以适应未来5g丰富的应用场景。
在海量设备连接,超高流量密度、超高连接数密度和超高移动性场景下,5g网络如何高能效的满足用户大带宽、高可靠、低时延服务体验存在巨大挑战,传统的网络设计、规划、运营、管理和维护方法无法适应高度复杂和动态的5g网络环境。这些挑战包括:
1)网络设备和流量不断增长:物联网中m2m联网设备数量和数据将迅速,视频/vr/ar等大流量业务不断涌现,最新的cisco移动vni预计,每个5g连接的数据消费量将达到22gb/月,比每个4g连接消费的数据多4倍,海量设备、海量数据和海量连接成为5g网络服务质量保障面临主要问题。
2)软件化/云化带来网络故障诊断和运维复杂性增加:基于sdn/nfv/cloud的网络架构重构给网络提供了强大的灵活性的同时,带来新的管控复杂性。例如:虚拟网元与物理网元的互动、虚拟网元的生命周期管理、产生大量新的逻辑接口,更加难以定位故障,这需要一整套开发运营维护协同的新模式。
3)5g网络技术日益多样和灵活:5g网络支持embb,urllc,mmtc三大业务形态。性能方面,引入大规模天线阵列、灵活空口、非正交多用户接入等技术;灵活性方面,架构上实现各种解耦,如软硬解耦、控制转发解耦、控制面功能分解、ran的cu和du分离等,从而使得网络功能更容易部署在云计算平台,实现灵活的网络编排和自动化部署,提高资源利用率,并为各行各业提供网络切片服务,技术的复杂和多样性同时也增加了网络服务质量保障的复杂性。
4)能效方面,信息通信产业是全球第五大能耗产业,5g移动通信带宽、速率、连接数的千倍提升不能以千倍能耗提升为代价,和4g相比,5g每比特能耗要求大幅降低,因此,5g通信网络功能、性能、成本、功耗的矛盾越发凸显。
综上所述,5g网络在性能和灵活性上带来质的飞跃同时,网络的复杂性、动态性在显著增加,这将导致运营成本增加、用户体验无法保证,如何通过智能化、自动化网络资源调度满足5g网络服务质量要求成为当前5g网络实际部署面临的巨大挑战。
人工智能、机器学习是新一轮技术革命及产业变革的重要驱动力。信息通信业更与人工智能相互促进、密不可分。机器学习方法,通过数据来自动驱动模型优化,在图像、语音识别、自动驾驶等领域取得巨大成功。人工智能、机器学习在网络领域的应用也成为了研究热点。
电信网络是信息流通最重要的基础设施,其规模庞大,结构复杂,网元众多,是信息化社会的最直接的参与者和支撑者。需要充分发挥电信网络在数据、算力方面的优势,实现网络服务质量异常的自动监测、自动优化。在电信网络应用人工智能技术拥有一定优势,首先是数据量优势:电信网络中的各种网元、终端和业务系统每时每刻都在产生大量的数据,例如:网元状态、链路流量、告警事件、信号质量、业务日志等,这些数据中蕴含着大量有价值的结构和信息,可以使用人工智能相关模型进行分析、提取转化为帮助网络优化运营的信息。其次具备算力优势:以深度学习为代表的人工智能模型在训练过程中需要强大的计算能力支撑。基础电信运营商自身拥有大量的数据中心硬件设施以及云计算软件设施,特别在目前“云网融合”的网络演进趋势下,不论是中心dc还是边缘dc,在计算能力的广度和深度上都将进一步的增强,有利于建成为支撑人工智能模型的大规模ai计算加速设施。
从以上分析,我们提炼出基于人工智能的5g网络服务质量保证需要解决如下问题:
1)过去已发生的5g网络服务质量事件如何从历史数据中自动重新构建;
2)现在正在发生的5g网络服务质量事件如何实时的检测并自动采取行动;
3)未来将要发生的5g网络服务质量事件如何准确的进行预测并实现自动优化。
人工智能模型的训练需要大量的算力和数据,需要大量的并行计算来完成数据的处理和模型的训练,直接应用于现网将对现网业务产生影响,可行的解决方案是进行离线的训练和离线验证后,再部署到现网进行应用。
技术实现要素:
本实用新型的目的在于克服现有技术的不足,提供一种保障5g网络服务质量的人工智能设备,部署在5g核心网,根据用户需求离线训练5g网络qos保障人工智能模型,为5g网络qos保障人工智能模型应用于真实的5g网络环境提供基础。
为了达到上述目的,本实用新型所采用的技术方案是:
一种保障5g网络服务质量的人工智能设备,其特征在于,包括:外壳;安装在外壳里的主电路板;安装在主电路板上的处理器单元、pcieswitch单元、gpu单元、以太网通信单元、内存单元、硬盘单元、io接口单元、风扇单元和电源单元,其中:
所述处理器单元通过以太网通信单元或者io接口单元离线采集5g网络服务质量数据,完成数据的采集、预处理和决策控制功能,所述处理器单元与硬盘单元、内存单元、io接口单元相互连接,并通过pcieswitch单元与gpu单元和以太网通信单元相互连接;
所述gpu单元包括多个运算核心alu,用于基于处理器单元采集的5g网络服务质量数据,利用alu的并行计算能力,离线训练5g网络服务质量的人工智能模型;
所述以太网通信单元,用于提供外部数据通信传输功能,采用4*10ge光口;
所述pcieswitch单元,负责连接gpu单元和处理器单元,实现二者之间的通信,pcieswitch单元也负责连接以太网通信单元和处理器单元;
所述内存单元支持ddr4,内存单元通过内部的dma控制器和处理器单元相连;
所述硬盘单元,用于提供5g网络服务质量数据存储功能;硬盘单元通过sas接口连接处理器单元;
所述io接口单元包括usb接口、vga接口、系统开关按键、系统复位按键;
所述风扇单元用于提供处理器单元和gpu单元散热功能;
所述电源单元用于提供处理器单元和gpu单元供电功能。
进一步的,所述处理器单元采用cpu来实现,选用的型号包括:英特尔
进一步的,所述gpu单元选用的型号包括:nvidiateslav100/p100,p100配有的gp100gpu包含56个流式多处理器sm,每个处理器均包含64个单精度cuda核心fp32,32个双精度cuda核心fp64,256kb寄存器堆rf,64kb共享内存,峰值计算吞吐量为:双精度性能为5.3tflop/s,单精度性能为10.6tflop/s。
进一步的,所述io接口单元包括3个usb接口分别接键盘、鼠标和u盘;1个vga接口接显示器,1个系统开关按键和1个系统复位按键,通过usb接口导入外部离线的5g服务质量数据。
进一步的,所述风扇单元包括2组冗余热插拔系统散热风扇,所述电源单元支持100v-240v交流和240v直流输入。
本实用新型的有益效果是:与现有技术相比,本实用新型的优点在于:本实用新型提供的一种保障5g网络服务质量的人工智能设备,充分利用gpu单元多运算单元(alu)的并行计算能力,切合人工智能模型的并行特性,可离线有效的训练人工智能模型。本实用新型提供的保障5g网络服务质量的人工智能设备,部署在5g核心网,根据用户需求离线训练5g网络qos保障人工智能模型,为5g网络qos保障人工智能模型应用于真实的5g网络环境提供基础。
本实用新型的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本实用新型而了解。本实用新型的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本实用新型的技术方案做进一步的详细描述。
附图说明
附图用来提供对本实用新型的进一步理解,并且构成说明书的一部分,与本实用新型的实施例一起用于解释本实用新型,并不构成对本实用新型的限制。在附图中:
图1为一种保障5g网络服务质量的人工智能设备内部结构示意图;
图2为gpu单元内部结构示意图;
图3为一种保障5g网络服务质量的人工智能设备在5g核心网的部署方式。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本实用新型实施例提供了一种保障5g网络服务质量的人工智能设备,如图1所示,包括:外壳;安装在外壳里的主电路板;安装在主电路板上的处理器单元、pcieswitch单元,gpu单元、以太网通信单元、内存单元、硬盘单元、io接口单元、风扇单元和电源单元。
处理器单元可采用cpu来实现,可选型号包括:英特尔
gpu单元包括更多的运算核心(alu),如图2所示,可选型号包括:nvidiateslav100/p100,p100配有的gp100gpu包含56个流式多元处理器(sm),每个处理器均包含64个单精度(fp32)cuda核心,32个双精度(fp64)cuda核心,256kb寄存器堆(rf),64kb共享内存,峰值计算吞吐量为:双精度性能为5.3tflop/s,单精度性能为10.6tflop/s可并行完成计算密集型任务,基于处理器单元采集的5g网络服务质量数据,离线训练人工智能模型。
人工智能模型参数更新的过程是在处理器单元端执行,gpu单元上的训练过程是循环,直到处理器单元采集的所有的训练数据处理完成。
人工智能模型的训练过程是:人工智能模型参数被处理器单元初始化并被保存,从训练数据集中随机选取一个小批量数据到gpu单元内存中,gpu单元从处理器单元获取目前模型最新的参数,gpu单元的模型副本就可以作为一个独立的结点在小批量数据上进行训练计算。训练得到的参数直接回传处理器单元,处理器单元进行完成模型评估检测后更新参数,开始下一轮的模型训练。
以太网通信单元用于提供外部数据通信传输功能,采用4*10ge光口。
pcieswitch单元,负责连接gpu单元和处理器单元,实现二者之间的通信。pcieswitch单元也负责连接以太网通信单元和处理器单元。
内存单元支持ddr4,rdimm/lrdimm,内存单元通过内部的dma控制器和处理器单元相连;
硬盘单元:提供sas接口,提供数据存储功能。
io接口单元:包括3个usb接口接键盘、鼠标和u盘;1个vga接口接显示器,1个系统开关按键和1个系统复位按键。可通过usb接口导入外部离线的5g服务质量数据。
风扇单元:2组冗余热插拔系统散热风扇。
电源单元:支持100v-240v交流和240v直流输入。
如图3所示,本实用新型实施例提供的保障5g网络服务质量的人工智能设备,可以部署在5g核心网,根据用户需求离线训练5g网络qos保障模型,为5g网络qos保障模型应用于真实的5g网络环境提供基础。
5g网络包括用户终端(ue)、接入网(an)、核心网(cn)和外部的数据网络(dn)。5g网络数据平面,各功能实体间接口包括ue-an接口、rp-au接口,rp-ud接口。5g网络控制平面,各功能实体间接口包括rp-tn接口、rp-an接口。核心网控制平面功能包括:nfr(网络功能注册)、udm(统一数据管理)、smf(会话管理功能)、asf(认证服务器功能)、pcf(策略控制功能)、nacf(网络接入控制功能)、nssf(网络切片选择功能)、af(应用功能)、cef(能力开放功能)等,核心网控制平面各功能间采用sba架构(基于服务的架构)。核心网数据平面upf(用户平面功能)负责在ue和dn之间转发和调度数据流量。
在上述的详细描述中,各种特征一起组合在单个的实施方案中,以简化本公开。不应该将这种公开方法解释为反映了这样的意图,即,所要求保护的主题的实施方案需要清楚地在每个权利要求中所陈述的特征更多的特征。相反,如所附的权利要求书所反映的那样,本实用新型处于比所公开的单个实施方案的全部特征少的状态。因此,所附的权利要求书特此清楚地被并入详细描述中,其中每项权利要求独自作为本实用新型单独的优选实施方案。
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括,”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
1.一种保障5g网络服务质量的人工智能设备,其特征在于,包括:外壳;安装在外壳里的主电路板;安装在主电路板上的处理器单元、pcieswitch单元、gpu单元、以太网通信单元、内存单元、硬盘单元、io接口单元、风扇单元和电源单元,其中:
所述处理器单元通过以太网通信单元或者io接口单元离线采集5g网络服务质量数据,完成数据的采集、预处理和决策控制功能,所述处理器单元与硬盘单元、内存单元、io接口单元相互连接,并通过pcieswitch单元与gpu单元和以太网通信单元相互连接;
所述gpu单元包括多个运算核心alu,用于基于处理器单元采集的5g网络服务质量数据,利用alu的并行计算能力,离线训练5g网络服务质量的人工智能模型;
所述以太网通信单元,用于提供外部数据通信传输功能,采用4*10ge光口;
所述pcieswitch单元,负责连接gpu单元和处理器单元,实现二者之间的通信,pcieswitch单元也负责连接以太网通信单元和处理器单元;
所述内存单元支持ddr4,内存单元通过内部的dma控制器和处理器单元相连;
所述硬盘单元,用于提供5g网络服务质量数据存储功能;硬盘单元通过sas接口连接处理器单元;
所述io接口单元包括usb接口、vga接口、系统开关按键、系统复位按键;
所述风扇单元用于提供处理器单元和gpu单元散热功能;
所述电源单元用于提供处理器单元和gpu单元供电功能。
2.根据权利要求1所述的一种保障5g网络服务质量的人工智能设备,其特征在于:所述处理器单元采用cpu来实现,选用的型号包括:
3.根据权利要求1所述的一种保障5g网络服务质量的人工智能设备,其特征在于:所述gpu单元选用的型号包括:nvidiateslav100/p100,p100配有的gp100gpu包含56个流式多处理器sm,每个处理器均包含64个单精度cuda核心fp32,32个双精度cuda核心fp64,256kb寄存器堆rf,64kb共享内存,峰值计算吞吐量为:双精度性能为5.3tflop/s,单精度性能为10.6tflop/s。
4.根据权利要求1所述的一种保障5g网络服务质量的人工智能设备,其特征在于:所述io接口单元包括3个usb接口分别接键盘、鼠标和u盘;1个vga接口接显示器,1个系统开关按键和1个系统复位按键,通过usb接口导入外部离线的5g服务质量数据。
5.根据权利要求1所述的一种保障5g网络服务质量的人工智能设备,其特征在于:所述风扇单元包括2组冗余热插拔系统散热风扇,所述电源单元支持100v-240v交流和240v直流输入。
技术总结