一、全业务备份的背景
行业客户(如政府、军队、金融、电力等)使用视频会议系统,大部分是独立组网,用于召开内部的重要工作会议,对系统可靠性有很高的要求,希望7×24小时工作。并当故障发生时,能够尽快恢复,做到业务的平滑切换。
行业客户的基本组网如下:
点击此处查看全部新闻图片
其主要部件包括:MCU管理台、GK、MCU和终端。在这些主要部件中,任何一个部件或环节出现问题,都将导致业务故障。以下列举几个常见的场景:
1)会议过程中主会场终端忽然掉电,如果这个时候没有备份的主会场,那么所有会场都看不到主会场,会议就陷入混乱;
2)会议过程中主会场的线路发生故障,如果没有线路备份,主会场将无法看到其他会场的图象和听到声音,其他会场也无法看到主会场的图象和听到声音,会议也会陷入混乱;
3)维护人员更换MCU某块单板,而此时该单板正用于开会,如果没有备份单板,整个会议的终端都无法看到图象和听到声音,会议完全被中断;
4)MCU供电出现故障,整个MCU无法工作,如果没有MCU备份,会议也完全中断;
5)MCU管理台和GK的服务器发生故障,如果没有备份功能,已经召开的会议将无法管理,同时也无法再召开新的会议。
华为针对现有视讯产品的应用场景,提出了视讯全业务备份的理念,从业务、设备、到线路,实现多重、全方位的备份方案,真正实现视讯系统的高可靠性。
二、华为全业务备份实现方案
1、GK1+1备份方案
点击此处查看全部新闻图片
基本原理参见上图,利用VRRP(VirtualRouterRedundancyProtocol)虚拟路由冗余协议,将1+1备份的两个GK虚拟成一个GK。当主GK服务器异常时,从GK自动升级为主GK。GK业务平滑切换,不受影响。维护人员诊断和排除异常GK服务器的故障后,恢复1+1的备份。
2、MCU管理台1+1备份
点击此处查看全部新闻图片
参见上图,利用的服务器群集(Cluster)和windows群集服务(ClusterService),将两台运行MCU管理台的服务器连接起来,正常运行情况下,两个服务器负荷分担。当其中一台服务器管理台异常时,群集服务将该台服务器的业务转移到正常的服务器,实现业务平滑切换,同时重新启动异常的管理台程序,恢复双机负荷分担的操作。由于管理台存储了整个视讯系统的业务数据,因此群集中的管理台需要有共享的存储设备。为保证数据的安全,采用RAID(RedundantArrayofInexpensiveDisks:冗余磁盘阵列,一共有RAID0~56个级别),根据对系统数据安全性的需要和磁盘配置,可以选择RAID1+0或者RAID5。
3、MCU冗余备份
点击此处查看全部新闻图片
通过MCU双机备份,异地部署的方式,可以保障外部环境异常时(如MCU所在网络故障、停电、自然灾害等),会议得以继续召开。如上图所示,管理台同时管理两台MCU,并在一台MCU上召开会议业务。当该MCU发生整机故障时(如掉电),管理台将该MCU会议转移到另外一台MCU,恢复会议,无需用户人工排除故障。
4、MCU内部可靠性
点击此处查看全部新闻图片
MCU可靠性采用对内部各个业务处理部件(软件/硬件)的实时故障检测、故障隔离和业务迁移来实现。
上图描述了整个MCU内部的可靠性措施。包含了各个软硬件的业务处理部件。
(1)电源热备份:通过双电源供电,正常情况下负荷分担。当某个电源模块异常,另一个电源模块能独立承担系统的供电任务。同时支持网管告警,用户通过网管能够及时获得信息,及时排除故障电源,整个业务不受影响。
(2)主控板1+1备份:主控板为MCU系统的管理核心,负责整个设备的配置状态管理和业务运行,因此提供1+1的冗余备份。两块单板实时同步运行,并有心跳握手。当主用板发生故障,备用板自动升级为主用板,同时复位原出故障的主用板,做为备用板使用。整个倒换过程业务不中断,正在召开会议的视音频效果完全不受影响。
(3)业务板n+1备份:业务板为MCU的接入和视音频处理单板。主控板监控所有业务板的在位状态和软件运行状态,如果主控板发现业务板软硬件故障,则将该单板上的业务(包括:码流收发、视音频编解码等)转移到其他正常运行的业务板上。通过主控板对业务的迁移和恢复,保障正在进行的会议能够自动恢复,无需用户人工排障。可以看到,业务板恢复的过程,也必须包含下文提到的“芯片备份”过程,才能保证视音频编解码处理也能够同时恢复。
(4)芯片备份:MCU的视音频处理都是由高性能的视音频编解码芯片完成。每块业务板上有密集的多个编解码芯片,提供强大的处理能力。如果业务板被拔出来或者某芯片发生故障,则会影响到视音频编解码,进而影响到图象声音效果。MCU主控板能实时监控所有单板和编解码芯片的软件运行状态,如果发现芯片发生故障,则将该芯片上的视音频编解码处理转移到正常运行的芯片(可以是故障芯片所在业务板的其他芯片,也可以是其他业务板的芯片),恢复视音频编解码处理。通过对芯片编解码处理的迁移和恢复,保障会议的视音频能够自动恢复,无需用户人工排障。
(5)网口备份:每块业务板都提供两个GE口做为码流收发,配合IP的冗余组网,可以实现整个IP线路的备份,任何一个节点的IP线路出问题,都不会中断业务。
5、线路备份
MCU的网口备份解决了IP线路的备份问题,但对于E1线路,除了E1线路之间的备份外,还需要提供IP线路对E1线路的备份,保障SDH网络出故障时,能够使用IP网络。同理,IP网络出故障,也能使用SDH网络。
点击此处查看全部新闻图片
如上图所示,MCU和终端同时支持4E1和IP,分别接入SDH和IP网络。当4E1线路中某个E1线故障(如:接口松脱、CRC过高等),MCU与终端将该故障线路隔离,使用三条E1线召开会议,并将会议速率自动降到6M以下,小于三条E1线的带宽。当所有E1线路都故障时,MCU与终端倒换到IP网络,使用IP网络开展会议业务。如果E1线路恢复,则MCU与终端根据配置,可以选择重新倒换回SDH网络,也可以让SDH网络做为IP网络的备份。
三、总结
华为视讯的全业务备份方案通过对视讯系统每个部件的冗余、故障自动检测和业务恢复,达到客户要求的高可靠性。每个部件冗余技术的选择都是根据部件的网络位置、软硬件平台特性、业务功能和技术可行性兼容性来确定,务求做到部署简单、自动恢复、无缝倒换、不间断运行。用户按上述方案部署视讯会议系统,能够解决本文第一节所列举的多种故障场景,保证会议不间断召开。
• 中国角型毛巾架行业运营态势与投资潜力研究报告(2018-2023)
• 中国直接挡轴市场深度研究及投资前景分析报告(2021-2023)
• 2018-2023年KTV专用触摸屏市场调研及发展前景分析报告
• 中国回流式高细度粉碎机市场深度调研与发展趋势预测报告(2018-2023)
• 2018-2023年中国原色瓦楞纸行业市场深度研究及发展策略预测报告
• 中国雪白深效精华液市场深度调研及战略研究报告(2018-2023)