网路流量就是网路上传输的数据量。网路流量的大小对网路架构设计具有重要意义,就像要根据来往车辆的多少和流向来设计道路的宽度和连线方式类似,根据网路流量进行网路的设计是十分必要的。
基本介绍
- 中文名:网路流量
- 外文名:Network traffic
- 含义:网路上传输的数据
- 优点:高可扩充性,高性价比等
- 套用:校园网等
独立访客
UV(独立访客):即Unique Visitor,访问网站的一台电脑客户端为一个访客。00:00-24:00内相同的客户端只被计算一次。就像要根据来往车辆的多少和流向来设计道路的宽度和连线方式一样,根据网路流量设计校园网路是十分必要的。
“80 /20”规则
在传统网路中,一般将使用相同应用程式的用户放到同一工作组中,他们经常使用的伺服器也放在一起。工作组位于同一物理网段或VLAN(虚拟区域网路)中。这样做的目的是将网路上客户机与伺服器之间产生的数据流量限制在同一网段中。在同一网段,可以使用频宽相对高的交换机连线客户机和伺服器,而不必使用频宽相对较低的路由器。将大部分网路流量控制在本地的这种网路设计模式,被称为“80/20规则”,即80%的网路流量是本地流量(採用交换机交换数据),在同一网段中传输;只有20%的网路流量才需要通过网路主干(路由器或三层交换机)。
“80/20”规则中的“80”和“20”不能简单地理解为数字,应该理解为网路流量分布的方式,即大部分网路流量局限在本地工作组,小部分流量通过网路主干。因此在实际网路设计中,只要大部分网路流量在本地、小部分网路流量通过主干,就认为它符合了“80/20”规则,而不管实际的数字比例是多少。
套用
校园网中,纯软体多媒体电子教室就是一个符合“80/20”规则的小型网路。多媒体网路教室主要在同一教室或教学楼内使用,多採用多播(Multicast)和广播(Broadcast)方式由教师机向学生机传送多媒体数据,因此会产生很多数据流。如果不加以处理,数据流将形成“广播风暴”,扩散到网路的其他地方,因此需要将多媒体网路教室所在的网段划分成一个独立的子网,以抑制广播风暴的产生。
“20/80”规则
随着网路套用的逐渐丰富,“80/20”规则已经不能完全满足网路设计的需要。而一种被称为“集中存储、分布计算”的模式逐渐得到推广。集中存储,就是数据集中在网路中心存储,如已经得到普遍使用的Web服务、电子邮件系统和逐渐流行的VOD(视频点播)、多媒体资源库、教育数据中心(EDC)、数字图书馆等;分布计算,就是数据被下载到各个工作站上处理,如使用网路上的多媒体资源库製作多媒体课件、浏览数字图书馆等。在“集中存储、分布计算”的网路套用模式下,对网路流量的要求已经大大偏离了“80/20”规则,一种新的规则应运而生,这就是“20/80”规则。
在符合“20/80”规则的网路中,只有大约20%的网路流量局限在本地工作组,而大约80%网路流量经过网路主干传输。这种网路流量模式的转变,给校园网主干交换机带来了很大的负荷。因此理想状态下主干交换机应该能够提供与下面连线的支干交换机相匹配的性能,即提供线速三层交换,也就是说,下面的支干交换机能够跑多快,上面的主干交换机也应该能够跑多快。同样,如果网路中有许多按功能(如教学、科研、行政管理)划分的VLAN,这些VLAN也很难管理。在以往的“80/20”规则中,伺服器往往分布在VLAN中,因此对于各工作组来说,访问起来比较快。但是在“20/80”规则中,伺服器往往集中在网路中心,因此对于各工作组,必须实现跨VLAN的访问。
分类概念
很多网路套用具有自身的特性,对于网路环境的需求也不尽相同,因此只有对网路流量进行及时準确的识别和分类,才能準确地为不同套用提供合适的网路环境,有效利用网路资源,为用户提供更好的服务质量。网路流量分类的研究很广泛,使用的方法也很多,但主要是基于以下三个层面的:
(1)Packet-level的流量分类:主要关注数据包(packet)的特徵及其到达过程,如数据包大小分布、数据包到达时间间隔的分布等;
(2)Flow-level的流量分类:主要关注流(flow)的特徵及其到达过程,可以为一个TCP连线或者一个UDP流。其中,流通常指一个由源IP位址、源连线埠、目的IP位址、目的连线埠、套用协定组成的五元组;
(3)Stream-level的流量分类:主要关注主机对及它们之间的套用流量,通常指一个由源IP位址、目的IP位址、套用协定组成的三元组,适用于在一个更粗粒度上研究骨干网的长期流量统计特性。
在上述三个层面的流量分类中,使用最广泛的是Flow-level的流量分类。这种以流为单位分析网路中传输数据的方法,是分组交换网路发展的必然需求。
评价指标
流量分类的一个关键度量标準是某个分类技术或分类模型对未知数据对象进行分类的準确率。通常用于衡量分类準确率的评估标準,主要包括以下四个方面:
真正(true positive,TP):表示被分类模型正确预测的正样本数,即属于类别A并被预测为类别A的样本数。
假负(false negative,FN):表示被分类模型错误预测为负类的正样本数,即属于类别A但被预测为不属于类别A的样本数。
假正(false positive,FP):表示被分类模型错误预测为正类的负样本数,即不属于类别A但被预测为属于类别A的样本数。
真负(true negative,TN):表示被分类模型正确预测的负样本数,即不属于类别A并被预测为不属于类别A的样本数。
此外,基于机器学习的分类方法通常採用另外两种度量标準对其分类结果进行评估,其定义如下:召回率(recall):recall=TP/(TP+FN),表示类别A中被正确预测的样本所占比例。
精度(precision):precision=TP/(TP+FP),表示在所有被预测为类别A的样本中,真正属于类别A的样本所占比例。很多流量分类研究都使用流準确率或位元组準确率作为其实验结果的度量标準,流準确率表示被正确分类的流所占的比例,而位元组準确率则更关注被正确分类的流所携带的位元组数。其中,準确率的定义如下:
準确率(accuracy):accuracy=(TP+TN)/(TP+TN+FP+FN),表示被分类模型正确预测的样本数在总样本中所占比例。
交换机
没有三层交换机,VLAN之间无法通信,VLAN类似于硬碟的逻辑分区,可以简单地理解为把同一硬碟划分成不同的硬碟盘符。但是与逻辑盘不同的是,VLAN之间通信可不像把档案从一个逻辑盘複製到另一个逻辑盘那样简单,而是必须依,路由器才能使VLAN之间相互通信。
作用
1、网路骨干少不了三层交换
要说三层交换机在诸多网路设备中的作用,用“中流砥柱”形容并不为过。在校园网、城域教育网中,从骨干网、城域网骨干、汇聚层都有三层交换机的用武之地,尤其是核心骨干网一定要用三层交换机,否则整个网路成千上万台的计算机都在一个子网中,不仅毫无安全可言,也会因为无法分割广播域而无法隔离广播风暴。如果採用传统的路由器,虽然可以隔离广播,但是性能又得不到保障。而三层交换机的性能非常高,既有三层路由的功能,又具有二层交换的网路速度。二层交换是基于MAC定址,三层交换则是转发基于第三层地址的业务流;除了必要的路由决定过程外,大部分数据转发过程由二层交换处理,提高了数据包转发的效率。 三层交换机通过使用硬体交换机构实现了IP的路由功能,其最佳化的路由软体使得路由过程效率提高,解决了传统路由器软体路由的速度问题。因此可以说,三层交换机具有“路由器的功能、交换机的性能”。
2、连线子网少不了三层交换
同一网路上的计算机如果超过一定数量(通常在200台左右,视通信协定而定),就很可能会因为网路上大量的广播而导致网路传输效率低下。为了避免在大型交换机上进行广播所引起的广播风暴,可将其进一步划分为多个虚拟网(VLAN)。但是这样做将导致一个问题:VLAN之间的通信必须通过路由器来实现。但是传统路由器也难以胜任VLAN之间的通信任务,因为相对于区域网路的网路流量来说,传统的普通路由器的路由能力太弱。 而且千兆级路由器的价格也是非常难以接受的。如果使用三层交换机上的千兆连线埠或百兆连线埠连线不同的子网或VLAN,就在保持性能的前提下,经济地解决了子网划分之后子网之间必须依赖路由器进行通信的问题,因此三层交换机是连线子网的理想设备。
优点
除了优秀的性能之外,三层交换机还具有一些传统的二层交换机没有的特性,这些特性可以给校园网和城域教育网的建设带来许多好处,列举如下:
1、高可扩充性
三层交换机在连线多个子网时,子网只是与第三层交换模组建立逻辑连线,不像传统外接路由器那样需要增加连线埠,从而保护了用户对校园网、城域教育网的投资。并满足学校3~5年网路套用快速增长的需要。
2、高性价比
三层交换机具有连线大型网路的能力,功能基本上可以取代某些传统路由器,但是价格却接近二层交换机。一台百兆三层交换机的价格只有几万元,与高端的二层交换机的价格差不多。
3、内置安全机制
三层交换机可以与普通路由器一样,具有访问列表的功能,可以实现不同VLAN间的单向或双向通讯。如果在访问列表中进行设定,可以限制用户访问特定的IP位址,这样学校就可以禁止学生访问不健康的站点。 访问列表不仅可以用于禁止内部用户访问某些站点,也可以用于防止校园网、城域教育网外部的非法用户访问校园网、城域教育网内部的网路资源,从而提高网路的安全。
4、适合多媒体传输
教育网经常需要传输多媒体信息,这是教育网的一个特色。三层交换机具有QoS(服务质量)的控制功能,可以给不同的应用程式分配不同的频宽。 例如,在校园网、城域教育网中传输视频流时,就可以专门为视频传输预留一定量的专用频宽,相当于在网路中开闢了专用通道,其他的应用程式不能占用这些预留的频宽,因此能够保证视频流传输的稳定性。而普通的二层交换机就没有这种特性,因此在传输视频数据时,就会出现视频忽快忽慢的抖动现象。
另外,视频点播(VOD)也是教育网中经常使用的业务。但是由于有些视频点播系统使用广播来传输,而广播包是不能实现跨网段的,这样VOD就不能实现跨网段进行;如果採用单播形式实现VOD,虽然可以实现跨网段,但是支持的同时连线数就非常少,一般几十个连线就占用了全部频宽。而三层交换机具有组播功能,VOD的数据包以组播的形式发向各个子网,既实现了跨网段传输,又保证了VOD的性能。 5、计费功能 在高校校园网及有些地区的城域教育网中,很可能有计费的需求,因为三层交换机可以识别数据包中的IP位址信息,因此可以统计网路中计算机的数据流量,可以按流量计费,也可以统计计算机连线在网路上的时间,按时间进行计费。而普通的二层交换机就难以同时做到这两点。
在全国掀起了建设校园网、城域教育网的热潮之时,相信三层交换机以其优秀的性能、适中的价格,一定会在这个热潮中大有作为。
控制器
产生原因
网路流量控制器bitSaver (又称套用流量管理器,频宽管理器或QoS设备)早在2000年就已经出现了,最早是美国的Packteer公司研发。但是由于网路频宽问题还没有显着,所以企业IT部门对频宽的重视程度还不够,随着各种网路新技术的套用以及网路多媒体技术的发展,网路频宽紧缺的问题越来越明显。尤其是2005年来,P2P套用更是对频宽的管理带来了严重威胁,所以频宽管理器的市场得到了很大的发展。据不完全统计,这个市场已经超过了近25亿美元。中国的频宽管理市场从2004年才开始逐渐受到重视,2007年中国频宽管理市场份额也在2亿人民币,预计中国频宽管理市场将以20%以上的速度增长。而具有频宽管理设备提供商的除了国外Packteer、Allot公司外,国内的北京英智兴达,畅讯科技等厂商,国外厂商频宽管理设备还没有实现界面的本地化,都是以授权代理的形式进入中国;国内的厂商在经历了3到4年的产品研发攻坚,产品才日益稳定,市场、技术、产品的竞争将在2008年展开。
基本功能
频宽管理器的基本功能非常简单,就是根据套用和用户进行频宽的分配与监控。由于是七层的网路管理设备,所以网路管理人员无需具备较高的网路知识就能直接对套用和用户进行频宽的分配,这在一定程度上降低了网路管理人员的投入。虽然功能很简单,但是能够实现的各种套用却很多,只是大部分用户对频宽管理的套用没有得到很好的认识。国外的频宽管理设备昂贵,且不支持中文展示所以Packteer和Allot的套用主要集中在电信和金融,国内的北京英智兴达等厂商虽然在教育、政府、能源与医疗行业有所斩获,但是产品系列才成型一年,所以在市场套用的推广各厂商没有过多投入,导致用户对频宽管理的套用处于初级阶段。
套用範围
在电信和金融领域频宽套用主要表现在SLA(服务等级协定)上,通过频宽管理设备给不同等级的用户提供不同等级的频宽服务,从而保障核心客户的投资回报率。
在教育、政府等套用,频宽管理器主要套用集中在对P2P的管理方面,尤其是BT的管理。同时频宽管理设备也开始作为视频会议的QoS的保障设备出现。由于P2P等套用的客户端不断升级,所以只有具有自主研发的国内产品才能实现快速根据新版本推出管理策略,在这个套用上国际厂商不具有优势。
当然作为频宽管理器,还具有更多的套用方式。如以下的套用:
一、网路套用透明度问题,通过频宽管理器可以让以前未知的网路套用的状况能够详细查看。
二、防範突发的流量激增和未知套用的攻击,如DoS攻击等,保障网路安全。
三、评估核心套用的价值,通过对核心套用流量的监查,了解核心套用的使用率与效率。
四、保证关键套用(如:CRM、VPN、无线网路、视频会议、VoIP、等)所需的频宽,保证任何时候关键套用不受阻
五、準确评估网路的负载能力以及新套用上线对整体网路套用的影响,保证客户的IT投资合理性。
六、实现按照用户的等级提供不同的网路资源配给,保障客户核心用户的网路价值。
七、降低网路管理人员的重複操作,并提供套用的量化数据,便于管理层根据套用状况做出决策。
这些套用只是在一些具体案例中出现,大部分用户还没有将频宽管理与自身的网路管理进行有效的融合。套用的前景很大。
网路中的流量控制
增加用户可用资源的办法:合理地选择路径,让轻负载时非最佳的路径,在重负载时有较多的分流;重负载时增加分层连线分流的连线数目;增大通道的贷款;增加信息速率;适当增加缓冲区等。减少用户对资源需求的办法:拒绝某些服务请求;要求用户减少负载量;合理配备用户对资源的使用,如使用预约、轮询、假如优先权等。减少用户对资源的需求的办法,其实质是降低服务水平和质量,或合理进行服务。
在很多计算机网路中,广泛採用的流控方法是以减少用户需求为出发点的,下面是集中流控方法:
1、等待传输法。也称抑制传送方式,当接收结点的缓冲区已被占用很多,使结点进入死锁的危险阶段时,就向传送结点发出暂停传送的信息,当危险阶段解除时,再通知暂停传送的结点 ,恢複数据传送。
2、预约缓冲区方式。源主机在开始数据传送之前,首先要了解目的主机可用缓冲区的情况,并预约缓冲区,然后根据目的主机分配的缓冲区,控制自己的数据传送。在缓冲区用完时,等待对方再次分配缓冲区后方可继续传送。
3、许可证方式。
4、数据单元丢弃法。