一种多接口路由器地理定位方法

2018-08-11 02:59朱金玉曾良伟余卓勋张宏莉
信息安全学报 2018年4期
关键词:频数置信度IP地址

朱金玉, 张 宇, 曾良伟, 余卓勋, 张宏莉

哈尔滨工业大学计算机科学与技术学院 计算机网络与信息安全技术研究中心 哈尔滨 中国150001

1 引言

网络空间测绘研究内容之一是实体资源定位,即确定网络设备实体在地理空间中的位置。路由器作为构建互联网的基石, 对其地理定位技术就成了能否准确绘制网络空间的关键。然而, 网络空间实体多以IP地址为标识, 而IP地址本身具有地理位置无关性, 同时, 一台路由器拥有多个 IP地址也增加了定位的不确定性。因此如何对路由器实施定位既是网络空间测绘核心问题之一, 更是一个难点问题。

以往工作通过提取和解码路由器主机名中包含的地理信息字符串定位路由器位置, 或通过建立路径-时延模型来定位路由器地理位置。这些方法通常需要额外测量工作, 或人工辅助解析, 难以持续更新。不仅如此, 测量通常不可重现, 人工参与的解析结果会因人而异, 导致定位过程难以重现, 定位结果难以评估。

本文提出一个种基于公开路由器级拓扑测量数据与商业IP地理信息的路由器定位方法--RLoc。该方法“站在巨人的肩膀上”, 充分利用现有网络拓扑测量与IP地理定位的成果来实施定位。与以往工作相比, RLoc无需实施新的大规模网络测量, 或构建及校对时延-距离模型; 无需在人工辅助下解析域名、Whois、网页等IP地址相关信息。

RLoc将拓扑测量与 IP定位工作获得的数据集作为输入, 但不依赖其获取方法与质量。在具备路由器级拓扑测量数据和 IP地理信息前提下, 对多接口路由器定位仍充满挑战。如图1所示, 由于相邻路由器间共享地址空间, 使路由器各接口 IP地址定位位置不同。该路由器共有25个接口IP地址, 位置分别在西班牙、美国、英国、德国。如图2所示, 虽然相邻路由器地理位置相近, 但有些路由器逻辑上相连但位置分布较远。该路由器共有1,269台邻居路由器,他们的位置在西班牙、美国、德国、中国、葡萄牙, 还有部分路由器位置无法确定。

RLoc充分利用同一台路由器拥有多个接口 IP地址但地理位置相同这一依据, 提出接口选举方法定位; 同时, 利用相连的路由器与路由器间地理位置相近这一依据, 提出邻居选举方法定位; 结合前两种定位依据, 综合路由器接口 IP地址位置与相邻路由器位置信息定位多接口路由器位置。

本文主要贡献总结如下:

1、提出一种基于公开路由器级拓扑测量数据与商业IP地理信息的多接口路由器地理定位方法——RLoc, 利用两点事实: 同一台路由器的不同接口 IP地址在相同位置; 相连路由器间地理位置相近。

2、将RLoc应用于132,175台多接口路由器的地理定位。实验结果表明, 在覆盖率上, 国家级达到99.84%, 城市级达到 96.00%, 比相关数据集分别高出0.93%和36.48%; 在IXP数据验证准确率上, 国家级达到 82.51%, 城市级达到 59.45%, 比相关数据集分别高出9.91%和27.20%。

图2 路由器的邻居路由器定位多个位置实例图Figure 2 Instance of router’s neighbors geolocated multi-location

3、RLoc易于实施与重复, 结果易于更新和评估。为此, 公开了对132,175台多接口路由器定位结果。( 百 度 网 盘 下 载 链 接 : https://pan.baidu.com/s/1mr6a8vDFMHKaM6-cWwEqwg)

本文的以下章节内容按照以下组织: 第二章介绍相关工作; 第三章提出多接口路由器地理定位方法RLoc;第四章给出实验及结果分析; 第五章是方法的局限性; 第六章总结了全文并展望未来工作。

2 相关工作

互联网拓扑测量和分析研究方向已有二十多年,其中包含AS、POP、路由器、接口级拓扑。IP地理定位技术伴随着云计算和社交网络等新型网络应用的不断发展, 逐渐受到了越来越多的关注。而本文提出的路由器地理定位方法以路由器级拓扑测量数据和 IP地理定位数据为基础, 实现对网络空间测绘中实体资源路由器的定位, 从而实现大规模网络逻辑拓扑与地理位置的映射。

路由器级拓扑测量: 路由器级拓扑通常是属于同一台路由器的接口组合, 一个节点代表着一个主机或一个多接口的路由器。如果节点间相互连接, 则节点间一定有接口位于同一个 IP广播域。在Traceroute测量数据中, 存在不可忽略的路由陷阱,如: 负载均衡和路由改变情况等。路由陷阱需要进行别名解析, 把属于同一台路由器的 IP地址映射到该路由器上。

Motamedi 等[1]对网络拓扑发现各层级拓扑数据收集的技术和工具深度分析。CAIDA[2]在2000年采用相同源地址方法实现了 Iffinder别名解析工具。Spring等[3]在 2002年采用 IPID计数器实现了 Ally别名解析工具。Bender等[4]提出了 RadarGun工具,降低了复杂度。Keys等[5]在 2016年提出基于 IPID的MIDAR别名解析技术, 比Ally和RadarGun准确率更高。本文综合考量各类拓扑数据质量, 选择使用CAIDA的Macroscopic Internet Topology Data Kit(ITDK)[6]项目中, MIDAR和IFFINDER共同使用作为别名解析工具所生成的路由器级拓扑数据集, 它较相同IP级拓扑数据作为输入的Kapar等方法具有高置信度和低误报率, 较其他平台拓扑测量覆盖率更高。

IP地理定位技术: IP地址定位是确定一个网络目标节点在某个粒度层次的地理位置, 由于每一个直接与互联网相连的主机都被一个唯一的IP地址所表标识, 通常利用 IP地址来寻找其地理坐标映射。根据近年的研究方法, 定位技术可以分为三类, 分别为基于主动测量、数据挖掘分析和数据库推测的定位技术。

Gueye等[7]采用三角定位方法确定被测 IP地址位置。Katz-Bassett等[8]采用网络路径信息作为目的IP和中间节点的约束条件从而确定待定位IP的位置区间。Wong等[9]利用时延-距离关系测量城市位置,使用贝塞尔曲线表示 IP地址可能出现的区域, 通过不断迭代确定IP所在区域。基于主动测量的方法准确度受时延-距离模型影响较大, 且需要大量测量点和地标点, 定位一个目标 IP地址所需时间也较长。Liu等[10]利用用户自愿提供的位置信息来定位, 误差中位数为799m。这类数据挖掘方法虽然可得到更加精确的定位, 但覆盖率和普适性不高。基于数据库推测的定位技术通过推测 DNS、Whois、BGP等数据中直接或间接提供的位置信息定位 IP地址。Moore等[11]通过直接查询 Whois数据库来推测主机位置信息。Padmanabhan等[12]通过挖掘主机名字中可能包含的不同粒度的地理位置信息推测主机的位置。

为能满足更广泛的应用, 如定向广告、诈欺监测、网站流量分析、地理目标定位、数字版权管理等, 国内外IP商业地理定位数据库, 如: MaxMind、IP2Location、Netacuity、IPMarker、IPIP.NET等, 利用测量、数据挖掘、数据库推测等各方法对IP地理定位, 精确度可为国家、城市、甚至于邮编级。宋健等[13]提出了一种基于IP地址库之间差异对比来评估可信程度的方法, 并发现IP地址库之间差异所存在的规律。王婷等[14]提出IPGEL方法有效提高已有 IP定位数据库的可用性。Gharaibeh等[15]评估了多种地理定位数据库在路由器定位的可靠性。本文综合各类商业IP地理定位数据库质量, 选择使用IP2location数据库为路由器各接口IP地址地理定位, 它较MaxMind等数据库的国家城市粒度更精细。

路由器定位方法: Huffaker等[16]提取和解码路由器主机名中包含的地理信息字符串从而定位路由器位置。该方法需要不断收集具有地理字符串的数据, 提出规则将其与实际物理位置联系起来, 需要大量的人工分析编译, 但人工解析结果因人而异且规则只能识别带有主机名信息的IP地址的位置, 无法适用于大规模的路由器地理定位。Laki等[17,18]提出了一个路径-时延模型来定位路由器地理位置。该方法需要进行大规模的拓扑测量并构建时延-距离模型, 但测量通常不可重现, 模型校对需要大量的地标点和测量工作, 而且时延受网络拥塞等外界条件影响较大。

CAIDA利用 ITDK的路由器级拓扑数据, IXP、DNS、MaxMind数据库信息对路由器进行地理定位。当路由器至少一个接口IP地址属于IXP地址空间且该地址空间只有一个地理位置, 则定位该路由器; 余下路由器利用DDec主机名映射, 当路由器至少一个接口IP地址的主机名解析了地理位置且所有能够解析的接口结果一致, 则定位该路由器; 除此之外的路由器,根据MaxMind数据库定位接口IP地址, 当所有接口IP地址定位在同一位置, 则定位该路由器位置。同时,CAIDA公开了路由器位置数据。但该方法过多的依赖于公开数据集的数据, 受到IXP、DNS、MaxMind数据库等信息的质量影响较大, 且每个 IXP有多个互联设施可能分布在不同的地方, 这导致能够利用IXP数据定位的路由器数量不多; 使用MaxMind数据库定位精度在城市级粒度上能够定位的路由器数量不多。

本文提出了一种新的多接口路由器地理定位方法—RLoc, 基于IP2Location商业数据库和路由器级拓扑数据, 减少了大量的测量时间, 与人工收集解析过程,提出启发式方法, 不仅利用路由器接口IP地址映射的位置定位路由器, 而且利用路由器位置与接口IP地址位置间关系和邻居路由器间位置关系定位。RLoc与CAIDA定位相同的路由器, 与CAIDA公开的数据集相比拥有更高的覆盖率与准确率。

3 多接口路由器地理定位方法

RLoc利用两点事实: 1.同一台路由器的不同接口IP地址在相同位置; 2.相连路由器间地理位置相近。提出了三种启发式方法, 如图 3所示, 接口选举(Interface Election, IE)、邻居选举(Neighbor Election,NE)和综合法(IE+NE)。

图3 三种启发式方法定位多接口路由器示意图Figure 3 Three heuristic methods to geolocate multi-interface routers

3.1 接口选举

RLoc充分利用同一台路由器上不同接口 IP地址在相同位置这一事实, 提出IE方法。该方法以路由器各接口 IP地址和商业 IP地理数据库为输入, 为每台路由器的接口IP地址地理定位。路由器的接口IP地址由于路由器间交换地址空间导致地理位置不同, 因此为每台路由器建立位置频数矩阵:

I中Li表示路由器接口IP地址的第i个位置,Fi表示第i个位置出现的频数,CIi表示第i个位置作为路由器位置的置信度。其中CIi表示为:

在位置频数矩阵中选择置信度最大的结果作为路由器的位置。在图3 IE方法示意图中, 一台路由器有四个接口IP地址, 地理位置分别为A、A、A、B, 则建立路由器位置频数矩阵为:

路由器可能的位置为A和B, 其中A的位置置信度更大, 则路由器的位置为A, 置信度0.75。

以路由器定位的实例图1为例, 一台路由器有25个接口IP地址, 分别定位地理位置, 并建立位置频数矩阵:

路由器可能的位置为西班牙、美国、德国、英国, 其中西班牙的置信度更大, 则该路由器位置为西班牙, 置信度为0.88。

IE方法会出现位置歧义, 即路由器有两个或几个位置拥有相同的置信度, 导致定位失败的情况。

3.2 邻居选择

RLoc充分利用相连路由器间地理位置相近这一事实, 提出NE方法。该方法以路由器间连接关系、单接口路由器和商业IP地理数据库为输入, 为每台单接口路由器地理定位, 通过邻居路由器位置的不断迭代从而定位路由器位置。单接口路由器,如图3中1所示, 只有一个接口IP地址, 其位置为接口 IP地址的位置。根据路由器间关系, 确定每台路由器的邻居路由器, 利用已知的单接口路由器位置, 建立每台路由器的邻居路由器位置频数矩阵:

N中ri表示邻居路由器的第i个位置,Ii表示第i个位置出现的频数,CNi表示第i个位置作为路由器位置的的置信度。其中CNi表示为:

单接口路由器的位置填入了初始邻居路由器位置频数矩阵中, 通过不断迭代增加多接口路由器的邻居路由器的位置频数, 直至频数矩阵中不再增加新数据为止。在实际数据中, 路由器可能有上千个邻居路由器(通过物理链路层等相互连接等), 为能够得到完整的频数矩阵会造成无限循环迭代等问题, 使数据规模庞大, 无法得到数据。因此, 本文将NE方法迭代次数设置最高阈值为10。迭代10次后, 频数矩阵中置信度最大的位置作为路由器位置。在图 3 NE方法示意图中, 路由器 N1与三台单接口路由器位置分别为B、B、A和一台多接口路由器N2相连;路由器N2与三台单接口路由器A、A、A和一台多接口路由器N1相连。为N1、N2路由器建立初始位置频数矩阵为:

第一次迭代的位置频数矩阵为:

不断迭代, 至频数矩阵中不再增加新的位置为止或达到迭代阈值10次为止。假设以第一次迭代后结果为最终结果, 则N1位置为B, 置信度为0.5;N2位置为A, 置信度为0.8125。

以为路由器定位的实例图2为例, 一台路由器有1,269台邻居路由器, 位置为西班牙、美国、德国、葡萄牙、中国、有170台路由器未定位位置, 建立位置频数矩阵:

其中有部分邻居路由器没有位置信息, 但置信度不高, 则路由器位置为西班牙, 置信度为0.8605。

NE方法会出现两种定位失败的情况: 位置歧义;邻居缺失, 即邻居路由器无法定位导致的频数矩阵缺失。

3.3 综合法

RLoc充分利用以上两种方法的事实依据, 提出IE+NE方法。该方法以IE方法和NE方法获得的位置频数矩阵为输入, 结合两个矩阵, 为每台路由器地理定位。两个方法的位置频数矩阵结合:

R中I与N表示各方法获得的位置频数矩阵, ⊕表示:

当I中元素Li和N中元素ri相同时, 两个元素对应的频数、置信度分别均为

当I中元素Li和N中元素ri不相同时,Li元素对应的频数、置信度分别为;ri元素对应的频数、置信度分别为

在位置频数矩阵中置信度最大的结果作为路由器位置。在图3 IE+NE方法示意图中, 路由器N1有三个接口 IP地址, 与三台单接口路由器和一台多接口路由器相连; 路由器N2有四个接口 IP地址, 与三台单接口路由器和一台多接口路由器相连; 基于IE和 NE方法获得的最终的位置频数矩阵, 建立IE+NE方法的位置频数矩阵, 路由器 N1的位置频数矩阵为:

则路由器N1的位置为B,置信度为0.5834。

路由器N2的位置频数矩阵为:

则路由器N2位置为A,置信度为0.7813。

图 1-2是同一台路由器不同方法定位的实例图,使用IE+NE方法为路由器建立位置频数矩阵:

该路由器位置为西班牙, 置信度为0.8703。

IE+NE方法会出现位置歧义导致定位失败的情况。该方法消除了NE方法中邻居缺失而影响定位的情况。

4 实验及结果分析

4.1 实验过程

4.1.1 实验数据

以CAIDA ITDK提供的2017年10月MIDAR和 IFFINDER别名解析后获得数据作为路由器级拓扑数据。对路由器级拓扑数据 76,520,865台路由器进行筛选及分析, 删除为主机的 IP地址, 获得41,798,800台路由器, 其中132,175台多接口的路由器, 41,666,625台单接口路由器。以2018年3月的IP2location商业地理数据库定位 IP地址, 总计定位42,186,037个IP地址。基于以上数据, 利用本文提出的RLoc方法为132,175台多接口路由器定位地理位置。

为评价RLoc方法的准确率, 以2017年12月IXP数据集、2018年3月DDEC工具获取的IP地址主机名映射的位置数据作为验证数据。其中, IXP数据是CAIDA发布IXP的json文件中提取IP前缀和位置映射关系, 从而定位路由器。当路由器至少一个接口IP地址在IXP的IP前缀中, 则IP前缀的位置定位为路由器真实位置, 有些路由器接口 IP地址可能对应的多个 IP前缀有多个位置, 将所有位置均定位为路由器的位置, IXP可定位1,929台路由器。DDEC数据以DDEC工具对路由器接口IP地址的反向域名获取带有位置字符串的信息来定位。当路由器至少一个接口 IP地址解析到位置, 则该位置定位为路由器真实位置, 有些路由器多个接口 IP均解析地理位置且位置不同时, 将所有可能的位置均定位为路由器的位置, DDEC数据可定位26,566台路由器。

为对比评价方法, 本文与2017年10月CAIDA发布的路由器位置数据集比较。RLoc以路由器级拓扑数据集和 IP2location商业地理数据库为输入, 定位路由器级拓扑数据集相同, 可直接比较定位结果数据集。为评价输入数据在地理定位中能够获得准确率的极值, 本文增加两个极值参照数据: 真值极大、真值极小。这两个数据可以获得相同输入数据情况RLoc最大、最小的准确率。

4.1.2 定位实验

IE方法以132,175台多接口路由器、IP2location定位数据库为输入, 为每台路由器建立位置频数矩阵, 选择置信度最大的位置作为路由器位置。定位路由器数量在国家级、城市级数量分别为 129,223和110,989; 由于位置歧义无法定位的数量分别为2,952和 21,186。

NE方法以41,666,625台单接口路由器、路由器间连接关系、IP2location定位数据库为输入, 为每台路由器建立邻居位置频数矩阵, 选择置信度最大的位置作为路由器位置。定位路由器在国家级、城市级数量分别为 120,990和 118,004; 由于位置歧义无法定位的数量分别为35和2,415; 由于邻居缺失无法定位的数量分别为477和1083。

IE+NE方法以IE与NE方法得到的位置频数矩阵为输入, 结合两个矩阵, 建立新的位置频数矩阵, 选择置信度最大的位置作为路由器位置。定位路由器在国家级、城市级数量分别为 131,967和126,893; 由于位置歧义无法定位的数量分别为208和5,282。

4.1.3 数据验证

以IXP、DDEC定位的位置作为真实路由器位置,评估RLoc提出的三种方法定位的准确率。当路由器定位结果与 IXP定位的路由器结果一致时, 定位正确, 反之, 错误。如图1-2所示, 路由器使用RLoc提出的三种方法中定位结果为西班牙, IXP定位位置也是西班牙, 则路由器地理定位结果准确。

如下图4-5所示, 分别为路由器使用IE、NE方法定位实例图。从图中可知, 该路由器 IE、NE和IE+NE方法定位位置为印度, 但在 IXP定位位置为新加坡, 此时该方法定位结果错误。路由器定位虽然结果错误, 但在位置频数矩阵中都存在真值位置,新加坡。

为获得 RLoc方法准确率的最大最小值, 利用EI+NE方法构建的路由器位置频数矩阵中的位置信息, 作为路由器的所有可能位置。真值极大数据为获得最大的准确率, 即选择与真实位置一致的位置作为路由器的位置。真值极小数据为获得最小的准确率, 即选择与真实数据不一致的位置作为路由器的位置。如图4-5所示的路由器定位中, IE+NE方法得到的位置数据有印度、新加坡、澳大利亚、美国、德国、孟加拉国、肯尼亚、印度尼西亚。真值极大数据选择新加坡为路由器的位置。相反, 真值极小数据选择除新加坡以外的位置为路由器的位置。

同时, 利用相同的验证数据集评价2017年10月CAIDA发布的路由器位置数据集的覆盖率和准确率并与RLoc结果比较。

图4 在IE方法下路由器定位结果实例图Figure 4 Instance of router geolocation’s result in IE

图5 在NE方法下路由器定位结果实例图Figure 5 Instance of router geolocation’s result in NE

4.2 覆盖率

RLoc提出的EI、NI、EI+NI获得的数据与CAIDA数据的路由器定位覆盖率如表1所示。

就覆盖率而言, IE+NE方法更好, 能够消除 NE方法中邻居缺失而导致无法定位的情况, 同时也减少了IE和NE方法出现位置歧义情况。CAIDA数据的国家级覆盖率与城市级覆盖率相差较大, 这是由于IP地理定位数据库在城市级对路由器接口定位在同一位置的情况较低, 导致路由器无法在城市级粒度上定位。

表1 各方法定位多接口路由器覆盖率Table 1 The coverage of various methods to geolocate multi-interface routers

IE在国家级优于NE,但NE在城市级优于IE。在国家级定位中, IE方法在IP地理定位数据库中对路由器接口 IP地址定位结果一致性更高, 出现位置歧义情况较小; 而NE方法不仅受位置歧义情况影响, 邻居路由器位置缺失也降低了定位的覆盖率。在城市级定位中, 由于 IP地理定位数据库在城市级定位粒度更加精细, 使路由器可能的城市位置增加, IE方法产生了较多的位置歧义情况;而NE方法以单接口路由器的位置作为输入, 在原有国家级定位失败的基础上并未产生更多位置歧义情况。

综合而言, 在国家级, RLoc方法定位了91.54%~99.84%, CAIDA 定位了 98.90%, 两数据基本持平。在城市级, RLoc方法定位了83.97%~96.00%,CAIDA定位了59.52%, RLoc比CAIDA数据高出了24.45%~36.48%。

4.3 准确性

以DDEC与IXP数据分别评价RLoc方法获得的数据、极值数据和CAIDA数据, 在国家级、城市级路由器定位的准确率, 如下图 6-9所示: 其中, 堆积柱形图表示各方法验证路由器的总数, 灰色柱形表示验证正确的数量, 白色柱形表示验证错误的数量。折线图表示各方法的准确率。

图6 DDEC验证国家级各方法的准确率Figure 6 Country-level accuracy by DDEC validation

图7 DDEC验证城市级各方法的准确率Figure 7 City-level accuracy by DDEC validation

图8 IXP验证国家级各方法的准确率Figure 8 Country-level accuracy by IXP validation

图9 IXP验证城市级各方法的准确率Figure 9 City-level accuracy by IXP validation

就准确率而言, 在国家级利用 DDEC验证极值范围为 18.50%~85.27%。RLoc为 60.38%~63.20%,CAIDA为 59.11%。利用 IXP验证极值范围为0.62%~100.00%, RLoc为79.15%~84.78%, CAIDA为72.60%。在城市级利用 DDEC验证极值范围为4.73%~52.15%, RLoc为25.23%~34.69%, CAIDA为19.15%。利用 IXP验证极值范围为 0.57%~96.63%,RLoc为46.01%~64.95%, CAIDA为32.25%。RLoc数据无论国家级、城市级的准确率均较CAIDA的数据有显著提升。对于输入数据获得最大、最小的准确率而言, RLoc方法的准确率还有一定的上升空间。

在 DDEC数据验证准确率时, 无论国家级或城市级, 无论各方法和真值的极大均不高。这可能是因为DDEC方法对路由器接口IP地址定位准确率不高或该方法获得的数据并非路由器真实的位置导致。城市级定位的准确率均较国家级准确率低。这可能是IP2location商业数据库对IP地址定位城市级准确率不高导致。

RLoc提出的方法中, IE+NE较IE准确率低, 这是由于NE准确率比IE的准确率低, 导致IE+NE方法将两个数据结合后准确率比IE方法低, 比NE方法高。均衡各方法的路由器定位覆盖率和准确率,IE+NE方法结合了路由器的接口位置信息与邻居路由器的位置信息, 效果更好。

5 局限性

本文提出了一种多接口路由器地理定位方法—RLoc, 虽然定位路由器的覆盖率和准确率均较现有数据有明显提升, 但仍存在局限性。RLoc方法以路由器级拓扑数据、商业地理定位数据库为输入,如果没有这两项工作, 该方法无法实现对路由器地理定位。同时, 输入数据的质量也将影响定位结果的质量。

RLoc方法在实际应用中前提条件有以下几点:

1、每台路由器的各接口IP地址均被发现。当IP地址被正确别名解析, 且路由器的各接口 IP地址均被发现时, 保证了路由器的接口的完整性, 使 IE方法定位路由器定位更加准确。

2、路由器间连接关系完整并正确。当每台路由器的连接关系完整并正确推断时, 保证了每台路由器的邻居路由器的完整性, 使NE方法定位路由器位置更加准确。

3、IP地理定位数据库的准确性和覆盖率高。每台路由器接口IP地址与单接口路由器的地理定位结果直接影响了对路由器地理定位结果。

RLoc方法更适用于在路由器组网中, 一台路由器的接口IP地址大多数被分配来自相同IP地址段,路由器与路由器相互通信、连接, 其位置分布也临近。在这样的网络中, RLoc方法的准确率和覆盖率更高。

6 结论

RLoc充分利用同一台路由器上不同接口 IP地址在相同位置和相连路由器间地理位置相近这两个事实, 具有比现有公开数据的更高的覆盖率和准确率。本文综合定位覆盖率和准确率两个方面, 选择IE+NE方法。覆盖率上, 国家级达到99.80%, 城市级达到 96.00%, 比 CAIDA数据分别高出 0.93%和36.48%; 准确率上, IXP验证国家级达到82.51%, 城市级达到59.45%, 比CAIDA数据分别高出9.91%和27.20%; DDEC验证国家级到达62.70%, 城市级达到32.96%, 比CAIDA数据分别高出3.59%和13.81%。

RLoc无需实施新的大规模网络测量, 或构建及校对时延-距离模型; 无需在人工辅助下解析域名、Whois、网页等 IP地址相关信息; 易于实施与重复,结果易于更新和评估。适用于对大规模路由器级网络拓扑映射地理位置。

本文在定位多接口路由器时, 发现当一个多接口路由器出现多个位置时, 可能由于路由器间共享IP地址空间所导致。那么, 这样的多位置的路由器可能是国家间或城市间的网络边界点的路由器, 也是国家内或城市内的骨干路由器。在未来的工作中, 将着重研究多位置路由器在识别国家边界、识别骨干路由器方面的问题。

猜你喜欢
频数置信度IP地址
置信度辅助特征增强的视差估计网络
一种基于定位置信度预测的二阶段目标检测方法
硼铝复合材料硼含量置信度临界安全分析研究
铁路远动系统几种组网方式IP地址的申请和设置
正负关联规则两级置信度阈值设置方法
中考频数分布直方图题型展示
公安网络中IP地址智能管理的研究与思考
学习制作频数分布直方图三部曲
《IP地址及其管理》教学设计
频数和频率