李学兵 陈 阳 周孟莹 王 新
1(复旦大学计算机科学技术学院 上海 201203) 2(上海市智能信息处理重点实验室(复旦大学) 上海 201203) 3(鹏城实验室 广东深圳 518066)xbli16@fudan.edu.cn)
QUIC是一个由Google提出的、用于替代TCP(Transmission Control Protocol)的数据传输协议[1].近几年来,在学术领域,对QUIC这一新型传输层协议的研究一直是一个热点.在SIGCOMM,IMC,WWW,CoNEXT,CCS等国际顶尖的网络、安全领域会议上[2-9]已经发表了一系列关于QUIC的传输性能、安全性等方面的研究成果.在工业界,QUIC也已经得到了广泛的应用与部署.Google在它的产品(Chrome浏览器[10]、Google Cloud[11]等)中最早提供了对QUIC的支持.此外,一些内容分发网络(content delivery network, CDN)服务商,例如Akamai[12]和Cloudflare[13],也已经对QUIC提供了支持.截至2018年,互联网近7.8%的流量使用QUIC进行网络通信[14].
与目前使用最为广泛的传输层协议TCP相比,QUIC引入了许多新的特性.例如,它支持一条传输层连接上的多路传输和延时更低的握手.这些新特性使得QUIC在大部分场景下表现出比TCP更好的性能.例如更短的网页加载时间、更低的握手延时等.在安全性方面,QUIC使用了比现有的TLS1.2[15]更加安全的加密传输协议TLS1.3[16],从而更好地保障通信安全以及用户隐私.然而,也有研究表明,QUIC在特定场景下的表现不如预期,甚至不如TCP.例如,QUIC无法很好地适应高丢包率的网络[3,17]基于此,本文从安全性和传输性能2方面对现有的QUIC相关研究工作进行分类和总结,并对基于QUIC的优化方案进行介绍.
QUIC最早由Google开发,正式发布于2013年,被称为gQUIC[18].gQUIC是一套相对独立的传输层协议,它同时保障了数据传输的可靠性和安全性,因此从功能性的角度出发,gQUIC类似于TCP+TLS.目前,gQUIC已经得到了广泛的应用,包括Chrome,IE,Safari,Firefox在内的主流浏览器都支持gQUIC.同时,Google的网站服务器与云服务中也提供了gQUIC的支持.在2013年末,QUIC的设计工作被互联网工程任务组(Internet Engineering Task Force, IETF)接管[19],并发布了正式的QUIC标准,我们称之为IETF版本的QUIC.IETF版本的QUIC与gQUIC最大的区别在于,它仅负责保障数据传输的稳定性,而将安全性的保障交由TLS1.3.目前IETF版本QUIC的开源实现有ngtcp2,aioquic等.但是与gQUIC不同,IETF版本的QUIC尚没有在互联网中大规模部署的例子.为了配合QUIC协议的标准化,Google表示,将会在自己的服务器与浏览器中逐渐放弃gQUIC并使用IETF版本的QUIC,gQUIC的设计也正在逐步向IETF版本的QUIC靠拢.
QUIC协议模型如图1所示.它向下使用了操作系统提供的UDP(User Datagram Protocol)套接字,向上为应用层协议(例如HTTP2)提供了可靠且安全的传输通道.虽然QUIC在实现上基于传输层协议UDP,但是它在协议设计上并没有依赖于UDP的特性,即没有使用UDP端口来标识一条传输层连接.QUIC使用UDP的目的仅仅是为了保持和现有网络的兼容性,因为目前互联网上的某些防火墙会屏蔽TCP和UDP之外的传输层协议.因此,尽管QUIC工作于传输层协议UDP之上,研究人员仍然普遍将它归类为传输层协议[1,5].
Fig. 1 QUIC protocol architecture图1 QUIC协议模型
与传统的传输层协议如TCP相比,QUIC引入了许多新的特性,其中最主要的是支持一条连接上的多路传输和更低的握手延时.
1.2.1 多路传输
QUIC通过对多路传输的支持,解决了TCP中的队头阻塞问题[22].
如图2所示,在TCP连接中,它维护的是一条先进先出的通道,也就是说接收端必须严格按照发送端的顺序处理收到的数据,这样的设计导致了队头阻塞的问题.在图2的例子中,客户端先后向服务端发送了逻辑上没有相关性的数据包2和数据包3.在接收端,即使数据包3先于数据包2到达,TCP也不会先将数据包3中的数据交给上层应用处理,而是必须等待数据包2的接收完成才能进行后续处理.正是因为TCP通道的先进先出特性,导致对数据包3的处理被数据包2拖延,造成了不必要的延时.这是队头阻塞的一种情况,关于队头阻塞的更详细的研究见文献[23-24].
Fig. 2 Multiplexing vs singleplexing图2 多路传输与单路传输的对比
为了解决队头阻塞的问题,QUIC增加了在一条传输层连接上的多路传输的支持.它在传输层连接下引入了流(stream)的概念.一条QUIC连接可以包含多个流,这些流各自保证了先进先出的有序性,但相互之间又不存在依赖关系.从这点来说,QUIC中“流”的概念更接近于TCP中“连接”的概念,因为它们都是为上层应用提供了一条先进先出的通道.但是,QUIC中不同流之间共享连接信息,所有的流共同参与拥塞控制、丢包检测以及数据加密.这样,和使用多条TCP连接相比,使用多个流的单条QUIC连接既达到了多路传输的目的,又节省了系统资源.
1.2.2 握手协议
QUIC设计了自己的握手协议,并达到了比TCP+TLS更低的握手延时.
TLS使用了对称加密和非对称加密相结合的方式为数据的安全性提供保障.其运行机制可以简单分为2步:1)客户端与服务端通过握手协议生成共享密钥;2)双方分别使用共享密钥进行数据的加密和解密.更详细的关于TLS介绍见文献[16-17].在TLS1.2中,握手协议通过RSA算法或者迪菲-赫尔曼算法完成.其中RSA要求通信双方首先交换各自的RSA公钥,再通过RSA加密传输一个新生成的共享密钥,因此完成握手需要2个往返时间(round trip time, RTT).而到了TLS1.3,迪菲-赫尔曼成为唯一的密钥交换协议,通信双方可以直接通过对方的公钥和自己的私钥生成共享密钥,握手延时也从原来的2个RTT降为了1个RTT.
Fig. 3 Handshake latency of different protocols图3 不同协议握手延时的对比
图3列举了QUIC和TCP握手延时的区别.目前使用最为广泛的协议组是TCP+TLS1.2,在该情况下,客户端与服务端之间的握手至少需要消耗3个RTT,包括1个RTT的TCP握手延时和2个RTT的TLS握手延时.在最新的TCP+TLS1.3协议组中,因为TLS的握手延时由原来的2个RTT减小到了1个RTT,所以总的握手延时降为了2个RTT.QUIC在此基础上更进一步地进行了优化,它允许在建立传输层连接的同时进行TLS握手.也就是说,QUIC的握手请求数据包中也包含了TLS1.3的握手请求数据,从而使整体的握手延时降为了1个RTT.我们称QUIC的这种握手方式为1-RTT握手.
Fig. 4 Category of QUIC-related studies图4 QUIC相关工作的分类
如果客户端在之前已经连接过服务端,客户端和服务端之间则会保留上次会话的相关加密信息,重用共享密钥.在这种情况下,客户端可以直接使用上次通信的共享密钥进行数据加密,而新的密钥交换过程会与数据传输同步进行.也就是说,数据传输不需要等待握手的完成,从而实现没有任何延时的握手.我们称QUICTLS1.3的这种握手方式为0-RTT握手.0-RTT握手极大地降低了客户端的握手延时从而可以显著减少用户访问网络的延迟感,提升用户体验.
图4对现有的QUIC相关研究工作进行了分类与总结.主要包括3个方面:QUIC网络传输性能的测量、QUIC性能的优化以及QUIC安全性的分析与改进.
在传输性能方面,研究人员最关心的是QUIC和TCP+TLS相比会有多大的性能提升,包括在不同网络环境和不同传输内容下的表现.在QUIC的性能优化方面,研究者一方面为QUIC协议带来了诸如多路径等新特性,另一方面在系统实现中使用内核旁路等新技术达到了比现有系统更高的IO吞吐率.在安全性方面,研究人员使用多种方法对QUIC的安全性进行了建模分析,同时也指出了QUIC存在的一些安全隐患,并给出了相应的改进建议.
自Google第1次发布QUIC以来,研究人员便对QUIC的网络传输性能产生了浓厚的兴趣.本节列举了近年学术界在QUIC性能分析上的工作.考虑到网络协议性能的分析离不开具体的应用场景,我们根据不同的应用场景对相关工作分为了2类,分别是网页浏览和视频传输.表1对QUIC性能分析的相关工作进行了总结.
Table 1 Related Work on QUIC Performance Analysis表1 QUIC性能分析的相关工作
2.1.1 网页浏览
网页浏览是互联网中使用最为广泛的应用.浏览器在进行网页访问时会先下载网站资源,包括HTML,CSS,JavaScript等类型的文件,再渲染在界面上,最终呈现给用户.一个好的网络协议应该保证浏览器花费最少的时间完成网站资源的下载,也就是最小化网页加载时间(page load time, PLT)[33].
Das[17]在他的硕士论文中最早进行了对QUIC网络传输性能的系统性分析.他在可控网络下模拟了不同的网络参数,包括带宽和端到端延时.他选择了500个网站,测量了使用TCP和QUIC在不同的网络环境下访问这些网站的网页加载时间.他根据实验结果总结并分析了QUIC的主要优势为:1)当带宽很低时,拥塞控制窗口会很小,导致丢包的发生更容易阻塞住后面的数据包,这时没有队头阻塞问题的QUIC更不容易受到影响.2)当端到端延时较高时,因为QUIC在握手过程比TCP消耗更少的RTT,所以能够有效降低初始数据包的延时.然而,作者在实验过程中也发现了QUIC存在的问题.一方面,因为QUIC协议实现仍然处于迭代式开发中,所以代码没有很好地进行优化,在与TCP的对比中处于劣势.另一方面,QUIC强制要求进行数据加密,而数据加密在TCP是可选项(即TLS协议),由加密解密带来的额外计算开销会降低QUIC的数据包处理速度.即便同时启用加密,因为QUIC的安全性更强,仍然导致其加密解密过程比TCP慢12%.当网络带宽变大,尤其是大于25 Mbs时,QUIC的网络传输速度甚至会比TCPTLS慢80%.这是因为高吞吐率使得CPU因无法及时完成加密解密操作,最终成为网络传输的瓶颈.
Google在2017年SIGCOMM的论文中总结了他们在大规模部署实验中使用QUIC的经验[5].从2014年开始,Google在Chrome浏览器以及手机上的YouTube应用和Google搜索应用上对部分用户启用了QUIC,并与TCP进行了对比.到2017年,几乎所有的Chrome和YouTube应用都已启用QUIC.他们发现,在搜索服务中,有88%来自桌面电脑的连接使用了0-RTT握手,在握手延时方面与原来的TCPTLS相比至少减少了2个RTT.另外,QUIC使用了更多的信号用于网络拥塞及丢包的检测,这也使得QUIC对高丢包率有更好的容忍性.这些因素导致搜索服务的整体延时降低了3%~8%.而QUIC在移动设备上的优势则没有桌面端的优势那么明显.这是因为移动端的0-RTT握手概率更低,只有68%.0-RTT握手概率降低的原因是,一方面,移动设备会频繁更换网络,使得服务端强制要求验证客户端新的IP地址并退回到1-RTT握手.另一方面,在切换网络后,客户端可能会选择与之前不一样的数据中心获得服务,从而无法利用之前的连接信息,只能使用1-RTT握手与新的服务器建立新的连接.与Das一样,Google也发现,当传输速率过快时(高于100 Mbs),CPU会成为系统的瓶颈从而限制网络吞吐率.
Kakhki等人[3]在可控环境下完成了更为详细的对比实验.他们使用软件模拟了不同的网络环境,包括带宽、延时以及丢包率,并在这些网络下对比了QUIC与TCP的网页加载延时.这些网页根据包含资源的数量和大小的不同被分为了很多组.实验表明,QUIC几乎在所有场景下都获得了比TCP更短的网页加载时间.作者发现,0-RTT握手是造成该场景下QUIC性能优越的主要原因.在所有情况下,只有当网页中存在大量的小资源时QUIC才表现出比TCP更差的性能.其原因是,QUIC发送端会因为观测到传输过程中最小RTT的增大而错误地认为网络中发生了拥塞,从而过早地结束了拥塞窗口的快启动阶段,导致发送速率无法快速增长.这一点在传输数据流大时没有显著的影响,因为比较长的传输时间让QUIC有充足的时间增长传输速率.然而,当传输数据量较小时,往往在QUIC的传输速率增长到物理带宽限制之前,传输就已经完成了.此外,作者发现,QUIC在数据包乱序严重的场景下,比如3G网络,性能会严重下降,甚至低于TCP.其原因在于QUIC在丢包检测算法的参数选择上过于严苛,导致算法错误地将乱序到达的数据包判断为丢包,造成不必要的重传,最终浪费带宽资源.
Kharat等人[25]在WiFi网络下对QUIC和TCP的公平性进行了分析.他们发现,在只有一条连接时,QUIC能比TCP更有效地利用带宽.但是当同时使用2条TCP连接和2条QUIC连接时,TCP能够抢占更多的带宽.原因是某些浏览器(例如Opera和Firefox)会为TCP连接保留部分带宽用于小文件的传输,造成了对QUIC的不公平.
Yang等人[26]分析了QUIC在卫星网络下的表现.相较于传统网络,用于空间通信的卫星网络拥有高延时、高丢包率的特征.他们基于仿真的卫星网络,比较了QUIC和TCP在地球同步轨道卫星和低地轨道卫星2种情况下的性能差异.比较结果显示,在所有的情况下,QUIC都能表现出更好的性能.通过对传输过程更细化的分析,他们总结出QUIC的优势主要在于通过0-RTT握手减少了握手延时以及通过更大的拥塞窗口减少了接收端的丢包.张晗[27]更进一步地在基于QUIC的卫星网络中使用BBR算法[34]替代QUIC中默认的NewReno算法[35]用于拥塞控制,进一步提升了QUIC在高延时和高丢包率网络下的传输性能.
与以上在仿真网络下进行的测量工作不同,Rajiullah等人[9]在真实的蜂窝网络下对支持QUIC的网站进行了测量.他们发现,使用QUIC访问这些网站往往比直接使用TCP会耗费更长的网页加载时间.其原因在于,支持QUIC的网站通常需要引用其他网站的资源,而这些资源所在的服务器通常不支持QUIC,因此浏览器需要花费一定的延时从QUIC退回到TCP,从而导致总的加载延时被延长.这一发现为后续从事互联网上QUIC测量工作的研究者提供了新的思路,即互联网对QUIC的支持情况也会对我们所观察到的QUIC的性能产生不小的影响.
对于以上测量工作,我们注意到,所有这些对QUIC的测量工作都是基于gQUIC完成的.主要原因是Google目前在Chrome上实现的是gQUIC而不是IETF版本的QUIC.Chrome作为一个主流浏览器,gQUIC为它带来的性能改变更受研究人员关心.同时,Google在全球部署的大量服务器也为gQUIC的测量提供了可靠的实验平台.但是这也导致了科研人员过分专注于gQUIC在互联网上的表现,而忽视了对IETF版本QUIC性能的分析.虽然这2个版本的QUIC有着相同的设计思想,但是在很多细节上仍有不同,这些差异可能会导致一些gQUIC上的测量结果在IETF版本QUIC上不再适用.此外,QUIC的安全性更接近于TLS1.3,但是在上述的对比实验中,大部分研究人员选择将QUIC与TCP+TLS1.2进行对比,这样的比较并不合理,因为TLS1.3的安全复杂程度远高于TLS1.2,性能必然会有明显地下降.随着TLS1.3标准的正式完成,相信以后会有更多测量是基于TLS1.3进行的.
2.1.2 视频传输
视频传输是互联网中另一个重要的应用.Cisco的报告表明,在2014年,视频流量占整个移动网络流量的55%.并且这一数据有望在2019年达到72%[36].在视频领域,研究人员普遍使用缓存等待率来衡量视频的服务质量,也就是用户等待视频缓存的时间占总播放时间的比例.
Google在YouTube应用上的测量数据表明,与搜索服务的场景下类似,QUIC能够在桌面端和移动端分别使得85%和65%的连接实现0-RTT握手[5].但与网页访问不同的是,YouTube会在用户打开视频前提前与服务端建立连接,从而导致QUIC的0-RTT握手的优势不再明显.尽管如此,实验表明,QUIC仍然能在很大程度上优化视频播放的质量,它在移动端和桌面端分别降低了13.5%和18.0%的缓存等待率.这是因为,相较于更低的握手延时,及时的丢包重传对视频传输来说更重要.一个视频或者音频帧的丢失往往会阻塞住后面的内容,导致播放器暂停并进行缓冲.YouTube在视频传输时同时使用2条TCP连接,一条连接无法得知另一条连接的数据包是否丢失,从而导致每条连接对数据包的敏感性降低.而QUIC只使用了一条连接,可以最大限度地使用已有信息作为判断依据,增加对数据包的敏感性.此外,QUIC支持更多的传输层信号,可以帮助发送方判断数据包是否已经丢失,从而能更精确地检测网络中的丢包行为,避免因为错误检测而造成的不必要的数据包重传.
然而Kakhki等人[3]却得出了与Google不完全相同的结论.他们在丢包率为1%,带宽为10 Mbs,50 Mbs,100 Mbs的网络下对比了使用TCP和QUIC播放YouTube视频的效果.实验发现,在低帧率时,QUIC和TCP的性能基本一致.只有在高帧率的场景下,QUIC才能提高视频传输的性能,减小缓存等待时间.
目前对QUIC的优化工作主要有2方面,分别是对协议本身的优化以及对其实现方法的优化.在协议方面,De Coninck等人[8]以及Viernickel等人[28]分别将多路径的概念引入QUIC,使得一条QUIC连接可以同时使用多条底层网络链路,增加带宽.在系统实现方面,Wang等人[29]在系统内核态实现了QUIC协议,而Duan等人[30]则使用了用户态的UDP实现,他们均在一定程度上提高了QUIC的处理数据包的速度.
2.2.1 多路径QUIC
多路径是指允许一条传输层连接同时使用多条物理网络链路的技术.其优势在于,可以同时使用多个物理网络从而增加有效网络带宽.例如,手机用户可以同时使用蜂窝网络和WiFi,电脑用户可以同时使用以太网和WiFi.多路径在TCP上已有大量研究[37-38],其中MPTCP[39]已经作为网络协议标准被IETF收录,并且被Linux内核所支持.
De Coninck等人[8]最早提出了多路径QUIC的设计:MPQUIC.他们在流之下定义了路径(path),用于描述数据传输所使用的物理网络路径.在每个Stream帧中会包含一个Path ID,根据不同的Path ID,QUIC可以在发送和接收时将数据包对应到不同的物理网络.在握手阶段,客户端与服务端会先在一条网络链路上建立QUIC连接.之后每有一个网络链路需要使用,便添加一个新的Path.由此,客户端可以以多个IP地址为源地址,向服务端发送数据包.在发送端,拥塞控制是对每个物理网络连接分别进行的.也就是说,每个Path都会维护自己的拥塞窗口、ACK计数、RTT估计等信息,从而实现对每条物理网络分别进行流量控制的目的.在接收端,来自不同Path的数据包会被合并从而得到完整的Stream帧,并进行下一步处理.在多路径的拥塞控制算法上,MPQUIC使用了在MPTCP上表现良好的OLIA算法[40].De Coninck等人[8]的实验表明,在下载大文件的场景下,大部分时候,MPQUIC能够比MPTCP更快地完成传输.这是因为MPTCP缺乏一个有效的对物理连接延时的判断机制,从而会使得某些数据包被阻塞在较慢的连接上,影响了整体的速度.而MPQUIC则不存在这些问题,因为它对每个物理连接都进行了精确的控制.
Viernickel等人[28]提出了另一套多路径QUIC的设计方案.与MPQUIC不同的是,他们通过不同的UDP套接字直接区分不同的物理网络路径,从而避免了引入Path ID的需要.但是,添加一个新的物理网络路径需要连接的一方主动发送announcement数据包通知对方新的物理网络连接即将被加到当前QUIC连接中,这样导致添加新物理网络连接需要耗费1个RTT的延时.
为了对比多路径QUIC与MPTCP在实际互联网下性能的差异,De Coninck等人设计了一个iOS应用:MultipathTester[41].该应用支持在不同网络环境下对多路径QUIC和MPTCP进行基准测试.实验结果表明,多路径QUIC与MPTCP在数据传输性能方面没有显著的差异[42].唯一的区别在于,多路径QUIC会在客户端主动检测每条物理链路的可用性并向服务端告知其物理网络的变化.例如,当手机的WiFi连接断开时,客户端会通过移动网络告知服务端放弃该网络连接,从而避免服务端继续使用其WiFi连接而造成不必要的丢包与重传.而iOS内核中实现的MPTCP并不具备这样的功能.由此可见,尽管多路径QUIC在协议设计上已经取得了一定的进展,但是正如MPTCP所面临的挑战一样[34-44],如何设计出性能更好的拥塞控制算法并将其应用在QUIC上才是让多路径QUIC普及的关键因素.
2.2.2 用户态与内核态
在操作系统中,出于安全性的考虑,地址空间被分为用户空间和内核空间.一般来说,用户程序,例如应用程序,运行在用户空间;而系统程序,例如操作系统,运行在内核空间.用户程序可以使用系统函数调用的方式进入内核空间.传统意义上,传输层协议(例如TCP和UDP)均在Linux内核中实现,并且运行在内核空间.但是近年来的研究发现基于内核旁路[45]的用户空间TCP可以达到比内核空间TCP更高的性能[46].因为应用程序工作于用户空间,所以用户空间TCP可以避免应用程序进行系统调用时的空间切换开销,同时也能够避免数据在内核空间和用户空间之间的复制,最终达到加速应用程序运行速度的目的.另外,实现于用户空间的网络协议不受系统内核更新周期的限制,可以实现更快速的更新.
目前使用的最为广泛的QUIC实现是在Chrome中的gQUIC,它工作于用户空间并且仍处于迭代开发中.这样的设计虽然可以允许协议的快速修改但是却不能提供最好的性能,因为它的下层网络使用了系统内核的UDP套接字,这样既不能利用内核态程序的高优先级又不能像用户空间TCP一样避免空间切换的开销.
Wang等人[29]在内核空间实现了gQUIC,用于在公平的环境下进行QUIC和TCP的性能对比.Duan等人[30]在用户空间实现了包括UDP在内的gQUIC协议栈.他们测试了客户端和服务端在短时间内进行快速握手的性能,发现使用内核旁路的QUIC能够比Chrome多处理100倍以上的握手.
此外,也有研究者致力于加速QUIC数据包的处理.因为QUIC性能最大的瓶颈在于加密与解密算法的开销,YouTube服务器在使用QUIC时的CPU开销是TCP+TLS的2倍[5].所以对该过程的优化也是未来的一个研究方向.一种可能的方式是PixelVault[47]一样,将加密解密相关的操作移到GPU上进行执行,从而降低CPU负载并加速数据包的处理.
gQUIC的安全性与其传输层协议相绑定,这导致早期对QUIC安全性的研究主要针对QUIC整体进行.随着IETF版本QUIC的推出,安全性相关的设计被从QUIC中剥离出来,并形成了TLS1.3.于是后续关于QUIC安全性的研究更倾向于对TLS1.3的安全性分析.在本节,我们首先列举研究者对QUIC和TLS1.3安全性的建模分析,然后对已发现的安全漏洞进行介绍与总结.表2对QUIC安全性的相关工作进行了总结.
Table 2 Related Work on QUIC Security表2 QUIC安全性的相关工作
2.3.1 安全模型
Fischlin等人[2]提出了多阶段公钥交换(multi-stage key exchange)模型,用于描述QUIC的握手机制.利用这个模型,他们证明了QUIC握手机制的安全性,然而该模型无法很好地涵盖握手之后的数据传输过程.也就是说,即便通信双方使用了安全的包含身份验证机制的加密协议用于数据加密,QUIC协议作为整体的安全性也无法得到保证.为了解决这个问题,他们提出了一种可以符合其安全模型的QUIC设计:QUICi.QUICi采用了更为复杂的密钥生成机制,从而使得用于不同目的的密钥之间相关性降低,增加了QUIC的安全性.
与Fischlin等人不同,Lychev等人[31]对未经修改的QUIC的安全性进行了更进一步的分析.针对QUIC和TLS1.3的0-RTT握手机制,他们提出了快速通信协议(quick communication protocols)的概念,用于描述在最终会话密钥(final session key)生成之前先使用初始会话密钥(initial session key)的做法,QUIC和TLS1.3均属于快速通信协议.同时,他们提出了QACCE(quick authenticated and confidential channel establishment)模型,并使用该模型证明了QUIC连接建立过程和数据加密传输过程的安全性.
同时,Lychev等人[31]指出,基于最终会话密钥的1-RTT握手和基于初始会话密钥的0-RTT握手拥有不同的安全级别.前者可以确保通信双方在攻击者存在的情况下能够生成一致的共享密钥进行数据加密,并且提供前向安全性的保障.而后者可能因为攻击者的存在而使通信双方产生不一致的共享密钥,导致数据的加密解密过程失败.并且,0-RTT握手也不能保证前向安全性.关于0-RTT的安全问题我们会在2.3.2节进行更为详细的介绍.
在此基础上,Jager等人[4]从攻击者的角度分别对QUIC和TLS1.3的安全性给出了分析.在TLS1.2中,Bleichenbacher攻击及其变形能够快速猜测出服务端的密钥,从而破坏其安全性[49-50].在QUIC和TLS1.3中,因为移除了TLS1.2中导致安全性漏洞的PKCS#1 v1.5标准的支持,从而理论上不再受该类攻击威胁.Jager等人的模拟攻击结果表明,TLS1.3和QUIC极大地增加了攻击者在进行攻击过程中所消耗的时间,从而使得该种攻击不再具有可行性.
2.3.2 前向安全性与0-RTT握手的安全问题
前向安全性是通信协议的一种安全属性,它指的是长期使用的主密钥泄露不会导致过去的会话密钥泄露[32].其意义在于,前向安全性能够保护过去进行的通讯不受密码或密钥在未来暴露的威胁.TLS1.2与QUICTLS1.3的1-RTT握手均很好地支持了前向安全性.但是QUICTLS1.3的0-RTT握手却无法为通信双方提供前向安全性[31].这是因为,0-RTT通信过程中使用的是初始会话密钥,而这个密钥是根据服务端的静态配置生成的,未来如果该配置泄露,亦会导致0-RTT的密钥也随之泄露.
为了解决这个问题,Günther等人[48]通过在服务端的修改使得QUIC的0-RTT握手支持前向安全性.他们使用了一种特殊的密钥设计:每当服务端用当前密钥解密一个密文后,就将当前密钥进行修改,新的密钥可以像原来的密钥一样进行密文解析,唯一不同的是不能对已经解析过的密文再次进行解密,从而保证了前向安全性.
同时,该设计也会使得QUIC不再遭受重放攻击的威胁.但是它带来了性能上的挑战,因为服务端的密钥的复杂度会随着时间的推移逐渐增加.为此,他们又提供了新的协议机制使得服务端可以每过一段时间将当前密钥重置一次,从而降低密钥的复杂度.
2.3.3 易遭受的攻击
虽然许多研究工作证明了QUIC可以保证其传输的数据无法被恶意攻击者所获取,但是攻击者仍然有能力对通信双方的正常通信进行干扰,甚至影响客户端或者服务端的正常运行.Lychev等人[31]列举了QUIC易遭受的几种安全攻击.根据攻击者是否处于客户端和服务端之间的网络路径上,这些攻击被分为了离线攻击和在线攻击.
1) Server Config重复攻击,离线.类似于TCP的reset攻击[51],攻击者可以通过嗅探获得服务端的基本配置信息,然后利用这些配置信息并伪装成服务端的IP地址向客户端发送reset数据包,终止QUIC连接.
2) Crypto Stream Offset攻击,离线.因为QUIC的握手数据包的大小也会被统计入Stream的偏移量(offset),攻击者可以在握手数据包后面附加一些字符串,导致接受方获得错误的Stream偏移量数值,从而无法正确解析之后的数据包.
3) 连接ID篡改攻击,在线.通过篡改握手过程中Client使用的连接ID,攻击者可以使得通信双方在很长的一段时间内(10 s)都认为连接已经成功,却无法正常解析接收到的数据,并导致连接中断.
4) Source-Address Token篡改攻击,在线.与连接ID篡改攻击相似,攻击者可以通过篡改Source-Address Token的方式导致通信双方无法正常解析对方收到的数据包.但是双方在很长的一段时间内(10 s)都认为连接已经成功,直到主动中断连接.
可以看出,QUIC在特定情况下无法提供有效的手段阻止在线和离线的攻击者中断一条QUIC连接.对于在线的攻击者,它能够让通信双方的连接处于闲置状态一段时间,并且该行为无法立刻被通信双方检测到.而对于离线的攻击者,它只需要获取极少的连接相关信息便可以让一条QUIC连接被迫中断.
此外,McMillan等人[6]使用Ivy[52]对QUIC协议进行了详细的定义,并通过自动生成的随机攻击者对QUIC各版本的安全漏洞进行探测.经过实验,他们一共发现了QUIC运行过程中可能产生的27个错误.出于安全性的考虑,McMillan等人只公布了QUIC历史版本中所发现的并且已经被解决的问题,并没有对现存问题进行详细介绍.
尽管研究人员已经对QUIC在网络传输性能测量、系统性能优化以及安全性分析等方面进行了大量工作.但是,目前已有的科研工作仍有进一步提高的地方:
1) 缺乏对IETF版本QUIC的分析.gQUIC只是QUIC的早期设计,属于过渡期的协议.IETF作为一个负责开发和推广互联网标准的组织,它制定的QUIC协议才是未来QUIC的标准版本.尽管有许多开源组织致力于跟进IETF QUIC的每一个草稿并提供实现.但是目前IETF版本QUIC的许多设计细节并没有确定,而且也没有一个被广泛使用的代码实现.反之,gQUIC借助于Chrome的影响力已经被数十亿人使用.因此,大部分的测量工作都是基于gQUIC进行的,学术界仍然缺少对IETF版本QUIC的性能的有效认识.
2) 软件实现对分析结果的影响过大.尽管目前对QUIC的性能分析工作很多,但是大多局限于特定的实现,导致学术界对QUIC性能没有一个统一的认识.在分析方法上,研究人员也普遍根据测量结果猜测造成差异的原因,没有进行严格的控制变量法的对比.如果可以通过禁用QUIC某些特性的方法进行对比,就能更加深入地了解QUIC在不同网络环境下表现好坏的根本原因.
3) CPU成为QUIC的性能瓶颈,导致无法充分利用带宽.与现有的安全性协议相比,QUIC借用TLS1.3达到了更高的安全性.但是随之而来的是加密解密复杂度的提高以及CPU负载的增加.这一点在手机等CPU性能相对薄弱的设备上尤为明显.如何让QUIC在现有的CPU性能下达到更高的带宽是一个亟待解决的问题.
基于现有对QUIC的研究工作,我们分别从网络传输性能、系统性能以及安全性3个方面预测了在未来可能有意义的QUIC的研究方向.
1) 现有的网络测量结果表明,QUIC在大部分情况下表现出了比TCP+TLS更低的延时.同时,测量结果也显示QUIC为了降低延时而进行的设计达到了预期效果.我们发现很多QUIC表现不如TCP的场景是由其不合适甚至错误的算法选择造成的,而并非其协议本身的缺陷.造成这一问题的原因正是QUIC在算法选择上的灵活性.因此,如果研究人员能够归纳并总结QUIC在拥塞控制、丢包检测等方面的可行算法,并对不同算法的适用环境进行分析,定能帮助QUIC更好地适应复杂的互联网环境.
2) 虽然研究人员已经为提高QUIC的系统性能和降低数据包处理的延时提出了很多设计,但是目前并没有一个真正有效且通用的策略.无论是内核旁路还是GPU都对硬件及其驱动有额外的要求,并且难以在移动设备上实现.一种可行的提高QUIC系统性能的思路是将QUIC的实现进行并行化.因为QUIC本身就是一个多路传输协议,如果能够有效利用现代处理器的多个核心,必然能为QUIC的处理速度带来进一步提升.但如何对QUIC协议进行解耦以使得它能够将原本单线程的工作分配到不同的CPU核心上还有待研究人员解决.
3) QUIC的0-RTT握手无法保证前向安全性,而Günther等人[48]所提出的前向安全的0-RTT握手却对系统性能有更大的消耗.另一方面,TLS1.3带来的加密解密负荷使得QUIC对CPU的运算需求已经大大提高.所以,如何在安全性与计算开销之间进行权衡是一个值得研究与讨论的话题.另外,现有的研究发现QUIC连接容易被在线或者离线的攻击者所打断.研究人员应当为QUIC连接增加更多的保障机制从而帮助它更好地鉴别攻击者的恶意行为,增加连接的安全性.
除了以上的研究方向外,我们注意到,已经有科研工作者将QUIC应用于HTTP以外的其他应用层协议,并且为系统性能带来了不错的提升[53].未来,如果能够将QUIC应用于更多的应用层协议,例如WebRTC,FTP,DNS等,很有可能会让它们在网络传输性能、系统性能以及安全性方面获得提升.
在5G领域,QUIC也有着不错的应用前景.3GPP在5G标准中规定了其核心网将使用虚拟化技术实现其各组件的功能.不同组件之间将使用基于HTTP2的RESTful接口进行通信[54].但是鉴于QUIC在传输性能方面的提升,3GPP正在考虑使用QUIC替代HTTP2用于核心网各组件之间的数据通信[55].除此之外,因为5G相较于上一代无线技术(4G)提供了更低的无线通信延时[56],所以它使得通过蜂窝网络为用户提供极低延时的网络服务成为了可能.而QUIC在握手延时方面的优势,尤其是0-RTT握手,将有助于网络服务更进一步地降低网络延时,提升用户体验.在我们的前期工作中,我们提出了一个基于QUIC的域名解析系统:Artemis[57].Artemis借助于QUIC在移动性上的优势,实现了比传统DNS更低的域名解析延时.我们相信,未来将会有更多的基于5G以及QUIC实现的低延时服务出现在云计算、边缘计算以及物联网等领域.
QUIC作为一个新的传输层协议,它在设计上针对TCP的不足进行了很多优化.它提供的多路传输、快速握手等新特性使得它和TCP相比在理论上可以获得更低的数据传输延时.现有测量工作表明,QUIC在大部分情况下的确能比TCP达到更低的传输延时,但是仍然有部分情况下QUIC的表现不如TCP.这些QUIC性能表现较差的场景往往是拥塞算法的选择、服务器部署等外部因素造成的,而非QUIC本身的设计缺陷.因此,QUIC的软件实现仍然有很大的进步空间.在安全性方面,基于TLS1.3的QUIC一方面牺牲了一定的计算资源为用户提供了比TLS1.2更高的安全性,另一方面以牺牲前向安全性为代价换来了更低的握手延时.但总体来说,TLS1.3还是很好地保障了数据传输的安全性.此外,许多在TCP上未被解决的问题在QUIC上也依然存在,仍然有很多后续工作等待着科研工作者们继续探索.
在QUIC的应用上,随着5G等新兴应用场景的出现以及HTTP3标准的制定,相信将来会有越来越多的基于QUIC的网络服务的出现.如何充分利用QUIC的特性提升网络服务的服务质量有待工业界和学术界的共同探索.