胡祖奎
21世纪是一个网络时代,网络已经无可争议地成为大家生活的一部分。查资料,看新闻,发微信……几乎衣食住行等等列一不用到和依赖网络。因此,本文不妨结合个人的体会谈谈网络资源的下载的一些方法和策略。
一、什么是网络资源
办公电脑作为办公室的标准配置,可以让我们打字、听歌、看电影、玩游戏等;实现对文本、图片、音视频、动画等多种媒体的处理,极大地提升了我们的工作效率。这些不同的媒体数据,都是以计算机可理解和接受的二进制的数字化的形式,并以文件的形态存储于计算机的硬盘、U盘、光盘等存储介质。网页是一种特殊的文件,它本质上是一个包含了各种HTML标签的纯文本文件。正是这些不同的标签,使得网页的内容不但有普通的文本内容,还能描述出网页所包含的图片、音频、视频、动画等其它媒体文件的信息,甚至以超链接的形式,与其它的文件起来。为区别于传统的文本文件,称网页为超文本文件(Htm)。网页里的图片、音频、视频、动画等媒体内容都是以文件的形式单独存放。通过网页中的超链接,可以将一台或者多台计算机主机(服务器)的不同文件内容组织起来,形成一个蜘蛛网一样的网页文件的链接——网站(Web)。要能让自己的网站内容能够通过Internet被其他人访问,还必须进行网站的发布。
从硬件的角度看,网络就是多台计算机通过网线、交换机等各种网络设备联接在一起的集合。不同范围的、不同功能的计算机的集合构成不同的或公用或私用的计算机网络,而Internet则是目前大家用得最多的一种公众计算机网络。Internet中计算机上的Web资源就形成庞大的遍布全球的网络资源(WWW:World Wide Web),一个海量的信息集合。因此,网络资源就是存储于Internet中计算机服务器(Web Server)上的多媒体文件。从软件的构成来看,WWW分为Web客户端程序(浏览器)和Web服务器程序。制作好Web网站后,在计算机上的Web服务器程序进行设置,就完成了网站的发布,这就是网络的WWW服务。我们上网,访问最多的就是WWW服务中的Web信息资源,所以网址里总有WWW。
当然,Internet呈现给我们的功能除了WWW,还有远程登录服务Telnet(Remote Login)、文件传送服务FTP(File Transfer Protocol)、电子邮件服务E-mail(Electronic Mail)、电子公告板系统BBS(Bulletin Board System)。但它把Internet上所有的超文本媒体资源统统连接起来,只要网络畅通,全球的信息就可方便获取,使得WWW几乎成了Internet的代名词。
二、下载方法
根据原理的不同,现在网上流行的下载方式主要有WEB、BT两种下载方式。根据数据传输规则的不同,WEB下载方式分为HTTP与FTP两种类型,也是两种最经典的下载方式。HTTP下载就是通过浏览器进行下载:这是大家最熟悉的日常上网的情况,在浏览器中输入某个网址,打开相应网页,通过简单的鼠标操作就可保存网页及其中的文字、图片等资源。毫无疑问,使用浏览器进行下载是最为简便的方法。FTP下载可以通过浏览器进行下载,也可以通过专门的FTP软件进行下载。在这种方式下,使用已知的FTP帐号登录FTP服务器,然后操作FTP上的文件就和操作“我的电脑”中的文件一样,通过简单的“复制”、“粘贴”就可完成从远程FTP服务器到本地的数据下载。因为WWW依循的是客户端/服务器端模式,基于Web下载的工作原理,都是通过所使用的本地終端(客户端)程序发出申请,访问相应网络地址的服务器(Server)资源,并将远程服务器资源存放于本地终端的过程,客户端与服务器之间存在着一对多的关系(P2S:Peer to Server),若同时下载的人数过多,也由于服务器的带宽问题,下载速度会减慢许多。具体的星形拓扑结构如图1所示。
BT(BitTorrent)就是比特流,是基于P2P传输协议的一种下载方法,BT下载也称为P2P下载。与Web下载不同,它要通过一个专门的P2P下载软件来实现,可以克服了传统Web下载方式中下载客户端较多时,单一的服务器端负荷重的局限性。P2P下载不需要专门的服务器,而是在各个用户的终端设备之间同时进行数据上传和下载。每个人使用的终端既是提供资源的服务器端,也是下载资源的客户端,是一种对等的关系(P2P:peer-to-peer)。每个客户在将其它客户端上的资源下载到自己终端设备的同时,还起着被其它客户端下载的作用。所以使用该种下载方式的用户越多,其可提供下载资源的端点数就越多,下载速度就越快。当然,缺点就是硬盘长期处于读写状态,可能更容易损坏。所以,BT下载是一种多对多的网状拓扑关系,其拓扑结构如图2所示。
P2SP(Peer to Server&Peer)下载方式实际上是对P2P技术的拓展,它不但支持P2P技术,同时还通过多媒体检索数据库这个桥梁把原本孤立的服务器资源和P2P资源整合到了一起,用户下载某一个文件的时候,会自动搜索其他资源,选择合适的资源进行加速,这样下载速度更快,同时下载资源更丰富,下载稳定性更强。
三、下载策略
浏览器是获取网络资源的门户,大多的网络访问都是在浏览器里面完成的,浏览器也是大家使用最频繁最熟悉的软件之一。因此,一般的网络资源下载大家更习惯通过浏览器进行HTTP下载。本文将基于浏览器的网络资源下载作进一步的策略阐述。由于浏览器的功能不同,具体下载时可采取不同的下载策略。
1. 直接下载