Web 信息抓取技术在物流案例库建设中的应用

2020-09-10 07:32汪贻生
物流技术 2020年8期
关键词:案例库队列检索

李 睿,汪贻生,郭 凌,闫 华

(陆军勤务学院,重庆 401331)

1 引言

案例教学自创立以来,已被广泛应用于物流专业的教学中,以其创新性、实践性、系统性、协作性等特点在实际教学应用中取得了良好的效果[1]。案例库作为案例教学的基础,其建设水平的高低直接影响着案例教学的效果[2]。随着信息时代的到来,信息获取渠道越来越广,信息更新速度越来越快,对物流案例教学和案例库建设提出了新的更高的要求。

2 Web信息抓取技术在案例库建设中应用的必要性

(1)信息传播速度的加快对案例更新的速度提出了更高要求。随着互联网时代的到来,信息传播速度有了突飞猛进的提升,学生更容易在互联网上获得需要的各类信息资源。如果案例更新较慢,比较成熟可靠的解决方案已被提出、验证、实践甚至公布,案例学习就变成了信息获取能力锻炼,案例学习效果难以保证。

(2)案例复杂程度的增加对支撑资料的全面性提出了更高要求。案例问题的提出一般来自各类组织运作管理中实际遇到的问题,往往需要考虑多个方面的因素。如果案例支撑资料收集有缺漏,学生在提出解决方案时就需要花费大量的时间与精力去收集补充相关资料,案例学习效率就会大大降低。

(3)案例信息资源的扩展对信息组织的规范性提出了更高要求。案例资料信息量较大,且类别较多,必须对资料信息进行严格的筛选与组织,去除冗余,让学生能够准确把握案例研读和分析的重点。

3 Web信息抓取技术在案例库建设中的应用研究

Web信息抓取技术是一种利用计算机程序自主完成网页信息获取的方法,其本质是一个网页自动抓取程序,能够遍历互联网或者用户指定的URL队列,将网络信息提取出来供用户使用[3]。Web信息抓取技术可以从案例收集、相关信息采集和信息组织三个方面应用于物流案例库建设中,为案例库建设提供高效可靠的信息技术手段。

(1)应用Web信息抓取技术实现案例的自动收集。Web信息抓取技术能够不间断的对指定URL队列进行遍历搜索,如果将中国物流与采购网、中国物流信息网等专业网站指定为URL队列成员,就可以使用Web信息抓取技术自动实时的收集上述网站上公布的最新行业动态、统计数据、实务案例等信息,极大的减少物流案例库建设的工作量。

(2)应用Web信息抓取技术实现案例相关信息的快速采集。针对单一网站案例资料不够全面的问题,可以应用Web信息抓取技术进行基于主题的搜索[4],将从网站获取来的案例标题作为搜索主题进行网络检索、信息抓取和收集,还可以对案例标题中企业或组织名称指向的网站做更深一层次的信息检索与挖掘,采集更加全面的信息资源来支撑案例教学。

(3)应用Web信息抓取技术实现信息资源的整理归类。从互联网上获取到的信息通常是零散的,非结构化或半结构化的,研读起来比较耗时费力。应用Web信息抓取技术可以对获取的信息进行归类整理、建立索引和相关性排序,完成信息资源的初步整理,交给编写者相对规范、标准的信息,便于后续编写使用。

4 Web信息抓取程序设计

应用多层检索抓取的思路设计“三步式”Web信息抓取程序辅助物流案例库建设,其功能流程如图1所示。

图1 Web信息抓取程序功能流程

首先,程序从URL队列中读取专业网站的地址,从各专业网站上抓取案例信息。基本实现代码如下(C#语言开发):

本例中,从中国物流与采购网抓取信息条目见表1。

然后,将各案例标题作为检索的主题进行二次网络检索,抓取更多信息。在本例的实现中,为了节约资源,直接引用百度搜索服务,实现主题式搜索,然后对百度返回的URL队列进行信息抓取。以表1中“武汉小码大众科技有限公司-微…”为例,可得到相关信息见表2。

表1 信息抓取案例标题

表2 二次网络检索

同时,还可以在企业或组织的官网进行深度发掘,以“武汉小码大众科技有限公司”为例,可在其官网抓取如下信息,见表3。

表3 官网信息抓取

最后,将所有信息资源按文件格式、资料类别、相关度高低等进行整理。可以采用聚类分析和文本关键词检索的方法实现,本例中按物流专业教学通常采用的分类方法[5]将收集到的资料归类整理,见表4。

表4 收集资料的归类处理

整理后的资料作为案例编写的基本材料能够分层次、分类别清晰的展现,可以提高编写教师解读案例和编写案例的效率。

5 结语

本文尝试将Web信息抓取技术应用于课程案例库建设中,主要从案例收集、相关信息采集和信息资源组织三个方面为案例库建设提供高效的信息技术手段,并应用C#编程语言以物流学科教学为例实现了主要程序功能的开发,能够在一定程度上减轻案例编写的工作量,提高案例更新和编写的速度,促进案例教学效果的提升。

猜你喜欢
案例库队列检索
心血管外科教学案例库的建设及应用研究
《宁夏大学学报(自然科学版)》入选2021年度中国高校科技期刊建设示范案例库
国内首个海事司法案例库正式上线
基于实践应用的基坑工程设计案例库建设研究
队列队形体育教案
队列里的小秘密
基于多队列切换的SDN拥塞控制*
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究