社区网络爬虫的设计与实现

2012-04-29 00:44郭涛黄铭钧
智能计算机与应用 2012年4期
关键词:爬虫标识码分类号

郭涛 黄铭钧

摘要: 社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值, 由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面为粒度,该爬虫以人为最小粒度,并以人与人之间的关系为抓取依据,在获取这类数据上有很好的性能。

关键词:

中图分类号:TP31文献标识码:A文章编号:2095-2163(2012)04-0065-03

猜你喜欢
爬虫标识码分类号
利用网络爬虫技术验证房地产灰犀牛之说
基于Python的网络爬虫和反爬虫技术研究
利用爬虫技术的Geo-Gnutel la VANET流量采集
大数据环境下基于python的网络爬虫技术
A Study on the Change and Developmentof English Vocabulary
Translation on Deixis in English and Chinese
Process Mineralogy of a Low Grade Ag-Pb-Zn-CaF2 Sulphide Ore and Its Implications for Mineral Processing
Study on the Degradation and Synergistic/antagonistic Antioxidizing Mechanism of Phenolic/aminic Antioxidants and Their Combinations
A Comparative Study of HER2 Detection in Gastroscopic and Surgical Specimens of Gastric Carcinoma
Significance of 18F—FDG PET / CT imaging in the evaluation of the efficacy of lymphoma