郭涛 黄铭钧
摘要: 社区互联网是以用户创造内容为主的新型互联网,具有很高的统计价值, 由于权限和数据更新频繁等限制,传统的网络爬虫很难获取这一部分数据,设计并实现了一种可以自动登录并可以根据更新频率快慢智能抓取数据的爬虫,不同于以往爬虫以页面为粒度,该爬虫以人为最小粒度,并以人与人之间的关系为抓取依据,在获取这类数据上有很好的性能。
关键词:
中图分类号:TP31文献标识码:A文章编号:2095-2163(2012)04-0065-03
智能计算机与应用2012年4期
1《师道·教研》2024年10期
2《思维与智慧·上半月》2024年11期
3《现代工业经济和信息化》2024年2期
4《微型小说月报》2024年10期
5《工业微生物》2024年1期
6《雪莲》2024年9期
7《中小企业管理与科技》2024年6期
8《现代食品》2024年4期
9《卫生职业教育》2024年10期
10《浙江临床医学》2024年3期