Home
|
En
系列 ▾
履迹与沉思
旅加经历
我的工作流
测试技能进阶
软件工程师的软技能指北
读书感悟
归档
搜索
标签
关于
RSS
主页
»
Tags
Bloom_filter
爬虫高效去重之布隆过滤器
笔者最近思考如何编写高效的爬虫; 而在编写高效爬虫的时候,有一个必需解决的问题就是: url 的去重,即如何判别 url 是否已经被爬取,如果被爬取,那就不要重复爬取。 ...