sponsored links

海量数据处理专题1——Bloom Filter

海量数据处理专题1——Bloom Filter

October 12
海量数据处理专题1——Bloom Filter
[什么是Bloom Filter] Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合.Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive).因此,Bloom Filter不适合那些"零错误"的应用场合.而在能容忍低错误率的应用场合下,采用Bloom Filter的数据结构,可以通过极少的错误换取了存储