网页去重算法

网页去重发生在网页下载后、索引建立前,典型的网页去重算法有SHINGLING、I-MATCH算法、RandomProjection、SimHash算法以及SPOTSING算法

相关推荐