Trie树-提高海量数据的模糊查询性能

今天这篇文章源于上周在工作中解决的一个实际问题,它是个比较普遍的问题,无论做什么开发,估计都有遇到过。具体是这样的,我们有一份高校的名单(2657个),需要从海量的文章标题中找到包含这些高校的标题,其实就是模糊查询关注公众号 渡码, 回复关键词 trie 获取源码)。对应的伪代码如下

selected_titles = [] for 标题 in 海量标题: for 高校 in 高校名单: if 标题.contains(高校): selected_titles.add(标题) break

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zywsyz.html