Trie树-提高海量数据的模糊查询性能

日期：2021-06-19 栏目：程序人生浏览：次

今天这篇文章源于上周在工作中解决的一个实际问题，它是个比较普遍的问题，无论做什么开发，估计都有遇到过。具体是这样的，我们有一份高校的名单（2657个），需要从海量的文章标题中找到包含这些高校的标题，其实就是模糊查询（关注公众号渡码，回复关键词 trie 获取源码）。对应的伪代码如下

selected_titles = [] for 标题 in 海量标题： for 高校 in 高校名单： if 标题.contains(高校): selected_titles.add(标题) break