【摘要】:近几年人工智能、大数据等移动互联网新一代技术的发展和兴起,使得人们的生活也走进了智能化的时代。移动互联网技术给生活带来便利的同时,也带来新的挑战,僵尸网络、恶意软件是当前网络安全所面临的重要难题。它们大部分都使用了Domain-Flux技术,其主要应用的技术是一种恶意域名的生成算法DGA(Domain Generation Algorithm)。网络攻击者通过使用DGA域名去连接和控制受感染机器去进行非法行为,所以对于DGA域名的检测尤为重要。本文针对DGA域名的检测,对不同类型的DGA域名实现了三种不同的算法。首先是基于人工提取特征的GBDT算法,这种算法需要人工预先对域名数据进行特征工程,选择相关性高的特征再使用GBDT算法进行识别和分类。然后是基于LSTM的DGA域名检测算法,这种方法无需人工预先提取特征,对域名进行简单序列化之后即可建模。最后是基于BERT模型的DGA域名检测算法,这种算法结合自然语言处理领域非常优秀的BERT模型,针对Wordlist-based的单词级DGA域名有比较好的效果。本文研究发现,无论是基于人工特征的GBDT算法,还是基于LSTM的DGA检测算法针对的都是字符级的DGA域名,而在Wordlist-based的单词级DGA域名的检测上效果不佳。本文主要贡献在于,为了改善该问题而设计实现了基于BERT模型的DGA域名检测算法在实验中表现出了比较不错的检测效果,多项模型检测指标都能达到不错的数值,从而解决了Wordlist-based DGA域名难以检测和分辨的问题。
《广州大学》2020年硕士论文
内容版权声明:除非注明,否则皆为本站原创文章。