13个人工智能自然语言处理的深度学习框架 (2)

13个自然语言处理的深度学习框架

SpaCy

 

开发人员称SpaCy是世界上最快的系统。他们还称SpaCy是为深度学习准备文本语料的最佳方式。SpaCy在gensim、Keras、TensorFlow和scikit - learning等知名Python库上运行良好。其作者马修·洪尼巴尔说,SpaCy的使命是使最先进的自然语言处理技术实用化,并得到广泛应用,比如用于文本分类、命名实体识别、词性标注、依存句法分析等。

 

13个自然语言处理的深度学习框架

Stanford’s CoreNLP

 

斯坦福大学的CoreNLP是一个灵活、快速、现代化的语法分析工具,为包括Python在内的大多数常见编程语言提供了APIs。它还可以为简单web应用提供服务。正如官方网站上提到的,该框架具有词性( POS )标记器、命名实体识别器( NER )、解析器、coreference resolution system、情感分析、自举模式学习和开放信息提取工具。

 

13个自然语言处理的深度学习框架

Tensorflow

 

谷歌大脑团队开发了TensorFlow,并于2015年发布,主要用于研究。现在许多公司如Airbus、英特尔、IBM、Twitter等都在工业生成中都使用Tensorflow。系统架构灵活,因此可以在CPU或GPU上高效运行。主要概念是流图(flow graph)。图的节点反映数学运算次数,而边表示结点之间通信的多维数据阵(张量)。TensorFlow最著名的NLP应用程序之一是谷歌翻译。其他应用包括文本分类和摘要生成、语音识别、标注等。

 

TFLearn

由于是Tensorflow的一个低级API,因此创建了许多高级API来运行在它上面,以使用户体验更快、更容易理解。TFLearn是在CPU和GPU上运行的主要工具之一。它有一个特殊的图形可视化工具,详细展示了权重,梯度,激活等模型训练情况。该库已经用于情感分析、文本生成和命名实体识别。它允许用户使用卷积神经网络和递归神经网络( LSTM )。

 

13个自然语言处理的深度学习框架

Theano

 

Theano是一个数字计算Python库,用户可以创建自己的机器学习模型。像Keras这样的许多框架都是建立在Theano之上。用于机器翻译、语音识别、词向量计算和文本分类的工具。

 

Summary

在本文中,我们介绍了基于Python编写的,用于进行自然语言处理的主流的神经网络库。这些工具是Chainer、Deeplearning 4j、Deepnl、Dynet、Keras、Nlpnet、Openmt、PyTorch、SpaCy、斯坦福大学的CoreNLP、Tensorflow、TFLearn和Theano。

相关资源

1. https://chainer.org/

2. pdf

3. https://deeplearning4j.org/

4. 

5. https://github.com/attardi/deepnl

6. https://github.com/clab/dynet

7. https://arxiv.org/pdf/1701.03980.pdf

8. https://keras.io/

9. https://github.com/erickrf/nlpnet

10. 

11. 

12. 

13. 

14. https://spacy.io/

15. https://stanfordnlp.github.io/CoreNLP/

16. https://www.tensorflow.org/

17. 

18. https://github.com/Theano/Theano

19. https://github.com/odashi/chainer_nmt

内容版权声明:除非注明,否则皆为本站原创文章。

转载注明出处:https://www.heiqu.com/zyjysw.html