深度学习利器：TensorFlow与NLP模型(4)

日期：2020-05-30 栏目：程序人生浏览：次

feed_previous：若为True, 只有第一个decoder的输入符号有用，所有的decoder输入都依赖于上一步的输出；

outputs, states = embedding_rnn_seq2seq( encoder_inputs, decoder_inputs, cell, num_encoder_symbols, num_decoder_symbols, embedding_size, output_projection=None, feed_previous=False)

TensorFlow官方提供了英语到法语的翻译示例，采用的是statmt网站提供的语料数据，主要包含：giga-fren.release2.fixed.en（英文语料，3.6G）和giga-fren.release2.fixed.fr（法文语料，4.3G）。该示例的代码结构如下所示：

seq2seq_model.py：seq2seq的TensorFlow模型

采用了embedding_attention_seq2seq用于创建seq2seq模型。

data_utils.py：对语料数据进行数据预处理，根据语料数据生成词典库；并基于词典库把要翻译的语句转换成用用词ID表示的训练序列。如下图所示：

(点击放大图像)

translate.py：主函数入口，执行翻译模型的训练

执行模型训练 Python translate.py --data_dir [your_data_directory] --train_dir [checkpoints_directory] --en_vocab_size=40000 --fr_vocab_size=40000 总结

随着TensorFlow新版本的不断发布以及新模型的不断增加，TensorFlow已成为主流的深度学习平台。本文主要介绍了TensorFlow在自然语言处理领域的相关模型和应用。首先介绍了Word2Vec数学原理，以及如何使用TensorFlow学习词向量；接着回顾了RNN、LSTM的技术原理，讲解了TensorFlow的语言预测模型；最后实例分析了TensorFlow sequence-to-sequence的机器翻译 API及官方示例。

参考文献

深度学习利器:分布式TensorFlow及实例分析

深度学习利器：TensorFlow使用实战

深度学习利器：TensorFlow系统架构与高性能程序设计

深度学习利器：TensorFlow与深度卷积神经网络

作者简介

武维：IBM Spectrum Computing 研发工程师，博士，系统架构师，主要从事大数据，深度学习，云计算等领域的研发工作。

转载注明出处：https://www.heiqu.com/13593.html

深度学习利器：TensorFlow与NLP模型(4)

相关推荐