5分快三走势一窥谷歌神经机器翻译模型真面貌,其底层框架开源! | 雷锋网

  • 时间:
  • 浏览:3

去年,谷歌发布了 Google Neu5分快三走势ral Machine Translation (GNMT),即谷歌神5分快三走势经机器翻译,二个 sequence-to-sequence (“seq2seq”) 的模型。现在,它并且用于谷歌翻译的产品系统。

其实消费者感受到的提升无须十分明显,谷歌宣称,GNMT 对翻译质量带来了巨大飞跃。

但谷歌想做的显然不止于此。其在官方博客表示:“并且内部人员研究人员无法获取训练哪此模型的框架,GNMT 的影响力受到了束缚。”

咋样把该技术的影响力最大化?答案只有二个 ——开源。

因而,谷歌于昨晚发布了 tf-seq2seq —— 基于 TensorFlow 的 seq2seq 框架。谷歌表示,它使开发者试验 seq2seq 模型变得更方便,更容易达到一流的效果。另外,tf-seq2seq 的代码库很干净并且模块化,保留了全版的测试覆盖,并把所有功能写入文件。

该框架支持标准 seq2seq 模型的多种配置,比如编码器/解码器的深度1、注意力机制(attention mechanism)、RNN 单元类型以及 beam size。另二个 的多功能性,能帮助研究人员找到最优的超参数,也使它超过了一点框架。详情请参考谷歌论文《Massive Exploration of Neural Machine Translation Architectures》。

上图所示,是二个 从中文到英文的 seq2seq 翻译模型。每二个 时间步骤,编码器接收二个 汉字以及它的上二个 状态(黑色箭头),并且生成输出矢量(浅紫色箭头)。下一步,解码器二个 词二个 词地生成英语翻译。在每二个 时间步骤,解码器接收上二个 字词、上二个 状态、所有编码器的加权输出和,以生成下二个 英语词汇。雷5分快三走势锋网提醒,在谷歌的执行中,大伙儿使用 wordpieces 来正确处理生僻字词。

据雷锋网(公众号:雷锋网)了解,除了机器翻译,tf-seq2seq 还能被应用到一点 sequence-to-sequence 任务上;即任何给定输入顺序、都要学习输出顺序的任务。这包括 machine summarization、图像抓取、语音识别、对话建模。谷歌自承,在设计该框架时可不不都还可以 说是十分地仔细,不都还可以 维持这个 层次的广适性,并提供人性化的教程、预正确处理数据以及一点的机器翻译功能。

谷歌在博客表示:

“亲戚大伙儿希望,让我用 tf-seq2seq 来加速(或起步)你的深度1学习研究。亲戚大伙儿欢迎你对 GitHub 资源库的贡献。有一系列公开的问题报告 都要你的帮助!”

GitHub 地址:https://github.com/google/seq2seq

GitHub 资源库:https://google.github.io/seq2seq/nmt/ 

via googleblog,雷锋网编译

相关文章:

谷歌翻译App对中国用户开放,不再都要VPN

Google Brain:NMT训练成本太高?用大规模神经机器翻译架构分析给出正确处理方案

涨姿势!咋样评价Google神经机器翻译(GNMT)系统?

雷锋网版权文章,未经授权禁止转载。详情见转载须知。