深度学习在自然语言处理方面的运用有哪些？

如题所述

推荐答案 2017-12-11

深度学习在自然语言处理中的应用已经非常广泛，可以说横扫自然语言处理的各个应用，从底层的分词、语言模型、句法分析等到高层的语义理解、对话管理、知识问答、聊天、机器翻译等方面都几乎全部都有深度学习的模型，并且取得了不错的效果。可以参看ACL2017年的accepted papers list。Accepted Papers, Demonstrations and TACL Articles for ACL 2017。从这里可以看到大部分论文都使用了深度学习的模型。那为什么深度学习在自然语言中取得这么大的进步呢。一、从数据上看，经过前些年互联网的发展，很多应用都积累到了足够量的数据。当数据量增大，以SVM、CRF等为代表的浅层模型，因为模型较浅，无法对海量数据中的非线性关系进行建模，所以不能带来性能的提升。相反，以CNN、RNN为代表的深度模型，能够随着模型复杂性的增加，对数据进行更精准的建模，从而得到更好的效果。二、从算法上看，深度学习也给自然语言处理的任务带来了很多好处。首先，word2vec的出现，使得我们可以将word高效的表示为低维稠密的向量（distributed representation），相比于独热表示表示（one-hot-representation），这一方面一定程度上缓解了独热表示所带来的语义鸿沟的问题，另一方面降低了输入特征的维度，从而降低了输入层的复杂性。其次，由于深度学习模型的灵活性，使得之前比较复杂的包含多流程的任务，可以使用end to end方法进行解决。比如机器翻译任务，如果用传统的方法，需要分词模块、对齐模块、翻译模块、语言模型模块等多个模块相互配合，每个模块产生的误差都有可能对其他模块产生影响，这使得原来的传统方法的构建复杂度很大。在机器翻译使用encoder-decoder架构后，我们可以将源语言直接映射到目标语言，从而可以从整体上优化，避免了误差传递的问题，而且极大的降低了系统的复杂性。深度学习虽然是把利器，但是并不能完全解决自然语言中的所有问题，这主要是由于不同于语音和图像这种自然界的信号，自然语言是人类知识的抽象浓缩表示。人在表达的过程中，由于背景知识的存在会省略很多的东西，使得自然语言的表达更加简洁，但这也给自然语言的处理带来很大的挑战。比如短文本分类问题，由于文本比较简短，文本所携带的信息有限，因此比较困难。像这样的问题，当样本量不够时，如何将深度学习方法和知识信息进行融合来提升系统的性能，将是未来一段时间内自然语言处理领域研究的主要问题。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://77.wendadaohang.com/zd/G3q3p88IIYq8NGNNY3p.html

其他回答

第1个回答 2017-12-11

目前，模型方面有两种大的类型，一是基于检索的 Retrieval-based models ，二是生成式的 Generative models。Retrieval-based models 预先定义好知识库，根据输入和上下文语境，使用启发式算法在预先准备好的知识库中检索并生成答案。启发式的检索算法简单的如基于规则的表达式匹配，复杂点的用机器学习分类器。这种系统不会生成新的文本内容，它只是在预定义好的文本集中挑选“最适合”的应答。Generative models 不依赖预定义的知识库，实现起来也更难。两种模型都各有所长，但也有缺点。两种模型中都有用到深度学习的地方，研究方面更倾向于和Generative models结合，比如sequence to sequence（[1409.3215] Sequence to Sequence Learning with Neural Networks）模型能生成文本，看起来也更智能。产品方面更多使用Retrieval-based models，因为后者更容易实现，不会有语法错误，同时也限定了应用场景，以减小准备知识库的开销。

第2个回答 2017-12-11

现在neural network这么火，基本上你能想到的NLP task都被刷过了。只是跟vision那边用到的network相比不一定很“深”。下面列一些有代表性的工作：机器翻译（Machine Translation）papers.nips.cc 的页面。事实问答（Factoid Question Answer）例如提问“谁是现任美国总统” 回答“奥巴马”stanford.edu 的页面umd.edu 的页面。社区类型问答（Community-based Question Answering），帮你找到一个语义上尽量类似的提问、或者回答。arxiv.org 的页面http://arxiv.org/pdf/1511.04108v3.pdf。语法解析（Syntactic Parsing）输入一个句子，分析句子的语法结构http://www.petrovi.de/data/acl15.pdfstanford.edu 的页面。信息提取、序列标注（Information Extraction / Tagging）从句子中抽取特殊片段（比如人名），或者标注每个单词类型（例如词性标注）emnlp2014.org的页面aclweb.org 的页面。分类问题：情感分析，文档分类比如判断淘宝京东商品评论是正面的还是负面的；当前新闻是体育相关还是财经相关等等。推荐系统：文档推荐，娱乐内容推荐(电影等, 用text mining)。图片题注： Image captioning, Image to text mapping。

相似回答

大家正在搜