相关文章推荐
刚毅的灭火器  ·  GIT permission denied ...·  6 月前    · 
老实的高山  ·  vuepress 内存溢出-掘金·  2 年前    · 

本资源主要是为了整理机器学习面试相关知识点的有用链接 (注:目前不打算将一些基础算法的内容加入这个repo里,比如LR、SVM算法在《统计学习方法》里已经得到了很好的解释,面试时可能考到的手推公式在书里已经写的很好了,所以推荐直接看书即可)

资源整理自网络,源地址:https://github.com/km1994/nlp_paper_study

内容涉及多次跳转,点击文末“阅读原文“”查看资源详情。

作者:杨夕 项目地址: 个人介绍:大佬们好,我叫杨夕,该项目主要是本人在研读顶会 论文 和复现 经典 论文 过程中,所见、所思、所想、所闻,可能存在一些理解错误,希望大佬们多多指正。 NLP 面经地址: 【关于 信息抽取】 那些的你不知道的事 【关于 实体关系联合抽取】 那些的你不知道的事 【关于 命名实体识别】那些你不知道的事 【关于 关系抽取】那些你不知道的事 【关于 文档级别关系抽取】那些你不知道的事 【关于 知识图谱 】 那些的你不知道的事 【关于 实体链指篇】 那些的你不知道的事 【关于 实体消歧 】 那些的你不知道的事 【关于KGQA 】 那些的你不知道的事 【关于Neo4j 】 那些的你不知道的事 【关于 细粒度情感分析】 那些的你不知道的事 【关于 主动学习】 那些的你不知道的事 【关于 对抗训练】 那些的你不知道的事 【关于 GCN in one-hot编码 在提出词向量(Distributed representation, Word embedding, word representation)之前所有的神经网络模型(或者传统的机器学习)对词数据的处理都是将词转换为one-hot编码进行处理。 NLP 中最直观,也是到目前为止最常用的词表示方法是 One-hot Representation,这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小,其中绝大多数元素为 0,只有一个维度的值 随着chat-gpt的爆火,越来越多的小伙伴们对 NLP 这个领域开始感兴趣。 NLP 设计多个领域,文本分类、文本摘要、机器翻译、信息抽取等等,本文对 NLP 领域的相关文献进行了梳理,筛选出一些 必读 文献和其他领域的基础文献,方便入门的小伙伴们学习。     本次给大家 分享 的是今年腾讯微信AI团队入选ACL的两篇文章,第一篇文章主要是针对 中文 诗歌生成的问题,介绍 中文 现代诗歌生产的修饰控制编码器,该编码器具有隐喻、拟人化等修辞功能。第二篇文章主要是针对递归神经网络RNNs在全局信息建模上的不足,提出了一种全局上下文增强的深度转换架... 【写在前面】ACL2021前段时间已经放榜,一直没时间 整理 ,最近抽时间 整理 了一下该会议在医疗自然语言处理方向上的相关 论文 ,放在这里,希望对大家有一定的帮助吧。还会继续更新,大家有兴趣的话可以持续关注。 更多关于 中文 医疗自然语言处理的资源和 论文 汇总,请访问我的GitHub相关主页https://github.com/FutureForMe/Chinese_Medical_Natural_Language_Processing。 学术范是一个新上线的一站式学术讨论社区,在这里,有海量的计算机外文文献资源与研究领域最新信息、好用的文献阅读及管理工具,更有无数志同道合的同学以及学术科研工作者与你一起,展开热烈且高质量的学术讨论!快来加入我们吧! 一、《Heterogeneous Graph Neural Networks for Extractive Document Summarization》 1、除句子外,还包含不同粒度级别的语义节点,这些另外的节点可以作为句子间的媒介,以加强句子间的关系。文件摘要是提取原始文档中的句子,把它作为摘要。模型的关键部分就是为交叉句子关系建模,本文不仅把句子作为节点,还引入了更多语义单元作为节点,这些节点作为连接句子的媒介,这些节点都可以看做句子间的特殊的关系,在信息传递的过程中,所有节点都会更新。 本文约1400字,建议阅读5分钟 论文 让我快乐,我爱学习! 给大家推荐100篇重要的 NLP 论文 论文 列表来自于Quora上的一个问题的答案:哪些是所有 NLP 学生...     今天主要和大家 分享 一篇关于 中文 命名实体识别的文章,本文分析Lattice-LSTM模型,并针对该方法的弊端提出将字符符号信息合并到字符向量表示中,提高了模型的性能(计算量、效果)。 First Blood TILE: Simplify the Usage of Lexico... 微软亚洲研究院成立20周年时表示: NLP 将迎来黄金十年。ACL2019 NLP 进展趋势也主要包括:预训练语言模型、低资源 NLP 任务(迁移学习/半监督学习/多任务学习/主动学习)、模型可解释... 《Efficient Estimation of Word Representation in Vector Space》 EM NLP 2014,Glove:最出名的词向量训练方法之一 《GloVe: Global Vectors for Word Representation》 EM NLP 2015,Char Embedding 第一篇介绍字符嵌入的 论文 《Compositional character models for open vocabu ©PaperWeekly 原创 · 作者 |王馨月单位 |四川大学研究方向|自然语言处理机器翻译1.1FCL 论文 标题:Frequency-Aware Contrastive Le...