智能写作-文本分析技术
编辑:pitaya02 日期:2020-09-14
龙果智能写作
经典NLG算法和序列生成算法的关注点都是“输出”人类语言,然而智能写作技术并不只关注输出,也要关注作为智能写作素材的“输入”。对于各类素材,需要利用文本分析技术抽取关键词、标签、情感倾向、摘要等用于智能写作的特征。以热点事件组稿自动写作为例,我们可以设计这样一种写作逻辑:
以热点事件突发为触发条件,按照以下方式收集相关素材:
核心线索是事件“火箭锁定季后赛”
以核心线索,从内容库检索该事件相关的内容集合
利用事件分析、事件聚合技术,将内容集合构造为若干聚类簇,例如核心战报、主帅角度分析、历史回顾等不同维度
每个维度挑选最好的原文,用自动摘要算法提取核心信息,构成写作结果
以上流程的一个关键步骤是自动摘要,因为最终选择的内容素材,是现存的篇幅较长的图文篇章,无法直接用于组稿,因此需要自动摘要算法提取长篇章中的核心信息,作为最终写作结果的部件。龙果智能写作
除上文已经介绍过的生成式摘要算法,另一类抽取式摘要算法从原文中选择合适的句子并且拼接为摘要结果,其重要优点是摘要结果中的语句直接来自原文,因此不会出现句子本身的通顺性问题,缺点是摘要结果受限于原文的句子集合,并且容易出现连贯性问题。抽取式摘要可以抽象为一个包括文档分析、句子排序、句子选择和摘要生成在内的流水线,达到理想效果的关键是如何对句子重要性做出精确预测。
火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。
火龙果智能写作官网https://www.mypitaya.com
积极拥抱变化,才能更好的应对这个时代