错别字校对-火龙果智能写作引领中国人工智能写作

编辑:pitaya02        日期:2020-08-31

文本作为信息的载体,是人类文明发展的必然要求。形式是随着生产力的发展而不断发展的。从古至今,从原始社会的绳索记事到殷商时期的甲骨文,从战国简牍到宋代雕版活字印刷术,直至今天的网络信息技术。由于信息承载能力和传播通道的提高,文字被从最简单的象形字逐步抽象为现在的简体字。每一次存储和传播手段的进步,都会对人类文明产生深远的影响。

古代人擅长信息编码

写作的第一个目的就是传播情感和思想。来欣赏一段文字吧。

”夜幕降临,一群乌鸦落在枯藤缠绕的古树上,发出凄惨的哀鸣。小桥下流水潺潺,小桥边庄户人家炊烟袅袅。在古老的道路上,一匹瘦弱的马,在西风中艰难地前进。落日渐渐黯淡,从西边落下。在凄冷的夜色中,只有孤零零的旅人漂泊在远方。

以上这段97字的文字让我们仿佛经历了岁月的穿梭,看到了世事沧桑,繁华落幕的景象。但这97个字对古人来说实在是太奢侈了。元诗人马致远仅用28个字就将这一意境表达出来。

枯藤老树迷惘,

小家的人,

古老的西风瘦马

落日,

断肠的人。

马致远把文字压缩,压缩率为28.86%,我们可以读到同样的意境。本例说明,将某些核心信息提取出来,可以保证所传递的信息不会丢失。那是简单的信息编码原则。

古代人是靠大脑来实现信息压缩的,每一件作品的诞生都非常不易,他们以创作的低效率来换取传播的高效率。现代人类就具备了编码能力,基本上高考作文都能拿满分。

贝叶斯信息论

随著资讯科技的发展,资讯承载量已不再以储存容量或传送媒介为瓶颈,资讯通道的进步让我们不必惜字如金,资讯内容也不再以编码方式有效传送,资讯需求只受读者阅读碎片的时间限制。

但是,内容的基本框架是不变的,其原则是,必须有一组核心来支持我们的重要信息。抽象化是逻辑上的框架,具象化是实体的组合。例如马致远只要抓住古树、乌鸦、小桥、人家、古道、瘦马、落日等核心实体,就可以理解他所要表达的意境,这背后是共同的历史、文化和情感。

因此,文本在内容中扮演什么角色?这句话前面加引号,起到了很重要的作用,比如“读完这话句,你就会把这个现话句的单词全部弄乱!”这表示文字仅仅是一张皮,虽然这张皮看起来并不好看,但是我们能够阅读这张皮背后的逻辑结构。贝叶斯理论就是这样,它的核心是“执果求因”。读书时,读者会根据文字这一“果”来判断逻辑这一“因”的可能性。当作者的文字表达不够精确时,读者获得核心逻辑的可能性就会降低。千千万万个人,心中有千千万万个哈姆雷特,说的就是这个意思。

拆分模拟作品

因此,人们在阅读信息时是通过一个层次模型来实现阅读理解的。

人们对文章的理解,是一个至高无上的过程。理解能力不强的人往往只能读懂文字的表层含义,而高手却能抓住文章的深层价值,这就是那些有“见微知著”能力的人所能做到的。具有较高认知能力的人,往往能够抓住多篇文章最底层的核心价值,串联起来,形成自己的理论体系。这种人我们称之为具有战略性思考能力的人。

回顾一下我们将要讨论的写作这个问题,如果我们在介绍阅读者获取信息的原则时,这个问题本身就变得非常简单了。无论人类还是机器都在写作,从理论上说,仅仅是将阅读过程进行了逆向工程。正如上面所示,写作的过程是由下而上推动的。

一位作家在写一篇文章时,首先要收集数据,对这些数据进行筛选和提炼,然后再进行分析,把有用的数据组合起来备用;有些基本的数据资料甚至已经初步形成简单的语义层,用句子或词组的形式来表达;接下来作者要做的就是构思文章的逻辑,一篇好的文章一定是有条理,有逻辑的,这一层就是文章要向读者传达的核心思想。在此逻辑层框架构建完成后,再用文字去做语言层的表达,已不再影响到信息的传递。在上述示例中,尽管文字的顺序是混乱的,但并没有影响读者的理解,这正是信息架构的核心原则。

火龙果智能写作引领中国人工智能写作

通过这样一套理论体系,我们可以在坚实的理论基础上构建出商业化的智能写作产品。在文章创作过程中,作者的工作量呈金字塔型结构。下层越混乱,此时就越需要花费大量精力来进行数据收集和分类。而且这些工作成果最终能够被文章吸收采纳的可能不到10%,有90%的前期工作要做但最终无法体现成果,而且在当前的生产关系下,那90%的前期工作是无法被其他作者有效利用的。因此,写作效率并没有实质性的提高。下列图表可说明创作工作成果的转换率。

当前人工智能技术在这一信息架构的不同层次上的应用,已经能够在产业化方面发挥巨大的价值。现在能够实现这种写作逻辑产业化落地的产品只有香侬科技信息技术有限公司的 火龙果智能写作。

智能写作通过庞大的数据处理引擎,以超过人力数十万倍的工作量来收集资料,再以数万倍的人力处理能力来整理、分类、标注数据。这就是 NLP和深度学习发挥它最大效益促进行业效率的环节。而逻辑层则是作者以预制逻辑的方式固定常用的写作逻辑,以便在随后的写作过程中不必反复构建复杂的文章逻辑框架。最终以编辑器为载体,有效地整合了机器生成的底稿和人的思想,辅以机器修改、查错、查重等大数据智能检测功能。这种内容生产逻辑完全符合信息阅读的反向过程,文章输出具有极大的过程可控性和传播价值。所以智能写作落地对推动中国人工智能写作产业化进程具有重要意义。


火龙果智能写作是全球第一款中英双语语法检查校对产品,运用火龙果智能写作技术进行错别字文本校对,除错别字校对以外,还可以对语法、标点等进行校对。

火龙果智能写作官网https://www.mypitaya.com

积极拥抱变化,才能更好的应对这个时代


错别字校对-一款专业检测错别字的工具