您现在的位置：首页> 研究主题> 文本生成

文本生成

文本生成的相关文献在1989年到2023年内共计657篇，主要集中在自动化技术、计算机技术、中国文学、语言学等领域，其中期刊论文126篇、会议论文6篇、专利文献132091篇；相关期刊91种，包括天府新论、现代图书情报技术、信息网络安全等；相关会议6种，包括全国第七届计算语言学联合学术会议、第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016）、辽宁省通信学会2019年度学术年会等；文本生成的相关文献由1514位作者贡献，包括李磊、刘挺、冯骁骋等。

文本生成—发文量

期刊论文>

论文：126篇占比：0.10%

会议论文>

论文：6篇占比：0.00%

专利文献>

论文：132091篇占比：99.90%

总计：132223篇

文本生成—发文趋势图

文本生成
-研究学者

李磊
刘挺
冯骁骋
李浩然
秦兵
王鹏
刘鑫
周浩
徐亮
王健宗
王少军
肖欣延
胡志鹏
范长杰
金戈
黄民烈
刘丽
刘家辰
刘志强
夏鲁瑞
庄伯金
张占月
李森
林郁
胡国平
邓黎明
陈刚
陈雪旗
乐小虬
刘俊华
刘庆峰
刘康
刘晓江
吴华
吴蔓
周明
张林箭
张聪
方昕
李丕绩
李健
李怀松
王影
王明轩
王芝燕
窦晓妍
罗俊海
罗雨
罗飞
肖春霞

文本生成
-相关主题

文本生成
-相关期刊

文本生成
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2023
(2)
2022
(203)
2021
(172)
2020
(29)
2019
(20)
2018
(10)
2017
(6)
2016
(3)
2015
(4)
2014
(2)
2013
(3)
2012
(3)
2009
(1)
2006
(1)
2002
(1)
1998
(1)
1997
(3)
1995
(2)
1990
(1)
1989
(1)

期刊

收录数据库

作者

李磊
(11)
刘挺
(9)
冯骁骋
(8)
李浩然
(8)
秦兵
(8)
王鹏
(7)
刘鑫
(6)
周浩
(6)
徐亮
(6)
王健宗
(6)
王少军
(6)
肖欣延
(6)
胡志鹏
(6)
范长杰
(6)
金戈
(6)
黄民烈
(6)
刘丽
(5)
刘家辰
(5)
刘志强
(5)
夏鲁瑞
(5)
庄伯金
(5)
张占月
(5)
李森
(5)
林郁
(5)
胡国平
(5)
邓黎明
(5)
陈刚
(5)
陈雪旗
(5)
乐小虬
(4)
刘俊华
(4)
刘庆峰
(4)
刘康
(4)
刘晓江
(4)
吴华
(4)
吴蔓
(4)
周明
(4)
张林箭
(4)
张聪
(4)
方昕
(4)
李丕绩
(4)
李健
(4)
李怀松
(4)
王影
(4)
王明轩
(4)
王芝燕
(4)
窦晓妍
(4)
罗俊海
(4)
罗雨
(4)
罗飞
(4)
肖春霞
(4)

关键词

申请/权力人

;

1. HLMGAN:分层学习的多奖励文本生成对抗网络
- 薛琪；孟祥福；张峰；张霄雁；朱金侠；朱尧；王丹丹
- 摘要：文本生成是自然语言处理的一项重要任务.针对生成的文本大多缺乏多样性,且当生成文本过长时,文本生成的质量会有明显下降的问题,提出了一种采用Sentences and Words(SW)奖励机制的传递向量文本生成对抗网络.首先,为生成器提出了层次结构设计,包括传递特征向量训练模块和生成向量训练模块,同时传递判别模型中真实文本特征向量给生成器的传递特征向量训练模块,由此来提高长文本生成的准确率,生成向量训练模块接收其生成词序列;然后,在训练过程中,使用关系存储核心代替传统的长短期记忆循环神经网络模型作为生成器,提高了模型的表达能力和捕获信息的能力;最后,采用SW奖励机制提高文本生成的多样性.实验结果表明,分层学习的多奖励文本生成对抗网络(Generation Adversarial Network Based on Hierarchical Learning with Multi-reward Text,HLMGAN)模型在合成数据负对数似然度和双语互译质量评估辅助工具指标中均有所提升.
2. 高考语文议论文自动生成技术概述
- 冯骁骋；秦兵；刘挺
- 摘要：议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,议论文文章长度更长,且要求具有明确的核心论点和清晰的论证结构。上述特点使得现有的生成模型难以直接迁移。本文基于已有自然语言生成相关技术从抽取和生成两个维度分别论述了面向高考议论文的自动生成模型。与已有方法不同的是,两个系统都充分结合议论文自身结构特点设计了不同的优化方案,抽取式模型采用词到句、句到段的多步生成方式,可解释性和可控性更强;生成式方法在学习篇章结构的基础上端到端地逐段生成作文样例,行文更加流畅。最终本文还展示了相关方案的生成样例,并针对当前不足对议论文自动生成任务的未来发展方向进行展望。
3. 结构化数据到数值型分析文本生成模型
- 杨子聪；焦文彬；刘晓东；汪洋
- 摘要：基于结构化数据的文本生成是自然语言生成领域重要的研究方向,其可以将传感器采集或计算机统计分析得到的结构化数据转化为适宜人阅读理解的自然语言文本,因此也成为了实现报告自动生成的重要技术.研究基于结构化数据到文本生成的模型为报告中的各类数值型数据生成分析性文本具有重要的实际应用价值.本文针对数值型数据的特点,提出了一种融合coarse-to-fine aligner选择机制和linked-based attention注意力机制的编码器-解码器文本生成模型,考虑了生成数值型数据的分析性文本过程中内容过度分散、无法突出描述的问题,另外也将数值型数据具体所属的域进行了关系建模,以提高生成文本中语序的正确性.实验结果表明,本文提出的融合两种机制的模型,比仅使用传统的基于内容的注意力机制和在前者基础上增加使用linked-based attention注意力机制的模型,以及基于GPT2的模型在指标上都具有更好的表现,证明了本文提出的模型在生成数值型数据的分析性文本任务中具有一定的效果.
4. 基于实体注意力的生成式摘要算法
- 李萧洋；周安民
- 摘要：随着信息过载问题日益严重,对新闻长文本进行自动摘要,不仅可以帮助读者实现快速精准地浏览,也能够减少撰写摘要所需要的人力物力。现有的自动文摘算法主要分为抽取式和生成式两大类,前者注重从原文抽取关键句子,后者倾向于模仿人类总结摘要的过程对原文进行理解和压缩。然而现有的算法中,面向中文长文本摘要的研究较少,并且大多数算法都聚焦于提升生成摘要的可读性而忽略了事实准确性。针对以上问题,本文提出了一种基于实体注意力的生成式摘要算法,将实体注意力与时序注意力相结合,并将实体信息引入了损失函数。经实验,所提出的模型在中文长文本数据集CLTS上取得了45.86的ROUGE-L得分,和其他模型相比能生成具有更高可读性的摘要。
5. 基于解耦-检索-生成的图像风格化描述生成模型
- 陈章辉；熊贇
- 摘要：图像描述旨在为输入的图像生成描述文本以准确描述图像内容,而图像的风格化描述在此基础上引入了对语言风格的考虑,恰当表达出特定的语言风格,使得模型生成的描述文本更具多样性。为了更好地在生成的描述文本中融入风格元素,提出了基于解耦-检索-生成的图像风格化描述生成模型。该模型首先将风格化语料中的句子拆分成内容词汇和风格词汇,并构建了一个内容-风格词汇的记忆模块;然后根据图像的事实描述从记忆模块中检索出与之相匹配的风格词汇;最后将图像的事实描述和检索出的风格词汇输入语言模型中生成风格描述。在真实数据集上的实验结果表明,相比已有方法,所提模型在各项评价指标上都有着更好的性能表现,可以在描述图像内容的同时表达出特定的风格。
6. 基于关键词主题控制的文本生成技术研究
- 李思雨；程芃森；刘嘉勇
- 摘要：深度学习技术的发展使得基于深度神经网络的方法成为自然语言处理(Natural Language Processing,NLP)领域的一种新解决思路。虽然神经网络技术能够有效提升生成文本的质量,但是生成文本的内容很容易偏离作者原本要表达的语义。笔者按照人们的写作习惯,即先构思出各部分的主题再进行写作的方式,提出基于交叉项编码的关键词主题控制文本生成模型。与其他模型相比,该模型生成的句子不仅在双语互译质量评估(Bilingual Evaluation Understudy,BLEU)中的得分更高,Correlation值也要高于其他模型。
7. 超大规模多模态预训练模型M6的关键技术及产业应用
- 林俊旸；周畅；杨红霞
- 摘要：阿里巴巴达摩院研发了超大规模中文多模态预训练模型M6,并陆续推出了百亿、千亿、万亿和十万亿参数规模的预训练模型,实现了高效低碳的预训练,推动超大规模预训练模型的产业化应用。同时,推出了M6服务化平台,帮助广大用户快速使用大模型。未来,大模型在产业领域的应用将更加丰富。
8. 语言模型攻击性的自动评价方法
- 侯丹阳；庞亮；丁汉星；兰艳艳；程学旗
- 摘要：基于大规模语料训练的语言模型,在文本生成任务上取得了突出性能表现。然而研究发现,这类语言模型在受到扰动时可能会产生攻击性的文本。这种不确定的攻击性给语言模型的研究和实际使用带来了困难,为了避免风险,研究人员不得不选择不公开论文的语言模型。因此,如何自动评价语言模型的攻击性成为一项亟待解决的问题。针对该问题,该文提出了一种语言模型攻击性的自动评估方法。它分为诱导和评估两个阶段。在诱导阶段,基于即插即用可控文本生成技术,利用训练好的文本分类模型提供的梯度方向更新语言模型的激活层参数,增加生成的文本具有攻击性的可能性。在评估阶段,利用训练好的文本分类模型的判别能力,估计诱导产生的攻击性文本的占比,用以评估语言模型的攻击性。实验评估了不同设置下的预训练模型的攻击性水平,结果表明该方法能够自动且有效地评估语言模型的攻击性,并进一步分析了语言模型的攻击性与模型参数规模、训练语料以及前置单词之间的关系。
9. 基于RoBerta-BiLstm-Attention模型的机器生成新闻检测
- 徐宇；杨频
- 摘要：随着文本生成算法的快速发展,生成语句通顺、逻辑性强的新闻已经成为可能。但是人类检测机器生成新闻的能力是有限的,因此本文提出了RoBerta-BiLstm-Attention的检测框架,以实现机器生成新闻的自动检测。首先使用RoBerta的词嵌入表示新闻文本,RoBerta能很好的捕捉新闻的语义信息,提高词嵌入关联上下文的质量。然后将新闻的嵌入表示输入到BiLstm-Attention神经网络中。通过微调GPT2构建的机器生成新闻数据集进行了实验测试。实验表明本文提出的方法在检测解码策略是核采样和序列长度为125的机器生成新闻时,相比于目前最好的方法F1值和准确率都提升了近2%,召回率提升了5.56%。在检测解码策略是topK和序列长度为125的机器生成新闻时,无论是准确率和F1值都比目前最好的方法提高了4%左右。
10. 自然语言处理技术在气象服务文本的应用综述
- 林孔杰；许艺雯
- 摘要：气象服务文本是气象服务产品的主要形式。使用自然语言技术自动生成气象服务文本将有效提高气象服务水平。文章首先总结了自然语言处理技术在国内外的研究现状,以及其在气象服务文本的应用,其次梳理了在气象服务领域下自然语言处理技术生成文本的基本技术路线,同时对其未来的应用发展提出想法,为今后的相关工作做参考。

1. 基于生成式对抗网络的文本生成研究
- 代威；陈博；熊振
- 《辽宁省通信学会2019年度学术年会》 | 2019年
- 摘要：生成式对抗网络的诞生,使得神经网络和机器学习领域的研究有了许多突破性进展.语言模型的离散空间输出形式,限制了基于梯度的生成式对抗网络在自然语言处理问题上的能力.WGAN作为生成式对抗网络的变体,成功将GANs的应用数据空间由连续数据空间推广至离散数据空间.本文在WGAN的基础上,分析总结了神经网络研究在文本生成任务中存在的问题,结合生成式对抗网络的性质和优点,提出了无监督的字符级文本生成方法LabelGANs.它是在WGAN的基础上将生成式对抗网络应用于离散文本序列生成的创新应用,结合噪声数据空间分布特点和约束方法,为生成式对抗网络在文本任务的研究提供了参考.
2. 寻找英雄"王二小"——关于《歌唱二小放牛郎》的文本生成与媒介传播
- 孙乃琨
- 《2015年中国艺术人类学国际学术研讨会》 | 2015年
- 摘要：对抗战民歌民谣的民俗学研究一方面多从类与量的整体上来研究,另一方面多从民歌本身的语言学及音乐学角度着手,做文本研究.又因为抗战民歌民谣创作时间持续长,作者多作品量大,地域分布广,影响范围大,题材内容社会性强,丰富深刻并且文学形式灵活多样,而造成对抗战民歌民谣研究的困难与空缺,这也与民俗学之前研究方法相关——多关注民俗事象起源与呈现传统.可随着民俗学研究当代化的转向,本文试图从民歌民谣本体与类中跳脱出来,分析《歌唱二小放牛郎》歌谣与"王二小"民间故事的关系,探讨《歌唱二小放牛郎》的文本生成与媒介传播问题,打开新的思考传统历史的一扇门.
3. 诊室"第三者"正在引发一场革命
- 刘文生
- 《第八届中国市县医院“云”论坛》 | 2020年
- 摘要：传统的诊疗场景正在发生变化,在门诊诊室内,除医患双方外,可能还会有一个"第三者".不是医生助手,也不是患者家属,而是一个类似平板的智能机器人.依托声学处理、语音识别、知识图谱、对话理解、文本生成等技术,它可以替医生准确书写出一份完整的电子病历.它就是左手医生推出的最新AI产品——诊室听译机器人.
4. 文本生成与理解的语言学模拟——伊戈尔·梅里丘克《意思←→文本》模型评介
- 易绵竹；南振兴；李绍哲；薛恩奎
- 《全国第七届计算语言学联合学术会议》 | 2003年
- 摘要： 20世纪60年代中期,由前苏联学者伊戈尔·梅里丘克等创立的《意思←→文本》模型是一种研究意思及其表达形式(文本)之间双向对应关系的语言学理论,其目标是模拟人的语言能力—文本的生成与理解机制,其基本思想成为随后兴起的莫斯科语义学派的方法论纲领.近年来,该模型受到国际学术界的广泛关注,并成功地应用于词典编纂和机器翻译设计.在本文我们将着重介绍该模型的理论框架及其主要构件,这对于我国计算语言学的基础研究必有助益.
5. 基于Transformer的AMR-to-Text生成
- Jie Zhu；朱杰； Junhui Li；李军辉； Longhua Qian；钱龙华
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》 | 2018年
- 摘要：抽象语义表示到文本(AMR-to-text)生成的任务是给定AMR图,生成相同意义表示的文本.可以把此任务当成一个从源端AMR图到目标端句子的翻译任务.然而,传统的序列到序列(seq2seq,简称S2S)的方法,使用循环递归网络进行编码,并不能很好的解决长短期依赖的问题.当前最好的性能是图到序列(graph2seq,简称G2S)的模型,使用了图模型直接对AMR图结构进行编码,但对于非直接相连的节点依然会损失大量的结构信息.针对上述问题,基于seq2seq框架,提出了一种直接而有效的AMR-to-text生成方法.在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(简称BPE)和共享词表的方法联合来对未登录词(简称OOV)的问题进行处理.在现有的两份英文标准数据集上,实验结果都取得了显著的提升,达到了新的最高性能.
6. 基于Transformer的AMR-to-Text生成
- Jie Zhu；朱杰； Junhui Li；李军辉； Longhua Qian；钱龙华
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》 | 2018年
- 摘要：抽象语义表示到文本(AMR-to-text)生成的任务是给定AMR图,生成相同意义表示的文本.可以把此任务当成一个从源端AMR图到目标端句子的翻译任务.然而,传统的序列到序列(seq2seq,简称S2S)的方法,使用循环递归网络进行编码,并不能很好的解决长短期依赖的问题.当前最好的性能是图到序列(graph2seq,简称G2S)的模型,使用了图模型直接对AMR图结构进行编码,但对于非直接相连的节点依然会损失大量的结构信息.针对上述问题,基于seq2seq框架,提出了一种直接而有效的AMR-to-text生成方法.在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(简称BPE)和共享词表的方法联合来对未登录词(简称OOV)的问题进行处理.在现有的两份英文标准数据集上,实验结果都取得了显著的提升,达到了新的最高性能.
7. 基于Transformer的AMR-to-Text生成
- Jie Zhu；朱杰； Junhui Li；李军辉； Longhua Qian；钱龙华
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》 | 2018年
- 摘要：抽象语义表示到文本(AMR-to-text)生成的任务是给定AMR图,生成相同意义表示的文本.可以把此任务当成一个从源端AMR图到目标端句子的翻译任务.然而,传统的序列到序列(seq2seq,简称S2S)的方法,使用循环递归网络进行编码,并不能很好的解决长短期依赖的问题.当前最好的性能是图到序列(graph2seq,简称G2S)的模型,使用了图模型直接对AMR图结构进行编码,但对于非直接相连的节点依然会损失大量的结构信息.针对上述问题,基于seq2seq框架,提出了一种直接而有效的AMR-to-text生成方法.在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(简称BPE)和共享词表的方法联合来对未登录词(简称OOV)的问题进行处理.在现有的两份英文标准数据集上,实验结果都取得了显著的提升,达到了新的最高性能.
8. 基于Transformer的AMR-to-Text生成
- Jie Zhu；朱杰； Junhui Li；李军辉； Longhua Qian；钱龙华
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》 | 2018年
- 摘要：抽象语义表示到文本(AMR-to-text)生成的任务是给定AMR图,生成相同意义表示的文本.可以把此任务当成一个从源端AMR图到目标端句子的翻译任务.然而,传统的序列到序列(seq2seq,简称S2S)的方法,使用循环递归网络进行编码,并不能很好的解决长短期依赖的问题.当前最好的性能是图到序列(graph2seq,简称G2S)的模型,使用了图模型直接对AMR图结构进行编码,但对于非直接相连的节点依然会损失大量的结构信息.针对上述问题,基于seq2seq框架,提出了一种直接而有效的AMR-to-text生成方法.在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(简称BPE)和共享词表的方法联合来对未登录词(简称OOV)的问题进行处理.在现有的两份英文标准数据集上,实验结果都取得了显著的提升,达到了新的最高性能.
9. 基于Transformer的AMR-to-Text生成
- Jie Zhu；朱杰； Junhui Li；李军辉； Longhua Qian；钱龙华
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》 | 2018年
- 摘要：抽象语义表示到文本(AMR-to-text)生成的任务是给定AMR图,生成相同意义表示的文本.可以把此任务当成一个从源端AMR图到目标端句子的翻译任务.然而,传统的序列到序列(seq2seq,简称S2S)的方法,使用循环递归网络进行编码,并不能很好的解决长短期依赖的问题.当前最好的性能是图到序列(graph2seq,简称G2S)的模型,使用了图模型直接对AMR图结构进行编码,但对于非直接相连的节点依然会损失大量的结构信息.针对上述问题,基于seq2seq框架,提出了一种直接而有效的AMR-to-text生成方法.在这项工作中,引入了当前最优的seq2seq模型Transformer作为基准模型,并且使用字节对编码(简称BPE)和共享词表的方法联合来对未登录词(简称OOV)的问题进行处理.在现有的两份英文标准数据集上,实验结果都取得了显著的提升,达到了新的最高性能.
10. 面向阅读理解复杂问题的句子融合
- TAN Hongye；谭红叶； ZHAO Honghong；赵红红； Li Ru；李茹
- 《第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016）》
- 摘要：阅读理解的研究是目前NLP领域的一个研究热点.阅读理解中好的复杂问题解答策略不仅要进行答案句的抽取,还要对答案句进行融合、生成相应的答案,但是目前的研究大多集中在前者.本文针对复杂问题解答中的句子融合进行研究,提出了一种兼顾句子重要信息、问题关联度与句子流畅度的句子融合方法.该方法的主要思想为:首先,基于句子拆分和词重要度选择待融合部分;然后,基于词对齐进行句子相同信息的合并;最后,利用基于依存关系、二元语言模型及词重要度的整数线性规划优化生成句子.在历年高考阅读理解数据集上的测试结果表明,该方法取得了82.62％的F值,同时更好地保证了结果的可读性及信息量.

1. 无条件文本生成方法、文本生成装置及存储介质
- 乐山师范学院
- 公开公告日期：2022.05.20
- 摘要：本发明公开了一种无条件文本生成方法，包括以下步骤：控制生成器生成文本数据；通过第一鉴别器计算所述文本数据中每一子文本的第一文本得分；根据每一所述子文本的所述第一文本得分确定目标子文本，并将所述目标子文本作为文本生成结果。本发明还公开了一种文本生成装置及计算机可读存储介质，达成了在保障文本生成质量的同时，提高文本生成结果的多样性的效果。
2. 文本生成模型训练方法和系统、文本生成方法及存储介质
- 北京澜舟科技有限公司
- 公开公告日期：2022.11.15
- 摘要：本发明涉及文本生成技术领域，特别涉及一种文本生成模型训练方法、文本生成方法及系统，包括以下步骤：获取源文章，基于源文章得到句子序列和话题序列；基于句子序列和话题序列分别得到对应的句子隐变量序列和话题隐变量序列；获取源文章的标题，分别将源文章的标题、句子隐变量序列和话题隐变量序列拼接输入第一预设模型进行训练，得到训练好的文本生成模型，句子级别的隐变量序列学习源文章中句子间的依赖关系，话题级别的隐变量序列学习源文章中话题的自然转移关系，通过将上述隐变量序列和源文章的标题输入第一预设模型进行训练，通过训练得到的文本生成模型生成的文本全局一致性和连贯性更强，解决了现有的文本连贯性较差的问题。
3. 文本生成方法、文本生成模型、文本生成设备及存储介质
- 上海流利说信息技术有限公司
- 公开公告日期：2022-03-25
- 摘要：本说明书实施例提供了文本生成方法、文本生成模型、文本生成设备及存储介质，其中，文本生成方法包括：获取输入数据；其中：所述输入数据包括：字段信息；所述字段信息适于表征待生成文本所要包含的字段；所述字段信息包括至少一个字符；对所述输入数据进行特征编码操作，得到特征编码数据；基于所述特征编码数据，执行数据解码操作，生成与所述输入数据匹配的文本。采用上述方案，能够增加文本表达形式的多样性。
4. 训练生成文本生成模型的方法及文本生成方法
- 海南车智易通信息技术有限公司
- 公开公告日期：2022-05-13
- 摘要：本公开公开了训练生成文本生成模型的方法和文本生成方法。其中，训练生成文本生成模型的方法包括步骤：收集多个描述对象的文本，并生成文本中各段落对应的第一标签和第二标签，作为训练数据集；从训练数据集中选取出第一标签和第二标签均相同的第一数量个段落；从第一数量个段落中选取第二数量个句子，并对所选取的句子进行随机排序，作为第一子集；从第一数量个段落中选取第三数量个句子，作为第二子集；以及利用第一子集和所述第二子集，对初始的文本生成模型进行训练，得到训练好的文本生成模型，用来生成新的描述对象的文本。
5. 文本生成模型的生成方法、文本生成方法及其装置
- 北京有竹居网络技术有限公司
- 公开公告日期：2022-11-25
- 摘要：本公开的实施例提供了文本生成模型的生成方法、文本生成方法及其装置。该方法可以包括确定文本样本数据中的文本单元的节奏信息。该方法还可以包括确定所述文本样本数据中的文本单元的格式信息。此外，该方法可以进一步包括至少基于所述文本样本数据、所述节奏信息和所述格式信息，训练所述文本生成模型。根据本公开的训练方式得到的文本生成模型可以生成符合相关节奏信息的文本，并且减少了对歌词文本数据的人工标注需求。
6. 文本生成模型生成方法、文本生成方法、装置及设备
- 北京有竹居网络技术有限公司
- 公开公告日期：2021-04-09
- 摘要：本公开实施例公开了一种文本生成模型生成方法、文本生成方法、装置及设备，其中，文本生成模型生成方法包括：利用多个语种的文本样本以及多个语种间的平行语料训练初始化语言编码器；根据初始化语言编码器的参数初始化文本生成模型，得到初始文本生成模型；基于文本样本、平行语料以及由文本样本构造生成的关键词与目标文本样本对，对初始文本生成模型进行范式训练；通过关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，得到最终的文本生成模型。本公开实施例解决了非汉语语种的文本样本数量少，不能充分利用多语种的丰富文本资源生成相关的目标文本的问题，实现了根据不同语种的关键字生成对应语种的文案。
7. 一种文本生成模型及文本生成方法
- 车智互联(北京)科技有限公司
- 公开公告日期：2022-05-10
- 摘要：本公开公开了一种文本生成模型及文本生成方法。其中，文本生成模型，包括：编码模块和解码模块。编码模块适于对输入数据进行处理，以提取出指示其语义特征的第一向量；解码模块适于对第一向量进行处理，以生成至少一个句向量，来组成长文本。进一步地，解码模块又包括：子句内容规划单元，与编码模块耦接，适于接收编码模块的输出，对编码模块输出的第一向量进行处理，以确定出至少一个指示子句语义特征的第二向量；单词生成单元，与子句内容规划单元耦接，适于对第二向量进行处理，生成多个单词对应的词向量，以及，利用词向量，组合成至少一个句向量，来生成长文本。
8. 文本生成模型训练方法和系统、文本生成方法及存储介质
- 北京澜舟科技有限公司
- 公开公告日期：2022-09-02
- 摘要：本发明涉及文本生成技术领域，特别涉及一种文本生成模型训练方法、文本生成方法及系统，包括以下步骤：获取源文章，基于源文章得到句子序列和话题序列；基于句子序列和话题序列分别得到对应的句子隐变量序列和话题隐变量序列；获取源文章的标题，分别将源文章的标题、句子隐变量序列和话题隐变量序列拼接输入第一预设模型进行训练，得到训练好的文本生成模型，句子级别的隐变量序列学习源文章中句子间的依赖关系，话题级别的隐变量序列学习源文章中话题的自然转移关系，通过将上述隐变量序列和源文章的标题输入第一预设模型进行训练，通过训练得到的文本生成模型生成的文本全局一致性和连贯性更强，解决了现有的文本连贯性较差的问题。
9. 文本生成模型训练方法和装置、文本生成方法和装置
- 北京百度网讯科技有限公司
- 公开公告日期：2022-09-23
- 摘要：本公开提供了一种文本生成模型训练方法和装置，涉及人工智能技术领域，具体涉及深度学习、自然语言处理等技术领域，可应用于OCR等场景。具体实现方案为：从预先构建的文本样本集中选取文本样本；将文本样本输入预先构建的文本生成网络，得到文本生成网络输出的预测结果；基于预测结果，分别计算字粒度的语义相关损失和句粒度的匹配程度损失，语义相关损失用于表征预测结果与文本样本的真值在字级别的相似程度，匹配程度损失用于表征预设结果与文本样本的真值在句级别的匹配程度；计算文本生成网络的损失；基于文本生成网络的损失，训练得到对应文本生成网络的文本生成模型。该实施方式提高了模型的精度和多样性。
10. 一种文本生成方法、文本生成装置和可读存储介质
- 北京健康之家科技有限公司
- 公开公告日期：2022-11-29
- 摘要：本申请提供了一种文本生成方法、文本生成装置和可读存储介质，涉及信息处理技术领域。该方法包括：获取待处理文本，并将待处理文本划分为多个语句，以及在多个语句中，确定不包含关键信息的目标语句，关键信息为表示待处理文本的关键语义的信息；将目标语句输入至相似文本生成模型，得到目标语句的至少一个第一相似句；基于语句相似度，在预设文本知识库中获取目标语句的至少一个第二相似句；将目标语句中的分词进行近义词替换，生成目标语句的至少一个第三相似句；在至少一个第一相似句、至少一个第二相似句以及至少一个第三相似句中确定目标相似句，并利用目标相似句替换目标语句，生成待处理文本的目标文本。

文本生成

文本生成—发文量

文本生成—发文趋势图

文本生成-研究学者

文本生成-相关主题

文本生成-相关期刊

文本生成-相关会议

文本生成
-研究学者

文本生成
-相关主题

文本生成
-相关期刊

文本生成
-相关会议