关于人工智能:AI文本创作在百度App发文的实践

作者 | 内容生态端团队

导读

大语言模型（LLM）指蕴含数百亿（或更多）参数的语言模型，这些模型通常在大规模数据集上进行训练，以进步其性能和泛化能力。在内容创作工具接入文心一言AI能力后，能够为用户提供更加智能化、个性化的服务，帮忙作者升高创作难度和创作老本、晋升创作效率，更好地创作本人的作品。本文简述了基于文心一言大模型，落地AI文本创作的根本流程，也是内容创作与AI联合的初步尝试，随着生成式AI翻新利用的继续推动，将陆续公布基于图片和视频的更多特色玩法，敬请期待！

全文4732字，预计浏览工夫12分钟。

01 背景

随着科技的飞速发展，人工智能畛域的大模型技术也日益引人注目。在大模型的广泛应用中，咱们看到了其在各种场景下的微小后劲和价值。大模型技术的倒退不仅推动了各个行业的翻新和改革，也正在扭转着咱们对人工智能的了解和预期。

大语言模型（LLM）指蕴含数百亿（或更多）参数的语言模型。这些模型通常通过在大规模数据集上进行训练，以进步其性能和泛化能力。大型模型的呈现受害于计算能力的晋升和数据的可获得性减少，使得钻研人员可能构建更简单、更弱小的模型来解决各种事实世界的问题。

常见的大模型比方OpenAi的ChatGPT、百度的文心一言，能够更好的了解和生成自然语言。通过对大量文本数据进行训练，它们可能捕捉到语言中的语法、语义和上下文信息。这使得它们在答复问题、提供解释、生成文本和进行对话时更加精确和晦涩。并且一经推出，便引起了社会的宽泛关注。大语言模型的技术倒退对整个AI社区产生了重要影响，也彻底改变咱们开发和应用AI算法的形式。

在百度App动静发文接入文心一言AI能力后，能够为用户提供更加智能化、个性化的服务，帮忙作者升高创作难度和创作老本、晋升创作效率，更好地创作本人的内容。

02 我的项目介绍

下图展现了在百度App – 公布动静中，AI文本创作的示例。

内容输出

AI写诗创作中

AI写诗创作实现

2.1 整体架构

百度App动静公布器的AI创作是基于百度文心一言的辅助创作性能，能够依据用户的输出续写、改写，以及一些提醒词去智能生成文案。

整体业务分为三层：

1、最顶层为业务层，蕴含端/H5/小程序等实现的手百AI辅助创作、AI笔记等；

2、两头为策略层，提供prompt模版配置能力、输入输出策略控制能力、配置信息管理能力等；

3、底层为文心一言、风控服务等根底服务。

2.2 全流程

业务层调用百家号创作大脑服务，获取账号权限、性能权限、prompt模版配置等信息，依据权限展现性能类型，如：日常动静、AI写诗、游览出行等；用户输出文案，拜访创作大脑文案生成接口，创作大脑校验账号、权限、模版信息，权限校验通过之后拜访风控词表，对输出信息进行风控治理；最终创作大脑携带prompt和用户输出问题拜访一言服务，获取通过AI润色的文案。

03 关键技术

3.1 Prompt

Prompt（提醒词），是给一个大型机器学习模型输出的指令或问题，以疏导它生成相应的答复或输入。它通常是一个文本字符串，用于形容所需的信息或工作，并向模型提供上下文和领导，以产生冀望的回应。比方在文心一言大模型根底下进行对话、文本生成或其余工作，Prompt起到了疏导模型生成输入的作用。良好设计的Prompt能够帮忙模型更精确地了解用户的用意，并生成相干和有用的答复，真正有产业/社会价值。一个好的、优质的prompt须要充分发挥咱们的了解和想象力，并调动大模型的能力，从而晋升咱们的工作效率。

3.1.1 Prompt根底定义

Prompt（提醒词），简而言之就是驱动大模型进行表白的文本形容。

Prompt 公式 = 工作 + 生成主体 + 细节(可选) + 模式(可选)。

工作：心愿模型实现的工作类型，如写诗

主体：生成对象，如写夏日的诗

细节：是否蕴含表情等细节输入

模式：排版、内容格调

通常优质的Prompt满足以下三点:

表达清晰：通俗易懂，表白简洁清晰，做到不仅能够让模型生成出好的内容，普通人也能够明确其中的含意。

通用型强：在同类工作上，更换主体词后仍有不错成果。

生成稳固：雷同提醒词状况下，屡次生成的内容足够稳固。

优质的Prompt + 大模型 = 优质内容。

3.1.2 Prompt配置

百度App动静公布器提供多款AI创作性能，每个能力会内置一个形容，不便用户进行发问，并且失去满足冀望的文案，咱们提供如下几个分类：

全文续写：要求大模型应用简洁的语言，为用户续写

全文改写：要求大模型是一位文章改写助手，批改语病并润色用户的内容

日常动静：要求大模型以用户输出为主题，写一段简短的日常动静

AI写诗：要求大模型为用户输出的主题创作简短的诗歌

好物举荐：要求大模型采纳活跃的语言格调，写一篇好物举荐文案

游览出行：要求大模型写一篇游览出行的随笔，帮忙用户表白见闻

3.2 危险管制

在Prompt中减少防御性指令，避免有人歹意Prompt注入，操纵提醒词，诱导模型返回非预期的后果，因而咱们在整个生产流程会经验如下防范措施：

输出内容返回内容接入内容风控能力，过风控词表；
一言返回清屏以及命中平安词表的状况下，革除用户输出内容；
记录用户信息，依据输入输出内容危险状况对高风险账号进行封禁；
定期巡逻历史记录进行剖析。

3.3 SSE协定

为了进步聊天的流畅性和响应速度，文心一言采纳了SSE作为服务端推送技术。它容许服务端向客户端发送事件，绝对于WebSockets或长、短轮询技术，SSE提供了更简略的形式来实现推送。

响应头需增加以下内容：

Content-Type: text/event-stream; charset=utf-8
Cache-Control: no-cache, no-transform
Connection: keep-alive
X-Accel-Buffering: no

客户端通过HTTP GET申请建设与服务器的连贯，并指定接管text/event-stream类型的数据，服务器在收到申请后，不立刻返回响应，而是放弃连贯关上，并依据用户的输出生成回复，服务器在生成回复后，将回复作为一个事件发送给客户端，并放弃连贯关上，期待下一个输出，客户端在收到事件后，解析事件中的数据，并显示在聊天界面上，客户端和服务器之间能够通过同一个连贯继续替换数据，直到客户端敞开连贯或者服务器出现异常。

相比拟于其余计划，SSE应用更简略，不须要增加任何新组件，只需应用现有的后端语言和框架即可。SSE齐全复用现有的HTTP协定，因而能够间接运行于现有的代理服务器和认证技术。SSE在浏览器端提供了原生的EventSource对象，能够不便地监听和解决服务器发送的事件。SSE反对断线重连和音讯追踪的性能，能够保证数据的完整性和一致性。

3.4 突变流式展现组件

客户端会依据server返回的数据，进行流式展现。分成上面几个阶段：初始期待、展现中、展现完结，几个状态转换中，对款式的展现也存在不同的变换。

初始期待：须要展现光标并进行光标闪动。

展现中：要求一一展现文案且光标闪动。

展现完结：须要展现残缺文案以及暗藏光标。

3.4.1 自定义TextView

以Android为例，首先初始化期待和展现中两个状态，看起来很像Android的EditText组件，然而EditText组件须要解决光标展现、焦点获取、键盘弹出、屏蔽编辑等组合事件，性能上显得不纯正，还可能存在适配问题。思考到这里决定通过继承TextView自定义View来实现。

咱们只须要思考3个点，一是逐字显示，二是文字突变，三是光标。

逐字显示

咱们通过自定义Handler定时器对文字进行一直截取后展现即可。

文字突变

参考罕用的ForegroundColorSpan源码会发现，ForegroundColorSpan是通过继承CharacterStyle并实现UpdateAppearance，最终通过重写对应的updateDrawState办法来实现的文字色彩的变更。同样咱们也能够通过设置画笔为渐变色并给出渐变色的起止地位，就能够实现文字色彩的突变成果。而画笔Paint的突变则能够通过罕用api中的LinearGradient来实现就能够了。

override fun updateDrawState(tp: TextPaint?) {
    tp ?: return
    val leadingWidth = tp.measureText(containingText, 0, gradientStart)
    val gradientWidth = tp.measureText(containingText, gradientStart,
            gradientEnd)
    val lineGradient = LinearGradient(
            leadingWidth,
            0f,
            gradientWidth,
            0f,
            intArrayOf(startColorInt, endColorInt),
            floatArrayOf(0f, 1f),
            Shader.TileMode.CLAMP
    )
    tp.shader = lineGradient
}

光标

光标增加：思考如何每次把光标显示在文案的最初呢？这里咱们参考ReplacementSpan，也是通过自定义的Span的形式。ReplacementSpan中有2个办法别离是getSize() 和 draw()办法。getSize() 该办法的返回值会被作为要替换文字的width，draw()在该办法内绘制咱们须要的光标到画布中，咱们只须要在draw()中，绘制适合大小的圆角矩形的作为光标。

override fun getSize(paint: Paint, text: CharSequence?,
                  start: Int, end: Int, fm: Paint.FontMetricsInt?): Int {
    return paint.measureText(" ").toInt()
}

override fun draw(canvas: Canvas, text: CharSequence?, start: Int, end: Int, x: Float,
                  top: Int, y: Int, bottom: Int, paint: Paint) {
    canvas.drawRoundRect(x,
            top.toFloat(), x + width, bottom.toFloat(), rx, ry, cursorPaint)
}

光标闪动：这里能够应用ValueAnimator动画更新Alpha值，并将Alpha值设置给画笔的透明度。

override fun draw(canvas: Canvas, text: CharSequence?, start: Int, end: Int, x: Float,
                  top: Int, y: Int, bottom: Int, paint: Paint) {
    cursorPaint.alpha = (alpha * 255).toInt().coerceAtMost(255)
    canvas.drawRoundRect(x,
            top.toFloat(), x + width, bottom.toFloat(), rx, ry, cursorPaint)
}

04 总结

本文简述了基于文心一言等大模型，落地AI文本创作的根本流程，也是内容创作与AI联合的初步尝试，随着生成式AI翻新利用的继续推动，将陆续公布基于图片和视频的更多特色玩法，敬请期待！

——END——

举荐浏览

DeeTune：基于 eBPF 的百度网络框架设计与利用

百度自研高性能ANN检索引擎，开源了

存储计划作为产品——Midgard摸索

百度垂类离线计算零碎倒退历程

度加剪辑App的MMKV利用优化实际

关于人工智能:AI文本创作在百度App发文的实践

01 背景

02 我的项目介绍

2.1 整体架构

2.2 全流程

03 关键技术

3.1 Prompt

3.1.1 Prompt根底定义

3.1.2 Prompt配置

3.2 危险管制

3.3 SSE协定

3.4 突变流式展现组件

3.4.1 自定义TextView

04 总结

评论

发表回复取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

关于人工智能:AI文本创作在百度App发文的实践

01 背景

02 我的项目介绍

2.1 整体架构

2.2 全流程

03 关键技术

3.1 Prompt

3.1.1 Prompt根底定义

3.1.2 Prompt配置

3.2 危险管制

3.3 SSE协定

3.4 突变流式展现组件

3.4.1 自定义TextView

04 总结

评论

发表回复 取消回复

更多文章

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

深入解析：基于Delta的线性数据结构模型，打造高效富文本编辑器

轻松管理社交媒体：使用Automa插件实现一键拉黑功能

发表回复取消回复