  Rasa 是一个支流的构建对话机器人的开源框架,它的长处是简直笼罩了对话零碎的所有性能,并且每个模块都有很好的可扩展性。参考文献收集了一些 Rasa 相干的开源我的项目和优质文章。

一.Rasa 介绍

1.Rasa 本地装置

间接 Rasa 本地装置一个不好的中央就是容易把本地计算机的 Python 包版本弄乱,倡议应用 Python 虚拟环境进行装置:

pip3 install -U --user pip && pip3 install rasa

2.Rasa Docker Compose 装置

查看本机 Docker 和 Docker Compose 版本:

docker-compose.yml 文件如下所示:

version: '3.0'
    image: rasa/rasa
      - "5005:5005"
      - ./:/app
    command: ["run", "--enable-api", "--debug", "--cors", "*"]

3.Rasa 命令介绍

用到的相干的 Rasa 命令如下所示:

rasa init:创立一个新的我的项目,蕴含示例训练数据,actions 和配置文件。rasa run:应用训练模型开启一个 Rasa 服务。rasa shell:通过命令行的形式加载训练模型,而后同聊天机器人进行对话。rasa train:应用 NLU 数据和 stories 训练模型,模型保留在./models 中。rasa interactive:开启一个交互式的学习会话,通过会话的形式,为 Rasa 模型创立一个新的训练数据。telemetry:Configuration of Rasa Open Source telemetry reporting.
rasa test:应用测试 NLU 数据和 stories 来测试 Rasa 模型。rasa visualize:可视化 stories。rasa data:训练数据的工具。rasa export:通过一个 event broker 导出会话。rasa evaluate:评估模型的工具。-h, --help:帮忙命令。--version:查看 Rasa 版本信息。rasa run actions:应用 Rasa SDK 开启 action 服务器。rasa x:在本地启动 Rasa X。

4.Rasa GitHub 源码构造

Rasa 的源码基本上都是用 Python 实现的:

二.Rasa 我的项目根本流程

1. 应用 rasa init 初始化一个我的项目

应用 rasa init 初始化聊天机器人我的项目:

├── actions
│   ├── __init__.py
│   └── actions.py
├── config.yml
├── credentials.yml
├── data
│   ├── nlu.yml
│   └── stories.yml
├── domain.yml
├── endpoints.yml
├── models
│   └── <timestamp>.tar.gz
└── tests
   └── test_stories.yml

2. 筹备自定义的 NLU 训练数据

nlu.yml 局部数据如下:

version: "3.1"

- intent: greet
  examples: |
    - hey
    - hello
    - hi
    - hello there
    - good morning
    - good evening
    - moin
    - hey there
    - let's go
    - hey dude
    - goodmorning
    - goodevening
    - good afternoon

下面的 intent: greet 示意用意为 great,上面的是具体的简略例子。略微简单点的例子格局是:[实体值](实体类型名),比方[今天](日期)[上海](城市)的天气如何?其中的日期和城市就是 NLP 中实体辨认中的实体了。除了 intent 必须外,该文件还能够蕴含同义词 synonym、正则表达式 regex 和查找表 lookup 等。

3. 配置 NLU 模型

最次要就是 pipeline 的配置了。相干的 config.yml 文件如下:

# # No configuration for the NLU pipeline was provided. The following default pipeline was used to train your model.
# # If you'd like to customize it, uncomment and adjust the pipeline.
# # See https://rasa.com/docs/rasa/tuning-your-model for more information.
#   - name: WhitespaceTokenizer
#   - name: RegexFeaturizer
#   - name: LexicalSyntacticFeaturizer
#   - name: CountVectorsFeaturizer
#   - name: CountVectorsFeaturizer
#     analyzer: char_wb
#     min_ngram: 1
#     max_ngram: 4
#   - name: DIETClassifier
#     epochs: 100
#     constrain_similarities: true
#   - name: EntitySynonymMapper
#   - name: ResponseSelector
#     epochs: 100
#     constrain_similarities: true
#   - name: FallbackClassifier
#     threshold: 0.3
#     ambiguity_threshold: 0.1

pipeline 次要是分词组件、特征提取组件、NER 组件和用意分类组件等,通过 NLP 模型进行实现,并且组件都是可插拔可替换的。

4. 筹备 story 数据

stories.yml 文件如下:

version: "3.1"


- story: happy path
  - intent: greet
  - action: utter_greet
  - intent: mood_great
  - action: utter_happy

- story: sad path 1
  - intent: greet
  - action: utter_greet
  - intent: mood_unhappy
  - action: utter_cheer_up
  - action: utter_did_that_help
  - intent: affirm
  - action: utter_happy

- story: sad path 2
  - intent: greet
  - action: utter_greet
  - intent: mood_unhappy
  - action: utter_cheer_up
  - action: utter_did_that_help
  - intent: deny
  - action: utter_goodbye


5. 定义 domain

domain.yml 文件如下:

version: "3.1"

  - greet
  - goodbye
  - affirm
  - deny
  - mood_great
  - mood_unhappy
  - bot_challenge

  - text: "Hey! How are you?"

  - text: "Here is something to cheer you up:"
    image: "https://i.imgur.com/nGF1K8f.jpg"

  - text: "Did that help you?"

  - text: "Great, carry on!"

  - text: "Bye"

  - text: "I am a bot, powered by Rasa."

  session_expiration_time: 60 #单位是 min,设置为 0 示意无生效期
  carry_over_slots_to_new_session: true #设置为 false 示意不继承历史词槽

畛域 (domain) 中蕴含了聊天机器人的所有信息,包含用意 (intent)、实体(entity)、词槽(slot)、动作(action)、表单(form) 和回复 (response) 等。

6. 配置 Rasa Core 模型

最次要就是 policies 的配置了。相干的 config.yml 文件如下:

# Configuration for Rasa Core.
# https://rasa.com/docs/rasa/core/policies/
# # No configuration for policies was provided. The following default policies were used to train your model.
# # If you'd like to customize them, uncomment and adjust the policies.
# # See https://rasa.com/docs/rasa/policies for more information.
#   - name: MemoizationPolicy
#   - name: RulePolicy
#   - name: UnexpecTEDIntentPolicy
#     max_history: 5
#     epochs: 100
#   - name: TEDPolicy
#     max_history: 5
#     epochs: 100
#     constrain_similarities: true

policies 次要就是对话策略的配置,罕用的包含 TEDPolicy、UnexpecTEDIntentPolicy、MemoizationPolicy、AugmentedMemoizationPolicy、RulePolicy 和 Custom Policies 等,并且策略之间也是有优先级程序的。

7. 应用 rasa train 训练模型

rasa train
rasa train nlu
rasa train core

应用 data 目录中的数据作为训练数据,应用 config.yml 作为配置文件,并将训练后的模型保留到 models 目录中。

8. 应用 rasa test 测试模型


rasa data split nlu
rasa test nlu -u test_set.md --model models/nlu-xxx.tar.gz


9. 让用户应用聊天机器人

能够通过 shell 用指定的模型进行交互:

rasa shell -m models/nlu-xxx.tar.gz

还能够通过 rasa run --enable-api 这种 rest 形式进行交互。如下:

三.Rasa 零碎架构

1.Rasa 解决音讯流程

  下图展现了从用户的 Message 输出到用户收到 Message 的根本流程:

  步骤 1 :用户输出的 Message 传递到 Interpreter(NLP 模块),而后辨认 Message 中的用意 (intent) 和提取实体 (entity)。
   步骤 2 :Rasa Core 将 Interpreter 提取的 intent 和 entity 传递给 Tracker,而后跟踪记录对话状态。
  步骤 3 :Tracker 把以后状态和历史状态传递给 Policy。
  步骤 4 :Policy 依据以后状态和历史状态进行预测下一个 Action。
  步骤 5 :Action 实现预测后果,并将后果传递到 Tracker,成为历史状态。
  步骤 6 :Action 将预测后果返回给用户。

2.Rasa 系统结构

  Rasa 次要包含 Rasa NLU(自然语言了解,即图中的 NLU Pipeline)和 Rasa Core(对话状态治理,即图中的 Dialogue Policies)两个局部。Rasa NUL 将用户的输出转换为用意和实体信息。Rasa Core 基于以后和历史的对话记录,决策下一个 Action。

  除了外围的自然语言了解 (NLU) 和对话状态治理 (DSM) 外,还有 Agent 代理零碎,Action Server 自定义后端服务零碎,通过 HTTP 和 Rasa Core 通信;辅助零碎 Tracker Store、Lock Store 和 Event Broker 等。还有上图没有显示的 channel,它连贯用户和对话机器人,反对多种支流的即时通信软件对接 Rasa。
  (1)Agent 组件 :从用户角度来看,次要是接管用户输出音讯,返回 Rasa 零碎的答复。从 Rasa 角度来看,它连贯自然语言了解(NLU) 和对话状态治理(DSM),依据 Action 失去答复,并且保留对话数据到数据库。
  (2)Tracker Store:将用户和 Rasa 机器人的对话存储到 Tracker Store 中,Rasa 提供的开箱即用的零碎包含括 PostgreSQL、SQLite、Oracle、Redis、MongoDB、DynamoDB,当然也能够自定义存储。
  (3)Lock Store:一个 ID 产生器,当 Rasa 集群部署的时候会用到,当音讯处于活动状态时锁定会话,以此保障音讯的程序解决。
  (4)Event Broker:简略了解就是一个音讯队列,把 Rasa 音讯转发给其它服务来解决,包含 RabbitMQ、Kafka 等。
  (6)Action Server:通过 rasa-sdk 能够实现 Rasa 的一个热插拔性能,比方查问天气预报等。

