共计 2554 个字符,预计需要花费 7 分钟才能阅读完成。
1. 引言
最近 ChatGPT 的呈现,把人工智能又带起了一波浪潮。机器人是否代替人类又成了最近热门的话题。明天咱们举荐的一个玩法和 ChatGPT 有点不一样。咱们的课题是“让用户能够应用自然语言从 Excel 查问到本人想要的数据”。要让自然语言能够从 Excel 中查数据,那咱们得做点筹备:须要一个 Excel 文档须要一个自然语言查问工具(这里咱们举荐 Smartbi NLA)
1.1. 体验自然语言查问
老规矩,先上成果再说其余。
【应用录屏动画】
2.Excel 阐明
咱们先筹备一个 Excel,这个数据是模拟一个企业的合同签订表数据造的一份随机数据,有些数字可能不大正当。不合理的中央,请主动疏忽 ^_^。2.1. 数据结构阐明
2.1.1 合同明细表
2.1.2. 销售表
2.1.3. 地区表
2.1.4. 日期维
2.2. 表关系图
【表关系图】
2.3. 数据示例
【Excel 详情】
3. 数据导入与建模
数据状况介绍完了,咱们要用上述的数据,做一个数据模型,上面次要介绍下建模的过程。
3.1.Excel 导入
Smartbi 中的 Excel 数据导入,非常简单,依照向导操作就能够了。
【Excel 数据导入】
3.2. 建设表关系
3.2.1. 第一个表关系数据
导入实现后,咱们先建设第一个表关系。鼠标放到《销售表》表下面后,会呈现 4 个小圆圈。抉择一个小圆圈,拖动到《合同表》下面,就会自动弹出表关系对话框。咱们抉择关联字段,而后抉择“一对多”关系。
【《销售表》和《合同表》关系建设】
【残缺表关系】
3.3. 指标、维表和事实表处理
3.3.1. 生成指标
【双击“合同金额”转指标】
从事实表中,找到须要转为指标的列,双击,就会主动生成指标。
3.3.2. 解决维度
默认状况下,右侧栏的每一个字段,都会默认生成一个维度。然而有些字段(ID、编码等)在失常的查问中咱们并不需要,所以倡议将不须要的字段暗藏。同时为了让自然语言可能更好的辨认到用户语言中的指标和维度,倡议在设计模型的时候将指标和维度批改成用户罕用的词语。
【暗藏“合同维表”】
【显示“合同名称”】
《合同维表》中,顺次显示“合同名称”、“商机类型”、“合同类型”、“行业名称”,这些是须要转成维度的,其余的字段都不须要,所以其余字段都能够暗藏掉。其余表也做同样操作,暗藏掉编码字段。
3.3.3. 创立工夫维度
【创立工夫维度】
在右键“日期”字段,抉择“创立工夫层次结构”,咱们能够创立蕴含指定档次的工夫维构造。
【抉择工夫层次结构】
依据查问须要,咱们抉择了“年”、“季”、“月”、“日”,4 种层次结构。
【生成的工夫档次】
如果感觉默认的名字不好,能够改名。不过为了能更合乎罕用日期说法,还是倡议改下默认名字。如果有非凡须要,也能够批改须要显示的日期格局。
【批改季度名字】
【改名后的工夫档次】
3.4. 自定义指标
除了合同金额,如果咱们还想晓得“合同个数”,咱们须要对“合同编码”做惟一计数。
【生成“合同个数”指标】
3.5. 模型抽取
最初,咱们须要对模型进行抽取,将 Excel 数据加载到高速缓存库中。
【模型抽取】
【点击:抽取并建宽表】
3.6. 模型验证
模型做好当前,咱们须要验证下模型是否正确。这里能够应用“自助仪表盘”实现模型的验证工作。
【新建 - 交互式仪表盘】
【查问验证】把用到的维度和指标都拖上来,看看是否有数据,数据是否正确。
3.7. 总结
以上是创立数据模型残缺的过程。是不是很简略,手痒的同学能够先试试了。Smartbi 的数据模型建设过程非常简单,全程就是鼠标拖拽就实现了,除了改名,根本不须要应用键盘。更不须要写 SQL 语句或者其余程序语言。对用户的要求大大降低。就算略微有点高级的 – 做计算指标,对用户的要求也只是:理解该指标的计算方法,而后根本也是全程鼠标就能够实现了。总之,应用 Smartbi 所有都太不便了!
4. 自然语言查问
4.1. 训练 NLA 模型
Smartbi 自然语言查问,是在“数据模型”之上,再建设了一个常识模型(常识图谱)。这个常识图谱,须要有一个简略的训练过程。不过 Smartbi 曾经把这些工作都包装好了,咱们只须要点一个训练按钮就能够实现常识图谱的训练了。
【训练 AI 图谱】
【抉择须要参加训练的维度】
日期维、ID、编码、数字这些个别是不须要参加训练的,也就是只训练有意义的字符串列。
【抉择对话式剖析 - 进入自然语言查问】
4.2. 查问演示
4.2.1. 语义场景自适应
【排名演示场景】
Smartbi 的自然语言查问和同类产品有个不一样的中央就是,通常的自然语言查问工具,须要比拟残缺地说出数据库中的字段名,而 Smartbi 的自然语言查问是不须要的,用户能够依照惯例的说法去说这个词语。零碎会依据以后的语言场景匹配最合适的字段。
比方上述例子中的“广州分部合同金额排名前十销售”,零碎会依据以后的语句自动识别是想要对“销售姓名”排名还是“销售分部”排名,在这句话中,零碎给出的抉择是应用“销售姓名”进行排序。“合同排名”也是同样的意思。这里就不具体开展了。
4.2.2. 主动生成计算指标
【动静生成计算指标】
Smartbi 自然语言查问,还有一个显著特点是能够主动生成一些罕用的工夫计算指标(不须要事后在模型中做好)。比方:同比、环比这些。Smartbi NLA 反对的工夫计算指标有:同期比环比同期值后期值同期增量后期增量年累计年累同比季累计季累同比月累计月累同比占比
4.2.3. 综合剖析案例
【剖析案例】
这个演示次要是介绍应用自然语言剖析出“广州分部合同金额去年同比降落”的起因。最开始查的是“各分部的合同状况”,而后发现广州分部同比降落了 37%。而后持续问广州分部各行业的状况,只看行业数据看不出问题,咱们加上了“同比”和“占比”,发现“占比”比拟大的行业(批发、教育、游览)的合同额都大幅下滑,特地是游览行业下滑 73%。
咱们再从月份的角度看,根本看到 4 月、5 月数据都下滑比较严重,到了下半年跌幅也比拟微小。通过上述示例发现,在做数据分析的时候应用自然语言查问,要比传统的利落拽形式疾速很多,比手写 SQL 更是提高了几代。所以应用自然语言做剖析,将会给业务剖析人员,带来更大的方便性。
👉感兴趣的敌人可点击链接,立刻体验 Smartbi 智能问答
https://demo.smartbi.com.cn/smartbi/vision/test.html