这是 Jerry 2022 年第二篇原创文章,也是本公众号第 370 篇原创文章。
之前有一个敌人在知乎上向我征询过这个问题,我觉得很有代表性,所以专门用一篇文章来讲述一些相干知识点。
先看这位敌人遇到的具体问题。
用 Postman 调用第三方接口,外面的中文字符可能失常显示。
然而当用 ABAP 的 HTTP 工具类 CL_HTTP_CLIENT 的 response->get_data( ) 读取响应之后,发现外面的中文字符,例如 "拜访胜利" 是乱码:
首先明确一点,既然 Postman 能正确显示响应数据中的中文内容,阐明 API provider 是不存在问题的,这个乱码问题呈现在接管方,即 ABAP 代码的编程实现须要调整。
咱们只有弄清楚呈现乱码的起因,就能对症下药进行修复了。
上个世纪 60 年代,美国制订了一套字符编码,定义了英文字符与二进制位之间的一一映射关系,称为 ASCII 码。将一个符号的图形显示,关联到其二进制存储位的这种行为,就称之为字符编码。ASCII 就是一种最简略的字符集和字符编码方式。
一个字节有 8 位,2 的 8 次方为 256,因而 1 个字节只能示意 256 种符号,而汉字的总数超过了 10 万个,显然无奈用 1 个字节来存储。
除了大家相熟的英文字符和汉字外,还有很多历史更悠久的文字,比方埃及象形文字:
以及周杰伦《爱在西元前》里提到的楔形文字:
有没有这样一种计算机编码方式,可能将这些稀奇古怪的符号都纳入其中呢?有,这就是 Unicode,正如其命名暗示的,Unicode 将世界各种语言的每个字符都调配了一个惟一的编码,以满足跨语言、跨平台的文本信息转换。
咱们依据 Unicode 编码表,就能查到一个字符对应的 Unicode 编码,比方汉字 "汪"对应的 Unicode 编码为 00006C6A.
6C6A 的二进制示意为 0110 1100 0110 1010,须要两个字节进行存储。示意其余的符号,可能须要三个甚至四个字节存储。
另一方面,对于本来就存在于 ASCII 编码表中的英文字符,仅需 1 个字节就能存储。如果 Unicode 强制要求每个字符依照最大须要的存储空间,即 4 字节进行存储,显然对于英文字符来说,意味着极大的空间节约。
因而,Unicode 仅仅定义字符到其编码的映射关系。而这些编码到底采取多少个字节进行存储,由 Unicode 具体的实现形式,比方 UTF-8,UTF16 等来决定。
UTF-8 是一种变长的编码方式,应用 1 到 4 个字节示意一个字符,符号不同,用于存储的字节长度也不同。比方 "汪" 的 UTF-8 码值为 E6B1AA,须要三个字节存储。
依据 SAP 帮忙文档,ABAP 采纳 UCS-2 编码方式,能够看成 UTF-16 的子集,因为 UCS-2 不反对 UTF-16 的 surrogates 区间内定义的一些特殊符号。
所谓 UTF-16,就是所有字符固定都用两个字节示意。
从上面这张表格可能看出,UTF-16 又分 UTF-16BE 和 UTF-16LE 两种实现形式。以汉字 "汪" 的 Unicode 编码值 6C6A 为例,如果 6C 存储在内存低位地址,6A 存储在内存高位地址,这就是 Big Endian 即大尾序(有时也译作大头,大端)存储形式,反之则为 Little Endian 即小尾序存储形式。
这两个名称来自英国讥刺寓言作家斯威夫特的《格列佛游记》。书中的小人国暴发了内战,和平起因居然是人们争执吃鸡蛋时到底应该从大头(Big Endian)一端敲开,还是从小头(Little Endian)敲开。
那么 ABAP 的 UCS-2(UTF-16 的子集), 到底是 BE 存储还是 LE 存储?一试便知。
在我的零碎里,答案是 UTF-16LE.
另一种形式,间接查看零碎类 CL_ABAP_CHAR_UTILITIES 的属性 ENDIAN. 在 Jerry 的零碎里,该属性的值为 L,代表 Little Endian:
咱们理解了这些常识,再来修复文章结尾形容的乱码问题。
仔细观察 Postman 调用 API 的返回后果,发现还有一条重要信息:charset=GB18030,意思是 API 响应数据采取 GB18030 字符集编码。
汉字 "访" 的 GB18030 编码值为 B7C3,齐全不等同于 UTF-16LE 中的编码值 BF8B.
如果咱们在 ABAP 代码里,依照默认的 UTF-16LE 的形式去读取一个依据 GB18030 编码的符号,当然不会失去冀望的后果。这种张冠李戴的解码形式见下图第 55 行的 get_cdata 办法,最初就会呈现乱码。
正确的形式,采取第 57 行 get_data,返回一个 16 进制数据流,类型为 xstring:
在这个16 进制数据流里,咱们曾经看到了汉字 "访" 和 "问" 对应的 GB18030 编码值。
剩下的事件就容易了,应用字符集 GB18030 对这段数据流进行解码。
咱们首先关上数据库表 TCP00, 依据关键词 18030 查问表字段 CPCOMMENT:
失去 GB18030 对应的 SAP Code Page 为 8401:
在上面这段代码中,传入 8401,变量 lv_binary 存储的是 16 进制数据流,变量 lv_text 寄存的就是基于 GB18030 的 API 响应内容:
能够看到乱码曾经隐没了,在 ABAP 程序里显示的内容曾经和 Postman 里察看到的完全一致了。
心愿本文介绍的这个例子,能对大家在 ABAP 里解决中文乱码问题有所启发,感激浏览。
Jerry 的 ABAP 专集
- Jerry的ABAP, Java和JavaScript乱炖
- ABAP开发人员将来应该学些什么
- Jerry 2017年的五一小长假:8种经典排序算法的ABAP实现
- Jerry的ABAP原创技术文章合集
- 300行ABAP代码实现一个最简略的区块链原型
- 应用Java+SAP云平台+SAP Cloud Connector调用ABAP On-Premise零碎里的函数
- 在SAP云平台的CloudFoundry环境下生产ABAP On-Premise OData服务
- ABAP vs Java, 蛙泳 vs 自由泳
- 聊聊C语言和ABAP
- 入手应用ABAP Channel开发一些小工具,晋升日常工作效率
- 我用ABAP做过的那些无聊的事件
- 不喜爱SAP GUI?那试试用Eclipse进行ABAP开发吧
- 应用Visual Studio Code编写和激活ABAP代码
- 你的ABAP程序给佛祖开过光么?来试试Jerry这个小技巧
- 在SAP云平台ABAP编程环境上编写第一段ABAP程序
- SAP官网公布的ABAP编程标准
- ABAP Code Inspector那些暗藏的性能,您都晓得吗?
- 还在用ABAP进行SAP产品的二次开发?来理解下这种全新的二次开发理念吧
- ABAP Netweaver体内的那些寄生式编程语言
- 从SAP社区上的一篇博客开始,聊聊SAP产品命名背地的那份情怀
- 云端的ABAP Restful服务开发
- 如何在SAP云平台ABAP编程环境里把CDS view裸露成OData服务
- 应用abapGit在ABAP On-Premises零碎和SAP云平台ABAP环境之间进行代码传输
- 30分钟用Restful ABAP Programming模型开发一个反对增删改查的Fiori利用
- Jerry带您理解Restful ABAP Programming模型系列之二:Action和Validation的实现
- Jerry带您理解Restful ABAP Programming模型系列之三:云端ABAP利用调试
- SAP云平台上的ABAP编程环境里如何生产第三方服务
- ABAP开发者上云的时候到了 - 当初大家能够收费应用SAP云平台ABAP环境的试用版了
- 学而不思则罔 - SAP云平台ABAP编程环境的由来和实用场景
- SAP云平台里的三叉戟利用
- 如何基于Restful ABAP Programming模型开发并部署一个反对增删改查的Fiori利用
- SAP 2019 TechEd Key Note解读:云时代下SAP从业人员如何做二次开发?
- 有哪些ABAP关键字和语法,到了ABAP云环境上就没方法用了?
- ABAP开发环境终于反对以驼峰命名法主动格式化ABAP变量名了
- 利用ABAP 740的新关键字REDUCE实现一个理论工作工作
- 一段让人瑟瑟发抖的ABAP代码
- 昨日万圣节ABAP怪兽级代码谜团,颁布答案啦
- 介绍一种在ABAP内核态进行内表高效拷贝的办法
- 应用SAP Cloud Application Programming模型开发OData的一个理论例子
- 当ABAP遇见普罗米修斯
- 应用ABAP绘制可伸缩矢量图
- ABAP开发环境语法高亮的那些事儿
- SAP谬误音讯调试之七种武器:让所有的谬误音讯都能被定位
- 应用ABAP操作Excel的几种办法
- SAP GUI里的收藏夹事务码管理工具
- SAP GUI和Windows注册表
- 有了Debug权限就能干坏事?小心了,你的一举一动尽在系统监控中
- ABAP CCDEF, CCIMP, CCMAC, CCAU, CMXXX这些东东是什么鬼
- 实现ABAP条件断点的三种形式
- 应用SAT跟踪监控从浏览器关上的SAP利用的性能和调用栈
- 一个13年ABAP老兵的倡议:理解这些基础知识,对ABAP开发有百利而无一害
- SAP ABAP Netweaver容器化, 不可能实现的工作吗?
- SAP产品加强技术回顾
- SAP API开发方法大全
- 浅谈Java和SAP ABAP的动态代理和动静代理,以及ABAP面向切面编程的尝试
- SAP ABAP应用服务器的HTTP响应状态码(Status Code)
- SAP ABAP里存在Java List这种汇合工具类么?CL_OBJECT_COLLECTION理解一下
- ABAP面试题系列:写一组会呈现死锁(Deadlock)的ABAP程序
- SAP ABAP Netweaver服务器的规范登录形式解说
- SAP ABAP关键字语法图和ABAP代码主动生成工具Code Composer
- SAP ABAP SM50的另类用处 - ABAP工作过程对数据库表读取操作的检测
- 对于SAP ABAP字符变量和字符串变量字符个数的一个知识点,和一个血案
- SAP ABAP一组关键字 IS BOUND, IS NOT INITIAL和IS ASSIGNED的用法辨析
- SAP ABAP和Java里的弱援用(WeakReference)和软援用(SoftReference)
- SAP AMDP介绍 - ABAP托管的HANA数据库过程
- 给你的ABAP对象打上标签(Tag)
- 历史上的明天:编程语言中null援用的十亿美元谬误
- ABAP Development Tool 代码模板和其余一些实用技巧汇总
- SAP ABAP Development Tool 进步开发效率的十个小技巧
- 如何在 SAP BTP 平台 ABAP 编程环境里生产基于 SOAP 的 Web Service
- ABAP 真的会过期吗?聊聊 ABAP 的过来,当初和将来
- 基于 abapGit 和 abaplint 的 ABAP 继续集成的一个例子
- 不应用任何框架,手写纯 JavaScript 实现上传本地文件到 ABAP 服务器
- 应用 JavaScript 上传 PDF 和 Excel 等二进制文件到 ABAP 服务器并进行解析
- 从 ABAP Netweaver 到 ABAP Platform,咱们始终在致力
更多Jerry的原创文章,尽在:"汪子熙":