关于java:JAVA-IO流中字符串编码不一致问题

问题:在读一个txt文件中的日期数据”2020-06-18″存入数据库时,发现读出的string怎么转都不能转为sql.Date类型。

初步诊断:System.out.println()输入的从流中读的字符串和预期字符串一样,然而length属性一个是21,一个是10。(因为字符间填充了”u0000″,而且是空字符)

空字符输入:System.out.println(“aa”+”u0000″+”bb”)输入为aabb。不同版本jvm可能输入不一样,有的是空格。

症状:通过debug发现寄存string的char[]填充了大量的”u0000″存在,这个是unicode编码中Character的最小值。
(文件字符流编码默认为GBK,JVM默认编码是UNICODE)

问题截图如下:


解决办法:

可分为两类:设置编码格局;删除所有”u0000″。
设置编码
又分为设置流的编码,以及设置String的编码。
设置流编码

new BufferedReader(new InputStreamReader(inputStream,"unicode"));

设置String编码

str = new String(str.getBytes("GBK"),"unicode");

删除所有u0000

str = str.replace("\u0000", "");

后果展现:

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理