关于后端:工具人实锤我用java中的文件IO流帮同事处理了足足18M的文本数据泪目一

7次阅读

共计 4420 个字符,预计需要花费 12 分钟才能阅读完成。

更多精彩请关注微信公众号java 小杰要加油, 京东工程师和你一起成长

  • 全篇是基于磁盘文件 IO 操作

关注此公众号java 小杰要加油,后盾回复“09IO”即可取得此思维导图以及文中全套代码,重要的中央都有备注及正文

流的概念

流,其实是个形象的概念,就像咱们生存中常见的水流一样,那么水流就有从哪里来?到哪里去?这两个问题,就别离对应的 java 中的 数据源 目的地 ,流中传送的是 java 中要解决的数据,能够是 字符模式 也能够是 字节模式

流的分类有以下几种:

  1. 按流的传送方向分:输出流 Input,输入流 Output
  2. 按流中的数据格式分:字节流,字符流

    • 字节流 (Stream) 能够解决一些文件照片视频 ppt 等
    • 字符流 (Writer Reader) 只能解决纯文本文件, 例如 txt 文件

如下图所示

我以前学的时候总是搞不清楚输出流输入流到底是从哪里来到哪里去,明天总结一下,感觉还挺便于了解的。

首先咱们始终记住一点:咱们的输出流、输入流是绝对咱们编写的 应用程序 来说的。

如果说咱们有一个 A.txt 文件,咱们编写了一个 java 程序,想操作这个 A 文件,将操作后的后果变为 B 文件。那么这时

  • 输出流 就是从 A 文件到咱们应用程序的这段流(从 A 文件输出到了咱们的应用程序中,读,就是读取 A 文件中的数据)
  • 输入流 就是从咱们的应用程序到 B 文件的这段流(从应用程序输入到了 B 文件中,写,就是写入到 B 文件中)

实战演练之需要思路

说到 API,这个 IO 流的确真的是太太太厌恶了,API 真的是太多太多了,就像高中背课文一样,还总忘,着实很难堪,不过我明天就把我的一些总结了解通过这个实在的例子写进去(只是操作磁盘文件 API),感觉或者会帮到一些忙呢

  • 需要:当初有一个 A 文件,A 文件每一行的语句都有双引号,咱们须要编写个程序,将每一行的双引号去掉,再把后果写到 B 文件中,达到下图的成果就行

A 文件

留神: 每一行的双引号都去掉了

B 文件

  1. 首先,咱们操作 A 文件的话,必定得有 A 文件这个对象对吧,他就是File,当前的输入输出流缓冲区等等都是围绕它的
  2. 其次,就像咱们上一节说到的,咱们得定义个 输出流 对吧,得把 A 文件的数据 进去,输出 到咱们编写的应用程序中去
  3. 最初,也像咱们上一节说到的,咱们得定义个 输入流 对吧,得把咱们利用程序处理好的数据 进去,输入 到咱们要寄存的 B 文件中

实战演练之代码实现

关注此公众号 java 小杰要加油,后盾回复“09IO”即可取得此思维导图以及文中全套代码,重要的中央都有备注及正文

老大当初发给了咱们一个 A.txt, 让咱们解决下,一个小时之后把解决好的文本 B.txt 发给他,所以咱们当初有文件 A,本人也能够创立个文件 B.txt,如图所示

咱们来实现下

  • 输出流:
// 输出流(读取数据到程序中)public static  List<String> read(String APath) throws IOException {
        // 创立一个字节输出流  从 A.txt 里读取数据进去
        FileInputStream fileInputStream = new FileInputStream(APath);
        // 因为字节流的话,没有行的概念,须要转换成字符流
        InputStreamReader inputStreamReader = new InputStreamReader(fileInputStream, "UTF-8");
        // 从转换的字符输出流中读取文本,这个时候就有行的概念了
        BufferedReader bufferedReader = new BufferedReader(inputStreamReader);
        // 读出来的每一行的值
        String s = "";
        // 用个 list 存储批改后读出来的每一行的值
        List<String> list = new ArrayList<String>();
        while ((s = bufferedReader.readLine()) != null) {
            // 对读出来的这一行的值进行操作,这次咱们是替换引号,当前就是依据业务来操作了
            s =s.replace(""","");
            // 将批改后的值存储进 list
            list.add(s);
        }
        // 关掉资源
        bufferedReader.close();
        inputStreamReader.close();
        fileInputStream.close();
        // 打印下 list, 看下咱们的 list 存储的数据对不对(是不是去除引号后的数据)for (int i=0;i<list.size();i++){System.out.println(list.get(i));
        }
        return list;
    }

运行后控制台的后果是

  • 输入流:
// 输入流(从程序中输入到 B 文本文件)public static void writer(String BPath, List<String> list) throws IOException{
         // 字节输入流,true 的意思是追加在文件开端,默认是 false 不追加,替换
         FileOutputStream fileOutputStream = new FileOutputStream(BPath,true);
         // 将字节流转换为字符流
         OutputStreamWriter outputStreamWriter = new OutputStreamWriter(fileOutputStream);
      // 从转换的字符输入流中写入文本,这个时候就有行的概念了
       BufferedWriter bufferedWriter = new BufferedWriter(outputStreamWriter);
        for (int i=0;i<list.size();i++){
            // 将 list 内的内容写入到文件中
            bufferedWriter.write(list.get(i));
            // 换行
            bufferedWriter.newLine();}
        // 敞开流
        bufferedWriter.close();
        System.out.println("写入完结啦");
    }

这时咱们关上 B 文件会发现内容曾经从无到有了

咱们代码中做了很多层转换,例如编写 输出流 时的代码

// 创立一个字节输出流  从 A.txt 里读取数据进去
        FileInputStream fileInputStream = new FileInputStream(APath);
        // 因为字节流的话,没有行的概念,须要转换成字符流
        InputStreamReader inputStreamReader = new InputStreamReader(fileInputStream, "UTF-8");
        // 从转换的字符输出流中读取文本,这个时候就有行的概念了
        BufferedReader bufferedReader = new BufferedReader(inputStreamReader);

编写 输入流 时的代码

// 字节输入流,true 的意思是追加在文件开端,默认是 false 不追加,替换
         FileOutputStream fileOutputStream = new FileOutputStream(BPath,true);
         // 将字节流转换为字符流
         OutputStreamWriter outputStreamWriter = new OutputStreamWriter(fileOutputStream);
      // 从转换的字符输入流中写入文本,这个时候就有行的概念了
       BufferedWriter bufferedWriter = new BufferedWriter(outputStreamWriter);

那咱们可不可以简化下呢?当然是能够的啦

咱们能够通过 FileReaderFileWriter来简化下面的字符流的读写操作。

  • FileReader
FileReader fileReader = new FileReader(APath);
BufferedReader bufferedReader = new BufferedReader(fileReader);
  • FileWriter
FileWriter fileWriter = new FileWriter(BPath);
BufferedWriter bufferedWriter = new BufferedWriter(fileWriter);

后果还是一样的,然而 API 变的更加精炼了起来。

API 关系梳理

咱们通过这个我理论遇到过的问题,来相熟理解了下 IO 流的一些操作,我再梳理总结一下,如下图所示(若有谬误请指出,谢谢大佬们指导

  • 备注:若 A ->B 构造方法参数,则代表
A a = new A();
  B b = new B(a);
  • 其实咱们只有静下心来好好看看这个图,而后入手操作几次应该就会有个清晰的认知,而不是一上来就去看各种各样的 API,我反正是记不下来

关注此公众号java 小杰要加油,后盾回复“09IO”即可取得此思维导图以及文中全套代码,重要的中央都有备注及正文

  • 文中的这个例子,是我一个共事让我帮忙解决一个大文本数据而产生的,那个大文本数据好多好多行,足足有 18M,这篇文章,仅仅是个开始,前期我还会好好打磨代码进行下效率比照进行下效率比照(缓冲区?多线程?),感兴趣的就请关注我吧,当前解决大文本再也不怕啦,做一名合格的工具人!

更多精彩请关注微信公众号java 小杰要加油, 京东工程师和你一起成长

往期精彩举荐

  • 京东这道面试题你会吗?
  • ?线程池为什么能够复用,我是蒙圈了。。。
  • 学会了 volatile,你变心了,我看到了
  • 《发明 11.11 之大厂男孩》(又名在京东双十一一线声援的那些事)
  • 原来你是这样的 xhJaver!(平庸而实在,走心文)
正文完
 0