关于asm:TransformASM牛刀小试

问题

之前始终在听他们说函数插桩，字节码插桩，ASM，总感觉很牛逼很高大上，晓得一个大略意思，就是Java文件编译成字节码，批改字节码，达到批改函数的目标，那么明天就尝试一个Demo级别的工程，实现APP打包，插入本人的代码,并且通过Plugin插件的形式实现。

什么是Transform，怎么自定义Transform？
Transform的作用周期是在哪里呢？在打包的哪一个阶段呢？
ASM工具是干嘛用的呢？

实在场景

当初APP的奔溃是一个很失常不过的问题，为了放大影响范畴，因为每一秒对互联网来说都是钱啊，也就有了很多的热修复框架，很多都用到了ASM技术，在打包的时候批改class文件，注入本人的逻辑达到本人的目标。

举个栗子：

失常逻辑的代码，是间接返回字符串的长度，然而没有判空，可能就会有空指针异样，为了平安，一些框架，会在APP打包，class2dex的时候，去烦扰class文件，批改字节码，在每个函数的函数体减少if-else的操作，没有异样的时候走失常的逻辑，crash的值就是false，如果产生了奔溃，就会走到修复的逻辑，从而防止奔溃。然而这个注入是怎么操作的呢？这个就设计到ASM字节码插桩了。

// 这个失常逻辑的代码
public int getStringLength(String name){
  return name.length;
}

// 批改字节码之后的代码
public int getStringLength(String name){
  if(crash){
    // 奔溃之后的解决逻辑
    ...
  }else{
    return name.length;
  }
}

什么是Transform

Gradle从1.5开始，内置了Transform的API，咱们能够通过插件，在class2dex的时候，对字节码文件进行操作，实现字节码插桩或者代码注入。每一个Transform都是一个工作，都是一个Task，他们是链式构造的，咱们只须要实现Transform的接口，并且实现注册，这些Transform就会通过TaskManager串联，每一个的输入都会是下一个输出，顺次执行。

Transform外围办法

getName() 指定以后transform的名称

isIncremental() 以后transform是否反对增量编译，增量编译能够放慢编译速度。

getInputTypes 指定以后transform要解决的数据类型，能够不只一种类型。比方本地class文件，资源文件等。

getScopes() 指定以后transform的作用域，比方只解决以后我的项目，只解决jar包等，很好了解。

TransformInvocation外围办法

getInputs() 返回输出文件，一般来说咱们关怀的是DirectoryInput和JarInput，前者指的是咱们源码形式参加编译的代码，后者就是Jar包形式参加编译的代码了。

getOutputProvider() 获取输入，能够取得输入的门路。

Transform应用

注册Transform

Transform逻辑

指标，在源码的每个办法中，插入System.out.println()输入代码。

模板代码

public class LogTransform extends Transform {

  @Override
  public String getName() {
    // 名称
    return getClass().getSimpleName();
  }

  @Override
  public Set<QualifiedContent.ContentType> getInputTypes() {
    // 须要解决的数据类型
    return TransformManager.CONTENT_CLASS;
  }

  @Override
  public Set<? super QualifiedContent.Scope> getScopes() {
    // 作用范畴
    return TransformManager.SCOPE_FULL_PROJECT;
  }

  @Override
  public boolean isIncremental() {
    // 是否反对增量编译
    return true;
  }

  @Override
  public void transform(TransformInvocation transformInvocation) throws IOException {
    boolean incremental = transformInvocation.isIncremental();
    // 获取输入，如果没有上一级的输出，输入可能也就是空的
    TransformOutputProvider outputProvider = transformInvocation.getOutputProvider();
    // 如果不反对增量编译，须要把之前生成的都删除掉，不缓存复用
    if (!incremental) {
      outputProvider.deleteAll();
    }
    // 当然工作也能够放在并发的线程池进行，期待工作完结
    for (TransformInput input : transformInvocation.getInputs()) {
      // 解决Jar
      Collection<JarInput> jarInputs = input.getJarInputs();
      if (jarInputs != null && jarInputs.size() > 0) {
        for (JarInput jarInput : jarInputs) {
          processJarFile(jarInput, outputProvider, incremental);
        }
      }
      // 解决source
      Collection<DirectoryInput> directoryInputs = input.getDirectoryInputs();
      if (directoryInputs != null && directoryInputs.size() > 0) {
        for (DirectoryInput directoryInput : directoryInputs) {
          processDirFile(directoryInput, outputProvider, incremental);
        }
      }
    }
  }
  
  ...

外围逻辑办法梳理

这份办法是Transform的必须要实现的办法，咱们能够从TransformInvocation获取输出，以及输入的门路，去做一些咱们本人的逻辑操作，执行转换。这里的逻辑很简略，就是获取输出，而后获取DirectoryInput源码，JarInput的jar包，进行转换，比方批改字节码。

  @Override
  public void transform(TransformInvocation transformInvocation) throws IOException {
    boolean incremental = transformInvocation.isIncremental();
    // 获取输入，如果没有上一级的输出，输入可能也就是空的
    // 之前说过，Transform是链式的，上一个Transform的输入就是以后的输出
    TransformOutputProvider outputProvider = transformInvocation.getOutputProvider();
    // 如果不反对增量编译，须要把之前生成的都删除掉，不缓存复用
    if (!incremental) {
      outputProvider.deleteAll();
    }
    // for循环遍历所有的输出
    for (TransformInput input : transformInvocation.getInputs()) {
      // 解决Jar
      Collection<JarInput> jarInputs = input.getJarInputs();
      if (jarInputs != null && jarInputs.size() > 0) {
        for (JarInput jarInput : jarInputs) {
          processJarFile(jarInput, outputProvider, incremental);
        }
      }
      // 解决source
      Collection<DirectoryInput> directoryInputs = input.getDirectoryInputs();
      if (directoryInputs != null && directoryInputs.size() > 0) {
        for (DirectoryInput directoryInput : directoryInputs) {
          processDirFile(directoryInput, outputProvider, incremental);
        }
      }
    }
  }

这个形式是用来解决Jar文件。首先获取输入文件，输入文件就是转换好之后的文件了，获取信息。而后判断是否是反对增量编译。如果不反对，会把所有的输入删除，间接把以后文件解决，把inputFile复制到指定的输入门路，下一步解决。如果反对，复用之前的输入，那么就须要判断以后文件的状态了。如果是NOTCHANGED，以后InputFile不必任何操作。如果是ADDED、CHANGED，新增或者批改，须要拷贝输出文件到输入。如果是REMOVED，就把之前复用的输入文件移除。很好了解。

/**
 * 解决Jar
 */
private void processJarFile(JarInput input, TransformOutputProvider outputProvider,
    boolean incremental) {
  // 获取到输入文件
  File dest = outputProvider.getContentLocation(input.getFile().getAbsolutePath(),
      input.getContentTypes(), input.getScopes(), Format.JAR);
  File inputFile = input.getFile();
  if (!incremental) {
    transformJarFile(inputFile, dest);
  } else {
    switch (input.getStatus()) {
      case NOTCHANGED:
        break;
      case ADDED:
      case CHANGED:
        transformJarFile(inputFile, dest);
        break;
      case REMOVED:
        deleteIfExists(dest);
        break;
    }
  }
}

private void transformJarFile(File inputFile, File outputFile) {
  try {
    FileUtils.touch(outputFile);
    FileUtils.copyFile(inputFile, outputFile);
  } catch (Exception e) {
    e.printStackTrace();
  }
}

private void deleteIfExists(File file) {
  try {
    if (file.exists()) {
      FileUtils.forceDelete(file);
    }
  } catch (IOException e) {
    e.printStackTrace();
  }
}

这个办法是用来解决源文件的，同理，首先获取输入目录，如果不反对增量编译，移除之前的复用的输入，并尝试从新创立文件夹，如果是文件夹的话。而后判断是不是反对增量编译，如果不反对，间接把以后所有文件复制到输入，如果反对，同样须要判断每一个文件的状态。首先获取扭转的文件汇合，遍历这个汇合，判断器状态NOTCHANGED、ADDED、CHANGED、REMOVED，和Jar的解决雷同。最初在transformDirFile办法中，尝试批改字节码。

/**
 * 解决source-file
 */
private void processDirFile(DirectoryInput input, TransformOutputProvider outputProvider,
    boolean incremental) {
  // 解决源文件
  File dest = outputProvider.getContentLocation(input.getFile().getAbsolutePath(),
      input.getContentTypes(), input.getScopes(), Format.DIRECTORY);
  // 创立文件夹
  try {
    FileUtils.forceMkdir(dest);
  } catch (IOException e) {
    e.printStackTrace();
  }
  if (incremental) {
    // 输出的门路
    String inputDirPath = input.getFile().getAbsolutePath();
    // 输入的门路
    String destDirPath = dest.getAbsolutePath();
    // 获取更改的
    Map<File, Status> changedFileMap = input.getChangedFiles();
    // 持续遍历
    for (Map.Entry<File, Status> entry : changedFileMap.entrySet()) {
      File inputFile = entry.getKey();
      String destFilePath = inputFile.getAbsolutePath().replace(inputDirPath, destDirPath);
      File outputFile = new File(destFilePath);
      switch (entry.getValue()) {
        case NOTCHANGED:
          break;
        case ADDED:
        case CHANGED:
          transformDirFile(inputFile, outputFile);
          break;
        case REMOVED:
          deleteIfExists(outputFile);
          break;
      }
    }
  } else {
    copyDir(input.getFile(), dest);
  }
}

private void copyDir(File input, File dest) {
  deleteIfExists(dest);
  String srcDirPath = input.getAbsolutePath();
  String destDirPath = dest.getAbsolutePath();
  File[] inputFiles = input.listFiles();
  if (inputFiles != null && inputFiles.length > 0) {
    for (File file : inputFiles) {
      String destFilePath = file.getAbsolutePath().replace(srcDirPath, destDirPath);
      File destFile = new File(destFilePath);
      if (file.isDirectory()) {
        copyDir(file, destFile);
      } else if (file.isFile()) {
        transformDirFile(file, destFile);
      }
    }
  }
}

private void transformDirFile(File inputFile, File outputFile) {
  try {
    FileUtils.touch(outputFile);
    // 这里要留神下，只批改class文件，只有class文件才有有字节码插桩
    // 不然就会报错，很好了解
    if (inputFile.getName().endsWith(".class")) {
      LogASM.insertCode(inputFile, outputFile);
    } else {
      FileUtils.copyFile(inputFile, outputFile);
    }
  } catch (Exception e) {
    e.printStackTrace();
  }
}

日志Transform小结

至此，Transform逻辑梳理结束，核心思想就是，首先是不是反对增量编译，如果不反对，就删除复用的所有的输入，判断以后遍历所有的源文件，间接拷贝。如果反对，复用之前的输入，而后遍历文件，找出产生状态更改的文件，选择性的更新。而后在批改单个文件的时候，执行字节码插桩批改，这样就实现了指标逻辑。

ASM简略应用

ASM是一个字节码操作和剖析的框架，能够间接用二进制批改现有类或者动静生成一个类，简略来说就是帮忙你写class字节码。大略就是这个意思。

引入ASM依赖

// ASM 相干
implementation 'org.ow2.asm:asm:9.2'
implementation 'org.ow2.asm:asm-util:9.1'
implementation 'org.ow2.asm:asm-commons:9.2'
implementation 'androidx.room:room-compiler:2.3.0'

罕用对象介绍

ClassVisitor Java类拜访用的，都是通过ClassRender调用的，比方拜访method，拜访filed，annotation等。

MethodVisitor Java中拜访读取办法用的

FieldVisitor Java中拜访读取字段属性用的

AnnotationVisitor Java中拜访读取注解用的，如果在一个类中用了某个注解，你须要做某种操作，能够匹配注解。

ASM简略应用

public class LogASM {

  public static void insertCode(File inputFile, File outputFile) {

    try {
      FileInputStream fileInputStream = new FileInputStream(inputFile);
      FileOutputStream fileOutputStream = new FileOutputStream(outputFile);
      ClassReader classReader = new ClassReader(fileInputStream);
      ClassWriter classWriter = new ClassWriter(ClassWriter.COMPUTE_MAXS);
      classReader
          .accept(new LogMethodVisitor(Opcodes.ASM7, classWriter), ClassReader.EXPAND_FRAMES);
      fileOutputStream.write(classWriter.toByteArray());
      fileInputStream.close();
      fileOutputStream.close();
    } catch (Exception e) {
      e.printStackTrace();
    }
  }
}

public class LogMethodVisitor extends ClassVisitor {

  public LogMethodVisitor(int api, ClassVisitor classVisitor) {
    super(api, classVisitor);
  }

  @Override
  public MethodVisitor visitMethod(int access, String name, String descriptor, String signature,
      String[] exceptions) {
    MethodVisitor methodVisitor =
        super.visitMethod(access, name, descriptor, signature, exceptions);
    return new MethodVisitor(api, methodVisitor) {
      @Override
      public void visitMethodInsn(int opcode, String owner, String name, String descriptor,
          boolean isInterface) {
        mv.visitFieldInsn(GETSTATIC, "java/lang/System", "out", "Ljava/io/PrintStream;");
        mv.visitLdcInsn("ASM Transform Running");
        mv.visitMethodInsn(INVOKEVIRTUAL, "java/io/PrintStream", "println", "(Ljava/lang/String;)V",
            false);
        super.visitMethodInsn(opcode, owner, name, descriptor, isInterface);
      }
    };
  }
}

外围就是拜访class文件，拜访办法，注入代码。具体的具体规定，能够本人找材料，具体理解一下ASM用法，还能够找相应的插件帮忙你理解字节码。

要害截图

目录在app/build/transforms/LogTransform

总结

这篇文章，咱们须要晓得Transform是什么，什么是ASM，咱们通过两者能够做一些什么事件就能够了。我也自我总结一下，我发现之前看过的JVM一书，还是不够彻底，字节码还是要多理解，而且我对打包的流程也更加理解了，真的是遇到问题才会更加容易的发现问题。

关于asm:TransformASM牛刀小试

问题

实在场景

什么是Transform

Transform外围办法

TransformInvocation外围办法

Transform应用

注册Transform

Transform逻辑

外围逻辑办法梳理

日志Transform小结

ASM简略应用

引入ASM依赖

罕用对象介绍

ASM简略应用

要害截图

总结

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于asm:TransformASM牛刀小试

问题

实在场景

什么是Transform

Transform外围办法

TransformInvocation外围办法

Transform应用

注册Transform

Transform逻辑

外围逻辑办法梳理

日志Transform小结

ASM简略应用

引入ASM依赖

罕用对象介绍

ASM简略应用

要害截图

总结

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复