关于java:SpireCloudPDF-添加提取PDF文本

42次阅读

共计 2442 个字符,预计需要花费 7 分钟才能阅读完成。

Spire.Cloud.PDF 提供了 PdfTextApi 接口来操作 PDF 文档中的文本内容。本文将应用该接口来介绍如何给 PDF 文档增加新的文本及提取文档中已有的文本内容。具体操作步骤和代码演示参见下文。

步骤一: 创立一个 maven 程序,并通过 maven 仓库装置 Spire.Cloud.SDK.jar 包及其依赖。具体导入办法可参考这篇教程。

步骤二: 通过冰蓝云官网注册账号并登陆,在“我的利用”版块创立应用程序,以取得 App ID 及 App Key。


步骤三: 上传 PDF 示例文档至冰蓝云官网的“文档治理”版块。

步骤四: 在 Maven 程序中编写代码调用 PdfTextApi 接口来给 PDF 示例文档增加新的文本及提取其已有文本内容。

增加新文本到 PDF 文档

import spire.cloud.pdf.sdk.*;
import spire.cloud.pdf.sdk.api.PdfTextApi;
import spire.cloud.pdf.sdk.model.*;

public class AddText {
    private static String appId = "App ID";
    private static String appKey = "App Key";
    private static String baseUrl = "https://api.e-iceblue.cn";

    public static void main(String[] args) throws ApiException {
        // 配置 App ID 和 App Key
        Configuration PdfConfiguration = new Configuration(appId, appKey, baseUrl);
        // 创立 PdfTextApi 实例
        PdfTextApi PdfTextApi = new PdfTextApi(PdfConfiguration);

        //PDF 示例文档名称
        String name = "Sample.pdf";
        // 指定后果文档名称
        String outPath = "AddText_output.pdf";
        // 指定需增加文本的页码
        int pageNumber =1;
        // 示例文档所属文件夹,若无,则 null
        String folder = null;
        // 示例文档关上明码,若无,则 null
        String password = null;
        // 示例文档所属内存,冰蓝云提供 2G 的收费存储空间
        String storage = null;

        // 指定需增加的文本内容
        Text text = new Text();
        text.setValue("Chapbook");

        // 设置文本字体格局
        Font font = new Font();
        font.setFontType(Font.FontTypeEnum.STANDARD);
        font.setFontFamily("Helvetica");
        font.setFontSize(15f);
        font.setFontStyle(Font.FontStyleEnum.REGULAR);
        text.setFont(font);

        // 指定文本所在位置
        RectangleF rectangleF = new RectangleF();
        rectangleF.setX(20f);
        rectangleF.setY(20f);
        rectangleF.setWidth(800f);
        rectangleF.setHeight(800f);
        text.setRect(rectangleF);

        // 设置文本字体色彩
        Color backColor = new Color();
        backColor.setA(1);
        backColor.setR(120);
        backColor.setG(182);
        backColor.setB(193);
        text.setBackgroundColor(backColor);

        // 调用 addText 办法给示例文档增加新的文本
        PdfTextApi.addText(name, outPath, pageNumber, text, folder, storage,password);
    }
}

增加成果:

提取 PDF 文本内容

import spire.cloud.pdf.sdk.*;
import spire.cloud.pdf.sdk.api.PdfTextApi;

public class ExtractText {
    private static String appId = "App ID";
    private static String appKey = "App Key";
    private static String baseUrl = "https://api.e-iceblue.cn";

    public static void main(String[] args) throws ApiException {
        // 配置 App ID 和 App Key
        Configuration PdfConfiguration = new Configuration(appId, appKey, baseUrl);
        // 创立 PdfTextApi 实例
        PdfTextApi PdfTextApi = new PdfTextApi(PdfConfiguration);

        //PDF 示例文档名称
        String name = "Sample.pdf";
        // 指定后果文档名称
        String outPath = "ExtractText_output.txt";
        // 指定需提取文本的页码
        int pageNumber = 1;
        // 示例文档关上明码,若无,则 null
        String password = null;
        // 示例文档所属内存,冰蓝云提供 2G 的收费存储空间
        String storage = null;
        // 示例文档所属文件夹,若无,则 null
        String folder = null;

        // 调用 extractText 办法来提取示例文档中的文本信息
        PdfTextApi.extractText(name, outPath, pageNumber, folder, storage, password);
    }
}

提取成果:

(本文完)

正文完
 0