使用Java将PDF转换为HTML

PDF文档可以在各种平台上展示,传输和保存,包含各种内容,如文本,图像,表格和视频等,而不改变其外观。与PDF文档相比,HTML文档更好地支持内容展示,并且能够容纳更多的内容,因此可以在网络上应用于Web内容的传输和呈现。因此,如果需要在网页上呈现PDF文档的内容,可以将其转换为HTML文件。本文介绍了如何编程使PDF文件转换为HTML文件的方法。

    PDFファイルをHTMLファイルに変換

本文携带的方法解释了需要使用免费的Free Spire.PDF for Java。您可以从官方网站下载或通过Maven进行安装。

<repositories>
        <repository>
            <id>com.e-iceblue</id>
            <name>e-iceblue</name>
         <url>https://repo.e-iceblue.com/nexus/content/groups/public/</url>
</repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.pdf.free</artifactId>
        <version>5.1.0</version>
    </dependency>
</dependencies>

将PDF文件转换为HTML文件。

转换操作非常简单,只需要三个步骤:

PdfDocument クラスのオブジェクトを作成します。

PdfDocument.loadFromFile() メソッドは、ディスクからPDF文書を読み込みます。

PdfDocument.saveToFile() メソッドは、PDF文書に変換され、HTMLファイルを保存します。

Python
代码

import com.spire.pdf.FileFormat;
import com.spire.pdf.PdfDocument;

public class Main {
    public static void main(String[] args) {
        //PdfDocumentクラスのオブジェクトを作成する
        PdfDocument pdf = new PdfDocument();

        //PDF文書を読み込む
        pdf.loadFromFile("Sample.pdf");

        //PDF文書をHTMLファイルに変換する
        pdf.saveToFile("PDFをHTMLに変換.html", FileFormat.HTML);
        pdf.close();
    }
}
PDFファイルをHTMLファイルに変換

这是介绍通过Java程序将PDF文档转换为HTML文件的方法。免费的Java库Spire.PDF还支持许多其他功能,您可以查看Spire.PDF for Java教程以获取更多信息。

广告
将在 10 秒后关闭
bannerAds