如何通過C#/VB.NET將PDF轉為Word

2022-12-08 17:04:22 來源:51CTO博客


(資料圖)

眾所周知,PDF文檔支持特長文件,集成度和安全可靠性都較高,可有效防止他人對PDF內容進行更改,所以在工作中深受大家喜愛。但是在工作中,我們不可避免的會對PDF文檔進行修改或再編輯,這時我們可以將PDF轉換為Word文檔格式進行修改。本文將分為兩部分介紹如何以編程的方式將PDF轉換為Word。

將 PDF 轉換為固定布局的Doc/Docx 文檔將 PDF 轉換為流動形態的Doc/Docx 文檔

固定布局模式轉換速度快,有利于最大程度保持 PDF 文件的原貌。但是,生成的文檔的可編輯性將受到限制,因為 PDF 中的每一行文本將在生成的 Word 文檔中顯示在單獨的框架中。

流動形態是一種完整的識別模式。轉換后的內容不會以框架形式呈現,并且生成的文檔的結構是可流動的。生成的 Word 文檔很容易重新編輯,但看起來可能與原始 PDF 文件不同。

將 PDF 轉換為固定布局的 Doc/Docx 文檔

創建一個PdfDocument對象。 使用PdfDocument.LoadFromFile()方法加載示例 PDF 文件。 使用PdfDocument.SaveToFile() 方法將PDF轉換為 .doc/.docx 格式文件并保存。

完整代碼

C#

using Spire.Pdf;namespace ConvertPdfToDoc{    class Program    {        static void Main(string[] args)        {            //創建一個 PdfDocument 對象            PdfDocument doc = new PdfDocument();            //加載示例 PDF 文件            doc.LoadFromFile(@"C:\Users\Administrator\Desktop\示例文檔.pdf");            //將PDF轉換為Doc格式文件并保存            doc.SaveToFile("ToDoc.doc", FileFormat.DOC);            //將PDF轉換為Docx格式文件并保存            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX);        }    }}

??VB.NET

Imports Spire.PdfNamespace ConvertPdfToDoc    Friend Class Program        Private Shared Sub Main(ByVal args As String())            "創建一個 PdfDocument 對象            Dim doc As PdfDocument = New PdfDocument()            "加載示例 PDF 文件            doc.LoadFromFile("C:\Users\Administrator\Desktop\示例文檔.pdf")            "將PDF轉換為Doc格式文件并保存            doc.SaveToFile("ToDoc.doc", FileFormat.DOC)            "將PDF轉換為Docx格式文件并保存            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX)        End Sub    End ClassEnd Namespace

將 PDF 轉換為流動形態的 Doc/Docx 文檔

創建一個 PdfDocument對象。 使用PdfDocument.LoadFromFile()方法加載示例 PDF 文件。 使用PdfConvertOptions.SetPdfToDocOptions(bool usePsMode,bool useFlowRecognitionMode) 方法將轉換引擎設置為 PS 模式并將識別模式設置為流。使用 PdfDocument.SaveToFile()方法將文檔轉換為.doc/.docx 格式的文件。

完整代碼

C#

using Spire.Pdf;namespace ConvertPdfToDocxUsingPsMode{    class Program    {        static void Main(string[] args)        {            //創建一個 PdfDocument 對象            PdfDocument doc = new PdfDocument();            //加載示例 PDF 文件            doc.LoadFromFile(@"C:\Users\Administrator\Desktop\示例文檔.pdf");            // PDF轉Word使用PS模式,識別模式設置為流            doc.ConvertOptions.SetPdfToDocOptions(true, true);            //將PDF轉換為Doc格式文件并保存            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC);            //將PDF轉換為Docx格式文件并保存            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX);        }    }}

VB.NET

Imports Spire.PdfNamespace ConvertPdfToDocxUsingPsMode    Friend Class Program        Private Shared Sub Main(ByVal args As String())            "創建一個 PdfDocument 對象            Dim doc As PdfDocument = New PdfDocument()            "加載示例 PDF 文件            doc.LoadFromFile("C:\Users\Administrator\Desktop\示例文檔.pdf")            " PDF轉Word使用PS模式,識別模式設置為流            doc.ConvertOptions.SetPdfToDocOptions(True, True)            "將PDF轉換為Doc格式文件并保存            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC)            "將PDF轉換為Docx格式文件并保存            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX)        End Sub    End ClassEnd Namespace

效果圖

——本文完——

標簽: 識別模式 流動形態 在工作中

上一篇:全球快看點丨基于xml的Spring配置二(Spring 配置非自定義Bean)
下一篇:環球微動態丨通過Powershell批量給VMware虛擬機掛載磁盤并初始化