如何通过C#/VB.NET将PDF转为Word

2022-12-08 17:04:22 来源:51CTO博客


(资料图)

众所周知,PDF文档支持特长文件,集成度和安全可靠性都较高,可有效防止他人对PDF内容进行更改,所以在工作中深受大家喜爱。但是在工作中,我们不可避免的会对PDF文档进行修改或再编辑,这时我们可以将PDF转换为Word文档格式进行修改。本文将分为两部分介绍如何以编程的方式将PDF转换为Word。

将 PDF 转换为固定布局的Doc/Docx 文档将 PDF 转换为流动形态的Doc/Docx 文档

固定布局模式转换速度快,有利于最大程度保持 PDF 文件的原貌。但是,生成的文档的可编辑性将受到限制,因为 PDF 中的每一行文本将在生成的 Word 文档中显示在单独的框架中。

流动形态是一种完整的识别模式。转换后的内容不会以框架形式呈现,并且生成的文档的结构是可流动的。生成的 Word 文档很容易重新编辑,但看起来可能与原始 PDF 文件不同。

将 PDF 转换为固定布局的 Doc/Docx 文档

创建一个PdfDocument对象。 使用PdfDocument.LoadFromFile()方法加载示例 PDF 文件。 使用PdfDocument.SaveToFile() 方法将PDF转换为 .doc/.docx 格式文件并保存。

完整代码

C#

using Spire.Pdf;namespace ConvertPdfToDoc{    class Program    {        static void Main(string[] args)        {            //创建一个 PdfDocument 对象            PdfDocument doc = new PdfDocument();            //加载示例 PDF 文件            doc.LoadFromFile(@"C:\Users\Administrator\Desktop\示例文档.pdf");            //将PDF转换为Doc格式文件并保存            doc.SaveToFile("ToDoc.doc", FileFormat.DOC);            //将PDF转换为Docx格式文件并保存            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX);        }    }}

​​VB.NET

Imports Spire.PdfNamespace ConvertPdfToDoc    Friend Class Program        Private Shared Sub Main(ByVal args As String())            "创建一个 PdfDocument 对象            Dim doc As PdfDocument = New PdfDocument()            "加载示例 PDF 文件            doc.LoadFromFile("C:\Users\Administrator\Desktop\示例文档.pdf")            "将PDF转换为Doc格式文件并保存            doc.SaveToFile("ToDoc.doc", FileFormat.DOC)            "将PDF转换为Docx格式文件并保存            doc.SaveToFile("ToDocx.docx", FileFormat.DOCX)        End Sub    End ClassEnd Namespace

将 PDF 转换为流动形态的 Doc/Docx 文档

创建一个 PdfDocument对象。 使用PdfDocument.LoadFromFile()方法加载示例 PDF 文件。 使用PdfConvertOptions.SetPdfToDocOptions(bool usePsMode,bool useFlowRecognitionMode) 方法将转换引擎设置为 PS 模式并将识别模式设置为流。使用 PdfDocument.SaveToFile()方法将文档转换为.doc/.docx 格式的文件。

完整代码

C#

using Spire.Pdf;namespace ConvertPdfToDocxUsingPsMode{    class Program    {        static void Main(string[] args)        {            //创建一个 PdfDocument 对象            PdfDocument doc = new PdfDocument();            //加载示例 PDF 文件            doc.LoadFromFile(@"C:\Users\Administrator\Desktop\示例文档.pdf");            // PDF转Word使用PS模式,识别模式设置为流            doc.ConvertOptions.SetPdfToDocOptions(true, true);            //将PDF转换为Doc格式文件并保存            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC);            //将PDF转换为Docx格式文件并保存            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX);        }    }}

VB.NET

Imports Spire.PdfNamespace ConvertPdfToDocxUsingPsMode    Friend Class Program        Private Shared Sub Main(ByVal args As String())            "创建一个 PdfDocument 对象            Dim doc As PdfDocument = New PdfDocument()            "加载示例 PDF 文件            doc.LoadFromFile("C:\Users\Administrator\Desktop\示例文档.pdf")            " PDF转Word使用PS模式,识别模式设置为流            doc.ConvertOptions.SetPdfToDocOptions(True, True)            "将PDF转换为Doc格式文件并保存            doc.SaveToFile("ToDoc1.doc", FileFormat.DOC)            "将PDF转换为Docx格式文件并保存            doc.SaveToFile("ToDocx1.docx", FileFormat.DOCX)        End Sub    End ClassEnd Namespace

效果图

——本文完——

标签: 识别模式 流动形态 在工作中

上一篇:全球快看点丨基于xml的Spring配置二(Spring 配置非自定义Bean)
下一篇:环球微动态丨通过Powershell批量给VMware虚拟机挂载磁盘并初始化