通常,PDF格式的文档能支持的编辑功能不如office文档多,针对PDF文档里面有表格数据的,如果想要编辑表格里面的数据,可以将该PDF文档转为Excel格式,然后编辑。本文,将以C#代码为例,介绍如何实现由PDF格式到Excel文档格式的转换。下面是具体步骤。
【dll引用方法】
在程序中引入Spire.Pdf.dll文件;将
Spire.PDF for .NET
下载到本地,解压。找到BIN文件夹中的Spire.Pdf.dll。然后在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“添加引用”,将本地路径BIN文件夹下的dll文件添加引用至程序。
通过
NuGet
安装。可通过以下2种方法安装:
1. 可以在Visual Studio中打开“解决方案资源管理器”,鼠标右键点击“引用”,“管理NuGet包”,然后搜索“Spire.PDF”,点击“安装”。等待程序安装完成。
2. 将以下内容复制到PM控制台安装:
Install-Package Spire.PDF -Version 8.3.9
【PDF转Excel】
转换时,可通过以下步骤来实现,仅需要三行代码:
创建
PdfDocument
类的对象。
调用
PdfDocument.LoadFromFile(string filename)
方法加载PDF文档。
通过
PdfDocument.SaveToFile(string filename, FileFormat fileFormat)
方法将文件保存为Excel格式到指定路径。
using Spire.Pdf;
namespace PDFtoExcel
class Program
static void Main(string[] args)
//加载PDF文档
PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile("test.pdf");
//保存为Excel文档
pdf.SaveToFile("ToExcel.xlsx",FileFormat.XLSX);
VB.NET
Imports Spire.Pdf
Namespace PDFtoExcel
Class Program
Private Shared Sub Main(args As String())
'加载PDF文档
Dim pdf As New PdfDocument()
pdf.LoadFromFile("test.pdf")
'保存为Excel文档
pdf.SaveToFile("ToExcel.xlsx", FileFormat.XLSX)
End Sub
End Class
End Namespace
用于转换的PDF文档,包含9页内容:
转换时,是将原有PDF每页单独转换为一个sheet页,如图,转换后的Excel文档包含9个sheet页:
另推荐阅读: Java 将 PDF 转为 Excel
—END—