Aspose.PDF for .NET是一种高级PDF处理和解析API,用于在跨平台应用程序中执行文档管理和操作任务。API可以轻松用于生成,修改,转换,渲染,保护和打印PDF文档,而无需使用Adobe
Acrobat。此外,还提供PDF压缩选项,表格创建和操作,图形和图像功能,广泛的超链接功能,印章和水印任务,扩展的安全控制和自定义字体处理。
PDF是当今最流行的文档格式之一,各种应用程序将其用作最终输出。由于支持多种数据类型和可移植性,因此它是创建和共享内容的首选格式。作为对开发文档管理应用程序感兴趣的.NET应用程序开发人员,可能希望嵌入处理功能,以读取PDF文档并将其转换为其他文件格式,例如HTML。
在本文中,我们将探索并演示Aspose.PDF for .NET API的强大转换功能,以使用多种选项读取PDF文件并将其转换为HTML。
将HTML转换到PDF
只需使用几行代码和资源加载回调就可以以非常基本的方式将HTML转换为PDF,以下是使您达到目的的代码段:
//Thepathtothedocumentsdirectory.
stringdataDir=RunExamples.GetDataDir_AsposePdf_DocumentConversion();
HtmlLoadOptionsoptions=newHtmlLoadOptions();
options.CustomLoaderOfExternalResources=newLoadOptions.ResourceLoadingStrategy(SamePictureLoader);
DocumentpdfDocument=newDocument(dataDir+"HTMLToPDF.html",options);
pdfDocument.Save("HTMLToPDF_out.pdf");
将PDF转换为多页HTML
可以使用以下示例代码在将PDF转换为HTML的过程中,将上述步骤中的HTML分为多个页面。
//Thepathtothedocumentsdirectory.
stringdataDir=RunExamples.GetDataDir_AsposePdf_DocumentConversion();
//OpenthesourcePDFdocument
DocumentpdfDocument=newDocument(dataDir+"PDFToHTML.pdf");
//InstantiateHTMLSaveOptionsobject
HtmlSaveOptionshtmlOptions=newHtmlSaveOptions();
//Specifytosplittheoutputintomultiplepages
htmlOptions.SplitIntoPages=true;
//Savethedocument
pdfDocument.Save(@"MultiPageHTML_out.html",htmlOptions);
将SplitIntoPages标志设置为true可以为您完成所有工作,并且输出HTML由多个页面而不是单个页面组成。
将图像保存到特定文件夹
PDF文档除了文本详细信息外还可以包含图像。HTML可以包含HTML内基于64位编码的图像,也可以引用这些图像所在的文件夹中的图像。Aspose.PDF API具有丰富的功能,可以将图像保存到光盘上用户指定的文件夹中。以下代码示例显示了在将PDF转换为HTML的过程中如何将图像保存到特定文件夹。
//CreateHtmlSaveOptionwithtestedfeature
HtmlSaveOptionsnewOptions=newHtmlSaveOptions();
//Specifytheseparatefoldertosaveimages
newOptions.SpecialFolderForAllImages=dataDir;
*想要购买Aspose正版授权的朋友可以联系慧都客服哦~
ASPOSE技术交流QQ群(64183)已开通,各类资源及时分享,欢迎交流讨论!
扫描关注“慧聚IT”微信公众号,及时获取更多产品最新动态及最新资讯
标签:
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至hey@