1200字范文,内容丰富有趣,写作的好帮手!
1200字范文 > 利用Chrome Headless模式网页转PDF

利用Chrome Headless模式网页转PDF

时间:2020-02-19 23:58:12

相关推荐

利用Chrome Headless模式网页转PDF

本文转载于:/aWDac/article/details/80865754

/xcl168/article/details/75675781

后台网页截图参考:/xsviglh_/article/details/105321649

一、概述

试过使用wkhtmltopdf来将网页打印成PDF文件,但有些网页转出来是空白的。然后发现Chrome Headless模式可以实现我想要的,而且用Chrome来实现,可以排除掉很多Bug。

Chrome Headless模式相当于一个没有界面的浏览器,能实现很多功能,能实现pdf打印,截图等,扩展下,可以 做web测试,爬虫抓取等等。

二、安装

sudo apt-get install libxss1 libappindicator1 libindicator7wget /linux/direct/google-chrome-stable_current_amd64.debsudo dpkg -i google-chrome-stable_current_amd64.debsudo apt-get install -f

三、命令使用

google-chrome --headless --disable-gpu --print-to-pdf='test.pdf' /

参数说明:

–headless:无头模式,就是无界面模式运行–print-to-pdf:指定转pdf的路径和名称–no-sandbox:让Chrome在root权限下跑–window-size:专门应对无头浏览器中不能最大化屏幕的方案,如–window-size=1920,1080

四、Java中使用

请参考/fanyong920/jvppeteer要使用 maven,请将此依赖添加到pom.xml文件中:

<dependency><groupId>io.github.fanyong920</groupId><artifactId>jvppeteer</artifactId><version>1.1.1</version></dependency>

生成页面的 PDF

//自动下载,第一次下载后不会再下载BrowserFetcher.downloadIfNotExist(null);ArrayList<String> arrayList = new ArrayList<>();//生成pdf必须在无厘头模式下才能生效LaunchOptions options = new LaunchOptionsBuilder().withArgs(arrayList).withHeadless(true).build();arrayList.add("--no-sandbox");arrayList.add("--disable-setuid-sandbox");Browser browser = Puppeteer.launch(options);Page page = browser.newPage();page.goTo("/?tn=98012088_10_dg&ch=3");PDFOptions pdfOptions = new PDFOptions();pdfOptions.setPath("test.pdf");page.pdf(pdfOptions);page.close();browser.close();

四、 官方文档

/web/updates//04/headless-chrome#create_a_pdf

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。