乐趣区

关于后端:没想到还有这种骚操作如何使用Golang实现无头浏览器截图

前言

在 Web 开发中,有时须要对网页进行截图,以便进行页面预览、测试等操作。

而应用无头浏览器来实现截图性能,能够防止手动操作的繁琐和不稳定性。

这篇文章将介绍:应用 Golang 进行无头浏览器的截图,轻松实现页面预览、测试和模仿用户操作。

乏味

这篇文章发完,有敌人在朋友圈留言说:没想到还有这种骚操作~

还有敌人思路关上了:问我能不能 主动实现挪动滑块辨认验证、能不能实现主动登录?

什么是无头浏览器

无头浏览器(Headless Browser)是一种没有图形用户界面的浏览器,它能够在后盾运行,并通过编程接口来管制和操作浏览器。

无头浏览器通常用于自动化测试、网页截图、爬虫等场景,能够帮忙咱们更不便地进行网页操作和数据采集。

常见的无头浏览器包含 Chrome Headless、PhantomJS、Puppeteer 等。

在 Golang 中,能够应用 chromedprod等库来实现无头浏览器截图的性能。

更多场景

应用 Golang 实现无头浏览器截图能够在很多场景下发挥作用,以下是一些常见的场景:

  1. 网页截图:应用无头浏览器能够不便地对网页进行截图,能够用于生成网页快照、监控网页变动等。
  2. 自动化测试:应用无头浏览器能够模仿用户操作,能够用于自动化测试、自动化部署等。
  3. 网页爬虫:应用无头浏览器能够模仿浏览器行为,能够用于网页爬虫、数据采集等。
  4. 数据分析:应用无头浏览器能够获取网页数据,能够用于数据分析、机器学习等。

应用chromedp

chromedp是一个基于 Chrome 或 Chromium 浏览器的 DevTools 协定的库,能够不便地管制浏览器进行截图、模仿用户操作等性能。

以下是应用 chromedp 库实现无头浏览器截图的示例代码:

package main

import (
   "context"
   "io/ioutil"
   "log"
   "time"

   "github.com/chromedp/cdproto/page"
   "github.com/chromedp/chromedp"
)

func main() {
   // 创立一个上下文
   ctx, cancel := chromedp.NewContext(context.Background())
   defer cancel()

   // 设置浏览器选项
   opts := append(chromedp.DefaultExecAllocatorOptions[:],
      chromedp.Flag("headless", true),
      chromedp.Flag("disable-gpu", true),
      chromedp.Flag("no-sandbox", true),
      chromedp.Flag("disable-dev-shm-usage", true),
      chromedp.Flag("remote-debugging-port", "9222"),
   )
   allocCtx, cancel := chromedp.NewExecAllocator(ctx, opts...)
   defer cancel()

   // 创立一个浏览器实例
   ctx, cancel = chromedp.NewContext(allocCtx)
   defer cancel()

   // 导航到指定的 URL
   var buf []byte
   err := chromedp.Run(ctx, chromedp.Navigate("https://www.baidu.com"), chromedp.Sleep(2*time.Second), chromedp.ActionFunc(func(ctx context.Context) error {
      // 获取页面截图
      var err error
      buf, err = page.CaptureScreenshot().WithQuality(90).WithClip(&page.Viewport{X: 0, Y: 0, Width: 1920, Height: 1080, Scale: 1}).Do(ctx)
      if err != nil {return err}
      return nil
   }))
   if err != nil {log.Fatal(err)
   }
   // 将截图保留到文件
   err = ioutil.WriteFile("screenshot.png", buf, 0644)
   if err != nil {log.Fatal(err)
   }
}

这段代码应用 chromedp 库创立了一个无头浏览器实例,并导航到百度首页。

而后应用 page.CaptureScreenshot() 函数获取页面截图,并将截图保留到 screenshot.png 文件中。

运行演示

把我下面的代码复制到 main.go 文件中,装置依赖间接运行即可:

go mod tidy

go run main.go

执行成果如下:

须要留神的是,应用 chromedp 库须要先装置 Chrome 或 Chromium 浏览器,并将其增加到零碎的环境变量中。

应用 rod

rod是另一个基于 Chrome 或 Chromium 浏览器的 DevTools 协定的库,能够不便地管制浏览器进行截图、模仿用户操作等性能。

以下是应用 rod 库实现无头浏览器截图的示例代码:

package main

import (
    "github.com/go-rod/rod"
    "github.com/go-rod/rod/lib/proto"
    "github.com/go-rod/rod/lib/utils"
    "github.com/ysmood/gson"
)

func main() {page := rod.New().MustConnect().MustPage("https://baidu.com").MustWaitLoad()

    // 简略模式,默认截图设置
    page.MustScreenshot("my.png")

    // 自定义截图设置
    img, _ := page.Screenshot(true, &proto.PageCaptureScreenshot{
        Format:  proto.PageCaptureScreenshotFormatJpeg,
        Quality: gson.Int(90),
        Clip: &proto.PageViewport{
            X:      0,
            Y:      0,
            Width:  300,
            Height: 200,
            Scale:  1,
        },
        FromSurface: true,
    })
    _ = utils.OutputFile("my.jpg", img)
}

这段代码应用 rod 库创立了一个无头浏览器实例,并导航到百度首页。

而后应用 page.MustScreenshot() 函数获取页面截图,并将截图保留到 my.png 文件中。

同样演示了应用 page.Screenshot 自定义截图,并将自定义截图保留到了 my.jpg 文件中。

须要留神的是,应用 rod 库须要先装置 Chrome 或 Chromium 浏览器,并将其增加到零碎的环境变量中。

运行形式

rod库示例代码的运行形式和 chromedp 基本一致,略有区别的是咱们须要依据提醒,运行屡次 go run main.go 装置须要的插件:

碰到下面提醒不必慌,再执行一次 go run main.go 即可

执行成果如下:

留神

再强调一遍,不论是应用 chromedp 库还是 rod 库,都须要先装置 Chrome 或 Chromium 浏览器,并将其增加到零碎的环境变量中。

我文章中的演示是基于 Mac OS。

总结

本文介绍了如何应用 Golang 实现无头浏览器截图的性能。

通过应用 chromedprod库,能够不便地管制浏览器进行截图、模仿用户操作等性能。

应用 Golang 实现无头浏览器截图的劣势包含:

高效性:Golang 是一种高效的编程语言,能够疾速地解决大量数据和申请。

可扩展性:Golang 具备良好的可扩展性,能够不便地扩大和批改代码。

跨平台性:Golang 能够在多个平台上运行,能够不便地进行跨平台开发和部署。

安全性:Golang 具备良好的安全性,能够无效地避免代码注入和攻打。

综上所述,应用 Golang 实现无头浏览器截图能够在很多场景下发挥作用,具备高效性、可扩展性、跨平台性和安全性等劣势。

一起学习

我的微信:wangzhongyang1993

我的公众号:程序员升职加薪之旅

欢送大家关注 我的思否 ,给这篇文章点赞、留言、转发。 你的反对,是我更文的最大能源!

退出移动版