一个用于自动抓取网站截图的命令行工具
有关此项目的背景信息,请参阅shot-scraper:基于 Playwright 构建的用于文档的自动化截图工具。
要无需安装任何软件即可开始使用,请使用 shot-scraper-template 模板创建自己的 GitHub 仓库,该仓库使用 shot-scraper
抓取页面的截图。有关详细信息,请参阅立即创建 GitHub 仓库以抓取网页截图。
您可以使用 pip 安装 shot-scraper
CLI 工具
pip install shot-scraper
# Now install the browser it needs:
shot-scraper install
您可以像这样抓取一个网页的截图
shot-scraper https://datasette.com.cn/
这将在名为 datasette-io.png
的文件中创建一个截图。
更多选项可用,有关详细信息,请参阅抓取截图。
- shot-scraper-demo 仓库使用此工具根据此页面抓取加利福尼亚州埃尔格拉纳达最近发现的猫头鹰,并生成一个带有注释的截图,说明 Datasette 的一个功能,如我的博客中所述。
- Datasette 文档使用在 simonw/datasette-screenshots GitHub 仓库中运行的
shot-scraper
抓取的截图,详细信息请参阅使用 shot-scraper 自动化 Datasette 文档的截图。 - Ben Welsh 构建了 @newshomepages,这是一个 Twitter 机器人,它使用
shot-scraper
和 GitHub Actions 抓取新闻网站首页的截图并发布到 Twitter。相关代码位于 palewire/news-homepages。 - scrape-hacker-news-by-domain 使用
shot-scraper javascript
抓取网页。有关其工作原理的详细信息,请参阅使用 shot-scraper 从命令行抓取网页。 - 路透社使用 shot-scraper 生成定期更新的数据仪表板,用于电子邮件通讯。