2022年6月30日

s3-ocr 是一个新工具,它可以通过 Amazon Textract 对 S3 存储桶中的每个 PDF 文件运行 OCR,并将结果写入可搜索的 SQLite 数据库,可用于 Datasette。更多信息请阅读 s3-ocr: 从 S3 存储桶中存储的 PDF 文件中提取文本