使用正则表达式丰富数据
在 Datasette 相同的环境中安装此插件。
datasette install datasette-enrichments-re2
此丰富功能允许您对某一列运行正则表达式,并执行以下操作之一
- 对该列执行搜索和替换
- 提取第一个匹配结果并将其存储在指定的列中(必要时添加新列)
- 提取所有匹配结果并将其作为 JSON 数组存储在指定的列中。如果正则表达式使用命名捕获组,这将是一个对象数组,否则将是一个字符串数组。
- 执行带有命名捕获组的正则表达式,并将结果存储在多个列中,每个命名组对应一列
要在本地设置此插件,首先检出代码。然后创建一个新的虚拟环境
cd datasette-enrichments-re2
python3 -m venv venv
source venv/bin/activate
现在安装依赖项和测试依赖项
pip install -e '.[test]'
运行测试
pytest