📋 抓取记录
每页显示:
暂无数据,请先抓取页面
📌 功能说明
- 文件存储:HTML文件保存在
data/html/,图片保存在 data/images/。
- 文件命名:优先使用URL中的原始文件名(如
0a9fc8ad-c73e-4f1c-96de-41d029934c7c.html),无效时使用MD5值。
- 图片处理:自动识别并下载HTML中的图片,替换为本地路径。支持重试机制(2次重试)。图片下载前会检查是否已存在,避免重复下载。
- 🔧 API路径智能映射:
/api/public-file/download → https://metaso.cn
/api/public-file/img → https://img.cn
- 其他API路径可在
getApiDomainMap() 函数中自定义
- 内容替换:自动替换敏感信息(手机号、邮箱、身份证等),共预设16种替换规则。微信/QQ号正则已优化,避免误匹配;地址正则已优化,不会误匹配"市场"中的"市"。
- 分页功能:支持分页浏览,可自定义每页显示数量(10/20/50/100条)。
- 批量操作:支持批量删除选中的记录,需要密码验证。
- 其他功能:JSON输出、搜索、防重复抓取。
- 🚀 快捷访问:直接访问
?action=https://example.com 即可抓取或展示页面。
- 📁 可迁移:数据库存储相对路径,整个目录可随意迁移到其他服务器。
- 🔒 安全删除:删除操作需要密码验证(默认密码:123456,可在文件开头的
DELETE_PASSWORD 常量中修改)。
- 🌐 域名白名单:只允许抓取白名单内的域名,当前白名单:
https://report.metaso.cn, https://daaee.cn。