CXPLAY on Nostr: 在思考如何存档 #酷安 上的文章. 目前通过携带 sharekey ...
在思考如何存档 #酷安 上的文章. 目前通过携带 sharekey 参数可以做到网页预览, 但是这是在暴露分享者身份的前提下做到的. 此外酷安的 WAF 似乎还屏蔽了海外 IP, archive.ph 和 12ft 都无法直接代理查看.
或许可以用 SingleFileZ 转储网页后再上传到一个临时 Web 服务器, 把 Web 服务器路径里的 HTML 再喂给 archive.ph, 存档完成后就删除 Web 服务器里的文件. 也可以同时喂给 web.archive.org, 不过可能它们的爬虫后端不支持这种含有自解压资源的 HTML, archive.ph 爬虫用的是无头 Chromium, 也许能用.
Published at
2024-03-03 09:26:47Event JSON
{
"id": "4264af285510d367416c126a2ce87b3fc0e2d76b6982ba078ac27bcfb363502b",
"pubkey": "434f97993627f1e61f14eeaf60caa8cfdcec10a592caff8250c825252d548c15",
"created_at": 1709454407,
"kind": 1,
"tags": [
[
"t",
"酷安"
],
[
"t",
"酷安"
],
[
"r",
"archive.ph"
],
[
"r",
"archive.ph"
],
[
"r",
"web.archive.org"
],
[
"r",
"archive.ph"
]
],
"content": "在思考如何存档 #酷安 上的文章. 目前通过携带 sharekey 参数可以做到网页预览, 但是这是在暴露分享者身份的前提下做到的. 此外酷安的 WAF 似乎还屏蔽了海外 IP, archive.ph 和 12ft 都无法直接代理查看.\n或许可以用 SingleFileZ 转储网页后再上传到一个临时 Web 服务器, 把 Web 服务器路径里的 HTML 再喂给 archive.ph, 存档完成后就删除 Web 服务器里的文件. 也可以同时喂给 web.archive.org, 不过可能它们的爬虫后端不支持这种含有自解压资源的 HTML, archive.ph 爬虫用的是无头 Chromium, 也许能用.",
"sig": "906f61f1807fd71cfacbfd51d7a6a168a54630ed65f6e88d4083e0375832a455ef574629315fb89a35fa5db78b974f97286bf985153f25e23e46c3133bc62dbf"
}