如何使用 AI 协助整理和静态化旧网站
很多旧网站不是没有价值,而是太难维护。
有些网站是以前用 WordPress、Jimdo 或其他建站工具做的;有些是用 HTTrack 之类工具镜像下来的;还有一些是多年积累出来的 HTML、CSS、图片和脚本混在一起。打开目录时,文件很多,入口不清楚,图片到处放,链接也不知道还通不通。
这时候,AI 很适合当一个“整理助手”。
它不能替你判断一个旧页面有没有纪念意义,也不能替你决定哪些内容必须保留。但它可以帮你看目录结构、找入口页面、分析引用关系、整理清理步骤、修复链接、生成发布检查清单。
这篇文章讲的不是某一种固定工具,而是一套思路:如何让 AI 协助你把一个旧网站整理成能打开、能部署、能长期保存的静态网站。
整理旧网站的目标,也不是把所有东西都改得很新,而是先得到一个清楚的发布目录:入口明确、资源齐全、链接可用、以后还能继续维护。
1. 先确认适不适合静态化
不是所有网站都适合静态化。
适合静态化的网站通常有这些特点:
- 主要是展示内容
- 页面不需要登录
- 不依赖实时数据库
- 不需要后台管理
- 表单可以改用第三方服务
- 主要内容是 HTML、图片、CSS、JavaScript
比如:
- 个人网站
- 公司介绍页
- 活动页
- 产品介绍页
- 旧博客归档
- 经文、资料、文档类页面
- 从旧建站平台导出或镜像下来的网页
不太适合直接静态化的网站包括:
- 需要用户登录的网站
- 需要后台提交数据的网站
- 实时查询数据库的网站
- 订单、支付、会员系统
- 强依赖服务器接口的应用
可以先问 AI:
我有一个旧网站目录,里面主要是 HTML、CSS、JS 和图片。
请告诉我它是否适合整理成静态网站,并列出判断标准。
如果不确定,可以把目录结构发给 AI:
这是旧网站的目录结构:
index.html
assets/
css/
js/
images/
wp-content/
hts-log.txt
请帮我判断它可能是什么类型的网站,以及静态化时要重点检查什么。
2. 不要一开始就删除文件
整理旧网站最怕一上来就删。
因为很多旧站文件名奇怪,目录也乱,看起来像垃圾的文件,可能正好被某个页面引用。尤其是图片、CSS、JavaScript、字体文件和下载附件,不检查引用关系就删除,很容易把页面弄坏。
比较稳妥的做法是:
- 先复制一份旧网站目录
- 在副本里整理
- 让 AI 帮你盘点目录结构
- 先确认入口页面
- 再确认哪些文件真的没有被引用
- 最后再清理
如果目录很乱,可以一开始就分成两个区域:
old-site-raw/ 原始备份,不直接修改
old-site-clean/ 整理后的静态网站发布目录
所有修改都发生在 old-site-clean/,old-site-raw/ 只用来对照和恢复。这样就算整理过程中删错或改错,也不会把原始材料弄丢。
可以这样问 AI:
我准备整理一个旧网站目录。
请帮我制定一个安全清理流程,要求先盘点、再确认引用关系,最后才删除无用文件。
如果你使用 Git 管理,也可以先提交一个原始状态:
请帮我设计一个旧网站整理前的 Git 备份步骤,确保后续清理错了可以恢复。
AI 可以帮你写流程,但真正删除文件之前,最好自己再确认一遍。
3. 找到真正的首页和内容入口
旧网站目录里可能有多个看起来像首页的文件。
常见情况包括:
index.htmlindex2.htmlhome.html- 某个子目录里的
index.html - 镜像工具生成的外壳页
- 旧 CMS 导出的页面
有些镜像站还会带着工具生成的文件,例如:
hts-log.txtbackblue.giffade.gifindex.html只是跳转或错误页- 真正内容在更深的目录里
这一步可以让 AI 帮你分析:
我有一个旧网站目录,里面有 index.html、index2.html、hts-log.txt 和多个子目录。
请告诉我如何判断哪个文件才是真正应该发布的首页。
如果可以读取文件内容,也可以把几个首页文件的开头片段发给 AI:
下面是 index.html 和 index2.html 的前 80 行。
请帮我判断哪个更像真实页面,哪个更像镜像工具生成的外壳或错误页。
找到入口以后,后续整理才有方向。
4. 检查本地链接和资源引用
静态网站最常见的问题是:页面能打开,但图片丢了,CSS 没加载,链接点过去 404。
需要重点检查:
<a href="..."><img src="..."><script src="..."><link href="...">- CSS 里的
url(...) - 表单里的
action - iframe 或地图嵌入
可以问 AI:
请告诉我整理静态网站时,需要检查 HTML 和 CSS 中哪些资源引用。
请按图片、样式、脚本、链接、表单分类列出。
如果你有一批页面,也可以让 AI 帮你设计检查命令或检查脚本:
我有一个静态网站目录。
请帮我写一个检查本地 href、src、link href、script src 和 CSS url(...) 是否存在的思路。
AI 很适合帮你找“检查点”,但实际检查结果要以本地文件是否存在为准。
5. 清理镜像工具残留
用 HTTrack 或类似工具保存下来的站点,经常会带一些不需要发布的文件。
常见残留包括:
- 镜像日志
- 缓存文件
- 临时页面
- 远程站点结构外壳
- 重复的入口页
- 不再使用的图片
- 原站统计代码
- 旧广告脚本
- 外部服务的失败引用
可以问 AI:
我这个目录是 HTTrack 镜像出来的静态网站。
请告诉我哪些文件通常是镜像工具残留,哪些文件不能轻易删除。
这里要特别小心:AI 可以告诉你“哪些类型可能是残留”,但不要只根据文件名删除。最好配合引用检查:
请帮我设计一个判断文件是否可以删除的规则:
1. 是否被 HTML 引用
2. 是否被 CSS 引用
3. 是否是入口页面
4. 是否是图片或下载资源
5. 是否只是日志或临时文件
原则很简单:不确定的先保留,确认没用的再删。
6. 处理不能静态化的功能
旧网站里可能有一些动态功能,静态化以后不能原样使用。
常见例子:
- 联系表单
- 评论区
- 搜索功能
- 登录入口
- 地图
- 预约系统
- 后台管理入口
- PHP、ASP、CGI 等服务器脚本
这些功能有几种处理方式:
- 删除不用的功能
- 改成普通联系方式
- 换成第三方表单服务
- 保留外链
- 写清楚“此功能已不再提供”
可以问 AI:
我想把旧网站静态化,但里面有联系表单、地图和搜索框。
请告诉我这些功能在静态网站里分别可以怎么处理。
对于小网站,联系表单可以考虑 Formspree、Google Forms 或其他托管表单服务。搜索功能也可以先用浏览器搜索、站内目录,或者交给 Google 搜索。
不要为了一个很少使用的功能,重新做一整套后端。维护成本可能比网站本身还高。
7. 统一页面样式
旧网站静态化以后,通常还会遇到一个问题:页面能打开,但风格混乱。
可能有的页面字体太小,有的页面宽度太窄,有的表格撑出屏幕,有的手机上阅读困难。
AI 可以帮你做这些整理:
- 统一字体
- 统一页面宽度
- 改善移动端阅读
- 整理导航
- 统一页脚
- 简化旧样式
- 删除过时的装饰代码
可以这样问:
这是一个旧静态页面的 HTML 和 CSS。
请帮我在尽量不改变内容的前提下,改善排版、字体、页面宽度和手机端阅读体验。
如果有多篇页面,可以先做一个模板:
请帮我设计一个简单的静态网站页面模板。
要求包含统一页头、导航、正文区域、页脚,并适合中文阅读。
然后再把旧内容慢慢迁进去。
8. 本地验证再发布
整理完成后,不要马上发布。
先本地检查:
- 首页能不能打开
- 图片是否显示
- CSS 是否加载
- 菜单链接是否可点
- 子页面是否可访问
- 手机宽度是否正常
- 没有明显乱码
- 不需要的动态入口是否已经处理
可以让 AI 帮你做检查表:
我已经把旧网站整理成静态目录。
请给我一份发布前检查清单,重点检查链接、图片、CSS、手机端和无用动态功能。
如果你有本地检查结果,也可以继续问:
检查结果如下:
- 首页正常
- 两张图片 404
- contact.html 里表单 action 指向旧 PHP
- 手机端表格超宽
请帮我按优先级整理修复顺序。
AI 在这种“把问题排队”的工作上很有用。
9. 后续文章如何发布
静态网站整理好以后,最好不要每次都手写 HTML。
更省心的方式是:把文章写成 Markdown,再用脚本自动生成 HTML 页面、文章目录和站点地图。这样以后新增文章时,只要关注内容本身,不用每次重复复制页面模板。
以一个个人博客为例,可以设计成这样的目录:
blog/
docs/
dailys/
20260607_005.md
dailys/
20260607_005.html
index.html
PowerShell/
Publish-Dailys.ps1
index.html
sitemap.xml
这里的分工是:
blog/docs/dailys/保存 Markdown 原稿blog/dailys/保存生成后的 HTMLPublish-Dailys.ps1负责把 Markdown 转成 HTMLblog/index.html显示文章入口sitemap.xml提供给搜索引擎
新增一篇文章时,可以先创建一个 Markdown 文件,例如:
blog/docs/dailys/20260607_006.md
文件开头可以写元信息:
---
title: 新文章标题
date: 2026-06-07
description: 这篇文章的简短说明
slug: 20260607_006
---
这里开始写正文。
写完以后运行发布脚本:
powershell -NoProfile -ExecutionPolicy Bypass -File .\blog\PowerShell\Publish-Dailys.ps1
脚本可以自动完成:
- 读取 Markdown
- 生成对应 HTML
- 更新文章目录页
- 更新网站首页入口
- 更新
sitemap.xml - 清理已经删除 Markdown 的旧 HTML
发布前再检查一下:
git status --short
确认无误后提交并推送:
git add blog/dailys/20260607_006.html blog/dailys/index.html blog/index.html blog/sitemap.xml
git add -f blog/docs/dailys/20260607_006.md
git commit -m "Publish new daily article"
git push origin main
如果 blog/docs/ 被 .gitignore 忽略,Markdown 原稿需要使用 git add -f 强制加入。这样远程仓库里既保留原稿,也保留生成后的网页。
这套流程的好处是:静态网站不只是一次性整理完成,而是变成了一个可以继续写、继续发布、继续维护的小系统。
遇到不确定的地方,也可以直接问 AI:
我现在有一个 Markdown 自动发布脚本。
请帮我设计新增文章、生成 HTML、检查 Git 状态、提交并推送 GitHub 的发布流程。
10. 发布到静态托管
整理好的静态网站可以发布到很多地方:
- GitHub Pages
- Cloudflare Pages
- Netlify
- Vercel
- 普通虚拟主机
- 对象存储静态网站
如果网站只是 HTML、CSS、图片和少量 JavaScript,GitHub Pages 就已经够用。
可以问 AI:
我已经整理好了一个静态网站目录。
请告诉我如何发布到 GitHub Pages,并绑定自己的域名。
如果网站是给客户或朋友维护,也可以让 AI 帮你写交付说明:
请帮我写一份静态网站交付说明,包含目录结构、如何修改页面、如何替换图片、如何发布。
一个整理好的静态网站,最重要的是别人以后还能看懂。
11. 常见坑
整理旧网站时,常见问题包括:
- 以为
index.html是首页,结果真正内容在index2.html - 删除了看似无用的图片,结果某个子页面正在使用
- 只检查 HTML,没有检查 CSS 里的
url(...) - 表单页面保留下来了,但提交功能已经失效
- 外部地图、统计、广告脚本加载失败
- 旧页面编码混乱,中文显示乱码
- 镜像下来的 HTML 其实是 gzip 或错误页面
- 本地路径能打开,发布后大小写不一致导致 404
- 文件夹层级太深,部署时入口放错位置
- 清理过度,导致历史内容丢失
遇到这种情况,可以把问题描述给 AI:
我在整理一个旧静态网站。
本地打开首页正常,但发布到 GitHub Pages 后图片 404。
图片路径是 common/images/a.jpg,HTML 在 blog/index.html。
请帮我判断可能是相对路径问题还是文件没有提交。
问题越具体,AI 越容易帮你定位。
12. 版权和隐私也要检查
旧网站能静态化,不代表所有内容都适合重新发布。
发布前还要确认:
- 内容是不是自己拥有或有权使用
- 图片、字体、下载文件有没有授权问题
- 页面里有没有电话、邮箱、地址等个人信息
- 旧表单、旧后台入口是否还暴露在页面上
- 客户、公司或他人的资料是否需要脱敏
- 原站统计代码、广告代码是否应该删除
可以问 AI:
我准备把一个旧网站整理成静态网站重新发布。
请帮我列一份版权、隐私和敏感信息检查清单。
AI 可以帮你提醒风险,但最终能不能发布,还是要按内容来源和实际授权来判断。
结语
AI 很适合协助旧网站静态化,因为这件事本身不是单一技术问题,而是一堆小判断、小检查、小修复。
它需要有人不断问:
- 哪个页面是真正入口?
- 哪些内容值得保留?
- 哪些文件可以删除?
- 哪些链接坏了?
- 哪些动态功能要替换?
- 最后怎么发布?
这些问题,一个人慢慢查当然也能做,但会很耗时间。AI 的价值,就是陪你把混乱的目录一点点拆开。
旧网站整理成静态网站以后,也许不会变得多么华丽。但它会变得清楚、轻量、容易部署,也更适合长期保存。
这就够了。