如何使用 AI 协助整理和静态化旧网站

2026-06-07

很多旧网站不是没有价值,而是太难维护。

有些网站是以前用 WordPress、Jimdo 或其他建站工具做的;有些是用 HTTrack 之类工具镜像下来的;还有一些是多年积累出来的 HTML、CSS、图片和脚本混在一起。打开目录时,文件很多,入口不清楚,图片到处放,链接也不知道还通不通。

这时候,AI 很适合当一个“整理助手”。

它不能替你判断一个旧页面有没有纪念意义,也不能替你决定哪些内容必须保留。但它可以帮你看目录结构、找入口页面、分析引用关系、整理清理步骤、修复链接、生成发布检查清单。

这篇文章讲的不是某一种固定工具,而是一套思路:如何让 AI 协助你把一个旧网站整理成能打开、能部署、能长期保存的静态网站。

整理旧网站的目标,也不是把所有东西都改得很新,而是先得到一个清楚的发布目录:入口明确、资源齐全、链接可用、以后还能继续维护。

1. 先确认适不适合静态化

不是所有网站都适合静态化。

适合静态化的网站通常有这些特点:

比如:

不太适合直接静态化的网站包括:

可以先问 AI:

我有一个旧网站目录,里面主要是 HTML、CSS、JS 和图片。
请告诉我它是否适合整理成静态网站,并列出判断标准。

如果不确定,可以把目录结构发给 AI:

这是旧网站的目录结构:

index.html
assets/
css/
js/
images/
wp-content/
hts-log.txt

请帮我判断它可能是什么类型的网站,以及静态化时要重点检查什么。

2. 不要一开始就删除文件

整理旧网站最怕一上来就删。

因为很多旧站文件名奇怪,目录也乱,看起来像垃圾的文件,可能正好被某个页面引用。尤其是图片、CSS、JavaScript、字体文件和下载附件,不检查引用关系就删除,很容易把页面弄坏。

比较稳妥的做法是:

  1. 先复制一份旧网站目录
  2. 在副本里整理
  3. 让 AI 帮你盘点目录结构
  4. 先确认入口页面
  5. 再确认哪些文件真的没有被引用
  6. 最后再清理

如果目录很乱,可以一开始就分成两个区域:

old-site-raw/     原始备份,不直接修改
old-site-clean/   整理后的静态网站发布目录

所有修改都发生在 old-site-clean/old-site-raw/ 只用来对照和恢复。这样就算整理过程中删错或改错,也不会把原始材料弄丢。

可以这样问 AI:

我准备整理一个旧网站目录。
请帮我制定一个安全清理流程,要求先盘点、再确认引用关系,最后才删除无用文件。

如果你使用 Git 管理,也可以先提交一个原始状态:

请帮我设计一个旧网站整理前的 Git 备份步骤,确保后续清理错了可以恢复。

AI 可以帮你写流程,但真正删除文件之前,最好自己再确认一遍。

3. 找到真正的首页和内容入口

旧网站目录里可能有多个看起来像首页的文件。

常见情况包括:

有些镜像站还会带着工具生成的文件,例如:

这一步可以让 AI 帮你分析:

我有一个旧网站目录,里面有 index.html、index2.html、hts-log.txt 和多个子目录。
请告诉我如何判断哪个文件才是真正应该发布的首页。

如果可以读取文件内容,也可以把几个首页文件的开头片段发给 AI:

下面是 index.html 和 index2.html 的前 80 行。
请帮我判断哪个更像真实页面,哪个更像镜像工具生成的外壳或错误页。

找到入口以后,后续整理才有方向。

4. 检查本地链接和资源引用

静态网站最常见的问题是:页面能打开,但图片丢了,CSS 没加载,链接点过去 404。

需要重点检查:

可以问 AI:

请告诉我整理静态网站时,需要检查 HTML 和 CSS 中哪些资源引用。
请按图片、样式、脚本、链接、表单分类列出。

如果你有一批页面,也可以让 AI 帮你设计检查命令或检查脚本:

我有一个静态网站目录。
请帮我写一个检查本地 href、src、link href、script src 和 CSS url(...) 是否存在的思路。

AI 很适合帮你找“检查点”,但实际检查结果要以本地文件是否存在为准。

5. 清理镜像工具残留

用 HTTrack 或类似工具保存下来的站点,经常会带一些不需要发布的文件。

常见残留包括:

可以问 AI:

我这个目录是 HTTrack 镜像出来的静态网站。
请告诉我哪些文件通常是镜像工具残留,哪些文件不能轻易删除。

这里要特别小心:AI 可以告诉你“哪些类型可能是残留”,但不要只根据文件名删除。最好配合引用检查:

请帮我设计一个判断文件是否可以删除的规则:
1. 是否被 HTML 引用
2. 是否被 CSS 引用
3. 是否是入口页面
4. 是否是图片或下载资源
5. 是否只是日志或临时文件

原则很简单:不确定的先保留,确认没用的再删。

6. 处理不能静态化的功能

旧网站里可能有一些动态功能,静态化以后不能原样使用。

常见例子:

这些功能有几种处理方式:

  1. 删除不用的功能
  2. 改成普通联系方式
  3. 换成第三方表单服务
  4. 保留外链
  5. 写清楚“此功能已不再提供”

可以问 AI:

我想把旧网站静态化,但里面有联系表单、地图和搜索框。
请告诉我这些功能在静态网站里分别可以怎么处理。

对于小网站,联系表单可以考虑 Formspree、Google Forms 或其他托管表单服务。搜索功能也可以先用浏览器搜索、站内目录,或者交给 Google 搜索。

不要为了一个很少使用的功能,重新做一整套后端。维护成本可能比网站本身还高。

7. 统一页面样式

旧网站静态化以后,通常还会遇到一个问题:页面能打开,但风格混乱。

可能有的页面字体太小,有的页面宽度太窄,有的表格撑出屏幕,有的手机上阅读困难。

AI 可以帮你做这些整理:

可以这样问:

这是一个旧静态页面的 HTML 和 CSS。
请帮我在尽量不改变内容的前提下,改善排版、字体、页面宽度和手机端阅读体验。

如果有多篇页面,可以先做一个模板:

请帮我设计一个简单的静态网站页面模板。
要求包含统一页头、导航、正文区域、页脚,并适合中文阅读。

然后再把旧内容慢慢迁进去。

8. 本地验证再发布

整理完成后,不要马上发布。

先本地检查:

可以让 AI 帮你做检查表:

我已经把旧网站整理成静态目录。
请给我一份发布前检查清单,重点检查链接、图片、CSS、手机端和无用动态功能。

如果你有本地检查结果,也可以继续问:

检查结果如下:
- 首页正常
- 两张图片 404
- contact.html 里表单 action 指向旧 PHP
- 手机端表格超宽

请帮我按优先级整理修复顺序。

AI 在这种“把问题排队”的工作上很有用。

9. 后续文章如何发布

静态网站整理好以后,最好不要每次都手写 HTML。

更省心的方式是:把文章写成 Markdown,再用脚本自动生成 HTML 页面、文章目录和站点地图。这样以后新增文章时,只要关注内容本身,不用每次重复复制页面模板。

以一个个人博客为例,可以设计成这样的目录:

blog/
  docs/
    dailys/
      20260607_005.md
  dailys/
    20260607_005.html
    index.html
  PowerShell/
    Publish-Dailys.ps1
  index.html
  sitemap.xml

这里的分工是:

新增一篇文章时,可以先创建一个 Markdown 文件,例如:

blog/docs/dailys/20260607_006.md

文件开头可以写元信息:

---
title: 新文章标题
date: 2026-06-07
description: 这篇文章的简短说明
slug: 20260607_006
---

这里开始写正文。

写完以后运行发布脚本:

powershell -NoProfile -ExecutionPolicy Bypass -File .\blog\PowerShell\Publish-Dailys.ps1

脚本可以自动完成:

发布前再检查一下:

git status --short

确认无误后提交并推送:

git add blog/dailys/20260607_006.html blog/dailys/index.html blog/index.html blog/sitemap.xml
git add -f blog/docs/dailys/20260607_006.md
git commit -m "Publish new daily article"
git push origin main

如果 blog/docs/.gitignore 忽略,Markdown 原稿需要使用 git add -f 强制加入。这样远程仓库里既保留原稿,也保留生成后的网页。

这套流程的好处是:静态网站不只是一次性整理完成,而是变成了一个可以继续写、继续发布、继续维护的小系统。

遇到不确定的地方,也可以直接问 AI:

我现在有一个 Markdown 自动发布脚本。
请帮我设计新增文章、生成 HTML、检查 Git 状态、提交并推送 GitHub 的发布流程。

10. 发布到静态托管

整理好的静态网站可以发布到很多地方:

如果网站只是 HTML、CSS、图片和少量 JavaScript,GitHub Pages 就已经够用。

可以问 AI:

我已经整理好了一个静态网站目录。
请告诉我如何发布到 GitHub Pages,并绑定自己的域名。

如果网站是给客户或朋友维护,也可以让 AI 帮你写交付说明:

请帮我写一份静态网站交付说明,包含目录结构、如何修改页面、如何替换图片、如何发布。

一个整理好的静态网站,最重要的是别人以后还能看懂。

11. 常见坑

整理旧网站时,常见问题包括:

遇到这种情况,可以把问题描述给 AI:

我在整理一个旧静态网站。
本地打开首页正常,但发布到 GitHub Pages 后图片 404。
图片路径是 common/images/a.jpg,HTML 在 blog/index.html。
请帮我判断可能是相对路径问题还是文件没有提交。

问题越具体,AI 越容易帮你定位。

12. 版权和隐私也要检查

旧网站能静态化,不代表所有内容都适合重新发布。

发布前还要确认:

可以问 AI:

我准备把一个旧网站整理成静态网站重新发布。
请帮我列一份版权、隐私和敏感信息检查清单。

AI 可以帮你提醒风险,但最终能不能发布,还是要按内容来源和实际授权来判断。

结语

AI 很适合协助旧网站静态化,因为这件事本身不是单一技术问题,而是一堆小判断、小检查、小修复。

它需要有人不断问:

这些问题,一个人慢慢查当然也能做,但会很耗时间。AI 的价值,就是陪你把混乱的目录一点点拆开。

旧网站整理成静态网站以后,也许不会变得多么华丽。但它会变得清楚、轻量、容易部署,也更适合长期保存。

这就够了。