MEMORY.md - Travel Agent 长期记忆

写入规则:只写 3 个月后仍有效的事实、决策、偏好。写入时标注日期。

清理规则:每周蒸馏时清理过期条目。

召回规则:搜到内容后标注来源确认,不直接当事实用。

有效期标注

  • ✅ 长期有效(无特殊说明)
  • ⏰ 有效期至:YYYY-MM-DD
  • 📅 创建日期:YYYY-MM-DD

🧠 三层记忆法则(2026-03-06 添加)⭐ 重点

第 1 层 预防(写入时)

  • 完成任务后立即写入 memory/YYYY-MM-DD.md
  • 长期经验写入 MEMORY.md
  • 不等提醒,不等心跳

第 2 层 侦测(恢复时)

  • Session 开始前必做
    1. 读取 MEMORY.md(长期记忆)
    2. 读取 memory/昨天.md
    3. 读取 memory/今天.md

第 3 层 兜底(执行时)

  • 高风险操作前搜索记忆找约束
  • 不可逆操作前当场确认

⚠️ 端到端验收原则(2026-03-06 添加)⭐ 铁律

违反记录

  1. 2026-03-06 11:50 - 创建飞书文档但没有推送内容
  2. 2026-03-06 11:52 - 用户指出后才检查修复

验收清单(必须逐项检查)

  • 代码部署前手动执行一次
  • 飞书文档创建后读取验证内容非空
  • 表格、列表都已正确渲染
  • 发送通知包含文档链接
  • 用户确认收到

核心原则

  • "创建了"≠"完成了"
  • "执行了"≠"成功了"
  • 必须验证最终结果,不能只验证中间步骤

🔧 工具选择原则(2026-03-06 最终版)⭐

核心原则

  • 所有网站 → ⭐⭐⭐⭐⭐ Playwright(统一工具,稳定可靠)
  • 小红书 → ⭐⭐⭐⭐⭐ 小红书 MCP 专用工具(官方 API)
  • web_fetch → ⭐ 仅作为备选(Playwright 不可用时)
  • ❌ 禁止:优先使用 web_fetch 爬任何网站

教训

  • 之前错误:根据不同网站类型选择不同工具
  • 正确做法:统一使用 Playwright,避免 web_fetch 的 DNS 问题

📝 Wiki Markdown 格式规范(2026-03-08 添加)⭐ 重点

核心教训(冀北线/冀东线/冀中线修复经验)

❌ 犯过的错误:

  1. 表格前没有空行 → 飞书文档渲染错乱
  2. 表格内用空行换行(单独一行写说明)→ 表格渲染错乱
  3. 子目录页面用 Markdown 相对路径 → 链接失效

✅ 正确做法:

  1. 表格前后必须有空行

    **行程**:
    
    | 时间 | 活动 | 交通 | 步行 |
    |------|------|------|------|
  2. 单元格内换行用 <br>

    | 09:00-12:00 | **避暑山庄**(3 小时)⭐⭐<br>宫殿区、湖泊区 | 步行 | 4km |
  3. 子目录页面面包屑用 HTML 绝对路径

    <a href="/">Home </a> / <a href="/河北">河北 </a> / 冀北线

相关 Skill

  • ~/.openclaw/skills/trip-planning/SKILL.md - 旅行规划技能(v2.2 已更新表格规范)
  • ~/.openclaw/skills/wiki-format/SKILL.md - Wiki 格式规范(v1.0 新建)

修复记录

  • 2026-03-08 10:45 - 修复冀北线旅行规划(v1.1 → v1.2)
  • 2026-03-08 10:52 - 修复冀东线/冀中线旅行规划(v1.1)
  • 2026-03-08 11:02 - 更新 trip-planning skill 至 v2.2,创建 wiki-format skill v1.0

🔧 北京展览爬取系统(2026-03-07 添加)⭐ 重点

数据源清单(10 个,已验证成功)

官方权威(7 个)

  1. 故宫博物院官网 → Playwright 浏览器自动化
  2. 中国美术馆官网 → web_fetch + Jina Reader
  3. 国家博物馆官网 → 北京市文物局官网汇总(最佳方案
  4. 首都博物馆官网 → Playwright + HTTPS
  5. 中国地质博物馆 → 北京市文物局官网
  6. 中国园林博物馆 → 北京市文物局官网
  7. 中国非物质文化遗产馆 → 北京市文物局官网

民间数据(3 个)

  1. 豆瓣同城 → web_fetch + Jina Reader
  2. 小红书 → Playwright + Cookies
  3. 北京市文物局 → 官方汇总(最推荐

核心教训(2026-03-06 血泪经验)

❌ 犯过的错误

  1. 脚本有 bug 就部署(log_message 函数未定义)
  2. 没有消息通知(执行失败用户不知道)
  3. 没有飞书同步(数据爬取了但没更新文档)
  4. 创建了飞书文档但没有推送内容(只有标题)
  5. 没有复用昨天成功经验

✅ 正确做法

  1. 部署前必须手动测试一次
  2. 集成消息通知(成功/失败都发送)
  3. 端到端验收(飞书文档内容验证非空)
  4. 固化成功经验(创建 Skill)
  5. 每日 9 点自动执行(cron)

文件位置

  • 主爬虫:/root/.openclaw/workspace/travel/beijing-exhibitions/scripts/crawler.py
  • 定时任务:/root/.openclaw/workspace/travel/beijing-exhibitions/scripts/daily_cron.sh
  • Skill: ~/.openclaw/skills/exhibition-crawler/SKILL.md
  • 飞书文档:https://feishu.cn/docx/IIpVd0zDZoJgSSxPdsXc0DzHneh

Cron 配置

0 9 * * * /root/.openclaw/workspace/travel/beijing-exhibitions/scripts/daily_cron.sh

🏛️ 山东国保单位核实(2026-03-07 添加)⭐ 重点

任务进度

  • 目标:核实山东省 250 处国保单位开放情况
  • 方法:小红书 MCP 搜索(关键词:{城市} {景点} 开放 门票
  • 判断标准:笔记数 ≥ 5 篇 → 高置信度开放

已完成任务

  1. P2-6-1(2026-03-07 10:33):济南 + 青岛 36 处,累计 81/250(32.4%)
  2. P2-6-2(2026-03-07 11:30):烟台 + 威海 20 处,累计 101/250(40.4%)
  3. P2-6-3(2026-03-07 15:00):潍坊 + 淄博 22 处,累计 123/250(49.2%)

核实结果规律

  • 全部开放:已核实的 123 处全部开放(100%)
  • 高置信度:大部分景点笔记数 ≥ 10 篇
  • 中置信度:部分遗址/墓葬类景点笔记数 5-10 篇

剩余任务

  • P2-6-4:泰安 + 济宁剩余 31 处
  • P2-6-5:枣庄 + 东营
  • P2-6-6:临沂 + 德州
  • P2-6-7:聊城 + 滨州
  • P2-6-8:菏泽

文件位置

  • 脚本:/root/.openclaw/workspace/travel/scripts/verify_shandong_p2-6-*.py
  • 数据:/root/.openclaw/workspace/travel/scripts/data/shandong_guobao_*.json
  • Wiki:wiki/山东/国保单位开放情况.md

👤 用户偏好(涛哥)- 2026-03-05 更新 ⭐ 重点

🏛️ 博物馆选择标准

✅ 必去博物馆类型(优先级高)

  1. 省级综合博物馆 - 如河北博物院、故宫博物院
  2. 考古遗址博物馆 - 如三星堆博物馆、金沙遗址博物馆、邺城博物馆
  3. 专题博物馆 - 如定州博物馆、磁州窑博物馆、隆兴寺
  4. 世界遗产相关 - 如避暑山庄博物馆、清西陵
  5. 历史文化类 - 展示古代文明、历史变迁

❌ 备选/可跳过类型(优先级低)

  1. 红色文化类 - 西柏坡纪念馆、李大钊纪念馆(除非用户特别要求)
  2. 现代专题类 - 秦皇岛市玻璃博物馆、唐山博物馆
  3. 民俗工艺类 - 武强年画博物馆
  4. 综合类(地级市) - 张家口市博物馆、沧州市博物馆、廊坊市博物馆、石家庄市博物馆
  5. 长城专题 - 山海关中国长城博物馆(除非对长城特别感兴趣)

博物馆筛选标准

  • 优先一级博物馆(国家文物局认证)
  • 次选二级博物馆(有特色馆藏)
  • 三级博物馆一般不安排(除非顺路且有时间)
  • 地级市综合博物馆优先级低于专题博物馆

🎨 展览内容偏好

✅ 保留的展览类型(14 个)

历史、人文、古建筑、博物馆、寺庙古刹、世界遗产、考古、书法、传统文化、古代艺术、藏传佛教、古蜀文明、工艺美术、学术研究

❌ 过滤的展览类型(10 个)

建筑艺术、民俗文化、国际艺术、生肖文化、非遗民俗、亲子教育、综合合集、当代艺术、地质科普、装置艺术


📊 河北博物馆选择实例(2026-03-04)

必去博物馆(19 家):

  • 河北博物院 ⭐⭐⭐⭐⭐(省级综合,长信宫灯、金缕玉衣)
  • 邯郸市博物馆 ⭐⭐⭐⭐⭐(国家一级,赵文化)
  • 定州博物馆 ⭐⭐⭐⭐⭐(国家一级,定瓷、汉墓文物)
  • 避暑山庄博物馆 ⭐⭐⭐⭐⭐(世界遗产,皇家园林)
  • 邺城博物馆 ⭐⭐⭐⭐⭐(二级,三国六朝都城)
  • 磁州窑博物馆 ⭐⭐⭐⭐⭐(二级,民窑瓷器)
  • 承德博物馆 ⭐⭐⭐⭐(二级,清王朝历史)
  • 隆兴寺 ⭐⭐⭐⭐⭐(二级,宋代建筑、铜铸千手观音)
  • 清西陵 ⭐⭐⭐⭐⭐(世界遗产,清代皇陵)
  • 燕下都遗址博物馆 ⭐⭐⭐⭐(二级,战国燕国都城)
  • 易县博物馆 ⭐⭐⭐⭐(二级,燕文化)
  • 满城汉墓博物馆 ⭐⭐⭐⭐⭐(金缕玉衣出土地)
  • 正定县博物馆 ⭐⭐⭐⭐(古城正定)
  • 邢台市博物馆 ⭐⭐⭐⭐(邢窑白瓷)
  • 临漳佛造像博物馆 ⭐⭐⭐⭐(北朝佛教造像)
  • 蔚县博物馆 ⭐⭐⭐⭐(辽金文化)
  • 元中都博物馆 ⭐⭐⭐⭐⭐(元代都城遗址)
  • 泥河湾博物馆 ⭐⭐⭐⭐(旧石器时代考古)
  • 山海关长城博物馆 ⭐⭐⭐⭐(长城文化)

备选博物馆(11 家):

  • 西柏坡纪念馆(红色文化,优先级低)
  • 李大钊纪念馆(红色文化,优先级低)
  • 唐山博物馆(综合类,优先级低)
  • 秦皇岛市玻璃博物馆(专题类,优先级低)
  • 武强年画博物馆(民俗工艺,优先级低)
  • 张家口市博物馆(地级市综合)
  • 沧州市博物馆(地级市综合)
  • 廊坊市博物馆(地级市综合)
  • 石家庄市博物馆(地级市综合)
  • 黄骅博物馆(县级)
  • 泊头清真寺(宗教建筑,可安排)

📊 北京博物馆选择实例(2026-03-05)

必去博物馆:

  • 故宫博物院 ⭐⭐⭐⭐⭐(世界遗产,中国古代宫廷)
  • 中国国家博物馆 ⭐⭐⭐⭐⭐(国家最高博物馆)
  • 中国美术馆 ⭐⭐⭐⭐⭐(国家级美术馆,免费)
  • 首都博物馆 ⭐⭐⭐⭐⭐(北京历史文化的博物馆)

可选博物馆:

  • 中国园林博物馆(专题类,顺路可去)
  • 中国非物质文化遗产馆(非遗展示,时间充裕可去)

🔧 北京展览爬取系统(2026-03-05 创建,2026-03-06 修复)⭐ 重点

数据源清单(10 个,已验证成功)

官方权威(7 个)

  1. 故宫博物院官网 → Playwright 浏览器自动化
  2. 中国美术馆官网 → web_fetch + Jina Reader
  3. 国家博物馆官网 → 北京市文物局官网汇总(最佳方案
  4. 首都博物馆官网 → Playwright + HTTPS
  5. 中国地质博物馆 → 北京市文物局官网
  6. 中国园林博物馆 → 北京市文物局官网
  7. 中国非物质文化遗产馆 → 北京市文物局官网

民间数据(3 个)

  1. 豆瓣同城 → web_fetch + Jina Reader
  2. 小红书 → Playwright + Cookies
  3. 北京市文物局 → 官方汇总(最推荐

核心教训(2026-03-06 血泪经验)

❌ 犯过的错误

  1. 脚本有 bug 就部署(log_message 函数未定义)
  2. 没有消息通知(执行失败用户不知道)
  3. 没有飞书同步(数据爬取了但没更新文档)
  4. 创建了飞书文档但没有推送内容(只有标题)
  5. 没有复用昨天成功经验

✅ 正确做法

  1. 部署前必须手动测试一次
  2. 集成消息通知(成功/失败都发送)
  3. 端到端验收(飞书文档内容验证非空)
  4. 固化成功经验(创建 Skill)
  5. 每日 9 点自动执行(cron)

文件位置

  • 主爬虫:/root/.openclaw/workspace/travel/beijing-exhibitions/scripts/crawler.py
  • 定时任务:/root/.openclaw/workspace/travel/beijing-exhibitions/scripts/daily_cron.sh
  • Skill: ~/.openclaw/skills/exhibition-crawler/SKILL.md
  • 飞书文档:https://feishu.cn/docx/IIpVd0zDZoJgSSxPdsXc0DzHneh

Cron 配置

0 9 * * * /root/.openclaw/workspace/travel/beijing-exhibitions/scripts/daily_cron.sh

⚠️ 端到端验收原则(2026-03-06 再次强调)⭐ 铁律

违反记录

  1. 2026-03-06 11:50 - 创建飞书文档但没有推送内容
  2. 2026-03-06 11:52 - 用户指出后才检查修复

验收清单(必须逐项检查)

  • 代码部署前手动执行一次
  • 飞书文档创建后读取验证内容非空
  • 表格、列表都已正确渲染
  • 发送通知包含文档链接
  • 用户确认收到

核心原则

  • "创建了"≠"完成了"
  • "执行了"≠"成功了"
  • 必须验证最终结果,不能只验证中间步骤
  • 中国地质博物馆(地质科普,优先级低)

不推荐:

  • 商业化展览、网红展、装置艺术展

🏨 出行偏好

类别 偏好 说明
出行人数 3-4 人 一家三口或四口亲子出行
交通方式 公共交通/高铁 不自驾,家人晕车
住宿档次 舒适型 全季 > 桔子水晶/美居/美仑/漫心,不选汉庭
房型要求 亲子房 至少一张 1.5 米 + 一张 1.2 米的床
起床时间 8:00 不早起
出发时间 9:30 早餐后出发
回酒店时间 21:00 前 不熬夜
每日步行 ≤10km 体力有限
午休 2 小时 + 轻松版必须安排
爬山 避免 不安排登山爬楼景点

🎯 景点偏好

✅ 喜欢

  • 历史和人文景观
  • 古建筑(原真性,非仿古)
  • 博物馆(一级 > 二级 > 三级)
  • 寺庙古刹
  • 世界遗产
  • 考古遗址
  • 古代艺术

❌ 不喜欢

  • ⚠️ 商业化严重的古城(典型:平遥古城)
  • ⚠️ 过度开发的景区
  • ⚠️ 人造仿古建筑(建国后新建)
  • ⚠️ 需要排长队的景点
  • ⚠️ 购物场所
  • ⚠️ 红色文化景点(除非特别要求)
  • ⚠️ 现代专题博物馆(玻璃、年画等)

📝 规划原则

博物馆选择优先级:

1. 省级综合博物馆(必去)
2. 考古遗址博物馆(必去)
3. 世界遗产相关(必去)
4. 特色专题博物馆(如定瓷、磁州窑)(优先)
5. 地级市综合博物馆(备选)
6. 红色文化/民俗工艺(可跳过)

行程安排原则:

  • 不二刷:与其二刷不如增加第一次的游览时长
  • 不紧凑:轻松休闲为主
  • 路线优化:减少重复路线
  • 博物馆优先:每个城市优先安排博物馆

🎯 北京展览爬取系统(2026-03-05)⭐ 重点

完成任务

  • P2 任务:爬取 10 个可信数据源,获取 39 个展览/攻略
  • 自动过滤:根据用户偏好自动过滤不符合兴趣的展览
  • 飞书文档:每日 9 点自动更新 https://feishu.cn/docx/TOnAdwh2DoteNSxMigPcGnh8njh

技术方案

  1. Playwright - 动态网站(故宫、小红书)
  2. web_fetch + Jina Reader - 静态网站(豆瓣、中国美术馆)
  3. 北京市文物局 - 最佳权威数据源(8 个博物馆汇总)

用户偏好(涛哥)

  • 保留类型:历史、人文、古建筑、博物馆、考古、书法、古代艺术、藏传佛教等 14 个
  • 过滤类型:建筑艺术、民俗文化、国际艺术、生肖文化、亲子教育、当代艺术等 10 个
  • 配置文件beijing-exhibitions/config/user_preferences.json

核心经验

  • 不是一门手艺走天下,根据网站类型选择工具
  • 找替代数据源(北京市文物局汇总最优)
  • 默认 3-4 人出行,住宿只选全季,公共交通为主

🔧 系统更新(2026-03-05)

Chromium 已安装可用:

  • 版本:Google Chrome 145.0.7632.159
  • 路径:/usr/bin/google-chrome
  • 用途:Playwright 浏览器自动化(网页读取、截图)
  • 安装源:Google 官方仓库

📅 最近完成任务(2026-03-01 至 2026-03-03)

✅ 山西全省深度调研(2026-03-02)⭐ 重点

完成时间:2026-03-02 11:56 - 19:47

工作内容

  1. 山西页面更新(13:12)
    • 添加分城市统计表格
    • 修改博物馆必去条件(仅限一级二级)
    • 修复仓库结构和入口链接
  2. 大同旅行规划 v9.0-v9.1(13:30-13:50)
    • 根据 531 处国保名录重新统计必去景点
    • 根据 7 家必去博物馆(一级 + 二级)重新筛选
    • 三套方案:轻松休闲版/标准充实版/紧凑丰富版
    • 确保全部覆盖 13 个必去景点
  3. 山西城市线路拆分(15:36-15:49)
    • 忻州:北线(19 处/6 天)、南线(8 处/4 天)
    • 太原:市区线(18 处/7 天)
    • 晋中:祁太线(14 处)、介灵线(16 处)、东线(15 处)、平遥线(15 处/5 天 4 晚)
    • 晋城:3 条线路
    • 长治:3 条线路
    • 总计:14 条城市线路
  4. 山西页面入口更新(15:49-15:56)
    • 添加 14 条线路入口链接
    • 文件移至山西目录
    • 更新山西页面和首页链接
    • 删除旧文件
  5. 河南 8 条线路规划(16:09)
    • 郑州 2 条、洛阳 1 条、其他 5 条
    • 删除旧的 3 条线路
  6. 大同规划完善(17:42-19:47)
    • 移动大同规划到山西目录
    • 修正链接
    • 为 13 个规划添加酒店推荐和交通信息

成果统计

  • 山西国保:531 处(全国第一)
  • 必去:469 处(古建筑 421 + 古遗址 45 + 名人墓 3)
  • 备选:62 处(古墓群)
  • 城市线路:14 条
  • Wiki 页面:15+ 个

Wiki 链接

  • 山西总览:https://travel.wudai9.net/山西
  • 大同规划:https://travel.wudai9.net/大同旅行规划

✅ 国保单位调研(2026-03-02 凌晨)

  • 河北省:291 处(100%)✅ 官方数据
  • 陕西省:269 处(100%)✅ 数据获取完成
  • 河南省:306 处(85.7%)
  • 北京市:98 处(100%)

总计:完成 964 处国保调研


✅ 五一计划 v6.2(2026-03-01)

  • 第三天增加两个方案:A(羑里城 + 岳飞庙)vs B(+马氏庄园)
  • 核实马氏庄园信息(¥40,8:30-17:30,市区西部 21km)

✅ 河南三线旅游规划(2026-03-01)

  • 豫北线:80 处国保,核心景点 TOP 10,4-6 日方案
  • 豫中豫西线:127 处国保,核心景点 TOP 15,4-6 日方案
  • 豫东豫南线:45 处国保,核心景点 TOP 10,4-5 日方案

📚 Wiki 服务器架构(2026-03-02 更新)

Travelwiki 结构(与 Mangawiki 一致):

/opt/travelwiki/
├── data/          # 内容目录(gollum WorkingDirectory)
│   ├── .git/      # git 工作目录
│   └── *.md       # Wiki 文件
└── repo/
    └── wiki.git/  # bare 仓库

更新方式: ⚠️ 只能用 git push,不能用 rsync

  • 本地仓库:/root/.openclaw/workspace/travel/wiki/
  • Remote:root@47.86.243.164:/opt/travelwiki/repo/wiki.git
  • 命令:git push origin master

Gollum 配置:

  • WorkingDirectory: /opt/travelwiki/data
  • 端口: 4567
  • 服务: gollum.service

标准 SOP

添加新规划(自动执行)

  1. 创建 目的地旅行规划.md
  2. 更新 Home.md 索引页
  3. 创建/更新地区分类页
  4. git add . && git commit && git push
  5. 验证同步成功

⚠️ Wiki 页面维护规范(2026-03-01 涛哥要求)

1. 链路完整性

每次改动页面时,必须同时更新:

  • ✅ 当前页面
  • ✅ 上级页面(省份/城市页面)
  • ✅ 首页(Home.md)- 如果是重大改动

确保从首页一路链接下去:

Home.md → 河南.md → 河南/五一计划.md

子目录页面链接格式:

  • 在父级页面:[五一计划](河南/五一计划)
  • 在子页面面包屑:<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划

2. Changelog 规范

每个页面底部必须有 changelog:

---

## 📝 页面更新日志

| 时间 | 版本 | 内容 |
|------|------|------|
| 2026-03-01 17:55 | v6.1 | 核实信息,优化路线 |

---

*由 Travel Agent 维护*

更新规则:

  • ✅ 每次修改页面 → 更新页面底部的 changelog
  • ✅ 重大改动(新版本、路线大调整)→ 同时更新 Home.md 的"最近更新"
  • ❌ 小改动(typo、格式)→ 只更新页面 changelog

3. 更新流程

修改页面内容
    ↓
更新页面底部 changelog
    ↓
更新上级页面相关信息和链接
    ↓
如果是重大改动 → 更新 Home.md changelog
    ↓
git add . && git commit && git push
    ↓
验证同步成功

4. 典型错误示例(避免)

错误 正确做法
❌ 只改五一计划,不改河南.md ✅ 同时更新河南.md中的五一计划信息
❌ 河南.md链接写成[五一计划](五一计划) ✅ 写成[五一计划](河南/五一计划)
❌ 改完不更新changelog ✅ 每次改动都记录到changelog
❌ 大改动不更新Home.md ✅ 重大改动要更新首页"最近更新"

已完成的规划

目的地 文件 状态
大同 大同旅行规划.md ✅ 完成
忻州 忻州旅行规划.md ✅ 完成
太原晋中 太原晋中旅行规划.md ✅ 完成
晋城长治 晋城长治旅行规划.md ✅ 完成
五一河南 河南/五一计划.md ✅ 完成
省份排行榜 省份排行榜.md ✅ 完成(2026-02-28)

📋 省份调研任务

排行榜已创建:

  • 古建TOP 10:山西、河南、河北、陕西、浙江、四川、江苏、山东、广东、湖北
  • 博物馆TOP 10:北京、江苏、山东、浙江、广东、河南、四川、陕西、湖北、上海

已完成省份: 4/20 (20%)

  • ✅ 山西省(古建第1)
  • ✅ 河南省(古建第2 + 博物馆第6)
  • ✅ 四川省(古建第6 + 博物馆第6)
  • ✅ 湖北省(古建第10 + 博物馆第9)

待调研省份(按优先级):

  1. ⭐⭐⭐⭐⭐ 河北省(古建第3)- 清皇陵、正定古城
  2. ⭐⭐⭐⭐⭐ 陕西省(古建第4 + 博物馆第6)- 兵马俑、华山
  3. ⭐⭐⭐⭐ 浙江省(古建第5 + 博物馆第4)- 西湖、普陀山
  4. ⭐⭐⭐⭐ 山东省(古建第8 + 博物馆第3)- 泰山、孔府
  5. ⭐⭐⭐⭐ 江苏省(古建第7 + 博物馆第2)- 苏州园林

📝 爬虫工作准则

重要规则(2026-02-28 涛哥指示):

⚠️ 爬取频率控制

必须遵守:

  1. 控制爬取频率 - 每次请求之间至少间隔3-5秒
  2. 避免触发风控 - 不要短时间内频繁访问同一网站
  3. 批量处理 - 一次爬取多个信息后,暂停一段时间
  4. 分散来源 - 不要只依赖单一网站,分散使用多个信息源

具体操作:

  • 每次web_fetch之间至少等待3-5秒
  • 遇到"网络不给力"或"安全验证"立即停止
  • 被拦截后,至少等待10-15分钟再尝试
  • 优先使用官方发布信息,减少爬取需求

错误示例(今天犯的错误):

  • ❌ 短时间内连续调用web_fetch 20+次
  • ❌ 触发百度安全验证后才停止
  • ❌ 没有控制频率,导致工作中断

正确做法:

  • ✅ 批量规划:一次列出需要核实的景点
  • ✅ 分批执行:每批5-10个,间隔5分钟
  • ✅ 优先级:优先核实4A/5A景区(信息多)
  • ✅ 休息间隔:每核实20个景点,休息10分钟

🔍 国保单位开放情况核实

2026-02-28 工作进度(19:07):

  • 已核实:121处(22.8%)
    • ✅ 已开放:111处
    • ❌ 暂不开放:10处
  • 待核实:409处(77.2%)

小红书信息源(2026-02-28):

🌟 超级信息源(374处,占全省70.6%)⭐⭐⭐⭐⭐

用户:🍀可以关注我一下吗🍀 完整系列(2026-02-28 19:15 全部获取):

  • ✅ 攻略01 - 运城76处古建国保(收藏859)
  • ✅ 攻略02 - 长治70处古建国保(收藏1286)
  • ✅ 攻略03 - 晋城71处古建国保(收藏1151)
  • ✅ 攻略04 - 大同20处古建国保(收藏458)
  • ✅ 攻略07 - 太原31处古建国保(收藏458)
  • ✅ 攻略08 - 临汾42处古建国保(收藏800)
  • ✅ 攻略10 - 晋中64处古建国保(收藏449)

总计:374/530处(70.6%) 可信度: ⭐⭐⭐⭐⭐(实地考察+详细攻略+图片丰富) 优先级: 最高 - 已获取全部7个城市攻略

📱 其他高价值笔记(7个)

  1. 山西省文旅厅官方 - 长治75处国保全部开放 ⭐⭐⭐⭐⭐
  2. 运城市102处国保开放情况汇总(实地考察)⭐⭐⭐⭐
  3. 长治全部国保攻略(收藏1286)⭐⭐⭐⭐
  4. 山西访古闭门羹大全(10处无法参观)⭐⭐⭐⭐
  5. 运城11国保懒人路线(新绛县)⭐⭐⭐⭐
  6. 山西92处前五批国保清单(收藏209)⭐⭐⭐⭐
  7. 主要中国木构建筑清单(收藏2391)⭐⭐⭐⭐⭐

数据价值:

  • 潜在覆盖:332/530处(62.6%)
  • 可信度:⭐⭐⭐⭐⭐(实地考察+详细攻略)
  • 更新频率:持续采集中

核实方法:

  1. ✅ 小红书信息源 - 主要来源(7个笔记)
  2. ✅ 百度搜索 - 辅助来源
  3. ✅ 4A/5A景区官方认证
  4. ✅ 长治市文旅局官方发布(60处)

工作原则(严格执行):

  • ✅ 必须有确认信息源
  • ❌ 不使用常识推断
  • ❌ 不使用其他地区数据
  • ⏸️ 无确认信息 → 待核实

遇到的问题:

  • ⚠️ 百度搜索触发安全验证(已解决)
  • ✅ 调整频率:10-20秒随机间隔
  • ✅ 使用小红书MCP作为主要信息源

涛哥的规划要求

页面结构

  • ⚠️ 新页面必须在首页添加入口和changelog
  • ⚠️ 每个页面必须有面包屑导航
  • ⚠️ 三套方案格式(紧凑/适中/宽松)

景点分类

  • ⚠️ 必去景点和备选景点要严格区分
  • ⚠️ 商业化景点要标注⚠️

交通限制

  • ⚠️ 家人晕车,不能自驾

景点偏好

  • ❌ 不喜欢:仿古建筑、商业化古城
  • ✅ 喜欢:真实古建筑、博物馆、历史遗迹

出行人数

  • ⚠️ 一家三口或四口出行(不是2人)

住宿偏好

  • 舒适型:只选全季
  • 高档型:可选桔子水晶、美居、美仑、漫心
  • 房型:必须有亲子房(1.5米+1.2米床)
  • 位置:离公交近,市中心或景点附近

经验教训

2026-03-01 Wiki 页面维护规范 ⚠️ 重要

❌ 犯的错误

  1. 只改当前页面,不改上级页面 → 河南.md中五一计划的链接和信息没更新
  2. 链接格式错误 → 子目录页面链接写成[五一计划](五一计划),应该是[五一计划](河南/五一计划)
  3. 没有changelog → 改完页面不记录更新历史

✅ 正确做法

  1. 每次改动都要更新链路
    • 当前页面
    • 上级页面(省份/城市页面)
    • 首页(如果是重大改动)
  2. 每个页面都要有changelog
    • 页面底部添加"页面更新日志"
    • 每次改动都记录
    • 重大改动同时更新 Home.md
  3. 确保从首页一路链接下去
    Home.md → 河南.md → 河南/五一计划.md

📝 已添加到工作规范

详见 MEMORY.md "Wiki 页面维护规范" 部分

2026-03-01 Wiki 面包屑导航错误 ⚠️ 重要

❌ 犯的错误(两次)

子目录下的页面使用了错误的面包屑导航格式

错误格式:

[Home](Home) > [河南](河南) > **五一计划**
  • /河南/五一计划.md 中,[Home](Home) 会查找 /河南/Home,而不是根目录的 Home
  • 同样 [河南](河南) 会查找 /河南/河南,而不是根目录的 河南

正确格式(子目录下的页面必须使用 HTML 绝对路径):

<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划

规则总结:

  • 根目录页面:可用 Markdown 格式 [Home](Home)
  • 子目录页面:必须用 HTML 绝对路径 <a href="/">Home</a>

2026-03-01 五一计划v6.0规划

❌ 犯的错误

  1. 第二天排太满 → 6个必去景点塞一天,压力过大
  2. 第三天安排不必要行程 → 备选景点(羑里城、岳飞庙)没必要
  3. 殷墟夜游时间太短 → 只安排30分钟,实际至少3小时

✅ 修正方案

  1. 分散殷墟游览 → 第一天可选夜游 + 第二天继续
  2. 删除备选景点 → 只保留6个必去景点
  3. 第三天只安排1个景点 → 小南海石窟 + 返程,不赶

📝 关键信息

  • 殷墟三景区分开:博物馆(新馆)、宗庙、王陵
  • 联票120元(含三景区+摆渡车)
  • 夜场仅博物馆开放,宗庙王陵无夜场
  • 夜场17:30-20:30,仅周五六日及节假日

2026-02-28 五一河南规划

❌ 犯的错误

  1. 按2人规划 → 预算、住宿、门票全错
  2. 推荐汉庭 → 不符合用户偏好
  3. 尝试用AI查12306 → 浪费时间,技术限制

✅ 正确做法

  1. 默认3-4人出行
  2. 住宿直接选全季,不问
  3. 车次让用户查12306,AI标注"待查询"
  4. 先查景点开放时间,再定行程

📚 生成的 Skill

  • /root/.openclaw/workspace/skills/trip-planning/SKILL.md
  • 下次规划时直接参考这个 skill

安阳必去景点

  1. 殷墟博物馆(主)
  2. 殷墟宗庙遗址
  3. 殷墟王陵遗址

其他安阳景点(红旗渠、太行大峡谷等)均为备选


用户偏好总结

类别 偏好
景点类型 历史/人文/古建筑/博物馆
出行方式 公共交通/高铁
住宿档次 全季/桔子水晶/美居
行程节奏 轻松休闲/不二刷
饮食要求 不辣+有蔬菜

✅ 工作完成总结(2026-02-28 19:16)

超级系列全部获取完成!

  • 7个城市攻略
  • 374处古建国保
  • 占全省70.6%

小红书采集:

  • 已获取笔记:14个
  • 高价值信息源:超级系列 + 官方发布 + 实地考察

下一步:

  • 整理超级系列信息到Wiki
  • 更新各市开放情况统计
  • 预计完成后达到400+处(75%+)