MEMORY.md - Travel Agent 长期记忆

写入规则:只写 3 个月后仍有效的事实、决策、偏好。写入时标注日期。

清理规则:每周蒸馏时清理过期条目。

召回规则:搜到内容后标注来源确认,不直接当事实用。

有效期标注

  • ✅ 长期有效(无特殊说明)
  • ⏰ 有效期至:YYYY-MM-DD
  • 📅 创建日期:YYYY-MM-DD

🎯 北京展览爬取系统(2026-03-05)⭐ 重点

完成任务

  • P2 任务:爬取 10 个可信数据源,获取 39 个展览/攻略
  • 自动过滤:根据用户偏好自动过滤不符合兴趣的展览
  • 飞书文档:每日 9 点自动更新 https://feishu.cn/docx/TOnAdwh2DoteNSxMigPcGnh8njh

技术方案

  1. Playwright - 动态网站(故宫、小红书)
  2. web_fetch + Jina Reader - 静态网站(豆瓣、中国美术馆)
  3. 北京市文物局 - 最佳权威数据源(8 个博物馆汇总)

用户偏好(涛哥)

  • 保留类型:历史、人文、古建筑、博物馆、考古、书法、古代艺术、藏传佛教等 14 个
  • 过滤类型:建筑艺术、民俗文化、国际艺术、生肖文化、亲子教育、当代艺术等 10 个
  • 配置文件beijing-exhibitions/config/user_preferences.json

核心经验

  • 不是一门手艺走天下,根据网站类型选择工具
  • 找替代数据源(北京市文物局汇总最优)
  • 默认 3-4 人出行,住宿只选全季,公共交通为主

🔧 系统更新(2026-03-05)

Chromium 已安装可用:

  • 版本:Google Chrome 145.0.7632.159
  • 路径:/usr/bin/google-chrome
  • 用途:Playwright 浏览器自动化(网页读取、截图)
  • 安装源:Google 官方仓库

📅 最近完成任务(2026-03-01 至 2026-03-03)

✅ 山西全省深度调研(2026-03-02)⭐ 重点

完成时间:2026-03-02 11:56 - 19:47

工作内容

  1. 山西页面更新(13:12)
    • 添加分城市统计表格
    • 修改博物馆必去条件(仅限一级二级)
    • 修复仓库结构和入口链接
  2. 大同旅行规划 v9.0-v9.1(13:30-13:50)
    • 根据 531 处国保名录重新统计必去景点
    • 根据 7 家必去博物馆(一级 + 二级)重新筛选
    • 三套方案:轻松休闲版/标准充实版/紧凑丰富版
    • 确保全部覆盖 13 个必去景点
  3. 山西城市线路拆分(15:36-15:49)
    • 忻州:北线(19 处/6 天)、南线(8 处/4 天)
    • 太原:市区线(18 处/7 天)
    • 晋中:祁太线(14 处)、介灵线(16 处)、东线(15 处)、平遥线(15 处/5 天 4 晚)
    • 晋城:3 条线路
    • 长治:3 条线路
    • 总计:14 条城市线路
  4. 山西页面入口更新(15:49-15:56)
    • 添加 14 条线路入口链接
    • 文件移至山西目录
    • 更新山西页面和首页链接
    • 删除旧文件
  5. 河南 8 条线路规划(16:09)
    • 郑州 2 条、洛阳 1 条、其他 5 条
    • 删除旧的 3 条线路
  6. 大同规划完善(17:42-19:47)
    • 移动大同规划到山西目录
    • 修正链接
    • 为 13 个规划添加酒店推荐和交通信息

成果统计

  • 山西国保:531 处(全国第一)
  • 必去:469 处(古建筑 421 + 古遗址 45 + 名人墓 3)
  • 备选:62 处(古墓群)
  • 城市线路:14 条
  • Wiki 页面:15+ 个

Wiki 链接

  • 山西总览:https://travel.wudai9.net/山西
  • 大同规划:https://travel.wudai9.net/大同旅行规划

✅ 国保单位调研(2026-03-02 凌晨)

  • 河北省:291 处(100%)✅ 官方数据
  • 陕西省:269 处(100%)✅ 数据获取完成
  • 河南省:306 处(85.7%)
  • 北京市:98 处(100%)

总计:完成 964 处国保调研


✅ 五一计划 v6.2(2026-03-01)

  • 第三天增加两个方案:A(羑里城 + 岳飞庙)vs B(+马氏庄园)
  • 核实马氏庄园信息(¥40,8:30-17:30,市区西部 21km)

✅ 河南三线旅游规划(2026-03-01)

  • 豫北线:80 处国保,核心景点 TOP 10,4-6 日方案
  • 豫中豫西线:127 处国保,核心景点 TOP 15,4-6 日方案
  • 豫东豫南线:45 处国保,核心景点 TOP 10,4-5 日方案

📚 Wiki 服务器架构(2026-03-02 更新)

Travelwiki 结构(与 Mangawiki 一致):

/opt/travelwiki/
├── data/          # 内容目录(gollum WorkingDirectory)
│   ├── .git/      # git 工作目录
│   └── *.md       # Wiki 文件
└── repo/
    └── wiki.git/  # bare 仓库

更新方式: ⚠️ 只能用 git push,不能用 rsync

  • 本地仓库:/root/.openclaw/workspace/travel/wiki/
  • Remote:root@47.86.243.164:/opt/travelwiki/repo/wiki.git
  • 命令:git push origin master

Gollum 配置:

  • WorkingDirectory: /opt/travelwiki/data
  • 端口: 4567
  • 服务: gollum.service

标准 SOP

添加新规划(自动执行)

  1. 创建 目的地旅行规划.md
  2. 更新 Home.md 索引页
  3. 创建/更新地区分类页
  4. git add . && git commit && git push
  5. 验证同步成功

⚠️ Wiki 页面维护规范(2026-03-01 涛哥要求)

1. 链路完整性

每次改动页面时,必须同时更新:

  • ✅ 当前页面
  • ✅ 上级页面(省份/城市页面)
  • ✅ 首页(Home.md)- 如果是重大改动

确保从首页一路链接下去:

Home.md → 河南.md → 河南/五一计划.md

子目录页面链接格式:

  • 在父级页面:[五一计划](河南/五一计划)
  • 在子页面面包屑:<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划

2. Changelog 规范

每个页面底部必须有 changelog:

---

## 📝 页面更新日志

| 时间 | 版本 | 内容 |
|------|------|------|
| 2026-03-01 17:55 | v6.1 | 核实信息,优化路线 |

---

*由 Travel Agent 维护*

更新规则:

  • ✅ 每次修改页面 → 更新页面底部的 changelog
  • ✅ 重大改动(新版本、路线大调整)→ 同时更新 Home.md 的"最近更新"
  • ❌ 小改动(typo、格式)→ 只更新页面 changelog

3. 更新流程

修改页面内容
    ↓
更新页面底部 changelog
    ↓
更新上级页面相关信息和链接
    ↓
如果是重大改动 → 更新 Home.md changelog
    ↓
git add . && git commit && git push
    ↓
验证同步成功

4. 典型错误示例(避免)

错误 正确做法
❌ 只改五一计划,不改河南.md ✅ 同时更新河南.md中的五一计划信息
❌ 河南.md链接写成[五一计划](五一计划) ✅ 写成[五一计划](河南/五一计划)
❌ 改完不更新changelog ✅ 每次改动都记录到changelog
❌ 大改动不更新Home.md ✅ 重大改动要更新首页"最近更新"

已完成的规划

目的地 文件 状态
大同 大同旅行规划.md ✅ 完成
忻州 忻州旅行规划.md ✅ 完成
太原晋中 太原晋中旅行规划.md ✅ 完成
晋城长治 晋城长治旅行规划.md ✅ 完成
五一河南 河南/五一计划.md ✅ 完成
省份排行榜 省份排行榜.md ✅ 完成(2026-02-28)

📋 省份调研任务

排行榜已创建:

  • 古建TOP 10:山西、河南、河北、陕西、浙江、四川、江苏、山东、广东、湖北
  • 博物馆TOP 10:北京、江苏、山东、浙江、广东、河南、四川、陕西、湖北、上海

已完成省份: 4/20 (20%)

  • ✅ 山西省(古建第1)
  • ✅ 河南省(古建第2 + 博物馆第6)
  • ✅ 四川省(古建第6 + 博物馆第6)
  • ✅ 湖北省(古建第10 + 博物馆第9)

待调研省份(按优先级):

  1. ⭐⭐⭐⭐⭐ 河北省(古建第3)- 清皇陵、正定古城
  2. ⭐⭐⭐⭐⭐ 陕西省(古建第4 + 博物馆第6)- 兵马俑、华山
  3. ⭐⭐⭐⭐ 浙江省(古建第5 + 博物馆第4)- 西湖、普陀山
  4. ⭐⭐⭐⭐ 山东省(古建第8 + 博物馆第3)- 泰山、孔府
  5. ⭐⭐⭐⭐ 江苏省(古建第7 + 博物馆第2)- 苏州园林

📝 爬虫工作准则

重要规则(2026-02-28 涛哥指示):

⚠️ 爬取频率控制

必须遵守:

  1. 控制爬取频率 - 每次请求之间至少间隔3-5秒
  2. 避免触发风控 - 不要短时间内频繁访问同一网站
  3. 批量处理 - 一次爬取多个信息后,暂停一段时间
  4. 分散来源 - 不要只依赖单一网站,分散使用多个信息源

具体操作:

  • 每次web_fetch之间至少等待3-5秒
  • 遇到"网络不给力"或"安全验证"立即停止
  • 被拦截后,至少等待10-15分钟再尝试
  • 优先使用官方发布信息,减少爬取需求

错误示例(今天犯的错误):

  • ❌ 短时间内连续调用web_fetch 20+次
  • ❌ 触发百度安全验证后才停止
  • ❌ 没有控制频率,导致工作中断

正确做法:

  • ✅ 批量规划:一次列出需要核实的景点
  • ✅ 分批执行:每批5-10个,间隔5分钟
  • ✅ 优先级:优先核实4A/5A景区(信息多)
  • ✅ 休息间隔:每核实20个景点,休息10分钟

🔍 国保单位开放情况核实

2026-02-28 工作进度(19:07):

  • 已核实:121处(22.8%)
    • ✅ 已开放:111处
    • ❌ 暂不开放:10处
  • 待核实:409处(77.2%)

小红书信息源(2026-02-28):

🌟 超级信息源(374处,占全省70.6%)⭐⭐⭐⭐⭐

用户:🍀可以关注我一下吗🍀 完整系列(2026-02-28 19:15 全部获取):

  • ✅ 攻略01 - 运城76处古建国保(收藏859)
  • ✅ 攻略02 - 长治70处古建国保(收藏1286)
  • ✅ 攻略03 - 晋城71处古建国保(收藏1151)
  • ✅ 攻略04 - 大同20处古建国保(收藏458)
  • ✅ 攻略07 - 太原31处古建国保(收藏458)
  • ✅ 攻略08 - 临汾42处古建国保(收藏800)
  • ✅ 攻略10 - 晋中64处古建国保(收藏449)

总计:374/530处(70.6%) 可信度: ⭐⭐⭐⭐⭐(实地考察+详细攻略+图片丰富) 优先级: 最高 - 已获取全部7个城市攻略

📱 其他高价值笔记(7个)

  1. 山西省文旅厅官方 - 长治75处国保全部开放 ⭐⭐⭐⭐⭐
  2. 运城市102处国保开放情况汇总(实地考察)⭐⭐⭐⭐
  3. 长治全部国保攻略(收藏1286)⭐⭐⭐⭐
  4. 山西访古闭门羹大全(10处无法参观)⭐⭐⭐⭐
  5. 运城11国保懒人路线(新绛县)⭐⭐⭐⭐
  6. 山西92处前五批国保清单(收藏209)⭐⭐⭐⭐
  7. 主要中国木构建筑清单(收藏2391)⭐⭐⭐⭐⭐

数据价值:

  • 潜在覆盖:332/530处(62.6%)
  • 可信度:⭐⭐⭐⭐⭐(实地考察+详细攻略)
  • 更新频率:持续采集中

核实方法:

  1. ✅ 小红书信息源 - 主要来源(7个笔记)
  2. ✅ 百度搜索 - 辅助来源
  3. ✅ 4A/5A景区官方认证
  4. ✅ 长治市文旅局官方发布(60处)

工作原则(严格执行):

  • ✅ 必须有确认信息源
  • ❌ 不使用常识推断
  • ❌ 不使用其他地区数据
  • ⏸️ 无确认信息 → 待核实

遇到的问题:

  • ⚠️ 百度搜索触发安全验证(已解决)
  • ✅ 调整频率:10-20秒随机间隔
  • ✅ 使用小红书MCP作为主要信息源

涛哥的规划要求

页面结构

  • ⚠️ 新页面必须在首页添加入口和changelog
  • ⚠️ 每个页面必须有面包屑导航
  • ⚠️ 三套方案格式(紧凑/适中/宽松)

景点分类

  • ⚠️ 必去景点和备选景点要严格区分
  • ⚠️ 商业化景点要标注⚠️

交通限制

  • ⚠️ 家人晕车,不能自驾

景点偏好

  • ❌ 不喜欢:仿古建筑、商业化古城
  • ✅ 喜欢:真实古建筑、博物馆、历史遗迹

出行人数

  • ⚠️ 一家三口或四口出行(不是2人)

住宿偏好

  • 舒适型:只选全季
  • 高档型:可选桔子水晶、美居、美仑、漫心
  • 房型:必须有亲子房(1.5米+1.2米床)
  • 位置:离公交近,市中心或景点附近

经验教训

2026-03-01 Wiki 页面维护规范 ⚠️ 重要

❌ 犯的错误

  1. 只改当前页面,不改上级页面 → 河南.md中五一计划的链接和信息没更新
  2. 链接格式错误 → 子目录页面链接写成[五一计划](五一计划),应该是[五一计划](河南/五一计划)
  3. 没有changelog → 改完页面不记录更新历史

✅ 正确做法

  1. 每次改动都要更新链路
    • 当前页面
    • 上级页面(省份/城市页面)
    • 首页(如果是重大改动)
  2. 每个页面都要有changelog
    • 页面底部添加"页面更新日志"
    • 每次改动都记录
    • 重大改动同时更新 Home.md
  3. 确保从首页一路链接下去
    Home.md → 河南.md → 河南/五一计划.md

📝 已添加到工作规范

详见 MEMORY.md "Wiki 页面维护规范" 部分

2026-03-01 Wiki 面包屑导航错误 ⚠️ 重要

❌ 犯的错误(两次)

子目录下的页面使用了错误的面包屑导航格式

错误格式:

[Home](Home) > [河南](河南) > **五一计划**
  • /河南/五一计划.md 中,[Home](Home) 会查找 /河南/Home,而不是根目录的 Home
  • 同样 [河南](河南) 会查找 /河南/河南,而不是根目录的 河南

正确格式(子目录下的页面必须使用 HTML 绝对路径):

<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划

规则总结:

  • 根目录页面:可用 Markdown 格式 [Home](Home)
  • 子目录页面:必须用 HTML 绝对路径 <a href="/">Home</a>

2026-03-01 五一计划v6.0规划

❌ 犯的错误

  1. 第二天排太满 → 6个必去景点塞一天,压力过大
  2. 第三天安排不必要行程 → 备选景点(羑里城、岳飞庙)没必要
  3. 殷墟夜游时间太短 → 只安排30分钟,实际至少3小时

✅ 修正方案

  1. 分散殷墟游览 → 第一天可选夜游 + 第二天继续
  2. 删除备选景点 → 只保留6个必去景点
  3. 第三天只安排1个景点 → 小南海石窟 + 返程,不赶

📝 关键信息

  • 殷墟三景区分开:博物馆(新馆)、宗庙、王陵
  • 联票120元(含三景区+摆渡车)
  • 夜场仅博物馆开放,宗庙王陵无夜场
  • 夜场17:30-20:30,仅周五六日及节假日

2026-02-28 五一河南规划

❌ 犯的错误

  1. 按2人规划 → 预算、住宿、门票全错
  2. 推荐汉庭 → 不符合用户偏好
  3. 尝试用AI查12306 → 浪费时间,技术限制

✅ 正确做法

  1. 默认3-4人出行
  2. 住宿直接选全季,不问
  3. 车次让用户查12306,AI标注"待查询"
  4. 先查景点开放时间,再定行程

📚 生成的 Skill

  • /root/.openclaw/workspace/skills/trip-planning/SKILL.md
  • 下次规划时直接参考这个 skill

安阳必去景点

  1. 殷墟博物馆(主)
  2. 殷墟宗庙遗址
  3. 殷墟王陵遗址

其他安阳景点(红旗渠、太行大峡谷等)均为备选


用户偏好总结

类别 偏好
景点类型 历史/人文/古建筑/博物馆
出行方式 公共交通/高铁
住宿档次 全季/桔子水晶/美居
行程节奏 轻松休闲/不二刷
饮食要求 不辣+有蔬菜

✅ 工作完成总结(2026-02-28 19:16)

超级系列全部获取完成!

  • 7个城市攻略
  • 374处古建国保
  • 占全省70.6%

小红书采集:

  • 已获取笔记:14个
  • 高价值信息源:超级系列 + 官方发布 + 实地考察

下一步:

  • 整理超级系列信息到Wiki
  • 更新各市开放情况统计
  • 预计完成后达到400+处(75%+)