Travel Agent 记忆
🎯 北京展览爬取系统(2026-03-05)⭐ 重点
完成任务
- P2 任务:爬取 10 个可信数据源,获取 39 个展览/攻略
- 自动过滤:根据用户偏好自动过滤不符合兴趣的展览
- 飞书文档:每日 9 点自动更新 https://feishu.cn/docx/TOnAdwh2DoteNSxMigPcGnh8njh
技术方案
- Playwright - 动态网站(故宫、小红书)
- web_fetch + Jina Reader - 静态网站(豆瓣、中国美术馆)
- 北京市文物局 - 最佳权威数据源(8 个博物馆汇总)
用户偏好(涛哥)
- 保留类型:历史、人文、古建筑、博物馆、考古、书法、古代艺术、藏传佛教等 14 个
- 过滤类型:建筑艺术、民俗文化、国际艺术、生肖文化、亲子教育、当代艺术等 10 个
-
配置文件:
beijing-exhibitions/config/user_preferences.json
核心经验
- 不是一门手艺走天下,根据网站类型选择工具
- 找替代数据源(北京市文物局汇总最优)
- 默认 3-4 人出行,住宿只选全季,公共交通为主
🔧 系统更新(2026-03-05)
Chromium 已安装可用:
- 版本:Google Chrome 145.0.7632.159
- 路径:
/usr/bin/google-chrome - 用途:Playwright 浏览器自动化(网页读取、截图)
- 安装源:Google 官方仓库
📅 最近完成任务(2026-03-01 至 2026-03-03)
✅ 山西全省深度调研(2026-03-02)⭐ 重点
完成时间:2026-03-02 11:56 - 19:47
工作内容:
-
山西页面更新(13:12)
- 添加分城市统计表格
- 修改博物馆必去条件(仅限一级二级)
- 修复仓库结构和入口链接
-
大同旅行规划 v9.0-v9.1(13:30-13:50)
- 根据 531 处国保名录重新统计必去景点
- 根据 7 家必去博物馆(一级 + 二级)重新筛选
- 三套方案:轻松休闲版/标准充实版/紧凑丰富版
- 确保全部覆盖 13 个必去景点
-
山西城市线路拆分(15:36-15:49)
- 忻州:北线(19 处/6 天)、南线(8 处/4 天)
- 太原:市区线(18 处/7 天)
- 晋中:祁太线(14 处)、介灵线(16 处)、东线(15 处)、平遥线(15 处/5 天 4 晚)
- 晋城:3 条线路
- 长治:3 条线路
- 总计:14 条城市线路
-
山西页面入口更新(15:49-15:56)
- 添加 14 条线路入口链接
- 文件移至山西目录
- 更新山西页面和首页链接
- 删除旧文件
-
河南 8 条线路规划(16:09)
- 郑州 2 条、洛阳 1 条、其他 5 条
- 删除旧的 3 条线路
-
大同规划完善(17:42-19:47)
- 移动大同规划到山西目录
- 修正链接
- 为 13 个规划添加酒店推荐和交通信息
成果统计:
- 山西国保:531 处(全国第一)
- 必去:469 处(古建筑 421 + 古遗址 45 + 名人墓 3)
- 备选:62 处(古墓群)
- 城市线路:14 条
- Wiki 页面:15+ 个
Wiki 链接:
- 山西总览:https://travel.wudai9.net/山西
- 大同规划:https://travel.wudai9.net/大同旅行规划
✅ 国保单位调研(2026-03-02 凌晨)
- 河北省:291 处(100%)✅ 官方数据
- 陕西省:269 处(100%)✅ 数据获取完成
- 河南省:306 处(85.7%)
- 北京市:98 处(100%)
总计:完成 964 处国保调研
✅ 五一计划 v6.2(2026-03-01)
- 第三天增加两个方案:A(羑里城 + 岳飞庙)vs B(+马氏庄园)
- 核实马氏庄园信息(¥40,8:30-17:30,市区西部 21km)
✅ 河南三线旅游规划(2026-03-01)
- 豫北线:80 处国保,核心景点 TOP 10,4-6 日方案
- 豫中豫西线:127 处国保,核心景点 TOP 15,4-6 日方案
- 豫东豫南线:45 处国保,核心景点 TOP 10,4-5 日方案
📚 Wiki 服务器架构(2026-03-02 更新)
Travelwiki 结构(与 Mangawiki 一致):
/opt/travelwiki/
├── data/ # 内容目录(gollum WorkingDirectory)
│ ├── .git/ # git 工作目录
│ └── *.md # Wiki 文件
└── repo/
└── wiki.git/ # bare 仓库
更新方式: ⚠️ 只能用 git push,不能用 rsync
- 本地仓库:
/root/.openclaw/workspace/travel/wiki/ - Remote:
root@47.86.243.164:/opt/travelwiki/repo/wiki.git - 命令:
git push origin master
Gollum 配置:
- WorkingDirectory:
/opt/travelwiki/data - 端口: 4567
- 服务:
gollum.service
标准 SOP
添加新规划(自动执行)
- 创建
目的地旅行规划.md - 更新
Home.md索引页 - 创建/更新地区分类页
git add . && git commit && git push- 验证同步成功
⚠️ Wiki 页面维护规范(2026-03-01 涛哥要求)
1. 链路完整性
每次改动页面时,必须同时更新:
- ✅ 当前页面
- ✅ 上级页面(省份/城市页面)
- ✅ 首页(Home.md)- 如果是重大改动
确保从首页一路链接下去:
Home.md → 河南.md → 河南/五一计划.md
子目录页面链接格式:
- 在父级页面:
[五一计划](河南/五一计划)✅ - 在子页面面包屑:
<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划✅
2. Changelog 规范
每个页面底部必须有 changelog:
---
## 📝 页面更新日志
| 时间 | 版本 | 内容 |
|------|------|------|
| 2026-03-01 17:55 | v6.1 | 核实信息,优化路线 |
---
*由 Travel Agent 维护*
更新规则:
- ✅ 每次修改页面 → 更新页面底部的 changelog
- ✅ 重大改动(新版本、路线大调整)→ 同时更新 Home.md 的"最近更新"
- ❌ 小改动(typo、格式)→ 只更新页面 changelog
3. 更新流程
修改页面内容
↓
更新页面底部 changelog
↓
更新上级页面相关信息和链接
↓
如果是重大改动 → 更新 Home.md changelog
↓
git add . && git commit && git push
↓
验证同步成功
4. 典型错误示例(避免)
| 错误 | 正确做法 |
|---|---|
| ❌ 只改五一计划,不改河南.md | ✅ 同时更新河南.md中的五一计划信息 |
❌ 河南.md链接写成[五一计划](五一计划)
|
✅ 写成[五一计划](河南/五一计划)
|
| ❌ 改完不更新changelog | ✅ 每次改动都记录到changelog |
| ❌ 大改动不更新Home.md | ✅ 重大改动要更新首页"最近更新" |
已完成的规划
| 目的地 | 文件 | 状态 |
|---|---|---|
| 大同 | 大同旅行规划.md | ✅ 完成 |
| 忻州 | 忻州旅行规划.md | ✅ 完成 |
| 太原晋中 | 太原晋中旅行规划.md | ✅ 完成 |
| 晋城长治 | 晋城长治旅行规划.md | ✅ 完成 |
| 五一河南 | 河南/五一计划.md | ✅ 完成 |
| 省份排行榜 | 省份排行榜.md | ✅ 完成(2026-02-28) |
📋 省份调研任务
排行榜已创建:
- 古建TOP 10:山西、河南、河北、陕西、浙江、四川、江苏、山东、广东、湖北
- 博物馆TOP 10:北京、江苏、山东、浙江、广东、河南、四川、陕西、湖北、上海
已完成省份: 4/20 (20%)
- ✅ 山西省(古建第1)
- ✅ 河南省(古建第2 + 博物馆第6)
- ✅ 四川省(古建第6 + 博物馆第6)
- ✅ 湖北省(古建第10 + 博物馆第9)
待调研省份(按优先级):
- ⭐⭐⭐⭐⭐ 河北省(古建第3)- 清皇陵、正定古城
- ⭐⭐⭐⭐⭐ 陕西省(古建第4 + 博物馆第6)- 兵马俑、华山
- ⭐⭐⭐⭐ 浙江省(古建第5 + 博物馆第4)- 西湖、普陀山
- ⭐⭐⭐⭐ 山东省(古建第8 + 博物馆第3)- 泰山、孔府
- ⭐⭐⭐⭐ 江苏省(古建第7 + 博物馆第2)- 苏州园林
📝 爬虫工作准则
重要规则(2026-02-28 涛哥指示):
⚠️ 爬取频率控制
必须遵守:
- 控制爬取频率 - 每次请求之间至少间隔3-5秒
- 避免触发风控 - 不要短时间内频繁访问同一网站
- 批量处理 - 一次爬取多个信息后,暂停一段时间
- 分散来源 - 不要只依赖单一网站,分散使用多个信息源
具体操作:
- 每次web_fetch之间至少等待3-5秒
- 遇到"网络不给力"或"安全验证"立即停止
- 被拦截后,至少等待10-15分钟再尝试
- 优先使用官方发布信息,减少爬取需求
错误示例(今天犯的错误):
- ❌ 短时间内连续调用web_fetch 20+次
- ❌ 触发百度安全验证后才停止
- ❌ 没有控制频率,导致工作中断
正确做法:
- ✅ 批量规划:一次列出需要核实的景点
- ✅ 分批执行:每批5-10个,间隔5分钟
- ✅ 优先级:优先核实4A/5A景区(信息多)
- ✅ 休息间隔:每核实20个景点,休息10分钟
🔍 国保单位开放情况核实
2026-02-28 工作进度(19:07):
- 已核实:121处(22.8%)
- ✅ 已开放:111处
- ❌ 暂不开放:10处
- 待核实:409处(77.2%)
小红书信息源(2026-02-28):
🌟 超级信息源(374处,占全省70.6%)⭐⭐⭐⭐⭐
用户:🍀可以关注我一下吗🍀 完整系列(2026-02-28 19:15 全部获取):
- ✅ 攻略01 - 运城76处古建国保(收藏859)
- ✅ 攻略02 - 长治70处古建国保(收藏1286)
- ✅ 攻略03 - 晋城71处古建国保(收藏1151)
- ✅ 攻略04 - 大同20处古建国保(收藏458)
- ✅ 攻略07 - 太原31处古建国保(收藏458)
- ✅ 攻略08 - 临汾42处古建国保(收藏800)
- ✅ 攻略10 - 晋中64处古建国保(收藏449)
总计:374/530处(70.6%) 可信度: ⭐⭐⭐⭐⭐(实地考察+详细攻略+图片丰富) 优先级: 最高 - 已获取全部7个城市攻略
📱 其他高价值笔记(7个)
- 山西省文旅厅官方 - 长治75处国保全部开放 ⭐⭐⭐⭐⭐
- 运城市102处国保开放情况汇总(实地考察)⭐⭐⭐⭐
- 长治全部国保攻略(收藏1286)⭐⭐⭐⭐
- 山西访古闭门羹大全(10处无法参观)⭐⭐⭐⭐
- 运城11国保懒人路线(新绛县)⭐⭐⭐⭐
- 山西92处前五批国保清单(收藏209)⭐⭐⭐⭐
- 主要中国木构建筑清单(收藏2391)⭐⭐⭐⭐⭐
数据价值:
- 潜在覆盖:332/530处(62.6%)
- 可信度:⭐⭐⭐⭐⭐(实地考察+详细攻略)
- 更新频率:持续采集中
核实方法:
- ✅ 小红书信息源 - 主要来源(7个笔记)
- ✅ 百度搜索 - 辅助来源
- ✅ 4A/5A景区官方认证
- ✅ 长治市文旅局官方发布(60处)
工作原则(严格执行):
- ✅ 必须有确认信息源
- ❌ 不使用常识推断
- ❌ 不使用其他地区数据
- ⏸️ 无确认信息 → 待核实
遇到的问题:
- ⚠️ 百度搜索触发安全验证(已解决)
- ✅ 调整频率:10-20秒随机间隔
- ✅ 使用小红书MCP作为主要信息源
涛哥的规划要求
页面结构
- ⚠️ 新页面必须在首页添加入口和changelog
- ⚠️ 每个页面必须有面包屑导航
- ⚠️ 三套方案格式(紧凑/适中/宽松)
景点分类
- ⚠️ 必去景点和备选景点要严格区分
- ⚠️ 商业化景点要标注⚠️
交通限制
- ⚠️ 家人晕车,不能自驾
景点偏好
- ❌ 不喜欢:仿古建筑、商业化古城
- ✅ 喜欢:真实古建筑、博物馆、历史遗迹
出行人数
- ⚠️ 一家三口或四口出行(不是2人)
住宿偏好
- 舒适型:只选全季
- 高档型:可选桔子水晶、美居、美仑、漫心
- 房型:必须有亲子房(1.5米+1.2米床)
- 位置:离公交近,市中心或景点附近
经验教训
2026-03-01 Wiki 页面维护规范 ⚠️ 重要
❌ 犯的错误
- 只改当前页面,不改上级页面 → 河南.md中五一计划的链接和信息没更新
-
链接格式错误 → 子目录页面链接写成
[五一计划](五一计划),应该是[五一计划](河南/五一计划) - 没有changelog → 改完页面不记录更新历史
✅ 正确做法
-
每次改动都要更新链路:
- 当前页面
- 上级页面(省份/城市页面)
- 首页(如果是重大改动)
-
每个页面都要有changelog:
- 页面底部添加"页面更新日志"
- 每次改动都记录
- 重大改动同时更新 Home.md
-
确保从首页一路链接下去:
Home.md → 河南.md → 河南/五一计划.md
📝 已添加到工作规范
详见 MEMORY.md "Wiki 页面维护规范" 部分
2026-03-01 Wiki 面包屑导航错误 ⚠️ 重要
❌ 犯的错误(两次)
子目录下的页面使用了错误的面包屑导航格式
错误格式:
[Home](Home) > [河南](河南) > **五一计划**
- 在
/河南/五一计划.md中,[Home](Home)会查找/河南/Home,而不是根目录的Home - 同样
[河南](河南)会查找/河南/河南,而不是根目录的河南
正确格式(子目录下的页面必须使用 HTML 绝对路径):
<a href="/">Home </a> / <a href="/河南">河南 </a> / 五一计划
规则总结:
- 根目录页面:可用 Markdown 格式
[Home](Home) - 子目录页面:必须用 HTML 绝对路径
<a href="/">Home</a>
2026-03-01 五一计划v6.0规划
❌ 犯的错误
- 第二天排太满 → 6个必去景点塞一天,压力过大
- 第三天安排不必要行程 → 备选景点(羑里城、岳飞庙)没必要
- 殷墟夜游时间太短 → 只安排30分钟,实际至少3小时
✅ 修正方案
- 分散殷墟游览 → 第一天可选夜游 + 第二天继续
- 删除备选景点 → 只保留6个必去景点
- 第三天只安排1个景点 → 小南海石窟 + 返程,不赶
📝 关键信息
- 殷墟三景区分开:博物馆(新馆)、宗庙、王陵
- 联票120元(含三景区+摆渡车)
- 夜场仅博物馆开放,宗庙王陵无夜场
- 夜场17:30-20:30,仅周五六日及节假日
2026-02-28 五一河南规划
❌ 犯的错误
- 按2人规划 → 预算、住宿、门票全错
- 推荐汉庭 → 不符合用户偏好
- 尝试用AI查12306 → 浪费时间,技术限制
✅ 正确做法
- 默认3-4人出行
- 住宿直接选全季,不问
- 车次让用户查12306,AI标注"待查询"
- 先查景点开放时间,再定行程
📚 生成的 Skill
/root/.openclaw/workspace/skills/trip-planning/SKILL.md- 下次规划时直接参考这个 skill
安阳必去景点
- 殷墟博物馆(主)
- 殷墟宗庙遗址
- 殷墟王陵遗址
其他安阳景点(红旗渠、太行大峡谷等)均为备选
用户偏好总结
| 类别 | 偏好 |
|---|---|
| 景点类型 | 历史/人文/古建筑/博物馆 |
| 出行方式 | 公共交通/高铁 |
| 住宿档次 | 全季/桔子水晶/美居 |
| 行程节奏 | 轻松休闲/不二刷 |
| 饮食要求 | 不辣+有蔬菜 |
✅ 工作完成总结(2026-02-28 19:16)
超级系列全部获取完成!
- 7个城市攻略
- 374处古建国保
- 占全省70.6%
小红书采集:
- 已获取笔记:14个
- 高价值信息源:超级系列 + 官方发布 + 实地考察
下一步:
- 整理超级系列信息到Wiki
- 更新各市开放情况统计
- 预计完成后达到400+处(75%+)