Harness 架构
引入 Anthropic Harness 设计模式,分离生成与评估。Planner 预先规划,Evaluator 按校准标准打分,避免 Agent 一次性自我圆说。
大多数 LLM 分析工具把「生成」和「评估」混在同一次调用里,模型一边写结论一边给自己背书。Syndicate 借鉴 Anthropic 的 Harness 架构,把这两件事彻底拆开:
每一位分析师只负责生成;另一位 Evaluator 按 证据溯源 / 内部一致性 / 置信度校准 / 幻觉检查 / 计划合规 五维度独立打分。未达阈值,带着具体反馈被打回重做。
到了辩论环节,多空双方必须引用具体 Evidence 才能发言;到了因果环节,LLM 给出的假设还要交给 Granger 检验做统计压力测试。让质疑成为流程的一部分,而不是事后审查。
评估市场状态(趋势 / 震荡 / 危机),为每位分析师生成包含 优先级 · 聚焦点 · 验收标准 的 AgentBrief,并设定多空辩论核心问题。
技术面智能体抓取 Binance K 线;链上智能体扫描 PostgreSQL 中 mempool + Blockstream 的 BTC 转账;舆情智能体通过 pgvector RAG 混合检索新闻与 X 帖。
Evaluator 按 证据溯源 · 内部一致性 · 置信度校准 · 幻觉检查 · 计划合规 五维度打分,未达阈值则携带具体反馈重试(可配置次数)。
Bull / Bear 基于三方分析结果与完整 transcript 历史进行 N 轮交锋。每轮发言必须引用具体 Evidence,避免空洞争论。
Arbitrator 综合辩论胜负做最终立场判定;Causal 智能体生成假设后,用 Granger 因果检验 做统计压力测试 —— 显著才采信。
Summary 输出带仓位建议 / 风险评估 / 触发条件的结构化报告。Memory 智能体提取本次分析的长期洞见,供下次 Planner 参考。
引入 Anthropic Harness 设计模式,分离生成与评估。Planner 预先规划,Evaluator 按校准标准打分,避免 Agent 一次性自我圆说。
向量召回(pgvector HNSW)+ 全文召回(FTS GIN)→ RRF 融合 → 时间衰减 → CrossEncoder 重排,六步打造高质量舆情检索。
五维度 + 硬阈值 + 加权平均,每个 Agent 输出都要经过显式质量门禁,不达标自动带反馈重试。
多轮 Bull / Bear 博弈减少单一视角偏差,Arbitrator 综合裁决,辩论 transcript 完整可追溯。
不仅 LLM 生成假设,还用统计学方法压力测试 —— 显著才采信,用数学对抗 AI 幻觉。
Memory Agent 把每次分析的关键洞见沉淀为 Markdown,下次 Planner 自动读取作为先验知识。
智能体之间的每条消息都是经校验的 Pydantic 模型,结构化输出 + JSON Schema 回退 + 重试校验。
遵循 Claude Code Skills 规范,每个技能独立文件夹 + SKILL.md,可为不同 Agent 灵活分配。
Docker Compose 一键启动 PostgreSQL + pgvector + 三路爬虫 + 分析流水线,所有依赖自动就绪。
填入至少一个 LLM API Key,然后构建镜像并启动数据库。
cp .env.example .env
docker compose build
docker compose up -d postgres
建表、建索引,并启动三路独立的爬虫容器。
docker compose run --rm app init-db
docker compose run --rm app init-indexes
docker compose up -d crawl-news crawl-onchain crawl-social
针对任意交易对运行完整流水线并导出报告。
docker compose run --rm app analyze \
--symbol BTCUSDT \
--json-out out/report.json \
--md-out out/report.md