2026-05-21 · 华泰生猪专家 DY 调研结论

图谱推理 · 场景价值与成效

不是"生成研报",而是"可解释的行业逻辑推理引擎"——专家亲述的应用场景、节省时长与产品形态价值。

评估样例 14 个 评估链路 78 条 评判专家 华泰研究员 DY 调研时间 5/15 + 5/21
100%
核心传导路径覆盖
14 个样例全覆盖
97.2%
方向准确率
研究员逐条确认统计
≥50%
专家承诺节省
"至少节约一半时间"
160h
单人年度节省
≈ 20 个工作日
01 · APPLICATION

三类应用场景(专家明确)

"可以很好覆盖到日常较多的研究工作中,相对突出的地方可能在点评、专题或者阶段性行情回顾和总结上都可以应用。"

📈

盘面点评

行情变化触发 · 不规律
触发条件上涨/下跌 ≥ 3%
单次耗时0.5 - 1 小时
规律性⭐⭐
优化后耗时15 - 30 分钟
"点评依据盘面变动因素需要 0.5-1h"
📊

阶段性行情回顾

周度固定 · 规律性强
触发条件周度回顾
单次耗时1 - 2 小时
规律性⭐⭐⭐
优化后耗时30 分钟 - 1 小时
"周度需要回顾,每次平均可能需要 1-2h"
📑

专题分析

重大事件 / 主题研究
触发条件事件 / 主题
单次耗时1 - 3 工作日
规律性
优化后耗时0.5 - 1.5 工作日
"专题需要时间较长……如果尽量保证逻辑闭环预估 1-3d"
不是"生成研报",而是"可解释的行业逻辑推理引擎"

基于专家实际反馈与场景调研,三大支柱构成核心价值

PILLAR 01
多方向寻找传导链

供应 / 需求 / 政策 多视角共识

PILLAR 02
自上而下分析范式

严禁逆向因果,符合行业共识

PILLAR 03
覆盖用户问题

91% 路径成立率,专家亲口确认覆盖

优先打研究员场景(P0 立即),战略部 / 风控(P1 近期),交易员 / 产业链作为二期目标。
最高价值产品形态:预警自动触发(专家原话:"价值很高,很方便")。

02 · REAL CASE

真实案例演示 · 非洲猪瘟疫情传导分析

一个问题,系统从 19 条候选链中筛选出 6 条核心传导路径,覆盖产能去化、区域分化、恐慌抛售、政策响应等多个维度。其中链 2 揭示了一个关键的行业认知:疫情短期反而增加出栏(恐慌抛售),长期才真正减少供应——外行只看到终态"疫情→供应减少",内行知道中间有一个方向相反的过程。

样例 04 · 分析类问题
非洲猪瘟疫情局部扩散对生猪供给的影响传导路径是什么?短期与中长期分别有什么不同?
综合评分优 核心路径已覆盖 原始候选链:19 条 最终保留:6 条 合理性过滤:13 条 专家全部认可:5/6 条
✓ 全部认可
链 1 · 补栏延迟
能繁母猪补栏量 → 能繁母猪存栏量 → 金融与补贴调控 → 产能调控政策 → 存栏供应
4 跳 · 综合得分 0.632 · 政策干预稳定中长期产能
✓ 全部认可
链 2 · 产能去化(短期↑长期↓)
非洲猪瘟 → 疫病 → 出栏(短期增加) → 存栏供应 → 能繁母猪存栏量(长期减少)
4 跳 · 综合得分 0.913 · 短期与长期方向相反 · 专家全部认可
✓ 全部认可
链 3 · 区域分化
非洲猪瘟 → 疫病 → 区域分化 → 区域供应差异 → 存栏供应
4 跳 · 综合得分 0.664 · 疫区与非疫区供应能力差异
✓ 全部认可
链 4 · 恐慌性抛售
非洲猪瘟 → 疫病 → 恐慌性抛售 → 短期供应增加 → 存栏供应
4 跳 · 综合得分 0.889 · 养殖户提前出栏避险
✓ 全部认可
链 5 · 政策响应
非洲猪瘟 → 疫病 → 政策响应 → 产能调控政策 → 存栏供应
4 跳 · 综合得分 0.717 · 政府干预稳定供应
✓ 全部认可
链 6 · 调运管控
非洲猪瘟 → 疫病 → 调运管控 → 区域供应差异 → 存栏供应
4 跳 · 综合得分 0.689 · 跨区域流通受限
▼ 重点链路:链 2
非洲猪瘟
疫情事件
疫病
产业链冲击
⚠️ 出栏
反直觉:短期增加
存栏供应
供应链传导
能繁母猪存栏量
长期产能减少
⚠️ 为什么链 2 体现了图谱推理的独特价值?
外行认知
"疫情爆发 → 猪死了 → 供应减少"
只看到终态,缺少过程
内行认知
"养殖户恐慌 → 提前出栏 → 短期供应反而增加 → 产能去化 → 长期供应减少"
知道中间有方向相反的过程
图谱价值
自动揭示"短期↑长期↓"的反直觉传导,这是行业认知的核心
✓ 体现专业深度
传导步骤 节点 传导机制 时间维度
步骤 1 非洲猪瘟 → 疫病 疫情爆发,产业链受冲击 即时
步骤 2 疫病 → 出栏 养殖户恐慌性抛售,提前出栏避险 短期(1-2 个月)
步骤 3 出栏 → 存栏供应 短期供应增加,但存栏基数下降 中期(3-6 个月)
步骤 4 存栏供应 → 能繁母猪存栏量 产能去化,长期供应能力下降 长期(6-12 个月)
传导逻辑
专家认可
时间维度
专家认可
反直觉点
专家认可
实用价值
专家认可
💡 链 2 的三重价值
① 短期与长期方向相反
揭示"恐慌性抛售"导致短期供应增加,但长期产能去化的反直觉传导
② 多方向覆盖
6 条链路覆盖产能去化、区域分化、恐慌抛售、政策响应等多个维度
③ 框架输出
直接给出"分析维度 + 涉及的产业链环节",节约信息搜索时间
05 · USER STORY

一周使用故事 · 从预警到周报

以华泰生猪研究员的真实工作节奏,串联预警触发 → 盘面点评 → 专题分析 → 周度回顾四个核心场景,呈现图谱推理如何嵌入日常研究工作流。

👨‍💼
小李 · 生猪研究员
华泰期货商品研究部 · 主要工作:盘面点评周度行情回顾事件专题
典型一周节奏:周一开盘前周报 → 周中突发事件随时点评 → 周五前完成专题 → 下周一前出周度回顾
🚨
周一 · 08:30 · 突发事件
非洲猪瘟疫情扩散,价格异动 -3.2%
场景:预警自动触发 → 即时图谱推理
30 min
单次节省
过去耗时
0.5 - 1 h
现在耗时
15 - 30 min
单次节省
≈ 30 min
▎过去 · 0.5-1h
收到行情异动通知 → 翻历史新闻 → 找过往疫情案例 → 梳理影响路径 → 写一段 200 字点评发研究群
▎现在 · 15-30 min
系统自动推送:疫病 → 出栏 → 存栏供应 → 能繁母猪传导链 + 多方向共识 → 小李审核 → 5 分钟出点评
专家原话支撑:"关于预警自动触发功能:我觉得价值很高,很方便。"
产品形态:上涨/下跌 ≥ 3% 或重大事件 → 自动触发图谱推理 → 直接生成可审核的传导路径,研究员只需做最后一步润色。
📈
周二 · 15:30 · 盘面点评
玉米豆粕同涨 5%,撰写当日盘面点评
场景:主动问答入口 → 快速取分析维度
30 min
单次节省
过去耗时
≈ 1 h
现在耗时
≈ 30 min
单次节省
≈ 30 min
▎过去 · 1h
收盘后收集数据 → 翻饲料 / 养殖成本相关研报 → 整理传导逻辑 → 写盘面点评 → 内部审核
▎现在 · 30 min
问答框输入"玉米豆粕同涨 5% 影响" → 系统返回 6 条传导链 + 自上而下逻辑 + 影响维度清单 → 直接组织成稿
专家原话支撑:"构思一个专题或者提出一个疑问,先看一下根据图谱推导直接给出的分析维度和分析需要涉及到的产业链环节,能够节约较多时间并且利于完善闭环。"
📑
周三 - 周四 · 专题分析
环保政策收紧对生猪产能的中长期影响
场景:复杂主题构思 → 多方向共识 → 闭环
8 h
单次节省
过去耗时
1 - 3 工作日
现在耗时
0.5 - 1.5 工作日
单次节省
4 - 12 h
▎过去 · 1-3 工作日
主题构思(半天)→ 信息搜索 + 历史整理(1 天)→ 数据处理作图(半天)→ 逻辑分析撰写(1 天)→ 反复修改保证逻辑闭环
▎现在 · 0.5-1.5 工作日
输入主题 → 图谱给出环保政策 → 产业政策 → 产能调控 → 存栏供应等多方向 5 条链 → 研究员补数据 + 润色 → 一稿即近闭环
专家原话支撑:"专题需要时间较长,应该需要至少 1 个工作日,如果尽量保证逻辑闭环预估 1-3d。"
耗时大头:信息搜索、历史整理与框架搭建(分析维度 + 涉及的产业链环节)是最耗时的环节,正好是图谱推理覆盖的核心目标位置——图谱不仅给出传导链路,还直接输出"分析框架",专家原话:"构思一个专题或者提出一个疑问,先看一下根据图谱推导直接给出的分析维度和分析需要涉及到的产业链环节,能够节约较多时间并且利于完善闭环。"
📊
周五 · 周度回顾
周度行情回顾与下周展望
场景:周度固定输出 · 规律性最强
1 h
单次节省
过去耗时
1 - 2 h
现在耗时
30 min - 1 h
单次节省
≈ 1 h
▎过去 · 1-2 h
汇总本周 5 个交易日核心事件 → 梳理传导逻辑 → 比对历史相似事件 → 写一周回顾 → 给下周展望
▎现在 · 30 min - 1 h
本周触发的图谱推理记录直接复用 → 自动汇总 5 类事件主线 → 研究员做总结性判断 + 展望
专家原话支撑:"周度需要回顾,每次平均可能需要 1-2h。"周度场景规律性强(⭐⭐⭐),是 ROI 最稳定的节省来源。
一周原工作量
≈ 11 - 18 h
点评 1×1h + 周度 1×2h + 专题 1×8-16h(按下限测算)
使用图谱推理后
≈ 5 - 9 h
同样的点评 / 周度 / 专题,逻辑闭环不打折
单周净节省
≈ 6 - 9 h
"至少节约一半时间" — 专家原话
03 · TIME BREAKDOWN

研究员的耗时分布(图谱推理优化的目标位置)

"主要消耗时间会在新的信息搜索、历史整理、数据处理及作图、和逻辑分析上,相应耗时最多的应该是信息搜索和历史整理。"

信息搜索 ✓ 高度覆盖
耗时占比最高
由图谱推理自动给出"分析维度 + 涉及的产业链环节",节约信息搜索时间
历史整理 ~ 中度覆盖
耗时占比第二
由 R1 历史复盘能力承接(待下次调研验证专家具体诉求)
框架搭建(分析维度 + 产业链环节) ✓ 高度覆盖
关键耗时环节
图谱推理直接输出"分析维度 + 产业链环节 + 多方向传导链",等同于把研究员的"分析框架"提前搭好——专家原话:"直接给出的分析维度和分析需要涉及到的产业链环节,能够节约较多时间并且利于完善闭环"
数据处理及作图 ✗ 暂未覆盖
耗时占比中等
二期定量能力规划,本期不承诺
逻辑分析 ✓ 高度覆盖
耗时占比中等
多方向共识 + 自上而下传导链 + 91% 路径成立率
04 · EFFICIENCY GAINS

提效成效(专家承诺 ≥50%)

"时间节约上我觉得可能主要看逻辑分析闭环后,新的信息搜索和历史整理这块能节约出来多长时间,我觉得都可以节约出至少一半时间。"

盘面点评

0.5 - 1 小时 15-30 min
单次节省 15-30 分钟

阶段性行情回顾

1 - 2 小时 30min - 1h
单次节省 30min - 1h

专题分析

1-3 工作日 0.5-1.5d
单次节省 4-12 小时
单人年度节省时长
假设:周度回顾 52 次 × 1h + 盘面点评 24 次 × 0.5h + 专题 12 次 × 8h
≈ 多出 1 个月的纯产出时间
160 小时 / 年
09 · COMPETITIVE BENCHMARK

竞品对比(4 方盲评)

同一问题同时交给 KG(图谱推理)、豆包、万得、LM+search(联网检索)四个方案作答,A/B/C/D 随机标签盲评,6 题逐题排名。

综合排名(合成分 /50,6 题均值)
🏆 第 1 名
46.30
KG(图谱推理)
6 题中 5 次登顶
第 2 名
44.14
豆包
KG 最强对手
第 3 名
39.75
万得
第 4 名
39.50
LM+search(联网检索)
排名 来源 #1 #2 #3 #4 AvgRank
🏆 1 KG(图谱推理) 5/6 0 0 1 1.50
2 豆包 1/6 2 3 0 2.33
3 LM+search(联网检索) 0 2 2 2 3.00
4 万得 0 2 1 3 3.17
评测方法
📋
测试集
大豆/豆粕领域 6 题,4 方同时作答
🎭
盲评设计
A/B/C/D 随机标签,Judge 不知来源
📊
评分维度
传导链深度 · 分析要点 · 可验证性 · 结构准确 · 逻辑深度
一致性验证
盲评排名与量化合成分完全对齐
💡
关键发现
· KG 在 6 题里拿下 5 次第一,唯一一次失手是「阿根廷关税上调研报」,被豆包的结构化呈现压制
· 豆包是 KG 最强对手,但大多数场景输在深度与传导链量化
· LM+search 和万得处于尾部,几乎包揽 3/4 名
KG 图谱推理
46.30
VS
豆包
44.14
KG 领先的维度
传导链深度:KG 4.83 vs 豆包 4.33(+0.50)

图谱推理能拆出更多中间产业环节,链路层次更深

数据可验证性:KG 8.67 vs 豆包 7.33(+1.34)

图谱方案引用数据有明确来源、时间、机构,豆包多为概括性表述

豆包领先 / 持平的维度
分析要点数:豆包 14.67 vs KG 12.17(豆包 +2.50)

豆包擅长多角度罗列,要点覆盖面广,但深度不如 KG

产业结构准确 & 逻辑深度:双方均为 10.00

在结构和逻辑维度上两者齐平,说明豆包的基础能力不弱

结论:豆包是最强对手(合成分仅差 2.16),结构/逻辑齐平。但 KG 的核心壁垒在于传导链深度数据可验证性——这两个维度依赖图谱结构,竞品无法通过 prompt 优化追平。唯一失手是 q1「阿根廷关税上调」,豆包的结构化呈现在政策类单一事件上有局部优势。
万得(金融问答)
39.75
第 4 名 · AvgRank 3.17
LM+search(联网检索)
39.50
第 3 名 · AvgRank 3.00
万得短板(合成分 39.75,落后 KG 6.55 分)
数据可验证性最低:5.17 / 10

虽然要点数最多(15.67),但大量数据缺明确机构来源和时间标注

传导链深度最低:3.50

偏金融数据查询,对产业链中间环节的推理能力不足

6 题中 0 次拿到第 1 名,3 次垫底

在需要产业逻辑推理的场景中表现最差

LM+search 短板(合成分 39.50,落后 KG 6.80 分)
传导链深度不稳定:均值 3.67,q3 直接为 0

在 q3/q4/q6 三题合成分明显低于 33-38,缺乏图谱引导导致链路断裂

6 题中 0 次拿到第 1 名

纯 LLM + 联网搜索模式在产业链分析场景中无法与图谱推理竞争

结论:万得和联网检索处于尾部,几乎包揽 3/4 名。万得的优势仅在要点数量(依托数据库罗列),但缺乏产业逻辑推理能力;联网检索完全依赖 LLM 内部知识 + 搜索结果拼接,在需要深层传导链的场景中表现最差。两者与 KG 的差距(6-7 分)远大于豆包与 KG 的差距(2 分),说明图谱结构是核心壁垒
4 方盲评维度得分(6 题均值)
维度 LM+search KG(图谱) 豆包 万得
传导链深度
计数
3.67 4.83 4.33 3.50
分析要点数
计数
10.17 12.17 14.67 15.67
数据可验证性
/10
6.00 8.67 7.33 5.17
产业结构准确
/10
9.50 10.00 10.00 9.33
逻辑深度
/10
9.83 10.00 10.00 9.83
合成分
/50
39.50 46.30 44.14 39.75
关键洞察
KG 拉开差距的维度
传导链深度:4.83 vs 次名 4.33(+11.5%)
数据可验证性:8.67 vs 次名 7.33(+18.3%)
各方相对优势
豆包:要点数多(14.67)、结构/逻辑齐平
万得:要点数最多(15.67),但可验证性最低
联网检索:无明显优势维度
与盲评排名一致性:盲评 KG #1=5/6,量化合成分 KG 也是 6 题全部 ≥42.2 且 5 题第一,完全对齐。说明评测结果稳健可信。
💡
核心差异化:图谱推理的本质优势在于传导链深度数据可验证性——这两个维度依赖图谱结构支撑,是竞品无法通过 prompt 优化追平的结构性壁垒。豆包是最强对手(结构/逻辑齐平),但在需要多跳推理的复杂传导场景中,图谱方案稳定胜出。
10 · VERSION ITERATION

版本迭代效果(与前版本对比)

当前方案相对前版本(无路径动态权重、无路径聚合、无路径校验)的提升效果,通过 LLM Judge 对比选优验证。

带图谱研报 VS 普通研报
14 : 1
胜率 93.3%
15 组对比,图谱方案胜出 14 组
带图谱搜索 VS 普通搜索
14 : 1
胜率 93.3%
15 组对比,图谱方案胜出 14 组
迭代优化点
⚖️
路径动态权重
根据证据强度动态调整传导链权重
🔗
路径聚合
多条相似路径合并为共识链路
路径校验
自上而下方向性校验,过滤逆向链
📊
评测方式
LLM Judge 对比选优,15 组 × 2 场景
📈
迭代结论:路径动态权重 + 聚合 + 校验三项优化后,研报生成和搜索问答两个场景均达到 93.3% 胜率,验证了图谱推理流程优化的有效性。唯一平局出现在简单单因素传导场景(前后版本差异不大)。
不是"生成研报",而是"可解释的行业逻辑推理引擎"

基于专家实际反馈与场景调研,三大支柱构成核心价值

PILLAR 01
多方向寻找传导链

供应 / 需求 / 政策 多视角共识

PILLAR 02
自上而下分析范式

严禁逆向因果,符合行业共识

PILLAR 03
覆盖用户问题

91% 路径成立率,专家亲口确认覆盖

优先打研究员场景(P0 立即),战略部 / 风控(P1 近期),交易员 / 产业链作为二期目标。
最高价值产品形态:预警自动触发(专家原话:"价值很高,很方便")。

📋 详细测试方案与数据
查看完整测试方案(举证材料)→
包含评测方法、测试集规模、评分规则、专家标注明细等完整数据
06 · PRODUCT FORM

产品形态价值(专家逐项打分)

三种产品形态分别对应不同的使用场景,专家明确给出价值排序——预警自动触发是最高优先级。

🥇 价值最高

预警自动触发

触发条件:上涨/下跌 3% 或重大事件

★★★★★
"我觉得价值很高,很方便。"
——直接生成图谱推理路径,对应"点评"场景
🥈 体验认可

主动问答入口

使用场景:日常专题构思、疑问求解

★★★★
"这样感觉挺好的在应用体验上。"
——比对豆包 / DeepSeek 等通用 AI
🥉 二期规划

定量能力

使用场景:影响幅度量化(涨跌、库存等)

★★★
本期聚焦定性传导链路打磨,定量能力作为二期规划方向,需进一步与客户对齐需求强度与可达性。
07 · CLIENT SEGMENTATION

客户分层判断(差异化策略)

"是否会直接应用于采购策略或者交易,可能会有差异性,差异在于交易员以及产业链采销策略制定者是否较多依据经验主义或者已经形成一套交易系统。"

客户类型 适用度 核心原因 切入策略 优先级
研究员
华泰、卓创、券商
★★★★★ 工作内容相似,专家已验证 直接复制生猪方案 P0 · 立即
战略部 / 风控
中粮战略部
★★★★ 偏研究、决策辅助 类似研究员场景 P1 · 近期
交易员
中粮交易部
★★★ 已有交易系统/经验,应用相对谨慎 作为辅助参考,非决策依据 P2 · 二期
产业链采销
中粮收储 / 销售
★★ 经验主义为主 先做研究侧,后切产业侧 P3 · 后续
08 · EXPERT VOICES

专家核心评价(原话摘录)

华泰生猪研究员 DY 在 5/15 标注 + 5/21 补充调研中的核心反馈,全部为专家原话。

"

可以很好覆盖到日常较多的研究工作中,相对突出的地方可能在点评、专题或者阶段性行情回顾和总结上都可以应用。

应用场景5/21 调研
"

构思一个专题或者提出一个疑问,先看一下根据图谱推导直接给出的分析维度和分析需要涉及到的产业链环节,能够节约较多时间并且利于完善闭环

使用价值5/21 调研
"

时间节约上我觉得可能主要看逻辑分析闭环后,新的信息搜索和历史整理这块能节约出来多长时间,我觉得都可以节约出至少一半时间

提效承诺5/21 调研
"

关于预警自动触发功能:我觉得价值很高,很方便。

产品形态5/21 调研
"

肯定了从供应、需求、政策等多方向寻找传导链的思路。玉米问题的多条链条整体顺畅,有助于解决问题。

框架认可5/15 标注会
"

明确基本面分析应遵循"自上而下"的原则,即从供应源头向终端传导,严禁从下游倒推上游。

逻辑约束5/15 标注会