情报思维:从公开信息到投资优势

OSINT-投资情报 | 第 01 篇 | 核心概念:OSINT、情报循环、信息优势

为什么投资者需要情报思维

2014年7月17日,马航MH17在乌克兰东部被击落。各国政府互相指责,信息战铺天盖地。一个叫 Bellingcat 的民间组织——没有间谍、没有卫星、没有任何政府资源——仅凭公开的社交媒体帖子、Google Earth 历史影像和众筹购买的 Digital Globe 卫星照片,就锁定了发射山毛榉导弹的俄军防空旅番号。他们的方法论后来被荷兰联合调查组(JIT)采纳为正式证据。

这件事的意义不在于地缘政治,而在于它证明了一个事实:在信息爆炸的时代,公开信息经过系统性收集和分析,能产出与机密情报同等甚至更高质量的判断。Bellingcat 将低分辨率卫星图与 Google Earth 高分辨率影像交叉比对,通过地理特征匹配确认发射地点;又对比历史影像的植被变化,证明俄罗斯国防部发布的"7月中旬影像"实际上来自更早日期,图片存在篡改痕迹。每一条证据单独看都不充分,但"聚合指向同一答案"时,形成了无法辩驳的推断。

这套方法论有个名字:OSINT,Open Source Intelligence,开源情报。CIA 和 NSA 用了几十年的情报分析框架,现在因为互联网和数据工具的普及,变成了任何人都能掌握的系统。而投资——尤其是追求 Variant Perception 的主动投资——本质上就是一项情报活动。

OSINT 是什么,不是什么

Mark Lowenthal 在《Intelligence: From Secrets to Policy》中给出了最干净的定义:"Information of potential intelligence value that is available to the general public."(对公众可得、具有潜在情报价值的信息。)这里有两个关键限定词:"potential intelligence value"意味着不是所有公开信息都算 OSINT,只有经过评估、具有分析价值的那部分才算;"available to the general public"划定了合法边界——你不需要偷、不需要黑、不需要贿赂,所有信息都是合法可得的。

Lowenthal 指出,开源情报传统上指公开出版的材料——报纸、书籍、学术期刊——过去被称为 literature intelligence (LITINT)。但今天 OSINT 的外延已经远超出版物:商业影像卫星提供的海量影像、商业数据库中的经济数据、社交媒体上的实时信息流,虽然不属于"出版物",但仍然是"对公众可得"的。

Robert Clark 在《Intelligence Analysis: A Target-Centric Approach》中进一步把开源来源分成几大类:

来源类别具体内容投资场景举例
Public Data 政府报告、官方统计、听证会记录、立法辩论、新闻发布会、演讲稿 SEC Filing、FOMC 会议纪要、国会听证会上 CEO 的证词措辞变化
Professional & Academic 会议论文、专业协会报告、学术期刊、行业专家观点 FDA Advisory Committee 的投票记录、行业会议上的技术路线辩论
Media 报纸、广播、电视、在线新闻 地方媒体对某工厂扩产/裁员的报道(往往比全国媒体早)
Commercial Data 卫星影像、商业数据库、信用卡交易数据、网络爬取数据 停车场车辆计数、App 下载量趋势、招聘网站岗位变化

这里要强调的是:OSINT 不等于"上网搜搜"。搜索引擎只是工具之一。真正的 OSINT 是一套系统性的收集-验证-分析框架,背后是几十年情报机构沉淀下来的方法论。Bellingcat 的调查之所以能被法庭采信,不是因为他们用了什么高科技,而是因为他们的验证流程(verification)——对信息"准确性、可信度和可靠性"的系统性核查——达到了情报分析的标准。

反思点

回想你做交易调研的过程。你平时用什么公开信息源做买卖决策?这些信息源中,哪些是你有意识地系统收集的,哪些只是偶然撞上的?你有没有一套固定的验证流程,还是基本靠直觉判断信息质量?

情报循环:把散落的信息变成可执行判断

CIA 的情报分析不是拍脑袋,它遵循一套叫"情报循环"(Intelligence Cycle)的标准流程。Clark 的原文描述是一个五步闭环:Requirements(需求定义)-> Planning/Direction(计划/指挥)-> Collection(收集)-> Processing & Analysis(处理与分析)-> Dissemination(传播)。每一步都有明确的输入和输出。

graph LR
    A["Requirements
需求定义"] --> B["Planning
计划/指挥"] B --> C["Collection
收集"] C --> D["Processing
& Analysis
处理与分析"] D --> E["Dissemination
传播"] E -->|"Feedback
反馈"| A

Requirements(需求定义)——"The cycle typically begins with a requirements or needs step, which amounts to a definition of the intelligence problem."(循环始于需求步骤,本质上是对情报问题的界定。)在投资语境下,这就是你的投资论点(thesis)。不是"帮我找点关于特斯拉的信息",而是"特斯拉上海工厂的产能爬坡是否已经被市场充分定价?"问题越精确,后续收集越高效。

Planning/Direction(计划/指挥)——"determining how the other components of the cycle will address the problem"(决定后续步骤如何解决这个问题)。你需要的是卫星影像?招聘数据?供应链上游的采购订单?还是工人社交媒体上的加班吐槽?不是所有问题都需要同样的收集手段。Clark 特别强调:"Not every issue requires the same types of collection support."(不是每个问题都需要相同类型的收集支持。)

Collection(收集)——按计划获取信息。这是大多数人以为 OSINT 的全部——爬数据、下报告、截图、录屏。但实际上这只是流程中的一个环节。

Processing & Analysis(处理与分析)——"Intelligence collected by technical means does not arrive in ready-to-use form. It must be processed... and these must then be exploited..."(技术手段收集的情报不会以即用形式到达,必须经过处理和利用。)原始数据不是情报。卫星图片要做地理定位和时序对比,招聘数据要做职位分类和趋势提取,财报要做同行对比和异常检测——这些处理步骤才是把"数据"变成"情报"的关键。

Dissemination & Feedback(传播与反馈)——情报产出后要传递给决策者。Lowenthal 特别强调传播之后还有两个被忽视的阶段:consumption(消费)和 feedback(反馈)。"Policy makers should give the intelligence community some sense of how well their intelligence requirements are being met."(决策者应让情报部门了解其情报需求的满足程度。)在投资语境下,你做了一笔交易,结果如何?你的信息收集是否抓住了关键变量?这个反馈闭环是提升分析能力的唯一途径。

这个循环看起来是线性的,但文献反复强调,现实中情报循环并非严格线性,常因新发现或环境变化呈现非线性互动。你在收集阶段可能发现新线索,需要回头重新定义问题;分析过程中可能暴露信息空白,需要追加收集。投资研究也是一样——你读着 10-K 发现一个关联交易,这个发现会让你重新定义整个研究问题。

反思点

把情报循环对应到你最近一次认真做的交易调研。你在五个阶段分别花了多少时间?大多数散户的问题是收集了大量信息但几乎不做"Processing & Analysis"——你觉得自己的薄弱环节在哪个阶段?

从情报循环到信息优势

情报循环是方法论,但做投资不能只有方法论,还需要知道方法论的目标是什么。答案在 Michael Steinhardt 那里。

Steinhardt 在《No Bull》中定义了 Variant Perception:"holding a well-founded view that was meaningfully different from market consensus"(持有一个有充分依据的、与市场共识显著不同的观点)。注意两个限定词:well-founded(有充分依据)排除了拍脑袋的逆向操作;meaningfully different(显著不同)排除了共识的边际修正。你的观点必须同时满足"对"和"不同"两个条件。

但 Steinhardt 还说了一句同样重要的话:投资成功需要"keen understanding of what the market expectations truly were"(对市场真实预期的敏锐理解)。也就是说,光有独立判断不够,你还必须知道市场在想什么。Michael Mauboussin 在《Expectations Investing》中把这个思路系统化了:股价快速反映修正后的预期,投资者的第一步是"read expectations"——通过长期折现现金流模型读取股价隐含的预期,然后判断这些预期是否会变化。

把这两个框架叠在一起,OSINT 在投资中的定位就清楚了:

graph TD
    A["市场共识
Price-Implied Expectations"] --> B["OSINT 收集
系统性获取公开信息"] B --> C["情报分析
处理、验证、聚合"] C --> D["Variant Perception
有依据的差异认知"] D --> E["交易决策
做多/做空/观望"] E -->|"结果反馈"| A

Mauboussin 把投资者的优势分为三类:Information Edge(信息优势,你知道别人不知道的事实)、Analytical Edge(分析优势,同样的信息你能得出更好的结论)和 Behavioral Edge(行为优势,你能克服人类固有的认知偏差)。OSINT 直接对应前两类。

优势类型含义OSINT 如何提供
Information Edge 你掌握了别人没有的事实 另类数据采集:卫星影像、信用卡交易数据、网络爬取、供应链追踪。数据本身不违法,但大多数人不知道去哪找、怎么找。
Analytical Edge 同样的信息,你能得出更好的结论 情报分析方法论:ACH(竞争假设分析)、结构化分析技术、交叉验证。不是看得更多,而是想得更深。
Behavioral Edge 你能克服认知偏差 情报分析训练本身就包含系统性去偏:Heuer 的《Psychology of Intelligence Analysis》整本书都在讲分析师如何被自己的认知偏差欺骗。

这就是 OSINT 投资情报这个学科的核心链条:OSINT 方法论提供收集和验证框架,另类数据是产出物,情报分析技术把数据变成判断,Variant Perception 是最终目标——形成有依据的、与市场共识显著不同的认知。

另类数据:OSINT 在投资领域的具体载体

讲到这里,需要把"另类数据"(Alternative Data)这个概念展开一下,因为它是 OSINT 方法论在投资领域最直接的产出物。

《The Book of Alternative Data》把另类数据的来源分为三大类,按数据生成者划分:

生成者数据类型具体例子
Individuals(个人) 社交媒体帖子、产品评论、搜索趋势 Twitter 情绪分析、Amazon 评论趋势、Google Trends
Business Processes(业务流程) 信用卡交易数据、company exhaust data、商业交易记录 Second Measure 的信用卡面板、招聘网站岗位数、专利申请
Sensors(传感器) 卫星影像、交通流量、船舶位置 Planet Labs 停车场计数、AIS 船舶追踪、IoT 设备数据

其中有个概念值得注意:"exhaust data"(业务废气数据)——企业在正常运营中产生的副产品数据。交易系统生成的市场数据、新闻机构产出的文本语料、物流公司的运输记录,这些对产生者来说是业务副产品,对分析者来说却是情报金矿。很多另类数据供应商的商业模式就是把这些"废气"收集、清洗、打包卖给对冲基金。

AIMA(Alternative Investment Management Association)的行业调查显示,对冲基金最常用的另类数据集按受欢迎程度排列是:web scraping(网络爬取数据)最受欢迎,其次是 credit/debit card datasets(信用卡/借记卡数据),然后是 consumer spending/lifestyle dataexpert networksbusiness performance metricsonline reviews and social media sentiment。而 satellite imagery(卫星影像)和 geolocation(地理定位)虽然最吸引眼球,实际使用频率反而较低——因为卫星数据的处理门槛高、时间分辨率受限、噪音大。

这个排名对你来说应该很有启发:你已经有了爬虫和数据处理的技术栈,而 web scraping 恰恰是对冲基金使用最多的另类数据类型。这不是巧合——信息的获取成本和处理成本是另类数据价值的核心决定因素。能爬、能洗、能分析,这三件事本身就是壁垒。

反思点

你在做爬虫项目时,有没有遇到过某个数据集让你产生"这个数据如果拿来做交易信号会很有趣"的念头?具体是什么数据、你当时为什么没有跟进?

这门学科的路线图

现在你已经有了全景图。OSINT 投资情报这条路线的学习结构是这样的:

graph TD
    subgraph S1["阶段一:OSINT 方法论"]
        C1["OSINT 工具链
Bazzell"] C2["情报循环实操
Clark / Lowenthal"] C3["信息验证
Bellingcat"] end subgraph S2["阶段二:金融调查"] D1["Financial Shenanigans
财务造假识别"] D2["做空调查
Hindenburg / Muddy Waters"] D3["企业尽调 OSINT"] end subgraph S3["阶段三:另类数据"] E1["另类数据评估与采集"] E2["NLP/情绪分析"] E3["卫星/地理空间"] end subgraph S4["阶段四:信息优势理论"] B1["Expectations Investing"] B2["Variant Perception 实战"] end subgraph S5["阶段五:思维操作系统"] A1["Heuer / ACH"] A2["Tetlock 超级预测"] end S1 --> S2 S2 --> S3 S3 --> S4 S4 --> S5 S2 -.->|"穿插:确认偏差"| A1 S3 -.->|"穿插:噪音与信号"| A2

路径是技术先行:先掌握 OSINT 方法论和工具链,然后进入金融调查和另类数据的实战领域,这两个阶段会大量用到你已有的爬虫/数据能力。心理学和认知偏差不会单独先学,而是在技术内容中自然穿插——比如讲做空调查时引入确认偏差,讲另类数据时引入噪音问题。系统性学习 Heuer、Tetlock、Duke 的思维框架放在技术全部掌握之后。


概念索引

概念一句话定义
OSINT (Open Source Intelligence)从公开可得信息中系统性提取有情报价值内容的方法论
Intelligence Cycle(情报循环)需求定义 -> 计划 -> 收集 -> 处理分析 -> 传播反馈的闭环流程
Variant Perception有充分依据的、与市场共识显著不同的观点(Steinhardt 定义)
Information Edge / Analytical Edge信息优势(知道别人不知道的事实)和分析优势(同样信息得出更好结论)
Alternative Data(另类数据)来自非传统来源(个人行为、业务流程、传感器)的投资相关数据
Exhaust Data(业务废气数据)企业正常运营中产生的副产品数据,对分析者有情报价值

你的反馈

添加批注