数据产品案例

Global Macro Database(全球宏观数据库)

一个公开宏观经济数据产品,把长期跨国数据、季度版本、文档和研究工具链整合成一套可使用的工作流。

Global Macro Database 更像一个公开数据产品,而不是个人工具。官网开头给出的信号很明确:这是一个覆盖极长时间维度的宏观经济数据集,并通过数据文件、配套包、文档、GitHub 和论文一起发布。

所以这篇项目文章也应该采用数据产品的结构:版本信号、覆盖指标、来源管线、访问方式和引用要求。

01

发布页就是产品界面

GMD 不是一个静态表格。官网围绕当前版本、更新说明、下载入口、论文、文档和 GitHub 来组织项目。

46变量覆盖 GDP、价格、政府财政、贸易、劳动力、信贷等领域。
240当前公开版本覆盖的国家和地区数量。
121数据来源,其中包括 27 个现代来源和 94 个历史数据集。
1086-2030历史数据从 1086 到 2025,并提供到 2030 的预测。
v2026_03官网显示的最新版本

这个版本新增 11 个数据来源、2 个消费变量,改进了政府财政比例拼接,并让 Python、R 和 Stata 包达到功能一致。

02

一条减少数据摩擦的管线

项目存在的原因,是宏观数据分散、口径不一,而且在分析前需要大量整理。

官网对痛点说得很直接:用户常常要花几周时间清理、统一和拼接数据,才能真正开始分析。GMD 把这部分工作移到系统性管线里:下载、清理、合并、记录文档并发布版本。

官方和机构数据

IMF、World Bank、OECD、UN、BIS 等现代来源提供近期覆盖。

历史重构

统计年鉴、档案、手册和学术数据集把部分序列向更早时期延伸。

统一口径逻辑

变量定义、来源排序、拼接规则和元数据,把来源碎片变成可用序列。

03

适配研究流程的访问路径

数据集只有能进入研究者已经使用的工具链,才会真正成为基础设施。

下载

CSV、Excel 和 Stata 文件支持直接检查、教学、复现和离线工作流。

配套包

Python、R 和 Stata 包让研究者不用手动下载,也能把 GMD 接入分析管线。

文档

技术文档解释变量、来源、构建选择和局限。

许可

官网说明数据可在 CC BY-NC-SA 4.0 下免费用于非商业用途,并要求引用。

04

引用也是产品的一部分

因为 GMD 按季度更新,官网要求用户引用自己实际使用的精确版本。

这对可复现性很重要。如果数据集会随时间变化,论文或报告应该指向产生结果的那个版本,而不只是项目名称。

带版本的引用形式
@techreport{GMD2025,
  title = {The Global Macro Database: A New International Macroeconomic Dataset (Version 2026-03)},
  author = {Müller, Karsten and Xu, Chenzi and Lehbib, Mohamed and Chen, Ziliang},
  institution = {National Bureau of Economic Research},
  number = {33714},
  year = {2025},
  doi = {10.3386/w33714}
}
为什么对我重要

GMD 是我参与过的、最系统的一类项目:让宏观经济历史更容易被研究、比较、教学和复现。