Global Macro Database(全球宏观数据库)
一个公开宏观经济数据产品,把长期跨国数据、季度版本、文档和研究工具链整合成一套可使用的工作流。
Global Macro Database 更像一个公开数据产品,而不是个人工具。官网开头给出的信号很明确:这是一个覆盖极长时间维度的宏观经济数据集,并通过数据文件、配套包、文档、GitHub 和论文一起发布。
所以这篇项目文章也应该采用数据产品的结构:版本信号、覆盖指标、来源管线、访问方式和引用要求。
数据、代码与引用
官网和代码仓库提供最新数据、文档、配套包、发布说明、源码和引用指引。
发布页就是产品界面
GMD 不是一个静态表格。官网围绕当前版本、更新说明、下载入口、论文、文档和 GitHub 来组织项目。
这个版本新增 11 个数据来源、2 个消费变量,改进了政府财政比例拼接,并让 Python、R 和 Stata 包达到功能一致。
一条减少数据摩擦的管线
项目存在的原因,是宏观数据分散、口径不一,而且在分析前需要大量整理。
官网对痛点说得很直接:用户常常要花几周时间清理、统一和拼接数据,才能真正开始分析。GMD 把这部分工作移到系统性管线里:下载、清理、合并、记录文档并发布版本。
IMF、World Bank、OECD、UN、BIS 等现代来源提供近期覆盖。
统计年鉴、档案、手册和学术数据集把部分序列向更早时期延伸。
变量定义、来源排序、拼接规则和元数据,把来源碎片变成可用序列。
适配研究流程的访问路径
数据集只有能进入研究者已经使用的工具链,才会真正成为基础设施。
CSV、Excel 和 Stata 文件支持直接检查、教学、复现和离线工作流。
Python、R 和 Stata 包让研究者不用手动下载,也能把 GMD 接入分析管线。
技术文档解释变量、来源、构建选择和局限。
官网说明数据可在 CC BY-NC-SA 4.0 下免费用于非商业用途,并要求引用。
引用也是产品的一部分
因为 GMD 按季度更新,官网要求用户引用自己实际使用的精确版本。
这对可复现性很重要。如果数据集会随时间变化,论文或报告应该指向产生结果的那个版本,而不只是项目名称。
@techreport{GMD2025,
title = {The Global Macro Database: A New International Macroeconomic Dataset (Version 2026-03)},
author = {Müller, Karsten and Xu, Chenzi and Lehbib, Mohamed and Chen, Ziliang},
institution = {National Bureau of Economic Research},
number = {33714},
year = {2025},
doi = {10.3386/w33714}
}GMD 是我参与过的、最系统的一类项目:让宏观经济历史更容易被研究、比较、教学和复现。