首页 > 经济学家 > 阿雷拉诺和邦德对计量经济学的贡献——科睿唯安“引文桂冠”经济学奖得主学术贡献评介

 

阿雷拉诺和邦德对计量经济学的贡献

——科睿唯安“引文桂冠”经济学奖得主学术贡献评介

孟勇    郭鹏巍

 

  摘要:阿雷拉诺和邦德是计量经济学领域具有重要影响力的学者,对面板数据尤其是动态面板数据模型设定及参数估计问题研究做出了杰出贡献,因此得以入选科睿唯安“引文桂冠”经济学奖名录。他们的主要贡献是使用广义矩估计框架统一了面板数据的参数估计方法,提出了著名的阿雷拉诺- 邦德估计量,并就面板数据模型的设定问题提出了严格的检验方法。该框架能够依靠模型本身的设定条件构建工具变量,通过模型转换充分利用工具变量信息,解决了面板数据模型的内生性问题,同时通过约束初始条件生成过程,在一阶差分广义矩估计基础上提出了系统广义矩估计方法,处理了弱工具变量问题。他们还提出通过赫尔默特转换与广义矩估计法相结合确定工具变量的方法,减少计算量的同时提升了参数估计效率。阿雷拉诺和邦德将广义矩估计框架推广到各种设定形式的面板数据模型,广义矩估计也因此成为面板模型参数估计的主流方法,阿雷拉诺- 邦德估计量也为之后的因果推断方法的开发奠定了基础。

  关键词:动态面板  工具变量  广义矩估计  阿雷拉诺- 邦德估计量

 

  面板数据模型是经济学实证研究最重要的方法,这个方法被计量经济学家普遍接受,模型的应用依赖于模型对参数的假设,如果数据生成过程与模型假设不一致,由此对应的参数估计量将是有偏且不一致的,统计性质也会变得很糟糕。对于面板数据模型的系统研究始于20世纪60年代,但是因为加入了不可观测的个体(时间)异质性效应带来的问题、内生性问题、工具变量的选择问题等,以及由此产生的模型参数估计、检验和推断问题,面板数据模型一直吸引着大批计量经济学家在孜孜不倦地探索,其中曼鲁埃尔·阿雷拉诺(Manuel Arellano)和斯蒂芬·罗伊·邦德(Stephen Roy Bond)是这领域最具有代表性的学者,取得了开创性的成就。

  阿雷拉诺于1957年出生在西班牙的阿利坎特省,1979年、1982年分获巴塞罗那大学经济学学士学位和硕士学位,1985年获伦敦经济学院经济学博士学位。他在攻读博士期间师从现代计量经济学的奠基人之一,伦敦经济学院的约翰·丹尼斯·萨甘(John Denis Sargan)。萨甘在时间序列、非线性模型的估计、检验、识别以及有限样本理论方面都做出了卓越的贡献。1991年至今,阿雷拉诺一直是西班牙马德里货币与金融研究中心的计量经济学教授,曾执教于伦敦经济学院、牛津大学经济统计学院和牛津大学纳菲尔德学院。他先后于2003年担任西班牙经济学联合会主席,2013年担任欧洲经济学联合会会长,2014年担任计量经济学会会长,并曾于2006—2008年担任《应用计量经济学期刊》(Journal of Applied Econometrics)主编,其研究领域主要在面板数据方面,包括面板模型的参数估计、检验和外生性相关问题,以及面板数据模型设定形式的拓展。

  邦德于1963年出生在英国林肯市,1984年获剑桥大学国王学院经济学学士学位,1986年获牛津大学纳菲尔德学院经济学硕士学位,1990年获牛津大学瓦德汉学院(Wadham College)经济学博士学位。1990—1993年,邦德在牛津大学纳菲尔德学院任吉本(Gwilym Gibbon)讲席公共经济学研究员,2000年至今任英国财政研究所研究员,经济和社会公共政策研究理事会副主任。邦德专攻应用微观计量经济学方法,主要研究兴趣在公司税务、分红、金融市场联系以及公司控制和投资等领域。

  阿雷拉诺和邦德(1991)构建了动态面板数据模型参数估计的广义矩估计框架,他们在巴尔加瓦和萨甘(1983)的研究基础上提出了基于该框架下的阿雷拉诺- 邦德(Arellano- Bond)估计量(简称AB估计量),该方法成为面板数据模型估计的标准方法。AB估计量充分利用了广义矩估计方法上的优势,即不需要考虑随机差分项的准确分布信息,且允许随机差分项存在异方差和自相关等违背经典假设的情况,巧妙地避开了永久不可观察的混淆变量。AB估计量还具有经济学因果推断的优势,单独使用变量的时间模式就可估计因政策或其他变量变化所产生的经济影响。他们解决了广义矩估计框架下的总体矩条件设定检验、工具变量选择、误差项方差协方差矩阵的估计、最优矩阵确定等关键问题,使用正交离差等模型转换方法降低了矩阵计算的复杂性。他们在解决与改进面板数据模型参数估计、检验与推断等问题方面做出了杰出贡献。

  一、构建差分广义矩估计框架

  阿雷拉诺和邦德最重要的贡献是创建了面板模型参数估计、相关的检验与推断的广义矩估计框架。使用广义矩估计框架估计面板模型参数的方法已成为解决动态面板模型内生性问题的主流技术。面板数据模型的优势在于可以处理数据中存在的个体异质性,引入了不可观测的个体异质性效应,但是也引起了内生性问题。广义最小二乘法可以处理异方差问题以及序列相关问题,但不能处理内生性问题。极大似然估计方法也不适用于处理内生性问题,该方法需要明确关键变量的分布,推导似然函数,在实践中也很困难。工具变量是处理内生性问题的得力方法,他们不仅在广义矩估计框架下处理了面板数据模型的内生性问题,而且改善了工具变量设定方法,提出了参数及模型计量经济学检验方法。他们通过广义矩估计框架选取工具变量只需要依据模型自身的假设条件,而无须在模型之外寻找工具变量(比如利用先验信息确定工具变量),因此该方法相对简单,更重要的是有统计理论做支撑,广义矩估计框架更加严谨、科学。另外,动态面板数据模型确定工具变量的方法还存在一种替代效应问题,也就是增加高阶滞后依赖变量做工具变量会减少可用的观测值数量,继而会产生估计偏误,但是使用广义矩估计工具变量的方法却巧妙地回避了这一问题。尤其是在广义矩估计框架下得出的AB估计量不仅对于计量经济学的发展有重要意义,而且对于经济学因果推断发展有基础性作用。

  阿雷拉诺和邦德(1991)构建了基于广义矩估计框架的动态面板数据模型参数估计方法,解决了动态面板数据模型参数估计的不一致和有偏的问题,提高了参数估计效率。动态面板模型的优势在于引入了局部调整机制,可以研究复杂的动态行为。但是在估计模型参数时,内生性一直是困扰动态面板模型的主要问题,由于面板模型包含不可观测的个体异质性效应,在估计参数时一般采用去均值(demean)的办法,去均值方法使模型成为差分模型,差分后虽然去除了不可观测的个体异质性效应,但是差分后的滞后依赖变量与差分后的误差项之间仍然会存在相关性,这也是内生性存在的主要原因。如果使用最小二乘法估计模型,必然会产生有偏且不一致的估计量。安德森和萧(简称AH)首先考虑了使用工具变量方法处理去均值后的动态面板模型内生性的问题,他们考虑了仅仅包含滞后依赖变量的动态面板模型,而没有包含其他独立变量、前定变量等,AH对于差分后的动态面板模型提出了工具变量估计量,使用滞后一期的依赖变量的水平值或者差分值作为工具变量,因为该工具变量与滞后依赖变量的差分项相关,但是与差分后的误差项不相关,因此滞后一期的依赖变量的水平值或者差分值可以用作有效工具变量。确定有效工具变量后,AH使用最小二乘法对差分后的动态面板模型进行参数估计,AH方法实质上是一种两阶段最小二乘方法。因为AH方法估计得出的参数估计量并没有使用全部有效的工具变量,比如滞后两期以上的依赖变量的水平值或者差分值,更多有效的工具变量可以降低估计误差,因此其估计量虽然是一致的,但不是有效的。

  为此阿雷拉诺和邦德提出了一阶差分广义矩估计方法,简称为差分GMM,该方法估计得到的估计量就是著名的AB估计量。广义矩估计是由拉斯·彼得·汉森(1982)根据卡尔·皮尔逊(Karl Pearson,1894)发明的矩估计方法发展而来,该方法的成功应用是汉森获得2013年度诺贝尔经济学奖的主要原因。广义矩估计是一种半参数估计方法,该方法依据了皮尔逊提出的矩估计原理,即样本矩依概率收敛于总体矩。根据该原理,可以依据总体矩构建参数的样本估计方程。其优势在于只需要依据模型本身的约束条件构建总体矩条件,无须附加其他约束条件,可以充分利用全部有效工具变量信息。在总体矩条件成立,且工具变量有效的前提下,汉森证明了广义矩估计方法估计得到的参数估计量将是有效且一致的。采用广义矩估计框架,理论上有两个优势:一个优势是每个方程可以有更多的不同的工具变量,如果采用最小二乘法或者极大似然法等,每个方程只能有一个工具变量;第二个优势是不需要知道初始条件的先验信息,也不需要知道误差项和不可观测异质性效应的统计分布。显然,传统最小二乘法、极大似然法等不具备这样的优势。在提出广义矩估计方法之前,动态面板模型的研究者多是希望通过研究不可观测的个体异质性效应和误差项的统计性质等解决内生性及参数估计问题,比如误差项的方差协方差结构,但却致使问题越来越复杂,甚至一度令人怀疑动态面板模型的实际可用性。

  阿雷拉诺和邦德首先在最简单的动态面板模型设定下提出了一阶差分广义矩估计框架,最简单的模型是指面板模型右端仅包含滞后依赖变量、不可观测的个体异质性效应和误差项。所谓一阶差分广义矩估计框架,就是指首先对动态面板模型进行一阶差分转换,变为差分方程;因为差分后的面板模型存在内生性,所以使用广义矩估计框架处理内生性问题。一阶差分广义矩估计框架最突出的一点就是改进了最优工具变量矩阵的确定方法,从而可以使用更多有效的工具变量。具体做法是:(1)对模型进行一阶差分。转换为一个差分方程系统,每一个差分方程对应一个时期。(2)根据模型自身假设条件确定有效工具变量。与AH方法不同,AB估计量单纯依靠模型自身的约束条件就可以确定工具变量。由于模型假设了误差项不存在序列相关,根据该假设条件,可以判断依赖变量滞后两期及以上的值与误差项差分值之间存在正交关系,在确定最优工具变量矩阵时,可以利用这个正交条件确定工具变量。(3)确定最优工具变量矩阵。矩阵由每个个体对应的工具变量矩阵块组成,每个个体都对应一个工具变量分块矩阵,对于每个个体,理论上讲可以对应多个工具变量,该个体有多少个工具变量,其对应的工具变量矩阵块就有多少行,每个工具变量矩阵块行数与差分后误差项行数相同,列数就是差分后误差项对应工具变量的总和。(4)确定广义矩估计准则函数。转置后的工具变量矩阵与差分后的误差项矩阵相乘的期望就是一阶差分广义矩估计方法的总体矩条件。根据总体矩条件确定样本矩条件,根据样本矩条件与最优权重矩阵构建广义矩估计准则函数。(5)确定最优权重矩阵。构建准则函数需要确定最优权重矩阵,最优权重矩阵根据工具变量矩阵与方阵(主对角线元素是2,次对角线元素是1,其余元素是0)构建的二次型矩阵的逆矩阵估计。(6)通过求广义矩估计准则函数最小值获得一步广义矩估计估计量。但是这仅是一步AB估计量,为了估计更加精确,他们还采用迭代方法,求得两步AB估计量。根据一步AB估计量可求得模型残差,根据一步残差与工具变量矩阵再次估计方差协方差矩阵,确定第二步最优权重矩阵,最后对准则函数求最小值可得到两步广义矩估计AB估计量。在残差是独立且同方差的情形下,他们也证明一步和两步参数估计是渐近等价的。实证研究表明,广义矩估计框架下得出的AB估计量的估计方差要显著小于AH估计量的渐近方差。这就是采用AB估计量的广义矩估计框架。

  阿雷拉诺和邦德将该方法推广到模型包含外生解释变量的情形,面板数据模型右端不仅包含滞后依赖变量、不可观测的个体异质性效应和误差项,还包含外生解释变量,同时假设全部外生解释变量都和不可观测异质性效应相关。这种情形下最优工具变量决定于外生解释变量是前定变量还是严格外生变量。如果是前定外生解释变量,意味着在误差项发生之前的前定外生解释变量与误差差分项无关,这些前定外生解释变量就可以作为差分方程的有效工具变量,最优工具变量矩阵不仅包含前述依赖变量滞后值,还包含了与误差项无关的前定外生解释变量。如果是严格外生变量,也就意味着任何时期的解释变量都与误差项无关,全部解释变量都可作为差分方程的工具变量,最优工具变量矩阵不仅包含前述依赖变量滞后值,还增加了全部解释变量作为新的工具变量。

  阿雷拉诺和邦德进一步放宽了全部外生解释变量都和不可观测异质性效应相关的假设条件,只是假设部分外生解释变量和不可观测异质性效应相关,也就是外生解释变量一部分与不可观测异质性效应不相关,一部分与不可观测异质性效应相关。为简便起见,不相关的外生解释变量称为1类解释变量,相关的外生解释变量称为2类解释变量。由于模型假设误差项不存在序列相关,在这种情形下又可以增加新的最优工具变量。最优工具变量取决于1类解释变量,如果1类解释变量是前定变量,根据模型假设可以判断,其中第一期1类解释变量与第二期不可观测个体异质性效应及误差项都不相关,第二期及之后的1类解释变量与同期的个体异质性效应和误差项都不相关,其余约束条件就是多余的,因为差分方程已经使用了这些约束条件,因此1类解释变量可以直接作为水平方程相应时期的矩条件。最优工具变量矩阵仍然是分块对角矩阵,其中第一块对角矩阵和不分为两部分时的前定解释变量的工具变量矩阵块相同;第二块本身也是分块矩阵,其中第一分块是与个体异质性效应不相关的一期和二期1类解释变量,其余分块分别是第三期及之后的与个体异质性效应不相关的1类解释变量。如果1类解释变量又是严格外生的,则所有时期的1类解释变量都是水平方程系统的有效工具变量。

  二、构建系统广义矩估计框架

  阿雷拉诺和博弗(1995)以及邦德和布伦德尔(Bond & Blundell,1998)开发了系统广义矩估计框架(简称SAB框架),进一步改进了AB估计量工具变量的设定方法,提高了AB估计量的估计效率。在AB估计量估计方法中,包括安德森和萧(简称AH)以及霍尔茨- 埃金、纽维和罗森(简称HNR)动态面板模型参数估计问题的研究,都是用了前定变量的滞后值作为差分方程的工具变量,这是因为他们的模型都假设独立变量与不可观测的个体异质性效应是相关的,因此只有基于一阶差分法的估计量才是一致的。阿雷拉诺和博弗(1995)在进一步研究中发现,在AB、AH和HNR工具变量设定基础上,还可以进一步找到与不可观测异质性效应无关的工具变量,因此可以增加与估计参数相关的变量的水平值信息,可提高参数估计效率。另一方面,邦德和布伦德尔(1998)发现了AB估计量还存在弱工具变量问题,提出使用系统广义矩估计方法来改善这一问题。

  阿雷拉诺和博弗(1995)在系统广义矩估计框架下统一了豪斯曼和泰勒(简称HT)、雨宫和麦柯迪(简称AM),布劳舒、米宗和施密特(Breusch, Mizon & Schmidt,1989,简称BMS)等设定有效工具变量的方法和参数估计框架。该框架分别给每一类模型设定了一套总体矩条件,改进了各自模型的均值方程和差分方程的工具变量设定方法。在HT、AM、BMS模型框架下,特定的工具变量矩阵只对某些广义最小二乘法有效,因此转换会引起不一致。但在广义矩估计框架下没必要像HT、AM、BMS模型那样,需要设定合适的广义最小二乘法转换矩阵,也没必要考虑转换方法是否适应工具变量。阿雷拉诺和博弗(1995)以HT模型为基础,给出了广义矩估计框架,该模型仅包含不随时间改变变量和随时间改变变量两类,而且假设这两类变量是严格外生的。但是假设每一类变量中的一部分与不可观测异质性效应无关,为简便起见,我们称不相关的这类变量为1类解释变量,相关的称为2类解释变量。并且考虑了两种方差协方差结构,一种情况是截面同方差的,这种情况可以允许误差项存在任意形式的自相关和时间序列异方差;另一种情况是传统的误差成分设定。

  在HT基础上,阿雷拉诺和博弗(1995)提出的系统广义矩估计框架的基本思想是,在继续保持对差分方程使用水平工具变量的同时,增加对水平方程使用独立变量的滞后差分作为工具变量,也就是在原AB估计量一阶差分方程工具变量的确定方法不变的前提下,增加了差分后独立变量的滞后项作为水平方程的工具变量。其具体方法是首先使用转换法,利用非奇异转换矩阵对原方程系统进行转换,通过转换,实现了组内方程和组间方程变化的分解,组内方程是经过差分后的方程系统,组间方程是均值方程。转换使执行模型本身隐含的正交条件更容易。对于组内方程组,由于差分去除了个体异质性效应,因此所有外生变量都是组内方程的有效工具变量,HT、AM和BMS模型的组内方程组确定的有效工具变量是一样的,其不同之处在于组间方程工具变量的确定方法。HT模型组间方程确定的工具变量是不随时间改变的1类解释变量和随时间改变的1类解释变量的均值。AM模型组间方程确定的工具变量是不随时间改变的1类解释变量以及随时间改变的全部1类解释变量,由于BMS模型假设不随时间改变的变量中的2类解释变量与不可观测异质性效应的相关系数是常数,因此组间方程确定的工具变量是1类解释变量(包含不随时间改变和随时间改变变量)以及2类解释变量的离差。

  由于系统广义矩估计框架是在经过正交离差转换后执行了广义矩估计方法,但是正交离差转换矩阵的形式是多种多样的,阿雷拉诺和博弗(1995)进一步证明了转换矩阵的选择并不影响系统广义矩估计最优估计量的结果,通过对自回归模型其他可替代估计量的模拟,证明了水平方程使用差分工具变量可以提高估计精确度。他们基于广义矩估计框架,比较了选择不同的工具变量对于各自参数估计量的效率。比较的依据是模型参数的广义矩估计量渐近方差矩阵的逆与总体参数的费希尔信息边界(Fisher information bound),费希尔信息边界是克拉默- 拉奥(Cramer- Rao)下界的逆(如果表示为矩阵的话),克拉默- 拉奥下界表示一个确定性参数无偏估计的方差下界,这个界限也称为克拉默- 拉奥不等式或者信息不等式。任何无偏估计量的方差至少大于等于克拉默- 拉奥下界,达到克拉默- 拉奥下界的无偏估计量称为最有效估计量。根据张伯伦(1992)的定理,他们证明,由于HT、AM和BMS等为组间方程选用的工具变量是组内方程工具变量的线性组合,因此系统广义矩估计框架得出的估计量渐近方差矩阵的逆可以达到克拉默- 拉奥下界,因此是有效的估计量。

  阿雷拉诺和博弗(1995)还将上述工具变量的确定方法推广到包含水平信息和前定变量的一般模型,也就是包含依赖变量滞后值、时间不变独立变量、其他严格外生独立变量、前定或者内生独立变量的情形,还进一步将独立变量(不包含滞后依赖变量)区分为与不可观测个体异质性效应相关与不相关两类(为简便起见,不相关的称为1类解释变量,相关的称为2类解释变量)。第一步确定工具变量,模型假设了1类解释变量与不可观测异质性效应以及误差项都不相关,又因为存在前定变量,因此每一个水平方程都有不同的工具变量,故在构建广义矩估计框架时不需要考虑均值方程。第二步确定最优工具变量矩阵,最优工具变量矩阵仍然分为两块,为了直接保留水平方程,转换矩阵的差分算子这一块保持不变,将均值算子块替换成单位矩阵。最优工具变量矩阵仍然是分块对角矩阵:第一块是经过差分转换方程系统的最优工具变量矩阵块。因为模型假定时间不变独立变量、其他的严格外生变量、前定变量都与误差项不相关,因此差分方程系统的每一个体在每一个时期的工具变量由对应时期的时间不变独立变量、其他严格外生变量、前定变量构成。第二块是经过单位矩阵转换后保留水平方程系统。对于水平方程系统,每个个体的工具变量矩阵块的每一行都对应相应时期的工具变量集合,本来水平方程系统的工具变量应该由1类且与误差项无关的独立变量(不包含滞后依赖变量)组成,但是由于其中部分工具变量与差分方程系统重复,以至于部分工具变量是冗余的,因此除了第一期对应的工具变量是时间不变独立变量、全部其他严格外生变量、第一期前定变量外,其余各期(也就是从第二期到最后一期)分别对应各期的前定变量,冗余工具变量全部剔除出最优工具变量矩阵。

  利用系统广义矩估计框架估计动态面板模型有两大优势:第一,阿雷拉诺和博弗(1995)提出的系统广义矩估计框架增加了水平方程使用的差分工具变量,使用了水平变量的信息,提高了参数估计效率。第二,系统广义矩估计框架也厘清了估计量和模型转换之间的关系,针对该框架的模型转换方法是稳健的,转换矩阵形式并不影响最优估计量。第三,转换后的模型可以更加清晰地发现正交条件,增加更多有效工具变量,也提高了工具变量选择的效率。第四,经过转换矩阵转换后,保留了全部水平误差,不需要之前的均值方程,不同的水平方程有不同的有效工具变量,减少了冗余的工具变量。经过蒙特卡洛模拟证明,在自回归参数较大,时期较短时,系统广义矩估计量的统计性质要显著优于阿雷拉诺和邦德(1991)开发的AB估计量。第五,使用系统广义矩估计框架统一了HT、AM和BMS参数估计框架,而且估计精确度也得到提高。

  三、广义矩估计框架下模型设定检验

  有效性和一致性是评价计量经济模型参数估计量的两条重要标准,阿雷拉诺和邦德(1991)使用了差分广义矩估计方法估计动态面板模型参数估计量,参数估计量决定于样本矩条件,样本矩条件决定于工具变量的选择,而误差项是否存在序列相关、个体异质性效应是否与独立变量相关直接影响工具变量的选择。再有广义矩估计方法基于总体矩条件成立的假设,样本矩条件根据总体矩条件构建,样本矩条件直接决定了参数估计量的统计性质。他们就这些重要的模型设定问题提出了针对性的检验方法,根据严格的计量经济学理论给出了检验统计量的理论分布,最后从实证角度进行了验证。

  1.提出了一致性检验方法。阿雷拉诺和邦德(1991)对动态面板数据模型广义矩估计的估计量一致性提出了检验方法。满足一致性是评价一个估计量优良与否的重要标准,广义矩估计的估计量一致性主要取决于矩条件设定是否正确。尽管模型假设了差分项本身是序列无关的,但是经过一阶差分后的方程的误差项却可能是序列相关的,这也就意味着广义矩估计的正交条件不再成立,滞后两期或者更多期的依赖变量水平值就不能作为差分方程的有效工具变量。差分后误差项是否存在二阶序列相关直接影响到工具变量的设定,工具变量选择直接影响样本矩条件的计算以及方差协方差矩阵的估计,因此为了保证广义矩估计的一致性,需要对差分后的误差项是否存在二阶序列相关进行检验。他们提出的序列相关检验方法也被称为m2检验。检验的原假设是样本中所有时期的二阶自协方差为零。检验统计量构建方法的具体步骤是:首先,选取一阶差分方程的滞后两阶的残差,然后向后截取模型差分项,使其维数与滞后两阶的残差向量维数相匹配,最后计算二者样本协方差作为检验的样本统计量。根据多元中心极限定理证明了检验估计量服从正态分布,且在正态分布下给出了检验准则。对于非平衡面板数据,可使用不同的样本数去估计每一个协方差,由于各个单元观测的样本数不同,检验的原假设为样本中全部时期所有二阶协方差都是零,或者更简单的是检验平均协方差是否为零。他们提出的序列相关检验简单、灵活,可以适用于任何一致的广义矩估计的估计量,而且不要求估计量有效,同时该检验方法也适用于最小二乘法和广义最小二乘法。

  2.提出了过度识别检验。过多使用工具变量也会产生过度拟合问题,会造成无效的渐近结果以及错误的设定检验,这就是所谓的过度识别问题。阿雷拉诺和邦德基于广义矩估计方法估计面板数据模型参数,该方法的主要假设是总体矩条件成立,也就是指工具变量全部是外生有效的,该检验是对矩条件联合有效性的检验。如果工具变量恰好与内生变量个数相同,就是恰好识别,也就无须检验。但是,在工具变量超过内生变量的情况下,就需要根据样本检验工具变量是否全部是外生有效的。检验的基本思想是:如果是过度识别的,那么检验矩条件联合有效性的统计量就会落在广义矩估计框架之外。如果是联合有效的,根据样本矩计算的统计量就会很小,几乎在零附近波动。鉴于此,他们提出了针对面板模型工具变量过度识别的检验方法,检验的原假设是总体矩条件成立,检验统计量是由样本矩与零的距离经过其方差协方差矩阵加权后得到。在原假设成立的条件下,他们推导出检验统计量服从卡方分布,其自由度为工具变量矩阵列数减去独立变量矩阵列数,由此完成了过度识别检验的基本理论构建。

  3.改进了相关不可观测异质性的统计检验方法。相关效应偏误是指个体异质性效应与独立变量相关。阿雷拉诺(1993)完成了静态面板模型、动态面板模型在各种情形下的不可观测异质性效应的检验。豪斯曼(1978)提出相关效应检验办法,检验估计量是沃尔德(Wald)统计量,该统计量基于组内估计量和广义最小二乘估计量的差异构建,如果差分项存在序列自相关或者异方差,则检验统计量的方差是不可比较的,统计量的效率也无法根据样本方差大小来比较,由此得出的统计推断就是无效的。阿雷拉诺针对豪斯曼检验的不足,提出了对于任意自相关和异方差形式都很稳健的检验方法,其改进方法是,检验估计量采用了怀特(1984)提出的异方差稳健方差协方差矩阵,稳健方差协方差矩阵估计量对于最小二乘法也是一致的。由于使用了对于自相关和异方差都稳健的方差协方差矩阵,可以比较组内估计量和广义最小二乘估计量的差异的方差。在个体异质性效应与独立变量无关的假设下,阿雷拉诺使用组内估计量和广义最小二乘估计量的差异构建了沃尔德检验统计量,并证明该统计量服从卡方分布,从而改进了豪斯曼提出的相关效应偏误的统计检验。阿雷拉诺检验方法的第一个优点是通过使用前向正交离差法,消除了差分变换后潜在的自相关问题。第二个优点是将对于个体异质性效应偏误的检验简化成了模型是否包含相关变量(个体异质性效应)的模型误设检验.阿雷拉诺检验方法还可以直接应用于独立变量与个体效应局部相关以及动态面板的情形。

  四、发现并解决弱工具变量

  有效性和一致性是衡量样本估计量好坏的标准,当模型出现弱工具变量问题时,工具变量与内生变量相关性就会很弱,模型参数的估计结果从计量经济学和统计学角度来看就没有意义了,计量经济学家在估计动态面板时一般假设模型自回归系数绝对值小于1,但是阿雷拉诺和阿朗索- 博雷戈(1996)进一步研究发现,动态面板自回归系数逼近于1时,动态面板模型存在弱工具变量问题,因此导致估计量效率降低。他们从计量经济理论角度分析了弱工具变量(weak instruments)问题存在的原因,把解决弱工具变量问题的方法简化成约束初始条件与系统广义矩估计相结合的办法,有效地解决了动态面板模型的弱工具变量问题。

  1.发现并解析了弱工具变量问题。阿雷拉诺和阿朗索- 博雷戈(1996)发现了广义矩估计方法中一阶差分工具变量存在弱工具变量的问题。在动态面板数据模型参数估计问题的研究中发现,如果动态面板自回归系数逼近于1或者个体异质性效应的相对方差增加时,滞后的水平序列给差分方程提供的工具变量是弱工具变量,差分广义矩估计方法偏误会明显增大,精确度也会明显降低,标准的一阶差分广义矩估计的估计量的工具变量功效将很弱。他们使用集中参数的方法描述了弱工具变量问题产生的原因,因为线性回归模型的F统计量度量了整体模型的拟合程度,第一阶段工具变量回归的F统计量收敛于一个自由度的非中心卡方分布,集中参数就是对应的非中心参数。他们基于简单动态面板模型,分析了集中参数的统计特征,证明集中参数与个体异质性效应方差成反比,集中参数与动态面板模型的自回归系数渐近标准误之间呈简单的线性关系。因此,当集中参数逼近于零时,或者自回归系数逼近于1时,系数估计的精确度也变得很差。

  阿雷拉诺和阿朗索- 博雷戈(1996)进一步以短面板(比如限制为三期)为例说明了弱工具变量问题,此时矩条件就简化成了简单的正交条件,动态面板的自回归系数是恰好识别的,自回归系数的广义矩估计量就相当于简约式方程使用普通工具变量得出的估计量。根据最小二乘法估计结果,当动态面板自回归系数逼近于1或者个体异质性效应的相对方差增加时,可推导出差分方程的自回归系数以概率极限逼近于零,这就意味着独立变量和滞后独立变量的差分相关性很弱,估计精度下降,误差会很大,工具变量也就失去了其本身的意义,动态面板自回归系数估计量的统计性质将不再优良。

  2.解决弱工具变量问题的方法。该方法是由邦德和布伦德尔(1998)提出的。第一种解决方法是使用系统广义矩估计方法。首先给初始条件过程增加适当的限制条件,也就是令初始期的依赖变量差分与差分项不相关,增加这个限制,初始值差分项就可以作为水平方程工具变量,使得在原工具变量集合即阿雷拉诺和博弗(1995)提出的系统广义矩估计工具变量矩阵的基础上增加了更多的工具变量信息。然后对转换后的面板方程系统使用系统广义矩估计方法,在原AB估计量的基础上更加充分地利用了所有有效的工具变量,该方法主要的改进是,使用独立变量滞后差分值作为水平方程的工具变量,为了解决弱工具变量问题,又在此基础上增加了对初始条件的约束,新增了与初始值相关的矩条件,工具变量信息变得更加丰富,提高了动态面板模型系数估计的效率。增加初始条件约束有两个重要意义:第一,原有矩条件是有效的。原有矩条件是阿雷拉诺和博弗(1995)提出的,使用滞后依赖变量的差分作为水平方程工具变量矩阵所导出的矩条件。第二,安和施密特(1995)提出的非线性约束条件是多余的。增加初始条件约束的系统广义矩估计的估计量包含了基于非线性矩条件的广义矩估计的估计量。第二种解决方法是使用误差成分广义最小二乘法(简称GLS)。其主要思想是将方程转换为可以使用GLS估计的形式,然后采用适当变换得到GLS一致估计量。具体做法是:首先通过下三角矩阵(主对角线元素是1,次对角元素是- 1,其余是零)左乘原动态面板方程,然后使得面板方程右端仅包含依赖变量初始值、不可观测异质性效应及误差项,然后左乘逆方差协方差矩阵,可以发现初始值与个体异质性效应相关是造成GLS估计量不一致的主要原因。其次,约束初始条件,将不可观测个体异质性的条件均值假设为依赖变量初始值与一个随机变量的和,依赖变量初始值要与随机变量线性无关。然后将依赖变量的初始值加入每一个水平方程中,这个随机变量就是新方程的不可观测异质性效应,经过对原模型的扩展,消除了依赖变量初始值与不可观测个体异质性效应的相关性问题,且保留了个体的同方差性质。在误差成分是同方差的情形下,阿雷拉诺和博弗(1995)推导出,使用方差协方差矩阵的逆矩阵变换作为权重矩阵,对于新的扩展方程施以广义最小二乘变换,误差成分广义最小二乘法得到了原动态面板模型参数的有效且一致的参数估计量。

  五、构建模型转换方法

  面板模型去除不可观测异质性效应的一般方法是一阶差分法,一阶差分与广义矩估计结合估计面板模型参数的方法简称为差分广义矩估计方法(包括一步差分广义矩估计法和两步广义矩估计法,简称为FD- GMM),阿雷拉诺和博弗(1995)进一步开发出了赫尔默特(Helmert)转换广义矩估计方法(也称为前向正交转换广义矩估计方法,简称为FOD- GMM),尽管FD- GMM和FOD- GMM在数值上等价,但在工具变量矩阵复杂时,FD- GMM具有显著的计算优势。两种转换并不总是产生一样的估计量,蒙特卡洛实证表明,FOD估计量比FD估计量的有限样本性质更好。

  1.提出赫尔默特转换法。阿雷拉诺和邦德提出了面板方程系统的赫尔默特转换(简称H转换)方法,它可以替代传统的一阶差分变换法,适用于包含前定变量的情形。面板数据模型包含不可观测的异质性效应,因此在估计模型参数时要去除不可观测的异质性效应。传统的去除方法是采用一阶差分法,但是一阶差分法无法消除差分后的误差项存在的序列相关。H转换主要使用了赫尔默特矩阵(Helmert matrix),它是正交离差转换矩阵(orthogonal deviations transformation)(Arellano, 2003)的一种形式,转换矩阵要具有两个性质:第一,转换矩阵的转置与其自身矩阵的乘积是组内算子矩阵或者对时间均值偏离的矩阵,这种算法将时间序列转换为对时间平均的序列偏差,也就是所谓的一阶差分性质,因此,H转换对时间平均序列的偏差可以去除不可观测的异质性;第二,矩阵自身与其转置矩阵的乘积是一个单位矩阵,也就是所谓的正交性,因为具有正交性质,所以即使原模型的误差项是同方差且是无自相关的,H转换也不会改变这一性质。

  赫尔默特转换另外还有几个优势:第一,H转换矩阵进一步可做上三角乔里斯基(Cholesky)分解,因此H转换亦可以像广义最小二乘法一样,去除因为差分所产生的序列相关。第二,简化了矩阵运算。广义矩估计要使用工具变量矩阵,如果工具变量矩阵的列很多,则直接计算广义矩估计的估计量是困难的,赫尔默特转换使经过转换矩阵转换后的方差协方差矩阵成为对角矩阵,在实践中可有效简化矩阵运算。第三,H转换为设定工具变量提供了统一框架,为统一HT、AM、BMS等模型创造了必要条件,获得了方差协方差矩阵不受限制的HT、AM、BMS估计量。

  2.提出将原方程系统转换为组内和组间相互独立的方程系统的方法。阿雷拉诺和博弗(1995)利用非奇异转换矩阵将原方程系统转换为组内估计方程系统和组间估计方程系统两个独立方程系统,一个是消除了不可观测个体异质性效应的组内方程组,另一个是包含个体效应的均值方程。这样的转换有三个优势:第一,更容易识别模型隐含的正交条件,可以提高识别有效工具变量的效率。由于差分方程系统(也就是组内方程)去除了不可观测异质性个体效应,差分系统(组内方程)中的所有外生变量(包含这些变量的非线性函数)都是有效工具变量,同理,转换使均值方程继续保留了不可观测的个体异质性效应,很容易观察到,与不可观测的个体异质性效应不相关的独立变量可作为有效的工具变量。第二,消除了转换方式的敏感性。将工具变量矩阵构建为分块对角矩阵,分块数和观测时期数一致,证明了最优估计量不会随着转换方式的变化而变化。第三,避免了GLS转换的问题。使用广义最小二乘估计设置面板模型工具变量仅仅对于特定的方程子集有效,也就是对于某些GLS转换有效的工具变量,对其他形式的转换是无效的,阿雷拉诺和博弗(1995)提出的独立方程系统的工具变量矩阵容纳了全部有效的个体矩条件,从而避免了这一问题。

  六、总结

  目前为止,面板数据模型仍然是经济学实证研究中最主要的模型。阿雷拉诺和邦德为面板数据模型的发展做出了开创性、基础性和工具性的贡献。他们将广义矩估计框架引入面板数据模型,对于静态和动态面板数据模型的设定,参数估计理论与方法,不可观测异质性偏误的统计推断与检验,动态误差成分协方差结构分析,内生性问题以及异方差、自相关与内生性相互交织等问题都从理论上进行了深入研究,并给出了解决方案。他们还引入了正交离差以及赫尔默特转换方法,解决了弱工具变量问题。他们在方法创新和深层次理论研究上为计量经济学及面板数据模型进一步蓬勃发展做出了突出贡献。

  第一,提出并改进了面板数据模型的设定检验方法。首先,阿雷拉诺和邦德构建了相关效应检验,也就是针对独立变量和个体异质性效应是否相关的检验提出了较简洁的检验办法,在构建检验统计量时,使用了正交离差转换法,该转换使检验方法简化为沃尔德检验,解决了面板数据模型设定中存在的一个重要问题。其次,构建了自相关检验。面板模型一般采用差分方法去除不可观测异质性效应,差分后的差分项可能存在自相关,正交条件就不再成立,差分方程的工具变量便不再有效,因此影响了广义矩估计参数估计量的一致性。阿雷拉诺和邦德提出的对一阶差分方程差分项的二阶序列相关进行检验为广义矩估计设定工具变量提供了新方法。

  第二,为解决面板数据模型的内生性问题提供新视角。面板数据模型是处理不可观测异质性的强有力的工具,但是模型引入异质性又会带来内生性问题。阿雷拉诺和邦德在广义矩估计框架下使用工具变量处理内生性问题,在确定工具变量时,使用正交离差转换法以及赫尔默特转换后的面板模型,而不是直接使用原面板模型确定工具变量,从而使工具变量信息得到更充分的利用,转换法的使用也减少了计算量,参数估计的效率也得到了提高。由于参数估计方法建立在一个更合理、更简洁而且严密的广义矩估计理论基础之上,因而由此得到的AB估计量成为计量经济学史上著名的估计量。

  第三,提出了面板数据模型的系统广义矩估计参数估计方法。差分广义矩估计方法通过差分有效去除不随时间改变的不可观测个体异质性效应,该方法选择滞后两期以上的独立变量水平值作为每一期差分方程的工具变量,但没有充分使用全部工具变量。系统广义矩估计将差分方程和水平方程联立估计,进一步改善了差分广义矩估计工具变量的设定方法,保持此方法不变,另外给水平方程也提供了工具变量,也就是使用滞后一期以上的独立变量差分值作为每一期的水平方程工具变量,不仅丰富了工具变量提供的信息,也提高了差分广义矩估计的估计量精度,估计效率进一步提高。

  第四,将广义矩估计框架进一步推广。阿雷拉诺和邦德进一步将面板模型的相关效应检验推广到对立假设各种设定的情形,包括张伯伦对立假设、局部相关对立假设;检验也被推广到有水平信息的模型以及动态模型,同时针对异方差和序列相关提出了相应的检验方法。他们进一步将广义矩估计工具变量的设定方法推广到更一般的模型,包含滞后依赖变量和其他前定变量的模型、包含外生变量的模型、包含前定变量模型、同时含有前定变量和水平信息模型的动态面板模型等。他们通过改善工具变量设定方法,统一将之前的HT、BS、AM以及BMS参数估计方法纳入广义矩估计框架下。该方法改善了方差协方差矩阵设定方法,通过使用一致的方差协方差矩阵,使最优估计量不受模型转换方法变换的影响。

  第五,解决了面板数据模型的弱工具变量问题。阿雷拉诺和邦德首先发现了弱工具变量问题,也就是当自回归参数较大、时间序列观测数较少时,一阶差分广义矩估计方法得出的估计量偏误较大,精确度较低。他们进一步从统计理论上阐述了产生弱工具变量问题的原因,同时提出通过对初始条件过程做进一步限制,可以改善差分广义矩估计估计量的估计效率。在增加初始条件约束的前提下提出了两类估计量:第一类方法是系统广义矩估计估计量,也就是在一阶差分广义矩估计工具变量设定的基础上使用独立变量滞后差分值作为水平方程工具变量,增加可使用的有效工具变量信息,解决一阶差分广义矩估计偏误较大的问题,同时该方法还能涵盖非线性矩条件。第二类方法是误差成分广义最小二乘法,该方法通过左乘加权矩阵发现,弱工具变量问题决定于初始条件与个体异质性效应的相关性,根据初始条件与个体异质性效应的相关的统计形式,对所有加权处理后的方程施以线性变换,加入第一期依赖变量,消除了初始条件的相关性,同时保留了同方差性质,最终使用广义最小二乘法估计出有效且一致的估计量,解决了弱工具变量的问题。

  阿雷拉诺和邦德基于有严格统计理论基础的广义矩估计方法原理,搭建起动态面板模型设定、参数估计、推断与检验的整个框架,对一般形式的动态面板数据模型遭遇的各类参数估计问题进行了详尽的描述,并进行严格的计量经济学处理,包括很关键的内生性问题、误差项以及经过正交离差转换后的误差项的异方差以及序列相关问题。他们针对具体情形提出了相应的工具变量矩阵设定方法以及计量经济学检验方法。他们还将广义矩估计框架下提出的估计量与之前文献提出的各种估计量做了对比,比如对广义最小二乘法、极大似然估计法、有限信息极大似然估计法所给出的估计量做了理论上和实证上的对比,充分证明了在广义矩估计框架下得出的估计量在统计性质方面有显著的改善。阿雷拉诺和邦德是动态面板模型理论及参数估计的集大成者,为面板数据模型设定、检验及参数估计与工具变量选择做出了开创性的贡献,同时为今后因果推断方法的开发奠定了基础。

  (注和参考文献略)

孟勇,山西财经大学资源转型发展研究院,邮政编码:030006,电子邮箱:m7025y@ 163.com;

郭鹏巍,山西财经大学财政与公共经济学院,邮政编码:030006,电子邮箱:uccf_ 2323@ 163.com。

原载《经济学动态》2023年第4期,全文可见经济学动态网站“最新目录”栏目,或点击微信“阅读原文”。