变量对象(Variable object)

变量对象(Variable object)

说明

此文译自Dmitry A.Soshnikov 的文章Variable object
另,此文还有另外一位同事(宋珍珍)共同参译

概要

我们总是会在程序中定义一些函数和变量,之后会使用这些函数和变量来构建我们的系统。

然而,对于解释器来说,它又是如何以及从哪里找到这些数据的(函数,变量)?当引用一个对象的时候,在解释器内部又发生了什么?

许多ECMA脚本程序员都知道,变量和执行上下文是密切相关的:

var a = 10; // 全局上下文中的变量  
   
(function () {  
  var b = 20; // 函数上下文中的局部变量  
})();  
   
alert(a); // 10  
alert(b); // "b" is not defined  

不仅如此,许多程序员也都知道,ECMAScript标准中指出独立的作用域只有通过“函数代码”(可执行代码类型中的一种)才能创建出来。比方说,与C/C++不同的是,在ECMAScript中for循环的代码块是无法创建本地上下文的:

for (var k in {a: 1, b: 2}) {  
  alert(k);  
}  
   
alert(k); // 尽管循环已经结束,但是变量“k”仍然在作用域中  

下面就来详细介绍下,当声明变量和函数的时候,究竟发生了什么。

数据声明

既然变量和执行上下文有关,那它就该知道数据存储在哪里以及如何获取。这种机制就称作变量对象:
A variable object (in abbreviated form — VO) is a special object related with an execution context and which stores:

declared in the context.
举个例子,可以用ECMAScript的对象来表示变量对象:

VO = {};

VO同时也是一个执行上下文的属性:

activeExecutionContext = {  
  VO: {  
    // 上下文中的数据 (变量声明(var), 函数声明(FD), 函数形参(function arguments))  
  }  
};  

对变量的间接引用(通过VO的属性名)只允许发生在全局上下文中的变量对象上(全局对象本身就是变量对象,这部分会在后续作相应的介绍)。 对于其他的上下文而言,是无法直接引用VO的,因为VO是实现层的。

声明新的变量和函数的过程其实就是在VO中创建新的和变量以及函数名对应的属性和属性值的过程。
如下所示:

var a = 10;  
   
function test(x) {  
  var b = 20;  
};  
   
test(30);  

上述代码对应的变量对象则如下所示:

// 全局上下文中的变量对象  
VO(globalContext) = {  
  a: 10,  
  test: <reference to function>
};  
   
// “test”函数上下文中的变量对象  
VO(test functionContext) = {  
  x: 30,  
  b: 20  
};  

但是,在实现层(标准中定义的),变量对象只是一个抽象的概念。在实际执行上下文中,VO可能完全不叫VO,并且初始的结构也可能完全不同。

不同执行上下文中的变量对象

变量对象上的一些操作(比如:变量的初始化)和行为对于所有的执行上下文类型来说都已一样的。从这一点来说,将变量对象表示成抽象的概念更加合适。 函数上下文还能定义额外的与变量对象相关的信息。

AbstractVO (generic behavior of the variable instantiation process)  
   
    
  ╠══> GlobalContextVO  
          (VO === this === global)  
    
  ╚══> FunctionContextVO  
           (VO === AO,  <arguments> object and <formal parameters> are added))  

接下来对这块内容进行详细介绍。

全局上下文中的变量对象

首先,有必要对全局对象(Global object)作个定义。

全局对象是一个在进入任何执行上下文前就创建出来的对象;此对象以单例形式存在;它的属性在程序任何地方都可以直接访问,其生命周期随着程序的结束而终止。

全局对象在创建的时候,诸如Math,String,Date,parseInt等等属性也会被初始化,同时,其中一些对象会指向全局对象本身——比如,DOM中,全局对象上的window属性就指向了全局对象(但是,并非所有的实现都是如此):

global = {  
  Math: <...>,  
  String: <...>  
  ...  
  ...  
  window: global  
};  

在引用全局对象的属性时,前缀通常可以省略,因为全局对象是不能通过名字直接访问的。然而,通过全局对象上的this值,以及通过如DOM中的window对象这样递归引用的方式都可以访问到全局对象

String(10); // 等同于 global.String(10);  
   
// 带前缀  
window.a = 10; // === global.window.a = 10 === global.a = 10;  
this.b = 20; // global.b = 20;  

回到全局上下文的变量对象上——这里变量对象就是全局对象本身

VO(globalContext) === global;

准确地理解这个事实是非常必要的:正是由于这个原因,当在全局上下文中声明一个变量时,可以通过全局对象上的属性来间地引用该变量(比方说,当变量名提前未知的情况下)

var a = new String('test');  
   
alert(a); // directly, is found in VO(globalContext): "test"  
   
alert(window['a']); // indirectly via global === VO(globalContext): "test"  
alert(a === this.a); // true  
   
var aKey = 'a';  
alert(window[aKey]); // indirectly, with dynamic property name: "test"  

函数上下文中的变量对象

在函数的执行上下文中,VO是不能直接访问的。它主要扮演被称作活跃对象(activation object)(简称:AO)的角色。

VO(functionContext) === AO;

活跃对象会在进入函数上下文的时候创建出来,初始化的时候会创建一个arguments属性,其值就是Arguments对象:

AO = {  
  arguments: <ArgO>
};  

Arguments对象是活跃对象上的属性,它包含了如下属性:

arguments对象的properties-indexes的值和当前(实际传递的)形参是共享的。
如下所示:

function foo(x, y, z) {  
   
  // 定义的函数参数(x,y,z)的个数  
  alert(foo.length); // 3  
   
  // 实际传递的参数个数  
  alert(arguments.length); // 2  
   
  // 引用函数自身  
  alert(arguments.callee === foo); // true  
   
  // 参数互相共享  
  alert(x === arguments[0]); // true  
  alert(x); // 10  
   
  arguments[0] = 20;  
  alert(x); // 20  
   
  x = 30;  
  alert(arguments[0]); // 30  
   
  // 然而,对于没有传递的参数z,  
  // 相关的arguments对象的index-property是不共享的  
  z = 40;  
  alert(arguments[2]); // undefined  
   
  arguments[2] = 50;  
  alert(z); // 40  
   
}  
   
foo(10, 20);  

上述例子,在当前的Google Chrome浏览器中有个bug——参数z和arguments[2]也是互相共享的。

处理上下文代码的几个阶段

至此,也就到了本文最核心的部分了。处理执行上下文代码分为两个阶段:

  1. 进入执行上下文
  2. 执行代码

对变量对象的修改和这两个阶段密切相关。
要注意的是,这两个处理阶段是通用的行为,与上下文类型无关(不管是全局上下文还是函数上下文都是一致的)。

进入执行上下文

一旦进入执行上下文(在执行代码之前),VO就会被一些属性填充(在此前已经描述过了):

看下面这个例子:

function test(a, b) {  
  var c = 10;  
  function d() {}  
  var e = function _e() {};  
  (function x() {});  
}  
   
test(10); // call  

当以10为参数进入“test”函数上下文的时候,对应的AO如下所示:

AO(test) = {  
  a: 10,  
  b: undefined,  
  c: undefined,  
  d: reference to FunctionDeclaration "d"
  e: undefined  
};  

注意了,上面的AO并不包含函数“x”。这是因为这里的“x”并不是函数声明而是函数表达式(FunctionExpression,简称FE),函数表达式不会对VO造成影响。尽管函数“_e”也是函数表达式,然而,正如我们所看到的,由于它被赋值给了变量“e”,因此它可以通过“e”来访问到。关于函数声明和函数表达式的区别会在第五章——函数作具体介绍。

至此,处理上下文代码的第一阶段介绍完了,接下来介绍第二阶段——执行代码阶段。

执行代码

此时,AO/VO的属性已经填充好了。(尽管,大部分属性都还没有赋予真正的值,都只是初始化时候的undefined值)。

继续以上一例子为例,到了执行代码阶段,AO/VO就会修改成为如下形式:

AO['c'] = 10;  
AO['e'] = <指向函数表达式"_e">;  

再次注意到,这里函数表达式“_e”仍在内存中,这是因为它被保存在声明的变量“e”中,而同样是函数表达式的“x”却不在AO/VO中: 如果尝试在定义前或者定义后调用“x”函数,这时会发生“x为定义”的错误。未保存的函数表达式只有在定义或者递归时才能调用。
如下是更加典型的例子:

alert(x); // function  
   
var x = 10;  
alert(x); // 10  
   
x = 20;  
   
function x() {};  
   
alert(x); // 20  

上述例子中,为何“x”打印出来是函数呢?为何在声明前就可以访问到?又为何不是10或者20呢?原因在于,根据规则——在进入上下文的时候,VO会被填充函数声明; 同一阶段,还有变量声明“x”,但是,正如此前提到的,变量声明是在函数声明和函数形参之后,并且,变量声明不会对已经存在的同样名字的函数声明和函数形参发生冲突, 因此,在进入上下文的阶段,VO填充为如下形式:

VO = {};  
   
VO['x'] = <reference to FunctionDeclaration "x"> 


// 发现var x = 10;  
// 如果函数“x”还未定义  
// 则 "x" 为undefined, 但是,在我们的例子中  
// 变量声明并不会影响同名的函数值  
VO['x'] = <the value is not disturbed, still function>

随后,在执行代码阶段,VO被修改为如下所示:

VO['x'] = 10;  
VO['x'] = 20;  
正如在第二个和第三个alert显示的那样。  
如下例子再次看到在进入上下文阶段,变量存储在VO中(因此,尽管else的代码块永远都不会执行到,而“b”却仍然在VO中):  
if (true) {  
  var a = 1;  
} else {  
  var b = 2;  
}  
   
alert(a); // 1  
alert(b); // undefined, but not "b is not defined"  

关于变量

大多数讲JavaScript的文章甚至是JavaScript的书通常都会这么说:“声明全局变量的方式有两种,一种是使用var关键字(在全局上下文中),另外一种是不用var关键字(在任何位置)”。 而这样的描述是错误的。要记住的是:
使用var关键字是声明变量的唯一方式
如下赋值语句:

a = 10;

仅仅是在全局对象上创建了新的属性(而不是变量)。“不是变量”并不意味着它无法改变,它是ECMAScript中变量的概念(它之后可以变为全局对象的属性,因为VO(globalContext) === global,还记得吧?)
不同点如下所示:

alert(a); // undefined  
alert(b); // "b" is not defined  
   
b = 10;  
var a = 20;  

接下来还是要谈到VO和在不同阶段对VO的修改(进入上下文阶段和执行代码阶段):
进入上下文:

VO = {  
  a: undefined  
};  

我们看到,这个阶段并没有任何“b”,因为它不是变量,“b”在执行代码阶段才出现。(但是,在我们这个例子中也不会出现,因为在“b”出现前就发生了错误)
将上述代码稍作改动:

alert(a); // undefined, we know why  
   
b = 10;  
alert(b); // 10, created at code execution  
   
var a = 20;  
alert(a); // 20, modified at code execution  

这里关于变量还有非常重要的一点:与简单属性不同的是,变量是不能删除的{DontDelete},这意味着要想通过delete操作符来删除一个变量是不可能的。

a = 10;  
alert(window.a); // 10  
   
alert(delete a); // true  
   
alert(window.a); // undefined  
   
var b = 20;  
alert(window.b); // 20  
   
alert(delete b); // false  
   
alert(window.b); // still 20  

但是,这里有个例外,就是“eval”执行上下文中,是可以删除变量的:

eval('var a = 10;');  
alert(window.a); // 10  
   
alert(delete a); // true  
   
alert(window.a); // undefined  

利用某些debug工具,在终端测试过这些例子的童鞋要注意了:其中Firebug也是使用了eval来执行终端的代码。因此,这个时候var也是可以删除的。

实现层的特性:__parent__属性

正如此前介绍的,标准情况下,是无法直接访问活跃对象的。然而,在某些实现中,比如知名的SpiderMonkey和Rhino,函数有个特殊的属性__parent__, 该属性是对该函数创建所在的活跃对象的引用(或者全局变量对象)。
如下所示(SpiderMonkey,Rhino):

var global = this;  
var a = 10;  
   
function foo() {}  
   
alert(foo.__parent__); // global  
   
var VO = foo.__parent__;  
   
alert(VO.a); // 10  
alert(VO === global); // true  

上述例子中,可以看到函数foo是在全局上下文中创建的,相应的,它的__parent__属性设置为全局上下文的变量对象,比如说:全局对象。
然而,在SpiderMonkey中以相同的方式获取活跃对象是不可能的:不同的版本表现都不同,内部函数的__parent__属性会返回null或者全局对象。
在Rhino中,以相同的方式获取活跃对象是允许的:
如下所示(Rhino):

var global = this;  
var x = 10;  
   
(function foo() {  
   
  var y = 20;  
   
  // the activation object of the "foo" context  
  var AO = (function () {}).__parent__;  
   
  print(AO.y); // 20  
   
  // __parent__ of the current activation  
  // object is already the global object,  
  // i.e. the special chain of variable objects is formed,  
  // so-called, a scope chain  
  print(AO.__parent__ === global); // true  
   
  print(AO.__parent__.x); // 10  
   
})();  

总结

本文,我们介绍了与执行上下文相关的对象。希望,本文能够对大家有所帮助,同时也希望本文能够起到解惑的作用。

Table of Contents