C++java中多态机制的异同


以前我有个错误的观点:即使在C++和java中多态性的实现机制可能不同,但它们的表现形式应该相同,也就是说如果代码结构相同,那么执行结果也应该相同。可惜事与愿违,事情并不总是你想象中的那样子。(在看下文以前,你最好先考虑一下这个问题,你有什么看法呢?)

 

ok,让我们进入正题。

 

        首先本文不讨论面向对象编程的基本概念,如封装、继承和数据抽象等,这方面的资料现在应该多如牛毛,只是稍微提一下多态性的概念。根据Bjarne Stoustrup的说法,多态性其实就是方法调用的机制,也就是说当在编译时无法确定一个对象的实际类型时,应当能够在运行时基于对象的实际类型来决定调用的具体方法(动态绑定)。

 

我们先来看一下在C++中的函数调用方式:

 

Ø         普通函数调用:具体调用哪个方法在编译时间就可以决定(通过查找编译器的符号表),同时在使用标准过程调用机制基础上增加一个表示对象身份的指针(this指针)。

 

Ø         虚函数调用:函数调用依赖于对象的实际类型,一般地说,对象的实际类型只能在运行时间才能确定。虚函数一般要有两个步骤来支持,首先每一个类产生出一堆指向虚函数的指针,放在表格中,这个表格就叫虚函数表(virtual table);然后每一个类对象(class object)会添加一个指向相关虚函数表(virtual table)的指针,通常这个指针叫做vptr。

 

在java中又是如何的呢?恩,区别还是满大的。在java虚拟机中,类实例的引用就是指向一个句柄(handle)的指针,而该句柄(handle)其实是一对指针:其中一个指针指向一张表,该表格包含了对象的方法列表以及一个指向类对象(表示对象类型)的指针;另一个指针指向一块内存地址,该内存是从java堆中为对象的数据而分配出来的。

 

唔,你要说了,好象差不多嘛,不是都要维护一张函数表吗?别急,让我们先看一下例子,这样你就能更好的理解它们之间的区别到底有多大了。

 

下面是C++和java的例子,不看后面的答案,你能够正确说出它们的执行结果吗?

 

例1:C++

class Base 
  
{ 
  
public: 
  
         Base() 
  
         { 
  
                   init(); 
  
         } 
  
 
  
      
  
         virtual ~Base() {} 
  
public: 
  
         virtual void do_init() 
  
         { 
  
                   init(); 
  
         } 
  
 
  
      
  
protected: 
  
         virtual void init() 
  
         { 
  
                   cout << "in Base::init()" << endl; 
  
         } 
  
}; 
  
 
  
      
  
class Derived : public Base 
  
{ 
  
public: 
  
         Derived() 
  
         { 
  
                   init(); 
  
         } 
  
protected: 
  
         void init() 
  
         { 
  
                   cout << "in Derived::init()" << endl; 
  
         } 
  
}; 
  
 
  
      
  
int main(int argc, char* argv[]) 
  
{ 
  
         Base* pb; 
  
         pb = new Derived(); 
  
         delete pb; 
  
         return 0; 
  
}

 

例2:java

class Base 
  
{ 
  
  public Base() 
  
  { 
  
    init(); 
  
  } 
  
 
  
      
  
  protected void init() 
  
  { 
  
    System.out.println("in Base::init()"); 
  
  } 
  
 
  
      
  
  public void do_init() 
  
  { 
  
    init(); 
  
  } 
  
} 
  
 
  
      
  
class Derived extends Base 
  
{ 
  
  public Derived() 
  
  { 
  
    init(); 
  
  } 
  
 
  
      
  
  protected void init() 
  
  { 
  
    System.out.println("in Derived::init()"); 
  
  } 
  
} 
  
 
  
      
  
public class Test 
  
{ 
  
  public static void main(String[] args) 
  
  { 
  
    Base base = new Derived(); 
  
  } 
  
}

 

例1的执行结果是:

                  in Base::init()

                  in Derived::init()

 

例2的执行结果是:

                  in Derived::init()

                  in Derived::init()

看了结果后,你是马上顿悟呢抑或是处于疑惑中呢?ok,我们来分析一下两个例子的执行过程。

 

首先看一下例1(C++的例子):

1. Base* pb; 只是声明,不做什么。

2. pb = new Derived();

                  1) 调用new操作符,分配内存。

                  2) 调用基类(本例中是Base)的构造函数

3) 在基类的构造函数中调用init(),执行程序首先判断出当前对象的实际类型是Base(Derived还没构造出来,当然不会是Derived),所以这里调用的是Base::init()。

4) 调用派生类(本例中是Derived)的构造函数,在这里同样要调用init(),执行程序判断出当前对象的实际类型是Derived,调用Derived::init()。

3. delete pb; 无关紧要。

 

例2(java的例子)的执行过程:

1.      Base base = new Derived();  

                  1) 分配内存。

                  2) 调用基类(本例中是Base)的构造函数

3) 在基类的构造函数中调用init(),执行程序首先判断出当前对象的实际类型是Derived(对,Derived已经构造出来,它的函数表当然也已经确定了)所以这里调用的是Derived::init()。

4) 调用派生类(本例中是Derived)的构造函数,在这里同样要调用init(),执行程序判断出当前对象的实际类型是Derived,调用Derived::init()。

 

明白了吧。java中的类对象在构造前(调用构造函数之前)就已经存在了,其函数表和对象类型也已经确定了,就是说还没有出生就已经存在了。而C++中只有在构造完毕后(所有的构造函数都被成功调用)才存在,其函数表和对象的实际类型才会确定。所以这两个例子的执行结果会不一样。当然,构造完毕后,C++与java的表现就都一样了,例如你调用Derived::do_init()的话,其执行结果是:

         in Derived::init()。

 

个人认为,java中的多态实现机制没有C++中的好。还是以例子说明吧:

 

例子3:C++

class Base 
  
{ 
  
public: 
  
         Base() 
  
         { 
  
                   init(); 
  
         } 
  
 
  
      
  
         virtual ~Base() {} 
  
protected: 
  
         int value; 
  
         virtual void init() 
  
         { 
  
                   value = 100;    
         } 
  
}; 
  
 
  
      
  
class Derived : public Base 
  
{ 
  
public: 
  
         Derived() 
  
         { 
  
                   init(); 
  
         } 
  
 
  
      
  
protected: 
  
         void init() 
  
         { 
  
                   cout << "value = " << value << endl; 
  
                   // 做一些额外的初始化工作 
  
         } 
  
}; 
  
 
  
      
  
int main(int argc, char* argv[]) 
  
{ 
  
         Base* pb; 
  
         pb = new Derived(); 
  
         delete pb; 
  
         return 0; 
  
}

 

例4:java

class Base 
  
{ 
  
  public Base() 
  
  { 
  
    init(); 
  
  } 
  
 
  
      
  
  protected int value; 
  
  protected void init() 
  
  { 
  
         value = 100;   
  } 
  
} 
  
 
  
      
  
class Derived extends Base 
  
{ 
  
  public Derived() 
  
  { 
  
    init(); 
  
  } 
  
 
  
      
  
  protected void init() 
  
  { 
  
    System.out.println("value = " + value); 
  
         // 做一些额外的初始化工作 
  
  } 
  
} 
  
 
  
      
  
public class Test 
  
{ 
  
  public static void main(String[] args) 
  
  { 
  
    Base base = new Derived(); 
  
  } 
  
}

 

例3的执行结果是:

         value = 10

 

例4的执行结果是:

         value = 0

         value = 0

从以上结果可以看出,java例子中应该被初始化的值(这里是value)没有被初始化,派生类根本不能重用基类的初始化函数。试问,如果初始化要在构造时完成,并且初始化逻辑比较复杂,派生类也需要额外的初始化,派生类是不是需要重新实现基类的初始化函数呢?这样的面向对象方法好不好呢?欢迎大家讨论。

 

 

Reference:

1.        Stanley B. Lippman:深度探索C++对象模型(Inside The C++ Object Model)。

---- 侯捷译,华中科技出版社 2001

2.        Bjarne Stoustrup:What is “Object-Oriented Programming” (1991 revise version)