月度归档：2011年06月

关于默认构造函数的几个错误认识

假期间闲来无事,就下载了某大师的VC++视频资料。在讲到C++时,说是如果程序员没有自己定义默认构造函数,那么编译器会自动为我们产生一个默认的构造函数。本来这个错误的认识很多程序员都有,不足为奇。但有这么多年编程经验的高手也有这样的错误认识就不禁让我哑然了。

其实编程语言和我们所用的任何软件没有区别,例如Photoshop、AutoCAD之类。其唯一不同的是我们用的编程语言是基于编译器的,而应用软件是基于我们的编程语言的。

既然我们所用的软件是基于编译器的,那么理解编译器在背后到底为我们做了些什么、在什么情况下做了哪些事情就显得异常重要。这就像Photoshop会为你产生一些基本图形例如矩形、三角形之类,而不会凭空产生一些风景优美的图片一样。

在《C++ Annotated Reference Manual(ARM)[ELLIS90]》中的Section 12.1告诉我们:”Default constructors…在需要的时候被编译器产生出来”。

其实默认构造函数也是分为两类的:有用的、无用的。

所谓有用的标准也是就默认构造函数会为我们的类做一些初始化操作。那么无用的就不会做任何工作,从而对我们的类也就没有任何意义。所以,我们通常所说的默认构造函数是指有用的默认构造函数,其英文名字叫nontrivial default constructor。

那么到底什么时候编译器会为我们产生nontrivial default constructor呢?有下面四中情况:

①如果一个类里面某个成员对象有nontrivial default constructor,编译器就会为我们的类产生nontrivial default constructor。

那么编译器这样做的理由是什么?

答案是因为类成员对象有nontrivial default constructor,那么编译器就需要显式的来调用这个类成员对象的nontrivial default constructor。而编译器想显式的调用类成员对象的nontrivial default constructor,就需要自己来合成一些代码来调用。但是记住,编译器合成的nontrivial default constructor仅仅调用类成员对象的默认构造函数,而不对我们类里面的其它变量做任何初始化操作。

也就是说,如果你想初始化类成员变量以外的变量例如一个int、一个String,那么必须自己定义默认构造函数来完成这些变量的初始化。而编译器会对你定义的默认构造函数做相应的扩展,从而调用类成员对象的nontrivial default constructor。

②如果一个派生类的基类有nontrivial default constructor,那么编译器会为派生类合成一个nontrivial default constructor。

编译器这样的理由是:因为派生类被合成时需要显式调用基类的默认构造函数。

③如何一个类里面隐式的含有任何virtual function table(或vtbl)、pointer member(或vptr)。

编译器这样做的理由很简单:因为这些vtbl或vptr需要编译器隐式(implicit)的合成出来,那么编译器就把合成动作放到了默认构造函数里面。所以编译器必须自己产生一个默认构造函数来完成这些操作。

所以如果你的类里带有任何virtual function,那么编译器会为你合成一个默认构造函数。

④如果一个类虚继承于其它类。

编译器这样做的理由和③类似:因为虚继承需要维护一个类似指针一样,可以动态的决定内存地址的东西(不同编译器对虚继承的实现不仅相同)。

那么除了以上四种情况,编译器并不会为我们的类产生默认构造函数。

所以编程中切忌想当然,要明白哪些事情是编译器做的,哪些事情需要程序员来完成的。就像堆所占用的资源需要程序员自己来释放,而栈空间是编译器管理的一样。

只有如此,才能编写出质量更高的代码。

原文：http://blog.csdn.net/dongfengsun/archive/2008/02/18/2104176.aspx

杂谈现代高级编程语言

发表评论

几个月之前，Slashdot转载了Robert Harper教授的一篇博客，说卡内基梅隆大学计算机系把”面向对象编程“从大一新生的必修课中删掉了，其原因是

Object-oriented programming … is both anti-modular andanti-parallel by its very nature.

这两个原因（anti-modular和anti-parallel）都是很重的指责了；尤其是anti-modular，因为OO的基本思想通常被理解成“封装”，从而实现模块化。

我是在1995年第一次听说“面向对象”（Object Oriented）这个说法。当时在学习正在成长过程中的C++，用的是Borland C++ 1.0。从那时开始的很多年里，”类“（class）、“对象”（object）和“方法”（methods），以及在这些概念之上构建的”继承“（inheritance）和”多态“（polymorphism）都是我理解中OO最核心的思想。我猜大多数程序员在这方面的认识都和我差不多。

但是“封装”真的是OO的本质嘛？直到最近为了给iPhone写个玩具程序而学习Objective-C（一种非常古老和原始的面向对象编程语言）的时候，才注意到早在1998年，OO之父Alan Kay就曾经在一篇邮件中说，他很后悔发明了“object”这个词，从而误导大家，把注意力都集中到“封装”，而忽视了OO的本质——messaging（消息传递）。Alan Kay的原话是：

The big idea is “messaging” … . The key in making great and growable systems is much more to design how its modules communicate rather than what their internal properties and behaviors should be.

Objective-C的设计是非常强调“消息传递”（messaging）的——对一个object的method的调用，被称为“给这个object发了一个消息”。为了突出调用method时指定的参数（parameters）实际上是消息中的一些内容，Objective-C不惜把method的定义方式都做了相对于C的很大的修改，从而把参数嵌入在method的名字里。比如在一个叫做myWebView对象中搜索一段文字，要求不区分大小写，从前往后搜索，用Objective-C来描述是：

[myWebView searchFor:myString 
           direction:YES
       caseSensitive:NO
                wrap:YES]

而用C++或者Java来描述，则是

myWebView.searchFor(myString, YES, NO, YES)

乍看上去，C++ 或者Java的方式更简短，但是Objective-C的方式更强调“发消息”。实际上，上面Objective-C语句会被翻译成如下C函数调用：

objc_msgSend(myWebView,
             searchFor:direction:caseSensitive:wrap:,
             myString, YES, NO, YES)

从强调messaging的角度看，Objective-C确实比C++和Java更符合Alan Kay对OO思想的描述。

OO中的messaging思想不仅体现在Objective-C语言以及在其上构建的NextSTEP/Cocoa GUI编程套件上。在Cocoa因为Mac OS X和iPhone流行起来之前，很多人都接触过Qt（一种基于C++语言的GUI开发套件）。Qt对messaing的支持比Objective-C/Cocoa更彻底——每个object可以发出若干signal，每个signal可以触发这个object自己的或者其他objects的若干个slot。

有意思的是，为了支持messaging，Qt对C++语言做了扩展，而Objective-C对C语言做了扩展。这两套扩展都利用了起源于C语言的“宏”机制（macro）。类似的做法也可以用于Java，前提是我们在调用Java编译器之前，先调用一下cpp宏展开程序来预处理一下我们的Java程序。这事儿可以留待Java爱好者们来搞？

不管是Objective-C还是Qt，都会“尽力”去检查一个object是否支持一个method（或者叫message），但是并不禁止程序员向一个object发送一个它不认识的message（或者调用一个object没有的method）。说“尽力”检查，是因为两者都不能保证检查的完备性。这是因为Objective-C和Qt都支持多态；具体的说，接受message的object可能是表示为一个指针（指向object），所以直到运行时候，当一个message抵达某个object的时候，系统才能（通过查这个object对应的message list）知道这个object是否认识这个message。

这种灵活性在Google新推出的Go语言中也同样实现了，而且做的很极致——Go语言中没有class的概念；换句话说，不需要是class类型的object才能有对应的方法（methods）——Go允许给几乎任何类型附上methods。而且程序中可以很方便的检测一个object是否支持（一组）methods，比如：

type Stringer interface {
        String() string
}
s, ok := v.(Stringer)  // Test whether object v implements "String()"

【和Go的这种灵活性类似的，Objective-C允许给已经定义了的class增加一些methods，而不需要derive subclass；Objective-C的这种机制被称为category。和Go不同的是，一个category是对某个class的一个扩展，而Go语言里完全没有class了（但是有interface的概念）。】

说到这里，我觉得差不多可以反过来理解Robert Harper教授对OO的评价了——其实Robert不是在藐视OO，而是在指责很多imperative OO languages（我理解包括Java和未经Qt扩展的C++；详见后述），认为这些语言没有完成实现OO中object messaging的核心思想，从而不算实现了“模块化“（modulization）的思想。

上述都是关于程序的模块化。实际上，模块化的另一个主要方面是对“数据”（data)的模块化。从图灵机和lambda-calculus开始，计算机科学家们就注意到程序和数据是统一的；比如在冯诺依曼的“二进制存储电子计算机”模型里，程序和数据都是bit stream。即时我们在讨论高级编程语言的时候，程序和数据也不应该被分开。因为现代数据操作和模块化的基础是并行程序（parallelism），而有效实现并行的基础是程序的first-class表达，也就是把程序作为一种基本数据类型。

鉴于这篇帖子已经很长了，这段话就作为下一篇帖子的提纲吧。下一篇帖子里，我们来说说XML、JSON、MessagePack、Protocol Buffers这些persistent data structure，以及用源于古老的functional programming paradigm的Go语言和MapReduce实现的并行数据操作。

原文：http://cxwangyi.wordpress.com/2011/06/19/%E6%9D%82%E8%B0%88%E7%8E%B0%E4%BB%A3%E9%AB%98%E7%BA%A7%E7%BC%96%E7%A8%8B%E8%AF%AD%E8%A8%80/

MySQL的大小写敏感性

发表评论

在 MySQL 中，数据库和表对就于那些目录下的目录和文件。因而，操作系统的敏感性决定数据库和表命名的大小写敏感。这就意味着数据库和表名在 Windows 中是大小写不敏感的，而在大多数类型的 Unix 系统中是大小写敏感的。

奇怪的是列名与列的别名在所有的情况下均是忽略大小写的，而表的别名又是区分大小写的。

要避免这个问题，你最好在定义数据库命名规则的时候就全部采用小写字母加下划线的组合，而不使用任何的大写字母。

或者也可以强制以 -O lower_case_table_names=1 参数启动 mysqld（如果使用 –defaults-file=…/my.cnf 参数来读取指定的配置文件启动 mysqld 的话，你需要在配置文件的 [mysqld] 区段下增加一行lower_case_table_names=1）。这样MySQL 将在创建与查找时将所有的表名自动转换为小写字符（这个选项缺省地在 Windows 中为 1 ，在 Unix 中为 0。从 MySQL 4.0.2 开始，这个选项同样适用于数据库名）。

当你更改这个选项时，你必须在启动 mysqld 前首先将老的表名转换为小写字母。

换句话说，如果你希望在数据库里面创建表的时候保留大小写字符状态，则应该把这个参数置0： lower_case_table_names=1 。否则的话你会发现同样的sqldump脚本在不同的操作系统下最终导入的结果不一样（在Windows下所有的大写字符都变成小写了）。

转载请保留本行原始出处声明信息 : http://www.zeali.net/entry/364 MaDe1nZEAL

阿黎的个人博客

爱技术，爱网络，爱思考，爱生活

月度归档：2011年06月

关于默认构造函数的几个错误认识

杂谈现代高级编程语言

MySQL的大小写敏感性