New[] In C++ User Guide
编写面向对象的程序,经常需要使用到new和delete操作为对象申请内存空间并且初始化。在我博客的另一篇文章 Debug The File System 我提到内存的分配和回收是开发中最令人头疼的事情,一旦出现内存的重叠分配或者访问越界等问题都是很难察觉到的,到时候出现段错误也需要花费大量的时间检查和排除错误。
在C编程中,程序员只需要谨慎仔细的使用malloc和free(虽然这样也不容易),C++在C的基础上,添加了强大的new功能,不仅可以分配内存,同时还可以为对象初始化,因此,更多的灵活性带来了更多的使用技巧。以我最近做的DBMS term project为例,对于对象内存的分配和回收这一部分而言,使用最频繁的要算是 Buffer Manager (以下简称BM
)这一层了,这一层主要的功能是在heap file层申请Insert, Update,delete等等各种操作请求时,由于每一项操作对应一个或多个虚拟的Page(Page是数据库的存储单位之一),BM会根据这些操作对应的Page,把其从外部存储设备(disk, flash)中读取到内存池(buffer pool)中,或者从内存池写到外部存储设备上。所以这其中涉及到了大量的内存分配和释放,看似new和delelte能为我们处理一切,可是不同的使用模式效率也会不同。首先有必要了解new的基本使用方法,我认为核心内容是关于placement new.内容转自百度sytarchen的空间和博客园的wanghetao.
一. New的用法
1. new( ) 分配这种类型的一个大小的内存空间,并以括号中的值来初始化这个变量;
2. new[] 分配这种类型的n个大小的内存空间,并用默认构造函数来初始化这些变量;
例子:
#include<iostream>
#include<cstring>
using namespace std;
int main(){
char * p=new char("Hello");
//error分配一个char(1字节)的空间,
//用"Hello"来初始化,这明显不对
char* p=new char[6];
//p="Hello";
//不能将字符串直接赋值给该字符指针p,原因是:
//指针p指向的是字符串的第一个字符,只能用下面的
//strcpy
strcpy(p,"Hello");
cout<<*p<<endl; //只是输出p指向的字符串的第一个字符!
cout<<p<<endl; //输出p指向的字符串!
delete[] p;
return 0;
}
3.开辟单变量地址空间
1)new int; //开辟一个存放数组的存储空间,返回一个指向该存储空间的地址.int *a = new int 即为将一个int类型的地址赋值给整型指针a.
2)int \*a = new int(5) 作用同上,但是同时将整数赋值为5
4.开辟数组空间
一维: int \*a = new int[100];开辟一个大小为100的整型数组空间
二维: int \*\*a = new int[5][6]
三维及其以上:依此类推.
一般用法: new 类型 [初值]
5.当使用new运算符定义一个多维数组变量或数组对象时,它产生一个指向数组第一个元素的指针,返回的类型保持了除最左边维数外的所有维数。
例如:
int *p1 = new int[10];
返回的是一个指向int的指针int*
int (*p2)[10] = new int[2][10];
new了一个二维数组,去掉最左边那一维[2],剩下int[10],所以返回的是一个指向int[10]这种一维数组的指针int (*)[10].
int (*p3)[2][10] = new int[5][2][10];
new了一个三维数组,去掉最左边那一维[5],还有int[2][10],所以返回的是一个指向二维数组int[2][10]这种类型的指针int (*)[2][10].
例子:
#include <iostream>
#include <typeinfo>
using namespace std;
int main() {
int *a = new int[34];
int *b = new int[];
int (*c)[2] = new int[34][2];
int (*d)[2] = new int[][2];
int (*e)[2][3] = new int[34][2][3];
int (*f)[2][3] = new int[][2][3];
a[0] = 1;
b[0] = 1; //运行时错误,无分配的内存,b只起指针的作用,用来指向相应的数据
c[0][0] = 1;
d[0][0] = 1; //运行时错误,无分配的内存,d只起指针的作用,用来指向相应的数据
e[0][0][0] = 1;
f[0][0][0] = 1; //运行时错误,无分配的内存,f只起指针的作用,用来指向相应的数据
cout<<typeid(a).name()<<endl;
cout<<typeid(b).name()<<endl;
cout<<typeid(c).name()<<endl;
cout<<typeid(d).name()<<endl;
cout<<typeid(e).name()<<endl;
cout<<typeid(f).name()<<endl;
delete[] a; delete[] b; delete[] c;
delete[] d; delete[] e; delete[] f;
}
输出结果:
int *
int *
int (*)[2]
int (*)[2]
int (*)[2][3]
int (*)[2][3]
6.new运算符
最常用的是作为运算符的new,比如:
string *str = new string("test new");
作为运算符,new和sizeof一样,是C++内置的,你不能对它做任何的改变,除了使用它。
new会在堆上分配一块内存,并会自动调用类的构造函数。
7.new函数
第二种就是new函数,其实new运算符内部分配内存使用的就是new函数,原型是:
void *operator new(size_t size);
new函数返回的是一个void指针,一块未经初始化的内存。如你所见,这和C语言的malloc行为相似,你可以重载new函数,并且增加额外的参数,但是必须保证第一个参数必须是size_t类型,它指明了分配内存块的大小,C++允许你这么做,当然一般情况下这是不必要的。如果重载了new函数,在使用new操作符时调用的就是你重载后的new函数了。 如果使用new函数,和语句
string *str = new string("test new")
相对的代码大概是如下的样子:
string *str = (string*)operator new(sizeof(string));
str.string("test new");
// 当然这个调用时非法的,但是编译器是没有这个限制的
8.placement new
1. placement new的含义
placement new 是重载operator new 的一个标准、全局的版本,它不能够被自定义的版本代替(不像普通版本的operator new 和 operator delete能够被替换)。
void *operator new( size_t, void *p ) throw() { return p; }
placement new的执行忽略了size_t参数,只返还第二个参数。其结果是允许用户把一个对象放到一个特定的地方,达到调用构造函数的效果。
和其他普通的new不同的是,它在括号里多了另外一个参数。比如:
Widget * p = new Widget; - - - - - - - - - //ordinary new
pi = new (ptr) int; pi = new (ptr) int; //placement new
括号里的参数ptr是一个指针,它指向一个内存缓冲器,placement new将在这个缓冲器上分配一个对象。Placement new的返回值是这个被构造对象的地址(比如括号中的传递参数)。placement new主要适用于:在对时间要求非常高的应用程序中,因为这些程序分配的时间是确定的;长时间运行而不被打断的程序;以及执行一个垃圾收集器 (garbage collector)。
2. new 、operator new 和 placement new 区别
-
new:不能被重载,其行为总是一致的。它先调用operator new分配内存,然后调用构造函数初始化那段内存。
-
operator new:要实现不同的内存分配行为,应该重载operator new,而不是new。
-
delete和operator delete类似。
-
delete首先调用对象的析构函数,然后调用operator delete释放掉所使用的内存。
-
placement new:只是operator new重载的一个版本。它并不分配内存,只是返回指向已经分配好的某段内存的一个指针。因此不能删除它,但需要调用对象的析构函数。
3. new 操作符的执行过程
(1). 调用operator new分配内存 ;
(2). 调用构造函数生成类对象;
(3). 返回相应指针。
operator new 就像operator+一样,是可以重载的。如果类中没有重载operator new,那么调用的就是全局的::operator new来完成堆的分配。同理,operator new[]、operator delete、operator delete[]也是可以重载的,其实 operator new也是operator new的一个重载的版本,只是很少用而已。如果你想在已经分配的内存中创建一个对象,使用new时行不通 的。也就是说placement new允许你在一个已经分配好的内存中(栈或者堆中)构造一个新的对象。原型中void*p实际上就是指向一个已经分配 好的内存缓冲区的的首地址。
4. Placement new 存在的理由
-
用Placement new 解决buffer的问题 问题描述:用new分配的数组缓冲时,由于调用了默认构造函数,因此执行效率上不佳。若没有默认构造函数则会发生编译时错误。如果你想在预分配的内存上创建对象,用缺省的new操作符是行不通的。要解决这个问题,你可以用placement new构造。它允许你构造一个新对象到预分配的内存上。
-
增大时空效率的问题 使用new操作符分配内存需要在堆中查找足够大的剩余空间,显然这个操作速度是很慢的,而且有可能出现无法分配内存的异常(空间不够)。 placement new 就可以解决这个问题。我们构造对象都是在一个预先准备好了的内存缓冲区中进行,不需要查找内存,内存分配的时间是常数;而且不会出现在程序运行中途出现内存不足的异常。所以,placement new非常适合那些对时间要求比较高,长时间运行不希望被打断的应用程序。
5. 使用步骤
在很多情况下,placement new的使用方法和其他普通的new有所不同。这里提供了它的使用步骤。
第一步 缓存提前分配
有三种方式:
1.为了保证通过placement new使用的缓存区的memory alignmen(内存队列)正确准备,使用普通的new来分配它:在堆上进行分配
class Task ;
char \* buff = new [sizeof(Task)]; //分配内存
(请注意auto或者static内存并非都正确地为每一个对象类型排列,所以,你将不能以placement new使用它们。)
2.在栈上进行分配
class Task ;
char buf[N\*sizeof(Task)]; //分配内存
3.还有一种方式,就是直接通过地址来使用。(必须是有意义的地址)
void* buf = reinterpret_cast<void*> (0xF00F);
第二步:对象的分配
在刚才已分配的缓存区调用placement new来构造一个对象。
Task *ptask = new (buf) Task
第三步:使用
按照普通方式使用分配的对象:
ptask->memberfunction();
ptask-> member; //...
第四步:对象的析构
一旦你使用完这个对象,你必须调用它的析构函数来毁灭它。按照下面的方式调用析构函数:
ptask->~Task(); //调用外在的析构函数
第五步:释放
你可以反复利用缓存并给它分配一个新的对象(重复步骤2,3,4)如果你不打算再次使用这个缓存,你可以象这样释放它:
delete [] buf;
跳过任何步骤就可能导致运行时间的崩溃,内存泄露,以及其它的意想不到的情况。如果你确实需要使用placement new,请认真遵循以上的步骤。
6. Example operator new[]
// operator new[] example
#include <iostream> // std::cout
#include <new> // ::operator new[]
struct MyClass {
int data;
MyClass() {std::cout << '*';} // print an asterisk for each construction
};
int main () {
std::cout << "constructions (1): ";
// allocates and constructs five objects:
MyClass * p1 = new MyClass[5];
std::cout << '\n';
std::cout << "constructions (2): ";
// allocates and constructs five objects (nothrow):
MyClass * p2 = new (std::nothrow) MyClass[5];
std::cout << '\n';
std::cout << "constructions (3): ";
// allocates storage for five objects, but does not construct them:
MyClass * p3 = static_cast<MyClass*> (::operator new (sizeof(MyClass[5])));
std::cout << '\n';
std::cout << "constructions (4): ";
// constructs five objects at p3, but does not allocate:
new (p3) MyClass[5];
std::cout << '\n';
delete[] p3;
delete[] p2;
delete[] p1;
return 0;
}
Output:
constructions (1): *****
constructions (2): *****
constructions (3):
constructions (4): *****
二.delete用法:
1. int *a = new int;
delete a; //释放单个int的空间
2.int *a = new int[5];
delete [] a; //释放int数组空间
要访问new所开辟的结构体空间,无法直接通过变量名进行,只能通过赋值的指针进行访问. 用new和delete可以动态开辟,撤销地址空间.在编程序时,若用完一个变量(一般是暂时存储的数组),下次需要再用,但却又想省去重新初始化的功夫,可以在每次开始使用时开辟一个空间,在用完后撤销它.
总结
-
函数new
void *operator new(size_t size); 在堆上分配一块内存,和placement new(void *operator new(size_t, void* buffer)); 在一块已经存在的内存上创建对象,如果你已经有一块内存,placement new会非常有用,事实上,它STL中有着广泛的使用。
-
运算符new 最常用的new,没什么可说的。
-
函数new不会自动调用类的构造函数,因为它对分配的内存类型一无所知;而运算符new会自动调用类的构造函数。
-
函数new允许重载,而运算符new不能被重载。
blog comments powered by Disqus