目录⭐️这是年前的最后一篇博客,今天我先为大家介绍STL中的vector容器,我会先介绍它的一些个常见接口以及用法,然后再模拟实现它,这样我们就能够比较深入地了解这个容器。
⭐️博客代码已上传至gitee:https://gitee.com/byte-binxin/cpp-class-code
vector的介绍vector中常见接口的介绍
vector的构造和析构函数vector的三种遍历方式vector的增删查改vector容器的容量变化和大小增减 vector迭代器失效问题vector的模拟实现
vector的小框架构造函数和析构函数迭代器和operator[]的实现vector的增删查改的实现vector的容量问题vector的拷贝构造函数和operator=memcpy拷贝问题 总结
vector的介绍
vector的本质其实是一个顺序表的结构,也可以说是数组存储,与顺序表的结构很相似,vector的接口更为完善,值得我们学习。
简单地说:
- vector是表示可变大小数组的序列容器。vector和数组一样是连续存储数据的,可以随机存取数据,时间复杂度都是O(1)。vector插入数据要考虑增容的问题,增容就是重新分配一块更大的空间,然后将全部元素移到新的数组。这个 *** 作就时间而言,是一个代价较高的任务,因为扩容是要付出代价的。vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
- 无参构造函数: vector()有参构造函数: vector(size_type n, const value_type& val = value_type())用n个val构造并初始化容器拷贝构造: vector(const vector& x)使用迭代器初始化: vector (InputIterator first, InputIterator last);
实例演示:
void TestVector() { vectorvector的三种遍历方式v1;// 无参构造 vector v2(4, 100);// 有参构造 vector v3(v2); // 拷贝构造 vector v4(v3.begin(), v3.end());// 使用迭代器进行初始化 }
其实和string类很相似
- for+operator[]访问遍历迭代器范围for
实例演示:
void TestVector1() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); // 三种遍历方式 // 1.通过[]的方式遍历 for (size_t i = 0; i < v.size(); ++i) { cout << v[i] << " "; } cout << endl; // 2.迭代器方式遍历 // 和string类一样,有四种迭代器 // iterator const_iterator reverse_iterator const_reverse_iterator vector ::iterator it = v.begin(); while (it != v.end()) { cout << *it << " "; ++it; } cout << endl; vector ::reverse_iterator rit = v.rbegin(); while (rit != v.rend()) { cout << *rit << " "; ++rit; } cout << endl; // 3.范围for 会被编译器替换成迭代器的方式遍历 for (auto e : v) { cout << e << " "; } cout << endl; }
代码运行结果如下:
迭代器的介绍
vector中迭代器可以分为四种,(正向或反向)+(普通或const)组合起来就有四种
如下:
- begin + end: 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置
的iterator/const_iteratorrbegin + rend: 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的
reverse_iterator
- push_back 尾插pop_back 尾删find vector中没有这个函数,调用的是算法中的接口
实例演示:
void TestVector5() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); for (auto e : v1) { cout << e << " "; } cout << endl; v.pop_back(); v.pop_back(); for (auto e : v) { cout << e << " "; } cout << endl; vector ::iterator pos = find(v.begin(), v.end(), 3); if (pos != v.end()) { cout << *pos << endl; } }
代码运行结果如下:
- insert 在pos位置之前插入一个元素erase 删除pos位置的一个元素operator[] 重载[]运算符,可以想数组一样访问
实例演示:
void TestVector7() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); for (auto e : v) { cout << e << " "; } cout << endl; v.insert(v.begin(), 0); for (auto e : v) { cout << e << " "; } cout << endl; v.erase(v.end() - 1); for (auto e : v) { cout << e << " "; } cout << endl; }
代码运行结果如下:
- size 返回容器中有效元素的个数capacity 返回容器的容量大小empty 判断容器是否为空resize 改变vector的size,要考虑增大size时是否要扩容,还有扩大size后补什么元素,如果给了就补给了的,没给就补缺省值reserve 改变vector中的capacity
实例演示1:
void TestVector4() { vectorv1(4, 100); //v1.resize(10); 多余处默认补0 //v1.resize(10, 5); 多余处给5 v1.resize(3); for (auto e : v1) { cout << e << " "; } cout << endl; cout << v1.size() << endl; cout << v1.capacity() << endl; }
代码运行结果如下:
实例演示2:
void TestVector8() { size_t sz; vectorv; sz = v.capacity(); cout << "making foo grow:n"; for (int i = 0; i < 100; ++i) { v.push_back(i); if (sz != v.capacity()) { sz = v.capacity(); std::cout << "capacity changed: " << sz << 'n'; } } }
代码运行结果如下:
实例演示3 我们把上面的代码中容器用reserve提前预留好空间,看会发生什么
void TestVector8() { size_t sz; vectorv; v.reserve(100); sz = v.capacity(); cout << "making foo grow:n"; for (int i = 0; i < 100; ++i) { v.push_back(i); if (sz != v.capacity()) { sz = v.capacity(); std::cout << "capacity changed: " << sz << 'n'; } } }
代码运行结果如下:
总结: 容易看出,在vs2019平台下,vector每次增容是以1.5倍的方式增长的,增长倍数一般是1.5倍或者2倍,过大过小都不好,过大会导致空间浪费,过小会导致频繁扩容,也会有很大的开销,所以1.5倍或者2倍是比较好的选择,当然,我们在知道接下来要用到容量的大小时,可以提前预留好空间,可以避免频繁扩容带来的开销。
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T*。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)
看一下两种情况:
- push_back
实例演示
void TestVector6() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); vector ::iterator it = v.begin(); v.push_back(6); v.push_back(7); // 迭代器失效,底层就是一个指针,尾插如数据是,因为扩容会导致空间会发生变化,指针指向的旧空间会被销毁,所以迭代器失效 while (it != v.end()) { cout << *it << " "; ++it; } cout << endl; }
代码运行结果如下:
扩容导致空间发生了变化,但是指针的指向没有改变,如果我们此时再去访问就相当于野指针的解引用了,编译器会报错。所以要及时更新迭代器的值就好了。
- erase
实例演示1
void TestVector6() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); vector ::iterator it = v.begin(); while (it != v.end()) { if (*it % 2 == 0) v.erase(it);// 迭代器失效,因为删除会导致后面的数据往前挪动,此时迭代器会错过一个数据,编译器检测就会报错 ++it; } for (auto e : v) { cout << e << " "; } cout << endl; }
代码运行结果如下:
程序崩了,删除会导致后面的数据往前挪动,理论上不会失效,但是编译器检测就会报错,这里的失效是指迭代器的位置不对了。
实例演示2 下面是堆上面的代码进行了修改
void TestVector6() { vectorv; v.push_back(1); v.push_back(2); v.push_back(3); v.push_back(4); v.push_back(5); vector ::iterator it = v.begin(); while (it != v.end()) { if (*it % 2 == 0) it = v.erase(it);// 给迭代器重新赋值 else ++it; } for (auto e : v) { cout << e << " "; } cout << endl; }
代码运行结果如下:
这样就没有报错了。
vector的模拟实现 vector的小框架总结: 使用迭代器前记得对迭代器赋值,可以避免迭代器失效的问题产生。
template构造函数和析构函数class vector { public: private: iterator _start;// 起始位置的指针 iterator _finish;// _start+size iterator _endofstorage;// _start+capacity };
- 这里我们实现一个无参的默认构造函数,对三个成员进行初始化 *** 作
vector() :_start(nullptr) ,_finish(nullptr) ,_endofstorage(nullptr) {}
- 踢狗一个析构函数,对空间和资源都进行清理
~vector() { delete[] _start; _start = _finish = _endofstorage = nullptr; }迭代器和operator[]的实现
我们首先要定义迭代器的类型,在vector中,迭代器其实就是一个原生指针T*。所以我们这样定义:
typedef T* iterator; typedef const T* const_iterator;
下面是STL中vector的源码定义:
- 普通迭代器:begin(),end()
iterator begin() { return _start; } iterator end() { return _finish; }
- const迭代器:begin(),end()
const_iterator begin() const { return _start; } const_iterator end() const { return _finish; }
- operator[]
T& operator[](size_t i) const { assert(i < size()); return _start[i]; }vector的增删查改的实现
- reserve 预留空间,要考虑增容问题(拷贝数据不用memcpy,因为memcpy进行的是浅拷贝,对自定义类型处理会有问题,后面还会详细介绍)
void reserve(size_t n) { int sz = size(); if (n > capacity()) { T* tmp = new T[n]; if (_start) { //memcpy(tmp, _start, sizeof(T) * sz);// 浅拷贝,对于自定义类型会出错,string类 // 赋值 对于string类就是赋值重载,也是深拷贝 for (size_t i = 0; i < size(); ++i) { tmp[i] = _start[i]; } } delete[] _start; _start = tmp; _finish = _start + sz; _endofstorage = _start + n; } }
- push_back 尾插要考虑增容,增容都可以复用reserve函数
void push_back(T x) { if (_finish == _endofstorage) { size_t newcapacity = capacity() == 0 ? 2 : 2 * capacity(); reserve(newcapacity); } *_finish = x; ++_finish; }
- 尾删 注意要加一个assert(_finish > _start);,确保不删空
void pop_back() { assert(_finish > _start); --_finish; }
- insert 在pos位置插入一个·元素
void insert(iterator pos, const T& x) { assert(pos <= end()); if (_finish == _endofstorage) { // 算出原先差距,以免迭代器失效带来的一些问题 int gap = end() - pos; size_t newcapacity = capacity() == 0 ? 2 : 2 * capacity(); reserve(newcapacity); pos = end() + gap; } iterator end = _finish; while (pos < end) { *end = *(end - 1); --end; } *pos = x; ++_finish; }
这里push_back还可以复用insert的代码,所以insert的新写法如下:
void push_back(T x) { insert(_finish, x); }
- erase 删除pos位置的元素
iterator erase(iterator pos) { assert(pos < _finish&& pos >= _start); iterator start = pos; while (start + 1 < _finish) { *start = *(start + 1); ++start; } --_finish; return pos; }
这里的pop_back也可以复用这个函数,新写法如下:
void pop_back() { erase(_finish - 1); }
总结: 这里要注意的是插入数据要考虑增容问题,增容我们可以封装为一个reserve这个函数处理。
vector的容量问题- size
size_t size() const { return _finish - _start; }
- capacity
size_t capacity() const { return _endofstorage - _start; }
- empty
bool empty() { return size() == 0; }
- resize 改变size的大小,缺省值给T(),这个是根据不同类型给缺省值
void resize(size_t n, const T& val = T())// T()是T类型的缺省值,具体是什么也不清楚 { size_t sz = size(); if (n < sz) { _finish = _start + n; } else { if (n > capacity()) { reserve(n); } iterator end = _finish; while (end < _start + n) { *end = val; ++end; } _finish = _start + n; } }vector的拷贝构造函数和operator=
- swap 加一个域限定符::表示调用std里面的swap函数
void swap(vector& v) { ::swap(_start, v._start); ::swap(_finish, v._finish); ::swap(_endofstorage, v._endofstorage); }
- 拷贝构造函数
写法1
vector(const vector& v) :_start(nullptr) ,_finish(nullptr) ,_endofstorage(nullptr) { reserve(v.capacity()); for (auto e : v) push_back(e); }
写法2
vector(const vector& v) { _start = new T[v.capacity()]; _finish = _start + v.size(); _endofstorage = _start + v.capacity(); //memcpy(_start, v._start, sizeof(T) * v.size()); for (size_t i = 0; i < size(); ++i) { _start[i] =v. _start[i]; } }
- operator= 复用swap函数,代码更简洁
vectormemcpy拷贝问题& operator=(vector v) { swap(v); return *this; }
- memcpy是内存的二进制格式拷贝,将一段内存空间中内容原封不动的拷贝到另外一段内存空间中如果拷贝的是自定义类型的元素,memcpy即高效又不会出错,但如果拷贝的是自定义类型元素,并且自定义类型元素中涉及到资源管理时,就会出错,因为memcpy的拷贝实际是浅拷贝。
总结: 想什么的拷贝构造函数和reserve函数里面都不要使用memcpy进行拷贝,因为这些都是字节序的拷贝,是浅拷贝,对于内置类型不会出问题,但是对于自定义类型会出现问题,和我们之前几篇博客讲到的浅拷贝导致的问题是累似的,这里就业不过多的介绍了。
总结vector的大致内容就说到这,今天是除夕,先祝大家除夕快乐!,最后欢迎大家点赞支持我的博客~
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)