C++ 模拟实现string
目录
重载比较运算符(<, <= ,? ?> , >=?,?==? ,?!=? , )
一.类的声明
为了避免与库函数里的string类重复定义,这里我们用命名空间,将我们自己定义的string类封到命名空间里,代码为:
namespace wzy
{
class string
{
public:
//成员变量
private:
//成员函数
};
}
二.确定成员变量
我们知道库里面的string类底层大致是使用的是一个字符指针,指向一个数组,然后将对数组的各种操作封装到类中,然后是两个size_t类型的变量记录字符的空间,与有效字符的个数。这里我们的成员变量可以参考:
// 成员变量
char* _str //指向存储字符的数组(数组空间大小包含'\0')
size_t _size //记录数组中有效字符的个数(不包含'\0')
size_t _capacity //记录数组空间的大小(不包含'\0')
三.成员函数
1.带参的构造函数,析构函数,拷贝构造
string(const char* str="")
:_str(new char[strlen(str)+1])
,_size(strlen(str))
,_capacity(_size+1)
{}
注:在使用初始化列表的时候,要注意类中成员变量的顺序!!!
原因:初始化列表是按照变量声明的顺序初始化的,建议初始化列表的顺序与成员变量声明的顺序一致.
C++规定常量字符串结尾自动加上'\0',因此这里缺省值相当于"\0"
析构函数:
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity=0;
}
拷贝构造
string(const string& s)
{
_str = new char[s._size + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
2.size()与capacity()
size_t size() const
{
return _size;
}
size_t capacity() const
{
return _capacity;
}
3.运算符重载
重载数组下标访问[]
可读可写
char& operator[](size_t pos)
{
assert(pos < _size);
return _str[i];
}
可读不可写(给被const修饰的string对象使用)
const char& operator[](size_t pos) const
{
assert(pos < _size);
return _str[i];
}
使用数组下标的方式遍历string对象
void test1()
{
string s("Hello World!");
for(size_t i=0;i<s.size();i++)
{
cout<<s[i]<<" ";
}
}
重载+=??
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(char* str)
{
append(str);
return *this;
}
重载比较运算符(<, <= ,? ?> , >=?,?==? ,?!=? , )
bool operator<(const string& s) const
{
return strcmp(_str, s._str)<0;
}
bool operator==(const string& s) const
{
return strcmp(_str, s._str) == 0;
}
bool operator!=(const string& s) const
{
return !(*this == s);
}
bool operator>(const string& s) const
{
return !((*this) < s || (*this) == s);
}
bool operator>=(const string& s) const
{
return !(*this < s);
}
bool operator<=(const string& s) const
{
return !(*this > s);
}
重载流插入与流提取
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s) //要先实现const迭代器
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear(); //用之前先清空s
char ch;
ch=in.get();
//为什么不用in>>ch?
//流提插入时,不能遇到空格或换行就停止
while (ch != ' ' && ch != '\n')
{
s += ch;
ch=in.get();
}
return in;
}
这里我们可以发现,在流提取时,当s满时,再插入,每插入一次就要扩容一次。这样效率不好。可以改为:
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch;
char buff[128];
ch=in.get();
size_t i=0;
while (ch != ' ' && ch != '\n')
{
buff[i++]=ch;
if(i==129)
{
buff[i]='\0';
s+=buff;
i=0;
}
ch=in.get();
}
if(i)
{
s+=buff;
}
return in;
}
这里我们用buff暂存字符,当buff满时,就尾插。结束当buff还有字符时,再尾插。这样可以减少开辟空间的次数。
重载=
string& operator=(const string& s)
{
if (this != &s)
{
char* temp = new char[s._capacity + 1];
strcmp(temp, s._str);
delete[]_str;
_str = temp;
_size = s._size;
_capacity = s._capacity;
}
}
这里我们可以看到里面的交换数据次过多,那我们能不能将其封装到一个函数里呢?
这里首先要介绍一个库函数std::swap(),功能:交换两个变量的值。(变量只能是内置类型!!!)
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
string& operator=(string temp)
{
swap(temp);
return *this;
}
注:这里参数temp不能用引用,被const修饰。
4.实现迭代器
这里我们一定要知道:迭代器很多行为与指针类似。当很多情况下,我们完全可以把迭代器当创指针使用。。因为迭代器也代表指向某个元素;迭代器指向下一个元素与指针的方式一样;迭代器也可以解引用使用元素。
这里我们实现迭代器的方式:使用typedef 将char* 重命名为iterator。因此在这里我们完全可以将迭代器当作指针使用。
正向迭代器
typedef char* iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const迭代器
typedef const char* const_iterator;
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
使用迭代器遍历
void test2()
{
string s("Hello World!");
string::iterator it = s.begin();
while (it != s.end())
{
cout << *it << " ";
}
cout << endl;
}
使用范围for遍历
我们知道范围for的底层就是使用迭代器实现的,因此当我们实现迭代器之后就可以使用范围for了。
void test3()
{
string s("Hello World!");
for(auto ch:s)
{
cout<<ch<<" ";
}
cout << endl;
}
5.实现reserve(size_t n)
按照库的方式分为两种情况:
1.? n>_capacity 。 扩容(申请新空间,拷贝旧空间,释放旧空间,_str指向新空间,更新_size与_capacity的值)
2. n<=_capacity? 。不做处理
注:这里_str指向新空间我们可以使用:std::swap 作用:交换两个内置类型的值.
只改变 _capacity,不改变 _size
void reserve(size_t n)
{
if (n > _capacity)
{
char* temp = new char[n+1]; //需要为'\0'开辟空间
strcpy(temp, _str);
std::swap(temp, _str);
delete[]temp;
_capacity = n;
}
}
6.实现push_back(char ch)
这里我们实现push_back按照库里面的方式。
这里我们可以分两种情况:
1._size<_capacity。扩容(使用reserve),然后尾插
2._size==_capacity。直接尾插
void push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity==0?4:_capacity*2);//注意当_capacity==0时
}
_str[_size] = ch;
_size++;
_str[_size] = '\0';
}
7.实现append(const char* str)
分两种情况:
1. _szie+strlen(str)>_capacity 。扩容(使用reserve),然后再将str的内容拷贝到_str里
2._szie+sizeof(str)<=_capacity。 直接拷贝
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len >= _capacity) //第一种情况
{
reserve(_size + len);//这里的扩容具体还得看要求
}
strncpy(_str+_size,str,len);//strncpy可以把'\0'也拷贝过来
_size += len;
}
8.实现insert()
string底层用的是数组,这里在将一个字符或字符串插入某个位置,可以看作像数组里插入。
string& insert(size_t pos, char ch)
{
assert(pos <= _size); //检查插入位置是否正确
if (_size == _capacity)//检测是否扩容
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
//这里要注意size_t是无符号的整形,要注意头插时,i的初始化值
//这里即使i为整形,i也会被整形提升为size_t类型
for (size_t i = _size+1; i > pos; i--)
{
_str[i] = _str[i - 1];
}
_str[pos] = ch;
_size++;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _capacity);
int len = strlen(str);
if (pos + len > _capacity) //检查是否扩容
{
reserve(pos + len);
}
for (int i = _size; i >=(int)pos; i--)
{
_str[i+len] = _str[i];
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
9.实现erase()
void erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos+len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
size_t begin = pos + len;
while (begin <= _size)
{
_str[begin - len] = _str[begin];
begin++;
}
_size -= len;
}
}
这里npos时一个无符号的整形,是size_t类型最大的整数,比特为全为1,所以直接赋值为1.
因为npos属于string类的成员变量,它的值不变,因此我们可以用const与static修饰它。我们知道被static修饰的变量要在类外面定义,但是C++11中,const修饰的static的成员变量(只能是整形),可以直接在类里面给缺省值
10.实现clear()
void clear()
{
_str[0] = '\0';
_size = 0;
}
11.实现resize()
以库里面的resize为例,分三种情况:
1.? n>_capacity? ,扩容,初始化多出来的空间。2.? _size<n<_capcity? ,将大于_size,小于n的空间初始化。
3. n<_size , 缩容
void resize(size_t n, char ch = '\0')
{
if (n <= _capacity)
{
_str[n] = '\0';
_size = n;
}
else
{
reserve(n);
int i;
for (i = _size; i < n; i++)
{
_str[i] = ch;
}
_str[i] = '\0';
}
}
12实现find()
在字符串中查找子串在理论上效率很高,但是在实际上效率并不好,所以我们一般用可以直接暴力查找。这里我们直接用了一个strstr()函数查找。
找到就返回子串的首地址,没找到就返回空指针。
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* sub, size_t pos = 0)
{
const char* p = strstr(_str, sub);
if (p)
{
return p-_str;
}
return npos;
}
13.实现substr
分两种情况:
1. pos+len>=_size,
2.pos+len <_size
string substr(size_t pos, size_t len = npos)
{
assert(pos < _size);
string s;
size_t end = len + pos;
if (len==npos||pos + len >= _size )
{
len = _size - pos;
end = _size;
}
s.reserve(len);
for (size_t i = pos; i < end; i++)
{
s += _str[i];
}
return s;
}
注:使用这个函数时,要先实现拷贝构造,否则在传返回值的时候是浅拷贝,会报错。
完整代码:
因为string类的方法太多,这里我只选了几个我们经常使用的实现,大家可以参考我这个头文件,继续实现下去:
#pragma once
#include<iostream>
#include<assert.h>
using namespace std;
namespace wzy
{
class string
{
public:
string(const char* str = "")
:_str(new char[strlen(str) + 1])
, _size(strlen(str))
, _capacity(_size + 1)
{}
string(const string& s)
{
_str = new char[s._size + 1];
strcpy(_str, s._str);
_size = s._size;
_capacity = s._capacity;
}
~string()
{
delete[] _str;
_str = nullptr;
_size = _capacity = 0;
}
size_t size()
{
return _size;
}
size_t capacity()
{
return _capacity;
}
char& operator[](int i)
{
assert(i < _size);
return _str[i];
}
typedef char* iterator;
typedef const char* const_iterator;
iterator begin()
{
return _str;
}
iterator end()
{
return _str + _size;
}
const_iterator begin() const
{
return _str;
}
const_iterator end() const
{
return _str + _size;
}
void reserve(size_t n)
{
if (n > _capacity)
{
char* temp = new char[n + 1];
strcpy(temp, _str);
std::swap(temp, _str);
delete[]temp;
_capacity = n;
}
}
void push_back(char ch)
{
if (_size == _capacity)
{
reserve(_capacity * 2);
}
_str[_size] = ch;
_size++;
_str[_size] = '\0';
}
void append(const char* str)
{
size_t len = strlen(str);
if (_size + len >= _capacity)
{
reserve(_size + len);//这里的扩容具体还得看要求
}
strncpy(_str + _size, str, len);//strncpy可以把'\0'也拷贝过来
_size += len;
}
string& operator+=(char ch)
{
push_back(ch);
return *this;
}
string& operator+=(char* str)
{
append(str);
return *this;
}
void insert(size_t pos, char ch)
{
assert(pos <= _size); //检查插入位置是否正确
if (_size == _capacity)//检测是否扩容
{
reserve(_capacity == 0 ? 4 : _capacity * 2);
}
for (size_t i = _size + 1; i > pos; i--)
{
_str[i] = _str[i - 1];
}
_str[pos] = ch;
_size++;
}
string& insert(size_t pos, const char* str)
{
assert(pos <= _capacity);
int len = strlen(str);
if (pos + len > _capacity)
{
reserve(pos + len);
}
for (int i = _size; i >= (int)pos; i--)
{
_str[i + len] = _str[i];
}
strncpy(_str + pos, str, len);
_size += len;
return *this;
}
bool operator<(const string& s) const
{
return strcmp(_str, s._str) < 0;
}
bool operator==(const string& s) const
{
return strcmp(_str, s._str) == 0;
}
bool operator!=(const string& s) const
{
return !(*this == s);
}
bool operator>(const string& s) const
{
return !((*this) < s && (*this) == s);
}
bool operator>=(const string& s) const
{
return !(*this < s);
}
bool operator<=(const string& s) const
{
return !(*this > s);
}
string& operator=(const string& s)
{
if (this != &s)
{
char* temp = new char[s._capacity + 1];
strcmp(temp, s._str);
delete[]_str;
_str = temp;
_size = s._size;
_capacity = s._capacity;
}
}
void swap(string& s)
{
std::swap(_str, s._str);
std::swap(_size, s._size);
std::swap(_capacity, s._capacity);
}
string& operator=(string s)
{
if (this != &s)
{
swap(s);
return *this;
}
}
void clear()
{
_str[0] = '\0';
_size = 0;
}
void erase(size_t pos, size_t len = npos)
{
assert(pos < _size);
if (len == npos || pos + len >= _size)
{
_str[pos] = '\0';
_size = pos;
}
else
{
size_t begin = pos + len;
while (begin <= _size)
{
_str[begin - len] = _str[begin];
begin++;
}
_size -= len;
}
}
void resize(size_t n, char ch = '\0')
{
if (n <= _capacity)
{
_str[n] = '\0';
_size = n;
}
else
{
reserve(n);
int i;
for (i = _size; i < n; i++)
{
_str[i] = ch;
}
_str[i] = '\0';
}
}
size_t find(char ch, size_t pos = 0)
{
assert(pos < _size);
for (size_t i = pos; i < _size; i++)
{
if (_str[i] == ch)
{
return i;
}
}
return npos;
}
size_t find(const char* sub, size_t pos = 0)
{
const char* p = strstr(_str, sub);
if (p)
{
return p-_str;
}
return npos;
}
string substr(size_t pos, size_t len = npos)
{
assert(pos < _size);
string s;
size_t end = len + pos;
if (len==npos||pos + len >= _size )
{
len = _size - pos;
end = _size;
}
s.reserve(len);
for (size_t i = pos; i < end; i++)
{
s += _str[i];
}
return s;
}
private:
char* _str;
size_t _size;
size_t _capacity;
public:
const static size_t npos;
};
const size_t string::npos = -1;
ostream& operator<<(ostream& out, const string& s)
{
for (auto ch : s)
{
out << ch;
}
return out;
}
istream& operator>>(istream& in, string& s)
{
s.clear();
char ch;
ch=in.get() ;
while (ch != ' ' && ch != '\n')
{
s += ch;
ch=in.get();
}
return in;
}
}
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!