C++STL的string(超详解)

2023-12-14 10:48:14

前言

无论c++还是c语言,字符串都是最常见的类之一。我们日常当中写的程序必然要存储数据。
我们的内置类型只能表示基础的信息,无法表示一些复杂的信息,比如int, double.但我们要表示身份证、住址那就表示不了了。

C语言的字符串

C语言用字符数组来表示字符串,但是这里有一个巨大的缺陷。

1.不够好用
2.不能够很好的管理
比如:用字符数组来存储地址,但是地址的长度要修改呢?这就很麻烦。

所以c++提供了一个管理字符串的一个类,string,你可以把它想象成存储字符的顺序表。

string

string是一个类模板,它是typedef出来的。
在这里插入图片描述

string的底层是一个字符数组,但是你可以把它想象成可以增删查改的数组。

string类的常用接口

string类的常见构造

构造函数

#include <string>
int main()
{
	string s2("hello world");
	for (size_t i = 0; i < s2.size(); ++i)
	{
		s2[i]++;
	}

	cout << s2 << endl;

	for (size_t i = 0; i < s2.size(); ++i)
	{
		cout << s2[i] << " ";
	}
	cout << endl;
	return 0;
}

在这里插入图片描述

为什么可以这样构造?

string s1="hello world";

本质是类型转换,把const char* 转换成string.
它是先构造再拷贝构造,然后优化成了构造。

string (const string& str, size_t pos, size_t len = npos);

int main()
{
	string s3 = "hello world";
	string s4(s3, 6, 3);
	cout << s4 << endl;
	
	string s5(s3, 6, 13);//如果字符不够,有多少取多好
	cout << s5 << endl;
	return 0;
}

在这里插入图片描述
** 如果第三个参数不给呢?**

string s6(s3, 6);

这里给了一个参数,npos,并且npos=-1;
-1代表什么,这里其实是无符号,所以-1表示最大值。
npos很大意味着取到结束

capacity

容量没有把’\0’算进去。

size和length

size和length有什么差异?

int main()
{
	string s3 = "hello world";
	cout << s3.size() << endl;
	cout << s3.length() << endl;
	return 0;
}

没有什么差异。

** 那为什么同时会有这两个东西呢?**
跟STL的发展历史有关。平时用size就可以了。

reserve

** 观察vs编译器的扩容情况**
在这里插入图片描述

** 那假如我知道要开多少空间呢?**
我们可以调用这样一个接口,reserve
知道需要开多少空间,提前开空间,减少扩容,提高效率。

s.reserve(100)

注意,你要100的空间,它不一定给你100的空间,它可能为了一些对齐等等的原因,可能开的比100大一些。

resize

resize和reserve功能相似,但也有很大区别。
resize除了开空间它还帮助初始化

int main()
{
	string s1;
	s1.reserve(100);
	cout << sizeof(s1) << endl;
	cout << s1.size() << endl;
	cout << "--------------" << endl;
	string s2;
	s2.resize(100);
	cout << sizeof(s2) << endl;
	cout << s2.size() << endl;
	return 0;
}

在这里插入图片描述

那初始化填了什么值呢?
填的是0;

那我想填其他的值怎么办呢?
比size小,删除数据,保留前5个

s2.resize(100, 'x');

但是它不会缩容。

这里提一个点,为什么编译器不会轻易的缩容?
缩容其实是不支持原地缩的,原地缩荣的话,那以为这要delete一部分空间,这增加了内存管理的难度。
真正缩荣都是开好另一块空间,然后将需要保留的数据拷贝过去。这也意味着缩容肯定会带来性能上的消耗。一般来说不要轻易的缩容。

resize可以删除数据
s2.resize(5);

modify

string 最好用的地方就是不用去管空间。

尾插

插入字符
int main()
{
	string s3 = "hello world";
	s3.push_back(' ');
	s3.push_back('!');
	return 0;
}
插入字符串
s3.append("bit");

但是我们不管是插入字符还是插入字符串都不喜欢这样写,我们喜欢用运算符重载+=;

s3+=' ';
s3+='!';

s3+='bit';

不过+=底层还是调用了push_back和append.

insert

如果我们再头部或者中间插入一个数据,我们就可以用insert;

int main()
{
	string s1("world");
	s1.insert(0, "hello");
	cout << s1 << endl;
	return 0;
}

在这里插入图片描述

中间插入

int main()
{
	string s1("world");
	s1.insert(0, "hello");

	//s1.insert(5, 1, ' ');
	//s1.insert(5, " ");
	s1.insert(s1.begin() + 5, ' ');//迭代器位置
	cout << s1 << endl;
	return 0;
}

在这里插入图片描述

不推荐经常使用,能不用就不用。因为要挪动数据,影响性能。

erase

删除一个字符

int main()
{
	string s2("hello world");
	//s2.erase(5, 1);
	s2.erase(s2.begin() + 5);//迭代器位置
	cout << s2 << endl;
	return 0;
}

在这里插入图片描述

删除多个字符

int main()
{
	string s2("hello world");
	//s2.erase(5, 30);//如果要删除的数据大于字符串的剩余长度,那就相当于全部删完
	s2.erase(5);
	cout << s2 << endl;
	return 0;
}

在这里插入图片描述

不推荐经常使用,能不用就不用。因为要挪动数据,影响性能。

replace

将hello world 中间空格,替换成%%d

string s1("hello world");
s1.replace(5, 1, "%%d");

replace 能不用就不用,为什么?

1.空间不够就要扩容
2.需要挪动数据

有个题目,把hello world i love you 中的所有空格替换成%20

int main()
{
	string s1("hello world i love you");
	size_t pos = s1.find(' ');
	while (pos != string::npos)
	{
		s1.replace(pos, 1,"%20");
		 pos = s1.find(' ');
	}
	cout << s1 << endl;
	return 0;
}

在这里插入图片描述

那上面的代码能不能优化一下呢?
每次都是从0的位置开始找,其实没必要。
还有一个点就是,replace可能会扩容。

int main()
{
	string s1("hello world i love you");
	size_t num = 0;
	//计算有多少个' ',为开空间做准备
	for (auto ch : s1)
	{
		if (ch == ' ')
			++num;
	}
	// 提前开空间,避免repalce时扩容
	s1.reserve(s1.size() + 2 * num);

	size_t pos = s1.find(' ');
	while (pos != string::npos)
	{
		s1.replace(pos, 1, "%20");
		pos = s1.find(' ', pos + 3);
	}
	cout << s1 << endl;
	return 0;
}

再给大家看个好玩的东西

int main()
{
	string s1("hello world i love you");
		string newStr;
		size_t num = 0;
		for (auto ch : s1)
		{
			if (ch == ' ')
				++num;
		}
		// 提前开空间,避免repalce时扩容
		newStr.reserve(s1.size() + 2 * num);
	
		for (auto ch : s1)
		{
			if (ch != ' ')
				newStr += ch;
			else
				newStr += "%20";
		}
	
		s1 = newStr;
		cout << newStr << endl;
	return 0;
}

在这里插入图片描述

这个是以空间换时间的方式,不需要挪动数据。

swap

看下面的代码有什么区别?

int main()
{
	string s1("hello world");
	string s2("xxxxx");
	s1.swap(s2);
	cout << s1 << endl;
	cout << s2 << endl;
	cout << "------------" << endl;
	swap(s1, s2);
	cout << s1 << endl;
	cout << s2 << endl;
	return 0;
}

s1.swap()和swap()有什么区别?
我们知道swap()是类模板,所有类型都可以交换,是泛型模板。

s1.swap()和swap()谁的效率高?
很明显s1.swap()的效率更高,s1和s2两段空间,只需要交换两段空间指针的指向就可以了。
而swap()要产生一个临时对象,需要调用拷贝构造,还是深拷贝,然后又需要两次赋值。

c_str

int main()
{
	string s1("hello world");
	cout << s1 << endl;
	cout << s1.c_str() << endl;
	return 0;
}

两者都可以打印数据,那它们的区别是什么?
s1.c_str()是遇到‘\0’结束,而cout << s1 << endl;则是根据s1.size()来打印的。

c_str的主要作用还是,为c的接口提供兼容

find

find其实前面已经见过了,再看一个例子,怎样取文件名的后缀。

int main()
{
	string file("string.cpp");
	size_t pos = file.find('.');
	if (pos != string::npos)//npos是静态成员变量,所以可以这样写,直接加上类域
	{
		string suffix = file.substr(pos, file.size() - pos);//substr表示从某个位置开始,取len字符长度的字符串
		string suffix = file.substr(pos);
		cout << suffix << endl;
	}
	return 0;
}

在这里插入图片描述

如果文件有多个点怎么样找后缀?
倒着找

size_t pos = file.rfind('.');

迭代器

如果不用[]加下标怎么访问string对象呢,这里要用到迭代器。

int main()
{
	string s1("hello world");
	string::iterator it = s1.begin();
	while (it != s1.end())
	{
		cout << *it << " ";
		++it;
	}
	cout << endl;
	return 0;
}

这个代码看起来有点懵,可以暂时先把迭代器理解为指针。
在这里插入图片描述

bein()表示第一个字符的地址,end()表示最后一个字符下一个位置的地址。
它是左闭右开。

其实还可以用范围for来访问,不过范围for的底层原理还是迭代器

for (auto ch : s1)
{
	cout << ch << " ";
}
cout << endl;

const迭代器

写成这样为什么会报错?
在这里插入图片描述
报错,s.begin()赋值不过去

在这里插入图片描述
有两个版本,普通对象返回普通迭代器,const对象返回const迭代器
所以很显然,应该改成const迭代器

string::const_iterator it = s.begin();//只能遍历和读取容器的数据,不能写

为什么要有返回const的迭代器呢?
不允许被修改。const只能遍历和读容器的数据,不能写。

普通迭代器和 const迭代器的区别?
能不能写的问题。

反向迭代器

除了正着访问string,还可以反着访问,这里要用到反向迭代器。

int main()
{
	string s1("hello world");
	string::reverse_iterator rit = s1.rbegin();//类型相同才能接受
	while (rit != s1.rend())
	{
		cout << *rit << " ";
		++rit;
	}
	return 0;
}

在这里插入图片描述

在这里插入图片描述

auto

正向的普通迭代器和const迭代器一共就有4种,我们可以用auto来优化一下迭代器的写法。

auto it = s.begin();

不过它也有一个弊端,降低了程序的可读性。

自己实现的string

有个问题,下面结果是多少?下面是在vs2022实现的。
在这里插入图片描述

	cout << sizeof(s3) << endl;

s3存了字符串会不会变得更大一点?
不会,字符串是存在堆上的空间的,不用算进去。


为什么是std的string是28?
std里的string里还有一些额外的东西。

在g++编译器里就不演示了,感兴趣的老铁可以自行去测试。

文章来源:https://blog.csdn.net/weixin_68359117/article/details/134835060
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。