C++ 基本字符转换

2024-01-09 15:32:26

宽字符和窄字符的概念

宽字符和窄字符是与字符编码相关的概念，通常在处理多语言字符时会涉及到这些概念。

窄字符（Narrow Character）：
- 窄字符通常指的是单字节字符，使用单个字节来表示一个字符。在ASCII编码中，每个字符都用一个字节表示，这就是典型的窄字符。
- 在Windows平台上，窄字符通常使用char类型表示。
宽字符（Wide Character）：
- 宽字符指的是使用多个字节（通常是2个字节）来表示一个字符，以处理更广泛的字符集，如Unicode。Unicode字符集包含了世界上几乎所有的字符，包括各种语言的字符、符号和表情等。
- 在Windows平台上，宽字符通常使用wchar_t类型表示。

在C/C++中，为了支持宽字符，引入了一些相关的数据类型和函数：

wchar_t：表示宽字符的数据类型。
L"string"：表示宽字符字符串字面量，与窄字符字符串使用"string"的形式不同。
wstring：表示宽字符字符串的std::basic_string模板实例。

在Windows API 中，有一些使用宽字符的函数，其参数和返回类型使用wchar_t或者以W结尾（如MessageBoxW）。相应地，也有使用窄字符的函数，其参数和返回类型使用char或以A结尾（如MessageBoxA）。

使用宽字符通常更适合处理多语言和国际化的场景，因为它能够更灵活地表示各种字符。但在某些情况下，尤其是在考虑存储和传输效率时，窄字符可能更为合适。在实际编程中，需要根据项目的需求和字符集的要求选择合适的字符类型。

TCHAR:

TCHAR是在 Windows 平台上定义的一种通用字符类型，根据编译选项的设置，它可以是char或wchar_t。
当使用 Unicode 编译选项时，TCHAR被定义为wchar_t，因此可以用于支持 Unicode 字符串。当不使用 Unicode 编译选项时，TCHAR被定义为char，用于支持窄字符（narrow character）字符串。

示例：

cppCopy code#ifdef UNICODE
typedef wchar_t TCHAR;
#else
typedef char TCHAR;
#endif

char wchar_t 之间的转换

在C++中，char、wchar_t、string、wstring之间的转换涉及到不同字符编码的处理。以下是一些常见的转换方法：

char数组（C风格字符串）和string之间的转换：

从char数组到string：

cppCopy codeconst char* charArray = "Hello";
std::string myString = charArray;

从string到char数组：

cppCopy codestd::string myString = "World";
const char* charArray = myString.c_str();

wchar_t数组（宽字符数组）和wstring之间的转换：

从wchar_t数组到wstring：

cppCopy codeconst wchar_t* wideCharArray = L"Hello";
std::wstring myWideString = wideCharArray;

从wstring到wchar_t数组：

cppCopy codestd::wstring myWideString = L"World";
const wchar_t* wideCharArray = myWideString.c_str();

char数组和wchar_t数组之间的转换：

从char数组到wchar_t数组：

cppCopy codeconst char* charArray = "Hello";
size_t charArraySize = strlen(charArray) + 1;
wchar_t* wideCharArray = new wchar_t[charArraySize];
mbstowcs(wideCharArray, charArray, charArraySize);

从wchar_t数组到char数组：

cppCopy codeconst wchar_t* wideCharArray = L"World";
size_t wideCharArraySize = wcslen(wideCharArray) + 1;
char* charArray = new char[wideCharArraySize];
wcstombs(charArray, wideCharArray, wideCharArraySize);

请注意，在进行字符编码转换时，要确保目标数组足够大，以容纳源字符串的所有字符和空终止符。此外，使用mbstowcs和wcstombs等函数时要注意字符编码的差异，以免出现乱码问题。

宽字符串的拼接

swprintf 和 wstringstream 都是用于处理宽字符字符串的 C++ 函数和类。它们有一些不同之处，主要在于它们的用途和使用方式。

swprintf：
- swprintf 是一个 C 标准库函数，用于将格式化的数据写入宽字符字符串。
- 它类似于 printf 函数，但是工作于宽字符字符串，接受格式化字符串和一组参数，并将结果写入指定的缓冲区。
- 需要注意的是，swprintf 可能存在一些安全性方面的问题，因为它不会检查缓冲区的大小。因此，在使用时需要确保提供的缓冲区足够大，以避免溢出。
示例：
```
cppCopy codewchar_t buffer[100];
swprintf(buffer, 100, L"Hello, %s %d!", L"world", 2023);
```
wstringstream：
- wstringstream 是 C++ 中的一个类，位于 <sstream> 头文件中，用于在内存中构建和处理宽字符字符串。
- 它类似于 std::stringstream，但是工作于宽字符字符串。你可以使用 << 运算符将各种数据类型插入到流中，并通过 str() 方法获取最终的字符串结果。
- wstringstream 提供了更灵活的方式，允许你通过串联多个操作来构建字符串。
示例：
```
cppCopy code#include <iostream>
#include <sstream>

int main() {
    std::wstringstream ss;
    ss << L"Hello, " << L"world " << 2023 << L"!";

    std::wcout << L"Constructed String: " << ss.str() << std::endl;

    return 0;
}
```
在这个示例中，wstringstream 被用于构建一个宽字符字符串，通过串联多个操作来添加各种数据类型。

选择使用 swprintf 还是 wstringstream 取决于你的需求。如果只是简单的格式化字符串，swprintf 可能更方便。如果需要进行更复杂的构建和操作，或者需要在不同的数据类型之间切换，wstringstream 提供了更灵活和面向对象的解决方案。

swprintf 和 swprintf_s 都是用于在宽字符字符串中执行格式化的 C 标准库函数。它们的主要区别在于安全性方面。

swprintf：
- swprintf 是标准的 C 库函数，用于将格式化的数据写入宽字符字符串。
- 不具备安全性检查，如果缓冲区不足以容纳格式化后的字符串，可能导致缓冲区溢出。
- 使用时需要确保提供的缓冲区足够大，以避免潜在的安全问题。
示例：
```
cppCopy codewchar_t buffer[100];
swprintf(buffer, L"Hello, %s %d!", L"world", 2023);
```
swprintf_s：
- swprintf_s 是 C11 标准引入的安全版本，用于避免缓冲区溢出问题。
- 接受额外的参数，用于指定缓冲区的大小，并在写入之前检查缓冲区大小，以确保不会发生溢出。
- 如果缓冲区太小，函数将返回一个错误代码，并且不会执行写入操作。
示例：
```
cppCopy codewchar_t buffer[100];
swprintf_s(buffer, 100, L"Hello, %s %d!", L"world", 2023);
```

在 swprintf_s 中，第二个参数表示缓冲区的大小。如果缓冲区足够大，且格式化字符串及参数的组合不会导致溢出，那么 swprintf_s 将成功执行。否则，将返回一个错误码（非零值）。

在现代的编程中，为了安全性考虑，推荐使用 swprintf_s 或者其他安全版本的函数，以避免缓冲区溢出引起的潜在问题。

文章来源:https://blog.csdn.net/ake698/article/details/135481014
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！