1-06格式化输入和输出

2024-01-09 10:31:47

一、概述

格式化输入和输出其实指的就是C语言标准函数库<stdio.h>中的：

scanf函数，用于从键盘读取输入。
printf函数，用于向屏幕输出信息。

它们是C语言当中使用非常非常频繁的两个函数，所以很重要。

这两个函数的基本使用，比如对int/float数据的打印或者键盘录入，我们在前面的小节已经讲过了，这里不再赘述。

本小节主要讲解一下这两个函数的原理，以及其更强大的功能。

二、输入/输出模型

scanf和printf函数看起来一个是从键盘接收数据输入，一个是将数据输出打印到显示器，但计算机内部处理的过程却没有那么简单。

我们通过输入/输出模型来简单了解一下这两个函数大体上的执行原理。

1. 冯诺依曼体系计算机

冯诺依曼体系计算机（也叫存储程序控制型计算机），主要包含三大核心组件：CPU、IO设备以及存储器，而存储器当中最重要的则是内存储器，也就是内存。直到今天，硬件设备的发展日新月异，但现代计算机仍没有脱离此体系。

冯诺依曼体系计算机，一个核心问题是CPU、内存以及IO设备三者之间的速度差异从而导致的性能瓶颈，这就是常说的"冯·诺依曼瓶颈”。

具体的说，这个瓶颈指的是：

CPU 的处理速度远远快于内存和 I/O 设备，导致在等待数据处理和传输时，CPU 大部分时间处于空闲等待的状态。这种速度差异造成了显著的性能瓶颈，限制了整个系统的效率。

为了平衡这三者之间的速度鸿沟，一个简单有效的手段是引入缓冲区技术，下面我们简单介绍一下缓冲区技术。

2. 缓冲区

缓冲区本质上是一块临时存储数据的内存区域(一般是在内存中分配的)，它在速度较慢的内存和 I/O 设备与速度较快的 CPU 之间起到桥梁的作用。

为了更深入地解释缓冲的工作原理，以printf和scanf函数为例，可以更直观地解释其运作机制：

当你使用 printf 输出数据时，数据并不是立刻写入到输出设备（如屏幕）。它首先被放置在一个stdout缓冲区中，然后在满足特定条件时，数据会被刷新到输出设备。
当你使用 scanf 输入数据时，数据也不是直接从输入设备（如键盘）读取的。它首先被加载到一个stdin缓冲区中，然后 scanf 从这个缓冲区中获取数据。

这个过程可以用下图来描述：

图 1. 格式化输入输出-缓存模型

那么添加这样的一个缓冲区有什么好处呢？

3. 缓冲区的优点

使用缓冲区的好处显而易见——提高IO性能。

缓冲区是如何提高IO性能的？

printf函数和scanf函数：

printf函数将程序(内存)中的数据打印到外部设备(显示器)上
scanf函数代表从外部设备(键盘)中读取数据到程序(内存)中

这些都是非常典型的I/O操作过程。

我们都知道，I/O的过程效率很低。除了硬件性能本身的差异外，I/O操作的复杂性也是非常重要因素。每次进行I/O操作都会带来一些固定的开销，比如：

每次 I/O 操作都需要设备初始化和响应等待等。
操作系统管理 I/O 请求，涉及中断处理和上下文切换，这些都消耗了大量时间。
应用从用户态切换到内核态的系统调用也会带来额外的时间开销。（I/O操作普遍涉及系统调用）
…

总之，如果每输入或输出一个字符都要进行一次完整的I/O操作，那么这些固定的开销就会迅速积累，导致性能显著下降。

硬件层面的效率低下，我们没有办法通过软件层面的优化去解决。但对于这些大量的固定开销，我们可以通过缓冲区来进行效率优化。

缓冲区的主要目的是暂时存储数据，然后在适当的时机一次性进行大量的I/O操作。这样，多个小的I/O请求可以被组合成一个大的请求，有效地分摊了固定开销，并显著提高了总体性能。

拿上述两个函数，具体来说：

scanf函数。当从键盘输入时，输入的字符首先被保存在stdin的缓冲区中。当满足某个触发条件后，程序才会从缓冲区读取并处理这些字符，从而减少了IO交互次数。
printf函数。输出到屏幕的内容会先被暂存到stdout的缓冲区。当满足某个触发条件后，这些内容会一次性写入并显示到屏幕，降低了与显示设备的交互频率。

如果你还不理解，就想象一次I/O操作就是搬运工搬运货物的过程，货物总量是一定的，搬一趟的时间也是差不多的。那么当然是一次性搬得尽量多，搬运的次数尽量少，总效率越高。

不使用缓冲区的I/O操作就像搬运工每次只能手提一个货物，频繁往返。而使用缓冲区，则好比搬运工使用了一个小推车，可以一次性搬运多个货物，大大提高了效率。

4. 缓冲区的分类

从上述内容中，我们可以明确地看到缓冲区的一个显著特点：当满足特定的条件时，程序会开始对缓冲区内的数据执行输入或输出操作。

这种**“满足条件即触发数据传输”的行为，被我们称为“缓冲区的自动刷新”**机制。

基于这种自动刷新的触发条件的不同，我们可以将常见缓冲区划分为以下三种类型：

**全缓冲区，也叫满缓冲区。**顾名思义，仅当缓冲区达到容量上限时，缓冲区才会自动刷新，并开始处理数据。否则，数据会持续积累在缓冲区中直到缓冲区满触发自动刷新。文件操作的缓冲区便是这种类型的经典例子。
**行缓冲区。**缓冲区一旦遇到换行符，缓冲区就会自动刷新，所有数据都会被传输。stdin和stdout缓冲区都是行缓冲区。
**无缓冲区，不缓冲。**在此模式下，数据不经过中间的缓冲步骤，每次的输入或输出操作都会直接执行。这种方法适用于需要快速、实时响应的场合。例如，stderr（标准错误输出）就是这种方式，它经常被用来即时上报错误信息。

补充和注意事项：

关于缓冲区，有以下几点需要特别注意：

无论是哪种类型的缓冲区，当缓冲区满了时，都会触发自动刷新。
1. 全缓冲区：唯一的自动刷新条件是缓冲区满。
2. 行缓冲区：除了缓冲区满导致的自动刷新，还有遇到换行符的自动刷新机制。
手动刷新。大多数缓冲区提供了手动刷新的机制，比如使用fflush函数来刷新stdout缓冲区。
当程序执行完毕（如main函数返回）时，缓冲区通常会自动刷新，除此之外，还有一些独特的机制也可以刷新缓冲区。但这些机制可能因不同的编译器或平台而异，不能作为常规手段。强烈建议依赖手动或者常规自动刷新的机制来完成缓冲区的刷新。
不同的编译器和开发环境可能会对输出缓冲进行特殊设置，尤其是在调试模式下，以便提供更好的调试体验。比如在VS的Debug模式下，即使没有换行符，printf函数的输出通常也会立即显示在控制台上。这种行为是为了帮助程序员更有效地调试程序，即时看到他们的输出，而不需要固定等待缓冲区刷新条件。

至此，我们已经对输入输出的基本概念有了全面的了解。接下来，我们将深入探讨具体的函数如何使用。

当涉及到函数调用时，虽然查阅文档是重要的学习步骤，但真正的关键在于实践：亲自编写和执行代码。

三、printf函数

printf函数的核心作用是将各种类型的数据转换为字符形式并输出到stdout缓冲区中。

从实际效果看，printf函数会展示格式字符串的内容，并在指定的位置插入对应的值。

调用printf函数时，首要参数是格式字符串。紧随其后的参数表达式则表示要插入到该字符串中的值。调用形式如下：

printf(格式字符串, 表达式1, 表达式2, ...);

一个我们已经使用过的代码示例如下：

代码块 1. printf函数-打印int和float类型

int i, j;
float x, y;

i = 10;
j = 20;
x = 43.2892f;
y = 5527.0f;

printf("i = %d, j = %d, x = %f, y = %f\n", i, j, x, y);

格式字符串包含两个主要部分：

普通字符，printf函数会将普通字符原封不动的进行显示。比如上面代码中的"i = , j = "。
转换说明，以字符% 开头，它为后续对应位置的表达式提供了一个占位符。在上述示例中，“%d"和”%f"就是转换说明。

理解转换说明的含义和用法是掌握printf函数的关键。

1. 转换说明（重点）

转换说明在printf函数中起到了关键的角色，允许开发者对输出格式进行精细的控制。它主要有以下几个作用：

占位符的作用。
控制输出的格式，比如宽度，精度等。
指示被转换成字符数据的对应参数的类型。

系统的讲，转换说明的组成公式如下：

%[标志][字段宽度][.精度][长度]说明符

注意，"%"和"说明符"是必不可少的，其余部分则是可选的！可选的部分用[]括起来了！

下面，我们一步步详细地讲解每个部分：

"%"是转换说明的开始，必不可省略。
**[标志]**用于决定一些特殊的格式，常见的标志有：
1. -：左对齐输出。如果没有该标志，输出默认是右对齐的。
2. +：输出正负号。对于正数，会输出+，对于负数，会输出-。
3. 0：当输出宽度大于实际数字的字符数量时，使用0而不是空格来填充。
4. 空格：当数值为正时，在数值前面添加一个空格，而负数则添加-。如果同时使用了+标志，+标志会覆盖空格标志。
**[字段宽度]**用于指定输出的最小字符宽度，但不会导致截断数据：
1. 如果输出的字符，宽度小于指定的宽度，那么输出的值将会按照指定的**[标志]**来进行填充。若标志位没有0，则会填充空格。
2. 如果输出的字符，宽度大于指定的宽度，那么printf函数并不会截断，而是完全输出所有字符。
**[.精度]**定义打印的精度：
1. 对于整数，表示要输出的最小位数，若位数不足则左侧填充0。
2. 对于浮点数，表示要在小数点后面打印的位数。
  - 当有效数字不足时，会自行在后面补0
  - 当有效位数超出时，会截断保留指定的有效位数。这个过程一般会遵守"四舍五入"的原则。
  - 但由于浮点数存储的固有精度问题，某些数值可能不能完美表示，导致结果中的数字稍有偏差。
  - 注意在不指定[.精度]的情况下，浮点数默认显示6位小数，多的部分舍弃，不够的话，会在后面补0。
**[长度]**主要描述参数的数据类型或大小。常见的长度修饰符有：
1. h : 与整数说明符一起使用，表示short类型。
2. l (小写的L): 通常与整数或浮点数说明符一起使用，表示long（对于整数）或double（对于浮点数）。
3. ll (两个小写的L): 与整数说明符一起使用，表示long long类型的整数。
4. L (大写的L): 与浮点数说明符一起使用，表示long double。
**说明符，必不可省略。**描述如何格式化和显示该参数。常见的说明符有：
1. d 或 i : 表示有符号的十进制整数。
2. u：表示无符号的十进制整数。
3. o：表示无符号的八进制整数。
4. x：表示无符号的十六进制整数，使用小写字母（例如：a-f）。
5. X：表示无符号的十六进制整数，使用大写字母（例如：A-F）。
6. f, e 或 E : 浮点数。
  - e：强制用科学计数法显示此浮点数，使用小写的“e”表示10的幂次。
  - E: 强制用科学计数法显示此浮点数，使用大写的“E”表示10的幂次。
7. g 或 G : 选择最合适的表示方式，浮点数或科学记数法。
  - g，当选择使用科学计数法显示此浮点数时，使用小写的“e”表示10的幂次。
  - G，当选择使用科学计数法显示此浮点数时，使用大写的“E”表示10的幂次。
8. c : 字符。
9. s : 字符串。纯粹打印字符串一般不需要用转换说明，直接使用普通字符输出即可。
10. p : 指针。

通过结合这些组件，你可以精确地控制printf的输出格式。但是请不要尝试死记硬背，要在不断使用的过程中，逐渐理解记忆。当遇到不会写的格式或者忘记时，再及时查表即可。

"%"的使用

在转换说明中，有一个非常特殊的字符——“%”。百分号用于转换说明的开始，那么如果我就希望打印一个百分号咋办？

很简单，用"%%“来表示一个”%"。

2. 注意事项（重要）

printf函数将数据写入stdout的行缓冲区，但要将这些数据真正展示到外部设备（如屏幕），则需依靠stdout的自动刷新机制。

为了增加输出的实时性和可预测性，一个常见策略是在输出字符串的末尾添加换行符"\n"，这样可以立即触发缓冲区的刷新。这确保了待显示的信息能够迅速呈现，不会因其他因素延迟。

建议：

在不影响程序的逻辑的前提下，调用printf函数的格式字符串应当总是以换行符"\n"结尾。

3. 小练习1

小练习当中，涉及的都是目前已经学习过的，并且比较常用的转换说明。

思考并回答以下代码的输出结果：

代码块 2. 转换说明-练习题1

printf("|%4f|\n", 3.14159f);
printf("|%10f|\n", 3.14159f);
printf("|%.4f|\n", 3.14159f);
printf("|%.7f|\n", 3.14159f);
printf("|%4.1f|\n", 3.14159f);
printf("|%04.1f|\n", 3.14159f);
printf("|%-4.1f|\n", 3.14159f);

代码块 3. 转换说明-练习题2

float value = 0.1f;
printf("%.10f\n", value);

int i = 40;
float x = 839.21f;

printf("|%d|%5d|%-5d|%5.3d|\n", i, i, i, i);
printf("|%f|%10f|%10.2f|%-10.2f|\n", x, x, x, x);

4. 小练习2

请按照下列要求，编写代码：

键盘输入一名学生的语文、数学和英语成绩（均为整数百分制）。计算其平均成绩，并保留两位小数打印显示。
键盘输入一个位于(0, 1)范围内的浮点数，并将其转化为百分比形式，结果保留一位小数。例如：输入0.12转换为12.0%，而输入0.1234转换为12.3%。

参考代码：

代码块 4. 转换说明-练习题3参考代码

#include <stdio.h>

int main() {
    int chinese, math, english;
    float average;

    printf("请输入语文成绩：");
    scanf("%d", &chinese);

    printf("请输入数学成绩：");
    scanf("%d", &math);

    printf("请输入英语成绩：");
    scanf("%d", &english);

    average = (chinese + math + english) / 3.0; // 使用 3.0 以确保结果是浮点数
    printf("平均成绩为：%.2f\n", average);

    return 0;
}

代码块 5. 转换说明-练习题4参考代码

#include <stdio.h>

int main() {
    float input, percentage;

    printf("请输入一个(0, 1)范围的浮点数：");
    scanf("%f", &input);

    if (input <= 0 || input >= 1) {
        printf("输入值超出范围!\n");
        return 1; // 返回一个错误代码
    }

    percentage = input * 100; // 转换为百分比
    printf("转化后的百分比为：%.1f%%\n", percentage);

    return 0;
}

5. 局部变量声明风格的说明

在早期的 C 语言标准（如 C89/C90）中，所有的局部变量必须在函数或代码块的开始处声明，这是强制的语法要求。

这种强制的语法设定，导致你会看到诸如下列代码：

代码块 6. 把局部变量声明放在函数开头-演示代码

int main(void){
    int i, sum = 0;
    for(i = 1; i <= 100; i++){
        sum += i;
    }
    printf("1 + 2 + ... + 100 = %d", sum);
    return 0;
}

但从C99标准开始，这个限制被放宽。在C99和之后的标准中，你可以在任何地方声明局部变量，只要在使用它们之间声明即可。

很显然这样，程序员就可以在更接近局部变量的实际使用地方来声明它，从而提高代码的可读性和可维护性。

综上，我们给出以下建议：

对于现代的C编程而言，就近声明使用局部变量是更规范、更推荐的做法。因为这样做可以提高代码的可读性和可维护性。
如果期望代码的兼容性更强，兼容更老的C语言版本，就必须把所有的局部变量在函数或代码块的开始处声明。但这种需求一般没有。

四、scanf函数

scanf函数的核心作用是从stdin缓冲区中读取字符形式的数据，并将其转换为特定类型的数据。

从实际效果看，scanf函数会根据格式字符串读取输入的内容，并将这些内容赋值给指定的变量。

调用scanf函数时，首要参数也是格式字符串，紧随其后的参数是变量的地址，表示将读取到的值存放在哪个位置。调用形式如下：

scanf(格式字符串, &变量1, &变量2, ...);

我们以往已经使用过scanf函数了，一个示例代码如下：

代码块 7. scanf函数-读取int和float类型

int i;
float x;

printf("输入整数: ");
scanf("%d", &i);

printf("输入浮点数：");
scanf("%f", &x);

printf("您输入的数据是: i = %d, x = %f", i, x);

scanf函数的格式字符串中可能包含：

普通字符，比如空格和其他字符，scanf函数会期望输入中有与之匹配的字符。一般来说，格式字符串不需要普通字符。
转换说明，以字符"%" 开头，它告诉scanf函数应该如何解释输入中的数据并如何存储它。在上述示例中，“%d"和”%f"就是转换说明。

值得注意的是，scanf函数在调用时填入的变量前面要加符号"&"，它是取地址运算符，意思是告诉scanf函数将数据存储到某个地址。它一般是必须的，但有些情况下可以省略。

1. 转换说明

scanf函数使用转换说明来解析和读取输入，这为开发者提供了对输入数据格式的精细控制。

系统地讲，scanf函数的转换说明的组成公式如下：

%[*][宽度][长度]说明符

其中，"%"和"说明符"是必不可少的，而其他部分则是可选的。我们用[]括起来表示这些可选的部分。

接下来，我们逐一解释每个组成部分：

**“%”：**是转换说明的开始，并且是必不可省略的。
**[*]也称之为赋值抑制：**当使用该符号时，对应的输入会被读取，但不会存储到任何变量中。例如，使用"%*d"意味着会读取一次输入，但此输入完全无效不会赋值到对应变量。
**[宽度]：**表示要读取的最大字符数量。例如，"%5d"意味着读取最多5个字符来解析为一个整数。
[长度]：描述参数的数据类型或大小。常见的长度修饰符有（和printf函数一致）：
1. h : 与整数说明符一起使用，表示short类型。
2. l (小写的L): 通常与整数或浮点数说明符一起使用，表示long（对于整数）或double（对于浮点数）。
3. ll (两个小写的L): 与整数说明符一起使用，表示long long类型的整数。
4. L (大写的L): 与浮点数说明符一起使用，表示long double。
说明符：这是必不可少的部分，描述如何解析输入数据。常见的说明符有**（和printf函数一致）**：
1. d: 表示有符号的十进制整数。
2. i：注意scanf函数的转换说明i和printf的是不同的。
  - printf函数的i和d都是等价的，都表示输出有符号的十进制整数。
  - 但scanf的i会自动判断输入的整数的进制，从而进行不同的录入。支持十进制、八进制、十六进制整数。
3. u：表示无符号的十进制整数。
4. o：表示无符号的八进制整数。
5. x/X: 表示无符号十六进制整数。
6. f, e, E, g, G: 表示浮点数。
7. c: 表示单字符。
8. **s：**字符串。会读取连续的字符，直到遇到空白字符（如空格、制表符或换行符）为止。
9. p: 指针。

和printf函数一样，当你在使用scanf函数时，建议不要死记硬背转换说明，而是在实践中逐渐熟悉并查阅文档或其他资料进行验证和参考。

2. scanf函数的工作原理

scanf函数本质上是一个**“模式匹配"函数，试图把"stdin缓冲区”**中的字符与格式字符串匹配。

scanf函数会从左到右依次匹配格式字符串中的每一项：

如果匹配数据项成功，那么scanf函数会继续处理格式串的剩余部分；
如果匹配不成功，那么scanf函数将不再处理格式串的剩余部分，而会立刻返回。

除此之外，scanf函数的转换说明符大都默认忽略前置的空白字符，这样的设计让输入对用户更好友好，比如：

%d: 忽略前置的空白字符 (包括空格符、水平和垂直制表符、换页符和换行符)，然后匹配十进制的有符号整数。
%f: 忽略前置的空白字符，然后匹配浮点数。
…

练习，下列代码的执行结果是什么？

代码块 8. scanf函数-练习题1

int i, j;
float x, y;
scanf("%d%d%f%f", &i, &j, &x, &y);

分别键盘录入以下数据：

100 200 0.1 0.2

1-20.3-4.0e3

100a2000.10.2

1002000.10.2

结果是什么呢？为什么？

3. 录入字符数据的特殊性

注意事项：

scanf 函数用 %c 格式化字符串来读取单个字符时，并不会跳过空白字符，%c 会读取输入的下一个字符，无论它是什么，包括空白字符。

所以在录入字符时，尤其是一行录入多个数据且包含输入字符时，一定要在转换说明前面留出一个空格，以匹配可能的空格：

代码块 9. %c转换说明使用注意事项

char ch;
int num;
printf("请输入一个数字以及一个字符: ");
scanf("%d %c", &num, &ch); // 注意 %c 前的空格
printf("你输入的数字是: %d\n", num);
printf("你输入的字符是: %c\n", ch);

上述代码运行，键盘录入：

100 a

程序打印结果：

你输入的数字是: 100

你输入的字符是: a

4. 普通字符

scanf函数的格式字符串串中也可以包含普通字符（"%"之前的部分是普通字符），和printf函数不同的是，scanf函数的普通字符也用来表示匹配规则。

例如：

空白字符：对应输入中的任意数量的空白字符（如空格、制表符或换行）。
非空白字符：要求输入中精确地匹配该字符。（是什么字符就匹配什么，写几个该字符就匹配几个）

因此，scanf中的普通字符不仅仅是装饰或分隔，它们也参与到输入数据的匹配中，确保数据的格式正确。

代码块 10. scanf函数-练习题2

int i, j;
scanf("%d/%d", &i, &j);

分别键盘录入以下数据：

5/ 96

5 / 96

结果是什么？

其它不变，把转换说明改完"%d /%d"，再次录入数据，有区别吗？为什么？

五、不要混淆 printf 函数和 scanf 函数

虽然scanf函数调用和printf函数调用看起来很相似，但这两个函数之间有很大的差异！

一个常见的错误是：调用printf函数时，在变量的前面加 &。

printf("%d, %d\n", &i, &j); /*** WRONG ***/

scanf函数在寻找数据项时，通常会跳过前面的空白字符。所以除了转换说明，格式串通常不包含其他字符。

一些常见混淆printf函数，导致的错误是：

代码块 11. scanf函数调用常见-错误写法

scanf("%d, %d", &a, &b);  // 这样写输入的数据必须是 "10, 20"格式的
scanf("%d\n", &a);    // 错误的添加换行

六、课堂小练习

写一个程序，实现分数相加。用户以分子/分母的形式输入分数，程序打印相加后的结果。如：

图 2. 综合练习题-图

拓展：如何将结果化为最简分数？

注意：当 scanf 函数遇到一个不属于当前项的字符时，它不会读取该字符。在下一次读取输入时，才会读取该字符。

参考代码如下：

int numerator1, denominator1; // 第一个分数的分子和分母
printf("请输入第一个分数：");
scanf("%d/%d", &numerator1, &denominator1);

int numerator2, denominator2; // 第二个分数的分子和分母
printf("请输入第二个分数：");
scanf("%d/%d", &numerator2, &denominator2);

// 分子错位相乘相加
int result_num = numerator1 * denominator2 + numerator2 * denominator1;
int result_denom = denominator1 * denominator2;

printf("sum = %d/%d", result_num, result_denom);

注意，变量命名要见名知意，不要乱用a、b、c等无意义字符。除此外为代码增加必要的注释也是一个非常好的编程习惯。

文章来源:https://blog.csdn.net/weixin_44398687/article/details/135471615
本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若内容造成侵权/违法违规/事实不符，请联系我的编程经验分享网邮箱：veading@qq.com进行投诉反馈，一经查实，立即删除！