深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游

2023-12-16 00:54:03

深读 CSAPP《深入理解计算机系统》——第一章-计算机系统漫游

请添加图片描述
你好我是拉依达,这是我秋招结束后更新的第一个系列。我将争取完成“ 年轻人,你渴望力量吗?”的全套深度笔记。

今天开始进行第一本CSAPP:深入理解计算机系统。

最基本的C程序—hello程序

一段最基本的hello.c源程序
//hello.c
#include <stdio.h>
int main()
{
	printf("hello, world\n");
	return
}

源程序的本质是0 1组成的位序列,8个位为一个字节。计算机中使用ASCII码表示文字字符,一个单字节表示一个字符

hello.c 源文件的ASCII码

在这里插入图片描述

hello.c 的源程序就是已字节序列的方式存储在文件中,每个字符对应一个字节(如上图),这种只由ASCII码组成的文件称为

hello程序的生命周期从C程序开始,转化到机器语言指令,最后打包成目标程序(可执行文件)

编译系统的四个阶段

在这里插入图片描述

  1. 预处理阶段: 预处理器(cpp)根据字符#开头的命令处理源程序生成.i文件
  2. 编译阶段: 编译器(ccl)将文本文件翻译成汇编程序的.s文本文件
汇编程序文本

在这里插入图片描述

  1. 汇编阶段: 汇编器(as)将汇编程序翻译成机器语言指令,打包成一种可重定位目标程序 的.o文件。是二进制文件
  2. 链接阶段: 链接器(ld)负责将多个.o的目标文件合并,生成一个可执行的目标程序,如hello,可以被加载到内存中系统执行

了解编译系统的好处

  1. 优化程序性能
  2. 理解链接时出现的错误
  3. 避免安全漏洞

系统的硬件组成

系统硬件组成

请添加图片描述

  1. 总线: 携带信息字节在各个部件间传递,传递定长的字节块,也就是字(word)。总线通常是4个字长(32位)或者8个字长(64位)

  2. I/O设备: 是系统与外界联系的通道。 每个IO设备都通过一个控制器或者适配器与IO总线相连。控制器是IO设备本身或者主板上的芯片,适配器插在主板上卡,功能都是在IO设备和IO总线之间传递信息

  3. 内存(内存): 临时存储设备,存放程序和数据。硬件由DRAM芯片组成,逻辑上是一个线性的字节数组,每个字节由唯一的地址

  4. 处理器: 中央处理单元(cpu),执行在内存中指令的引擎。
    处理器的核心是一个大小为一个字的寄存器,称为程序计数器(PC)。

    处理器从PC指向的内存处读取指令,解释指令中的位,执行该指令指示的简单操作,然后更新PC。

    CPU在指令的要求下可能会执行这些操作

    • 加载:从内存复制一个字节或者一个字到寄存器,以覆盖寄存器原来的内容。
    • 存储:从寄存器复制一个字节或者一个字到内存的某个位置,以覆盖这个位置上原来的内容。
    • 操作:把两个寄存器的内容复制到算术/逻辑单元(ALU),ALU对这两个字做算术运算,并将结果存放到一个寄存器中,以覆盖该寄存器中原来的内容。
    • 跳转:从指令本身中抽取一个字,并将这个字复制到程序计数器(PC)中,以覆盖PC中原来的值。

处理器的指令集架构和微体系结构

  • 指令集架构描述的是每条机器代码指令的效果
  • 微体系结构描述的是处理器实际上是如何实现的

高速缓存 cache

系统设计者采用了更小更快的存储设备,称为高速缓存存储器( cache memory,简称为 cache或高速缓存),作为暂时的集结区域,存放处理器近期可能会需要的信息。

比较新的、处理能力更强大的系统甚至有三级高速缓存: L1、L2和L3。

系统利用了高速缓存的局部性原理,即程序具有访问局部区域里的数据和代码的趋势。通过让高速缓存里存放可能经常访问的数据,大部分的内存操作都能在快速的高速缓存中完成。

高速缓存存储器

请添加图片描述

存储设备的结构层次

存储器层次结构的主要思想是上一层的存储器作为低一层存储器的高速缓存

因此,寄存器文件就是L1的高速缓存,L1是L2的高速缓存,L2是L3的高速缓存,L3是内存的高速缓存,而内存又是磁盘的高速缓存。在某些具有分布式文件系统的网络系统中,本地磁盘就是存储在其他系统中磁盘上的数据的高速缓存。

存储结构层次

请添加图片描述

操作系统管理硬件

操作系统是应用程序和硬件之间的一层软件。所有应用程序对硬件的操作都必须经过操作系统。

计算机分层

请添加图片描述

操作系统有两个基本功能:

  1. 防止硬件被失控的应用程序滥用;
  2. 向应用程序提供简单一致的机制来控制复杂而又通常大不相同的低级硬件设备。
    操作系统通过几个基本的抽象概念(进程、虚拟内存和文件)来实现这两个功能。

文件是对I/O设备的抽象表示,虚拟内存是对内存和磁盘I/O设备的抽象表示,进程则是对处理器、内存和I/O设备的抽象表示。

os提供的抽象表示

请添加图片描述

进程

进程: 是操作系统对一个正在运行的程序的一种抽象。在一个系统上可以同时运行多个进程,而每个进程都 好像在 独占地使用硬件(并不是真实的独立使用)。

并发运行,则是说一个进程的指令和另个进程的指令是交错执行的。运行的进程数是多于可以运行它们的CPU个数的。CPU看上去都像是在并发地执行多个进程,这是通过处理器在进程间切换来实现的。操作系统实现这种交错执行的机制称为上下文切换

操作系统保持跟踪进程运行所需的所有状态信息。这种状态,也就是上下文,包括许多信息,比如PC和寄存器文件的当前值,以及内存的内容。

当操作系统决定要把控制权从当前进程转移到某个新进程时,就会进行上下文切换,即保存当前进程的上下文、恢复新进程的上下文,然后将控制权传递到新进程。新进程就会从它上次停止的地方开始。

进程上下文切换示意

请添加图片描述

线程

进程实际上可以由多个称为线程的执行单元组成,每个线程都运行在进程的上下文中,并共享同样的代码和全局数据。

虚拟内存

虚拟内存是一个抽象概念,它为每个进程提供了一个假象,即每个进程都在独占地使用内存。每个进程看到的内存都是一致的,称为虚拟地址空间

虚拟地址空间分部

请添加图片描述

  • 程序代码和数据: 对所有的进程来说,代码是从同一固定地址开始,紧接着的是和 C全局变量 相对应的数据位置。代码和数据区是直接按照可执行目标文件的内容初始化的
  • 堆: 代码和数据区在进程一开始运行时就被指定了大小,与此不同,当调用像malloc和free这样的C标准库函数时, 堆可以在运行时动态地扩展和收缩
  • 共享库: 大约在地址空间的中间部分是一块用来存放像 C标准库和数学库 这样的共享库的代码和数据的区域。
  • 栈: 位于用户虚拟地址空间顶部的是用户栈,编译器用它来实现函数调用。和堆样,用户栈在程序执行期间可以动态地扩展和收缩。特别地,每次我们调用一个函数时,栈就会增长;从一个函数返回时,栈就会收缩。
  • 内核虛拟内存: 地址空间顶部的区域是为内核保留的。不允许应用程序读写这个区域的内容或者直接调用内核代码定义的函数。相反,它们必须调用内核来执行这些操作。

文件

文件就是字节序列 。每个IO设备,包括磁盘、键盘、显示器,甚至网络,都可以看成是文件。

文件这个简单而精致的概念是非常强大的,因为它向应用程序提供了一个统一的视图,来看待系统中可能含有的所有各式各样的I/O设备。

系统之间利用网络通信

从单独一个系统看, 网络可视为一个I/O设备 。当系统从内存复制一串字节到网络适配器,数据经过网络到达另一台机器。

网络设备作为IO

请添加图片描述

并发和并行

数字计算机的整个历史中,有两个需求是驱动进步的持续动力:

  • 一个是我们想要计算机做得更多;
  • 另一个是我们想要计算机运行得更快。

当处理器能够同时做更多的事情时,这两个因素都会改进。我们用的

  • 术语并发( concurrency)是一个通用的概念,指一个同时具有多个活动的系统;

请添加图片描述

  • 术语并行( parallelism)指的是用并发来使一个系统运行得更快。并行可以在计算机系统的多个抽象层次上运用。
    请添加图片描述

(并行是物理上同时执行,并发是逻辑上等效同时执行)

线程级并发

使用线程,我们甚至能够在一个进程中执行多个控制流。这种并发执行只是 模拟 出来的,是通过使一台计算机在它正在执行的进程间快速切换来实现的。

由单操作系统内核控制的多处理器组成的系统时,我们就得到了一个多处理器系统。

典型多核处理器的组织结构,其中微处理器芯片有4个CPU核,每个核都有自己的L1和L2高速缓存,其中的L1高速缓存分为两个部分个保存最近取到的指令(icache),另一个存放数据(dcache)。这些核共享更高层次的高速缓存,以及到主存的接口。

多核处理器架构

请添加图片描述

超线程,是一项允许一个CPU执行多个控制流的技术。它涉及CPU某些硬件有多个备份,比如程序计数器和寄存器文件,而其他的硬件部分只有一份,比如执行浮点算术运算的单元。

常规的处理器需要大约20000个时钟周期做不同线程间的转换,而超线程的处理器可以在单个周期的基础上决定要执行哪一个线程。这使得CPU能够更好地利用它的处理资源。
比如,假设一个线程必须等到某些数据被装载到高速缓存中,那CPU就可以继续去执行另一个线程。

(举例来说,Intel Core i7处理器可以让每个核执行两个线程,所以一个4核的系统实际上可以并行地执行8个线程)

指令级并行

同时执行多条指令 的属性称为指令级并行。

其实每条指令从开始到结束需要长得多的时间,大约20个或者更多周期,但是处理器使用了非常多的聪明技巧来同时处理多达100条指令。

在流水线中,将执行一条指令所需要的活动划分成不同的步骤,将处理器的硬件组织成一系列的阶段,每个阶段执行一个步骤。这些阶段可以并行地操作,用来处理不同指令的不同部分。

如果处理器可以达到比一个周期一条指令更快的执行速率,就称之为超标量( superscalar)处理器。大多数现代处理器都支持超标量操作。

单指令、多数据并行

许多现代处理器拥有特殊的硬件,允许一条指令产生多个可以并行执行的操作,这种方式称为单指令、多数据,即SIMD并行。

文章来源:https://blog.csdn.net/qq_44814825/article/details/135020529
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。