C语言深入分析整形数据存储-C/C++开发

目录数据类型类型的分类整形在内存中的存储原码、反码、补码大小端介绍char类型数据的取值范围练习练习1练习2练习3练习4练习5练习6练习7数据类型C语言中存在着数据类型，我们或多或少都见到...

数据类型

C语言中存在着数据类型，我们或多或少都见到过。

char //字符数据类型 - 1个字节

short //短整型 - 2个字节

int //整形 - 4个字节

long //长整型 - 4/8个字节

long long //更长的整形 - 8个字节

float //单精度浮点数 - 4个字节

double //双精度浮点数 - 8个字节

小思考：C语言有没有字符串类型？

C语言有字符串，表示为"字符串内容"的形式，但不存在字符串类型。

类型存在的意义是什么？

使用这个类型开辟内存空间的大小(大小决定使用范围)。
如何看待内存空间的视角(例如指针解引用和指针运算)。

类型的分类

整形

char
   unsigned char
   signed char
//虽然是字符类型，但是字符类型存储的时候，存储的字符的ascii码值，ascii码值是整数
short
   unsigned short [int]
   signed short [int]
int
   unsigned int
   signed int
long
   unsigned long [int]
   signed long [int]

unsigned 和 signed

unsigned：无符号，只有正数的数据可以存放在无符号的变量中。
signed：有符号，有正负的数据可以存放在有符号的变量中。

Tips：

对于short，int，long，long long数据在进行定义时，默认都为signed。而对于char类型则不确定，C语言标准没有规定char是否有符号，取决于编译器，所以char实际上可以归为3类，char(不确定)，signed char(有符号)，unsigned char(无符号)。在vs2022中，char默认为signed char。

浮点型

float//单精度浮点数 - 4个字节
double//双精度浮点数 - 8个字节

构造类型

//例：int arr[10]
数组类型 int [10]
//数组只要个数和元素类型发生变化，类型都会发生变化
结构体类型 struct
枚举类型 enum
联合类型 union

指针类型

int *pi;//整形指针
char *pc;//字符指针
float* pf;//单精度浮点数指针
void* pv;//空类型指针

空类型

void 表示空类型（无类型）

通常应用于函数的返回类型、函数的参数、指针类型。

例：

void test1()//无返回值
{}
void test2(void)//函数接收参数，参数部分加void
{}
int main()
{
	void* p = NULL;
	//void*可以存放任何类型的指针
	int a = 10;
	void* p1 = &a;//没问题
	p1++;//err，不知道类型，无法决定跳过几个字节
	*p1;//err，不知道类型，无法决定解引用的权限
	//一般用来临时存放地址，用的时候拿走或者强转使用
	return 0;
}

整形在内存中的存储

一个整形变量的创建需要再内存中开辟四个字节，那整形在内存中是如何存储的？

比如：

int a = 10;

int b = -10;

在了解整形在内存中如何存储之前我们需要了解以下概念：

原码、反码、补码

计算机中的整数有三种2进制表示方法，即原码、反码、补码。

三种表示方法均有符号位和数值位两部分，二进制序列的第一位为符号位，其他均为数值位，符号位数值位均由0，1组成。

原码：

直接将数值按照正负的形式翻译成二进制就可以。

反码：

原码的符号位不便，其他位依次按位取反就可以得到。

补码：

反码 + 1得到补码。

注意：

正整数的原码、反码、补码都相同。
负整数的三种表示方式各不相同，需要通过计算得到。

样例：

int a = 10;//整形值
//0000 0000 0000 0000 0000 0000 0000 1010 a的原、反、补
//转化为16进制：0X0000000a
int b = -10;//整形值
//1000 0000 0000 0000 0000 0000 0000 1010 b的原码
//1111 1111 1111 1111 1111 1111 1111 0101 b的反码
//1111 1111 1111 1111 1111 1111 1111 0110 b的补码
//转化为16进制：0Xfffffff6

那么对于整形而言，在内存中存储的是什么呢？

让我们启动调试，查看内存:

我们可以看到对于a和b分别存储的是补码，这是为什么？

在计算机系统中，数值一律用补码来表示和存储。原因在于，使用补码，可以将符号位和数值域统一处理；

同时，加法和减法也可以统一处理（CPU只有加法器）此外，补码与原码相互转换，其运算过程是相同的，不需要额外的硬件电路。

举个简单的例子，例如计算机在计算a - b的时候，会转化成a + (-b)的形式进行计算，而这时使用原码来进行计算，是无法计算出结果的，但使用补码就可以计算出结果。

但是对于数据在内存中存储的方式很奇怪，它是倒着存储的，这是为什么？让我们了解一下大小端。

大小端介绍

什么是大端小端：

大端字节序存储：把一个数据低位字节处的数据存放在高地址处，把高位字节处的数据放在低地址处

小端字节序存储：把一个数据低位字节处的数据存放在低地址处，把高位字节处的数据放在高地址处。

例如：

0x11223344

为什么会有大端和小端：

为什么会有大小端模式之分呢？这是因为在计算机系统中，我们是以字节为单位的，每个地址单元都对应着一个字节，一个字节为8 bit。但是在C语言中除了8 bit的char之外，还有16 bit的short型，32 bit的long型（要看具体的编译器），另外，对于位数大于8位的处理器，例如16位或者32位的处理器，由于寄存器宽度大于一个字节，那么必然存在着一个如何将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。

例如：一个16bit 的short 型x ，在内存中的地址为0x0010 ， x 的值为0x1122 ，那么0x11 为高字节， 0x22 为低字节。对于大端模式，就将0x11 放在低地址中，即0x0010 中， 0x22 放在高地址中，即0x0011 中。小端模式，刚好相反。我们常用的X86 结构是小端模式，而KEIL C51 则为大端模式。很多的ARM，DSP都为小端模式。有些ARM处理器还可以由硬件来选择是大端模式还是小端模式。

其实数据在内存中无论是大小端存储或者乱序存储都可以，大小端字节序存储也是为了让存储方式变得更简单，如果乱序存储的话在还原数据时会更加复杂。

注：大小端存储时以字节为单元，16进制的两位为一个字节，为一个单元，按照大小端存储规律存储，并不会将16进制的每一位都倒过来存储。例如0x123456按照小端存储就为56 34 12 00，而不是65 43 21 00。

所以说大小端字节序存储，就是以字节为单位的存储顺序。

一道笔试题

请简述大端字节序和小端字节序的概念，设计一个小程序来判断当前机器的字节序。

思路：数据在内存中是通过补码的形式储存的，判断大端还是小端，例如数字1，我们只需要观察它的第一个字节为0或1，就可以判断字节序。而数据类型决定了指针解引用时看待内存的视角，所以我们可以用char*指针来对元素第一个字节的内容进行解引用。

int check_sys()
{
	int a = 1;
	//二进制：0000 0000 0000 0000 0000 0000 0000 0001
	//十六进制：0x00000001
	char* p = (char*)&a;//char*指针解引用为一个字节
	if (*p == 1)
		return 1;
	else
		return 0;
}
//简化
//int check_sys()
//{
//	int a = 1;
//	return *(char*)&a;//1的大端或小端存储，第一位为00或者01，取出的值正好和main函数中接收的值相同，直接返回
/

目录

数据类型

类型的分类

整形在内存中的存储

原码、反码、补码

大小端介绍

基础教程推荐