下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922

浅谈C语言中的位域

作者:课课家     来源: http://www.kokojia.com点击数:2269发布时间: 2019-03-01 17:07:14

标签: 编程语言C语言位域

大神带你学编程,欢迎选课

  在学习C语言结构体的过程中我们必定会接触到的一环便是C语言中的位域。按照字面的意思想必大家都会理解为是某个位置的某个数值段。那么真正的意思到底是不是这样呢?下面课课家笔者就为大家简单介绍C语言中的位域的概念。

浅谈C语言中的位域_编程语言_C语言_位域_课课家

  我们知道有些数据在存储时并不需要占用一个完整的字节,只需要占用一个或几个二进制位就可以了。简单点来说比如开关只有通电和断电两种状态,我们通过用一个二进位0和1表示就可以了。正是基于这种考虑,C语言又提供了一种叫做位域的数据结构。在结构体定义时,我们可以指定某个成员变量所占用的二进制位数(Bit),这就是位域。具体大家可以观察下面的代码例子:

  structbs{

  unsignedm;

  unsignedn:4;

  unsignedcharch:6;

  }

  :后面的数字用来限定成员变量占用的位数。成员m没有限制,根据数据类型即可推算出它占用4个字节(Byte)的内存。成员n、ch被:后面的数字限制,不能再根据数据类型计算长度,它们分别占用4、6位(Bit)的内存。n、ch的取值范围非常有限,数据稍微大些就会发生溢出,具体大家可以观察下面的代码例子:

  #include<stdio.h>

  intmain(){

  structbs{

  unsignedm;

  unsignedn:4;

  unsignedcharch:6;

  }a={0xad,0xE,'$'};

  //第一次输出

  printf("%#x,%#x,%c\\n",a.m,a.n,a.ch);

  //更改值后再次输出

  a.m=0xb8901c;

  a.n=0x2d;

  a.ch='z';

  printf("%#x,%#x,%c\\n",a.m,a.n,a.ch);

  return0;

  }

  输出结果:

  0xad,0xe,$

  0xb8901c,0xd,:

  对于n和ch,第一次输出的数据是完整的,第二次输出的数据是残缺的。第一次输出时,n、ch的值分别是0xE、0x24('$'对应的ASCII码为0x24),换算成二进制是1110、100100,都没有超出限定的位数,能够正常输出。第二次输出时,n、ch的值变为0x2d、0x7a('z'对应的ASCII码为0x7a),换算成二进制分别是101101、1111010,都超出了限定的位数。超出部分被直接截去,剩下1101、111010,换算成十六进制为0xd、0x3a(0x3a对应的字符是:)。

  C语言标准规定,位域的宽度不能超过它所依附的数据类型的长度。简单来说就是成员变量都是有类型的,这个类型限制了成员变量的最大长度,:后面的数字不能超过这个长度。比如上面的bs,n的类型是unsignedint,长度为4个字节,共计32位,那么n后面的数字就不能超过32;ch的类型是unsignedchar,长度为1个字节,共计8位,那么ch后面的数字就不能超过8。我们可以这样认为,位域技术就是在成员变量所占用的内存中选出一部分位宽来存储数据。

  C语言标准还规定,只有有限的几种数据类型可以用于位域。在ANSIC中,这几种数据类型是int、signedint和unsignedint(int默认就是signedint);到了C99,_Bool也被支持了。但编译器在具体实现时都进行了扩展,额外支持了char、signedchar、unsignedchar以及enum类型,所以上面的代码虽然不符合C语言标准,但它依然能够被编译器支持。

  ◎位域的存储

  C语言标准并没有规定位域的具体存储方式,不同的编译器有不同的实现,但它们都尽量压缩存储空间。位域的具体存储规则如下:

  ①当相邻成员的类型相同时,如果它们的位宽之和小于类型的sizeof大小,那么后面的成员紧邻前一个成员存储,直到不能容纳为止;如果它们的位宽之和大于类型的sizeof大小,那么后面的成员将从新的存储单元开始,其偏移量为类型大小的整数倍。下面笔者以位域bs为例:

  #include<stdio.h>

  intmain(){

  structbs{

  unsignedm:6;

  unsignedn:12;

  unsignedp:4;

  };

  printf("%d\\n",sizeof(structbs));

  return0;

  }

  输出结果:

  4

  m、n、p的类型都是unsignedint,sizeof的结果为4个字节(Byte),也就是32个位(Bit)。由于m、n、p的位宽之和为6+12+4=22,小于32,所以它们会挨着存储,中间没有缝隙。sizeof(structbs)的大小之所以为4,而不是3,是因为要将内存对齐到4个字节,以便提高存取效率。如果将成员m的位宽改为22,那么输出结果将会是8,因为22+12=34,大于32,所以n会从新的位置开始存储,相对m的偏移量是sizeof(unsignedint),也即4个字节。如果再将成员p的位宽也改为22,那么输出结果将会是12,三个成员都不会挨着存储。

  ②当相邻成员的类型不同时,不同的编译器有不同的实现方案,GCC会压缩存储,而VC/VS不会。具体大家可以观察下面的位域bs:

  #include<stdio.h>

  intmain(){

  structbs{

  unsignedm:12;

  unsignedcharch:4;

  unsignedp:4;

  };

  printf("%d\\n",sizeof(structbs));

  return0;

  }

  在GCC下的输出结果为4,三个成员挨着存储;在VC/VS下的输出结果为12,三个成员按照各自的类型存储(与不指定位宽时的存储方式相同)。m、ch、p的长度分别是4、1、4个字节,共计占用9个字节内存。

  ③若是成员之间穿插着非位域成员,那么就不会进行压缩。比如对于下面的bs:

  structbs{

  unsignedm:12;

  unsignedch;

  unsignedp:4;

  };

  在各个编译器下sizeof的结果都是12。

  通过上面的分析,我们发现位域成员往往不占用完整的字节,有时候也不处于字节的开头位置,因此使用和获取位域成员的地址是没有意义的,而且C语言也禁止这样做。需要我们注意的地方是地址是字节(Byte)的编号,而不是位(Bit)的编号。

  ◎无名位域

  位域成员可以没有名称,只给出数据类型和位宽,具体代码例子如下所示:

  structbs{

  intm:12;

  int:20;//该位域成员不能使用

  intn:4;

  };

  通常情况下无名位域一般用来作填充或者调整成员位置。由于没有名称,所以无名位域不能使用。在上面的代码例子中,若是没有位宽为20的无名成员,m、n将会挨着存储,sizeof(structbs)的结果为4;若有了这20位作为填充,m、n将分开存储,sizeof(structbs)的结果为8。

  本次浅谈C语言中的位域的讲解到此暂告一段落,如果以后有什么内容进行补充或者修改的话,笔者会在此继续进行补充或者修改的工作,同时也欢迎大家对本次的讲解提出自己的建议和补充。最后笔者希望本次的讲解对大家学习C语言能够起到一定的帮助作用!

赞(0)
踩(1)
分享到:
华为认证网络工程师 HCIE直播课视频教程