摘要: C 语言作为编程的入门语言,学习者如何疾速把握其外围知识点,面对茫茫书海,仿佛有点迷茫。为了让各位疾速地把握 C 语言的常识内容,在这里对相干的知识点进行了演绎。
引言
笔者有十余年的 C ++ 开发教训,相比而言,我的 C 教训只有一两年,C 比较简单,简略到《The C Programming Language》(C 程序设计语言)只有区区的 200 多页,相比上千页的 C ++ 大部头,不得不说真的很人性化了。
C 语言精简的语法集和规范库,让咱们能够把精力集中到设计等真正重要的事件上来,而不是迷失在语法的陆地里,这对于初学者尤其重要。尽管 C 语言有形象有余的毛病,但我更喜爱它的精美,只须要花大量的工夫,钻研分明它每一个知识点,看任何 C 源码就不会存在语法上的阻碍,大家须要建设的常识共识足够少,少即是多,少好于多。
我教过 6 集体编程,教过 HTML,教过 JAVA,也教过 C ++。最近,我在教我小孩编程,他只有十岁,很多人倡议我抉择 Python,但我最终抉择了 C 语言,因为 C 语言简略且弱小,当初看来,如同是个不错的抉择。
类型
C 是强类型语言,有 short、long、int、char、float、double 等 build-in 数据类型,类型是贯通 c 语言整个课程的外围概念。
struct、union、enum 属于 c 的构造类型,用于自定义类型,裁减类型零碎。
变量
变量用来保留数据,数据是操作的对象,变量的变字意味着它能够在运行时被批改。
变量由类型名 + 变量名决定,定义变量须要为变量分配内存,能够在定义变量的同时做初始化。
int i;
float f1 = 0.5, f2= 0.8;
常量
const int i = 100;
const char* p = “hello world”;
运行中恒定、不可变,编译期便可确定。
数组
光有简略变量显然不够,咱们须要数组,它模仿事实中雷同类型的多个元素,这些对象是严密相邻的,通过数组名 + 地位索引便能拜访每个元素。
二维、三维、高纬数组实质上还是线性的,二维数组通过模仿行列给人立体的感觉,理论存储上还是间断内存的形式。
数组是动态的,在定义的时候,数组的长度就曾经确认,运行中无奈伸缩,所以有时候咱们不得不为应酬裁减多调配一些空间。数组元素不论用多用少,它都在哪里,有时候,咱们会用一个 int n 去界定数组理论被应用的元素个数。
函数
函数封装行为,是模块化的最小单元,函数使得逻辑复用变得可能。
C 语言是过程式的,事实世界都能够封装为一个个过程(函数),通过过程串联和编排模仿世界。
用 C 语言编程,行为和数据是拆散的。调用函数的时候,调用者通过参数向函数传递信息,函数通过返回值向调用者反馈后果。
函数最好是无副作用的,函数内应该尽量避免批改全局变量或者动态局部变量,更好的形式是通过参数传递进来,这样的函数只是逻辑的盒子,它满足线程平安的要求。
有了变量和函数,就能够编写简略的程序了。
管制语句
- 分支:if、else、else if、switch case、?:
- 循环:while、do while、for
- break、continue、goto、default
构造体
build-in 数据类型不足以描述事实世界,或者用 build-in 类型形容不够间接,构造体用来模仿复合类型,它赋予了咱们裁减类型零碎的能力,咱们把类型组合到一起构建更简单的类型,而每个被组合的成分就叫成员变量。
构造体内的成分,对象通过点(.)运算符,指针通过箭头(->)拜访成员。
指针
C 语言的灵魂是指针,指针带来弹性,指针的实质是地址。
须要辨别指针和指针指向的对象,多个指针变量可指向同一个对象,一个指针不能同时指向多个对象。
指针相干的基本操作包含:赋值(批改指针指向),解援用(拜访指针指向的对象),取地址(&variable),指针反对加减运算。
因为指针变量要能笼罩整个内存空间,所以指针变量的长度等于字长,32 位零碎下 32 位 4 字节,64 位零碎下 64 位 8 字节。
指针的含意远比上述丰盛,指针跟数组联合便有了指针数组(int* p[n])和数组指针(int (*p)[n]),指针跟函数联合便有了函数指针(ret_type (*pf)(param list)),指针跟 const 联合便有了 const char*/char* const/const char* const,还有指向指针的指针(int **p)。
既能够定义指向 build-in 数据类型的指针,也能够定义指向 struct 的指针,void* 示意通用(万能)指针,它不能被解援用,也不能做指针算术运算。
函数指针与回调(callback)
c source code 被编译链接后,函数被转换到可执行程序文件的 text 节,过程启动的时候,会把 text 节的内容装载到过程的代码段,代码段是 c 过程内存空间的一部分,所以任何 c 函数都会占一块内存空间,函数指针就是指向函数在代码段的第一行汇编指令,函数调用就会跳转到函数的第一个指令处执行。
函数指针常常被用来作为回调(callback),c 语言也会用蕴含函数指针成员的构造体模仿 OOP,实质上是把 C ++ 编译器做的事件,转给程序员来做(C++ 为蕴含虚函数的类构建虚函数表,为蕴含虚函数的类对象附加虚函数表的指针)。
字符串
char* 是一类非凡的指针,它被称为 c 格调字符串,因为它总是以‘\0’作为结尾的标识,所以要标识一个字符串,有一个 char* 指针就够了,字符串的长度被 0 隐式指出,跟字符串相干的 STD C API 大多以 str 打头,比方 strlen/strcpy/strcat/strcmp/strtok。
内存和内存治理
指针提供了 c 语言间接操作底层内存的能力,c 程序辨别栈内存和堆内存,栈内存是函数内的局部变量,它随程序执行而动静伸缩,所以不要返回长期变量的指针,栈内存容量无限(8/16M),所以咱们要防止在函数内创立过大的局部变量,要警觉递归爆栈。
堆内存也叫动态内存,它由一个叫动态内存配置器的规范库组件治理,glibc 的默认动态内存配置器叫 ptmalloc,初始版本有性能问题,但前面用线程公有解决了竞争改善了性能。动态内存配置器是介于 kernel 与应用层的一个档次,从内核视角看 ptmalloc 是应用程序,从应用层来看 ptmalloc 又是零碎库。malloc 跟 free 必须配对,这是程序员的职责,动态分配的内存失落援用就会导致内存透露,指向已开释的内存块俗称野(悬垂)指针。
预处理
从 c source file 到可执行程序须要通过预处理 - 编译 - 汇编 - 链接多个阶段,预处理阶段做替换、打消和裁减,预处理语句以 #打头。
宏定义,#define,宏定义能够用 \ 做行连贯,#用来产生字符串,## 用来拼接,宏定义的时候要留神加 () 防止操作符优先级烦扰,能够用 do while(0)来把定义作为独自语句,#undef 是 define 的反操作。
if #ifdef #ifndef #else #elif #endif 用来条件编译,为了防止头文件反复蕴含,常常用 #ifndef #define #endif。
include 用来做头文件蕴含;#pragma 用来做行为管制;#error 用来在编译的时候输入错误信息。
__FILE__、__LINE__、_DATE_、_TIME_、_STDC_等规范预约义宏能够被用来做一些 debug 用处。
typedef 用来定义类型别名。比方 typedef int money_t;money_t 比 int 更有含意。
typedef 也能用来为构造体取别名,有时候会这样写:
typedef struct
{
int a;
int b;
} xyz_t;
这样在定义构造体变量的时候就能够少敲几下键盘。
typedef 也能够用来重定义函数指针类型,比方 typedef void (*PF) (int a, int b); PF 是函数指针类型,而非函数指针变量。
枚举
枚举能减少代码可读性和可维护性,枚举实质上是 int,只是为了更有含意,将无限取值的几个 int 值放在一组,比方定义性别:enum sex {male = 1, female};
能够在定义的时候赋值,比方 male=1,前面的值顺次递增 1,如果不赋值则从 0 开始。
联合体(union)
构造体和联合体(共用体)的区别在于:构造体的各个成员会占用不同的内存,相互之间没有影响;而共用体的所有成员占用同一段内存,批改一个成员会影响其余所有成员。
union u_data
{
int n;
char ch;
double f;
};
其实实质上,联合体就是对一块内存的多种解释,大小按最大的来。
位域(bitfield)
struct SNField
{
unsigned char seq:7 ; // frame sequnce
unsigned char startbit:1 ; // indicate if it's starting frame 1 for yes.
};
节俭空间,在面向底层的编码,或者编写解决网络等程序时候用的比拟多,留神这个语法特色是跟机器架构相干的。
位操作
- 位与 &
- 位或 |
- 位取反 ~
- 位异或 ^
- 位移 << >>
static、extern、register、volatile、sizeof
- static 润饰全局函数,示意模块内(编译单元)内可用,不须要导出全局符号。
- static 润饰局部变量,象征超过函数调用的生命周期,不存储在栈上,只会被初始化 1 次。
- extern 申明内部变量。
- register,寄存器变量,倡议编译器将变量放在寄存器里。
- volatile,通知编译器不要做优化,每次从内存读取,不做寄存器优化。
- sizeof 求大小,能够作用于变量,类型,表达式
可变参数
void simple_printf(const char* fmt, …)
va_list、va_start、va_arg、va_end
C 的高级感
- 泛型:linux 内核链表,通过 offset 和内嵌 node,写出泛型链表,参考:https://www.cnblogs.com/wangz…
- OOP:通过定义带函数指针成员变量的构造体,在运行中,为构造体对象设置上函数指针,模仿运行时绑定,实现相似 OOP 多态的感觉。
GNU C 扩大
GNU C 扩大不是规范 C,倡议以符合标准 C 的形式编写 C 代码,但如果你浏览 linux kernel code,你会发现有很多乏味看不懂的语法,它来自 GNU C 扩大,它的确也带来了一些便利性。
比方构造体成员能够不按定义程序初始化:
struct test_t {int a; int b;};
struct test_t t1 = {.b = 1, .a = 2};
比方能够通过指定索引初始化数组:
int a[5] = {[2] 5,[4] 9};
或 int a[5] = {[2] = 4, [4] = 9 };
相当于 int a[5] = {0, 0, 4, 0, 9};
或者 int a[100] = {[0 ... 9] = 1, [10 ... 98] = 2, 3};
比方 0 长度数组
struct foo
{
int i;
char a[0];
};
比方用变量作为数组长度
void f(int n)
{char a[n];
...
}
比方 case 范畴,case ‘A’ … ‘Z’ case 1 … 10
比方表达式扩大({…}),比方三元运算符扩大 …
点击关注,第一工夫理解华为云陈腐技术~