一. 常用命令
1. 编辑相关
①. awk
- NF:字段总数
- NR:第几行数据
- FS:分隔字符
②. sed
- -n
- -i 直接修改
- 4a:在第四行后添加
- 4i:在第四行前插入
- 1,5c sting:用 sting 替换 1 到 5 行的内容
- s/ 要被替换的字符串 / 新的字符串 /g
③. sort
- -t
- -nr sort |uniq -c |sort -nr
④. tr
- -d:删除
- [a-z] [A Z]:替换
2. 查看负载相关
①. top
-
load average cpu 里面的几个数字代表什么意思,怎么衡量,为什么
- load average 50 算高还是低?怎么计算的?
- 系统在 1,5,15 分钟的平均工作负载,进程队列中的平均进程数量。
- 一般不能大于系统逻辑 CPU 的个数
- /proc/loadavg
- 关键参数
- Task:僵尸进程的数量
- CPU:%wa IOwait
- Mem:
- Swap:要尽可能的少用
②. uptime
③. free:读取自文件:/proc/meminfo
- buffer 存放要写回到磁盘的数据
- cache 存放从磁盘上读出的数据
- -buffers/cache,表示一个应用程序认为系统被用掉多少内存;被程序实实在在占用的内存
- +buffers/cache,表示一个应用程序认为系统还有多少内存;可用的内存数。
④. vmstat:动态的了解系统资源运行
- -d:磁盘
- r:等待运行的进程数,r<5 表示状态好
- b:处于非中断睡眠状态的进程数,b≈0 表示状态好
- id:CPU 闲置时间
- 如果 r 经常大于 3 或 4,且 id 经常小于 50,表示 CPU 负荷很重
⑤. ps
- aux
- -l
⑥. lsof:列出被进程所打开的文件名
⑦. pwd
首先获取当前目录的 i 节点编号,但是并不能知道当前目录的名称,我们切换到其的父目录,在里面寻找当前 i 节点编号对应的文件名即可。终止条件是 ”.” 和 ”..” 指向同一个 i 节点,我们可以以此判断是否发到达了根目录
⑧. pgrep
3. 查找
①. grep
- -n
- -v
- -A
- -B
②. find
-
时间:
- 4:4 天前的那一天
- +4:大于等于 5 天之前
- -4:小于等于 4 天之内
- -exec 命令 {} ;
4. 磁盘
①. du
- -sh /
- du -cks * | sort -rn | head -n 10
- 评估目录所占容量,通过将指定文件系统中所有的目录、符号链接和文件使用的块数累加得到该文件系统使用的总块数
- du 命令是用户级的程序,它不考虑 Meta Data,而 df 命令则查看文件系统的磁盘分配图并考虑 Meta Data。
- du 以文件名、目录名为依据计算空间使用的,而 df 是以硬盘块使用情况来计算空间使用的。
- -sm 以 M 为单位列出文件容量
②. df
- 列出所有文件系统的整体磁盘使用量,通过读取块位图获取
- dumpe2fs
5. 网络配置命令
①. netstat
- -tlnp
②. ss
③. ping
④. traceroute
⑤. tcpdump
- tcpdump ip host
- tcpdump tcp port 25 and host 210.27.48.1
⑥. nslookup
⑦. dig
⑧. nmap
- tcp 端口扫描:-sT、-sP
-
TCP SYN 端口扫描:-sS
- nmap -sS 192.168.137.10 -255 -p 20,21,53-110,30000 –v
- UDP 端口扫描:-sU
- TCP ACK 扫描:-sA
二. Raid 阵列
1. RAID 的各个级别及区别
- RAID0:数据切片,分盘存储,性能最佳,风险最高
- RAID1:镜像模式,完整备份,写性能差,利用率低
- RAID10/RAID01
- RAID5:循环写入,同位检查码,性能与备份的均衡考虑
- RAID6:牺牲两块磁盘的容量做同位检查码
三. 系统调优参数
1. /etc/sysctl.conf 这个文件有没有改过?列举一些常见的 kernel 参数和作用。
①. time_wait 相关
- net.ipv4.tcp_tw_reuse = 1:是否允许新的 TCP 连接重新应用处于 time_wait 状态的 socket
- net.ipv4.tcp_tw_recycle = 1:加速 time_wait socket 回收
- net.ipv4.tcp_max_tw_buckets:time_wait 套接字的最大数量,把 time_wait 所占用内存控制在一定范围
②. syn 攻击相关
- net.inet.tcp.syncookies = 1:开启 syncookies 功能,防止 dos 攻击,syn 攻击
- net.ipv4.tcp_synack_retries = 2:内核放弃连接之前发送 SYN+ACK 包的数量
- net.ipv4.tcp_syn_retries = 2:新连接,内核放弃连接之前发送 SYN 包的数量
- net.ipv4.tcp_max_syn_backlog = 65536:表示 SYN 队列的长度
③. 缓冲区
- net.core.rmem_default:接收套接字缓冲区大小缺省值
- net.core.wmem_default:发送套接字缓冲区大小缺省值
- net.core.rmem_max:最大 TCP 接收缓冲区大小
- net.core.wmem_max:最大 TCP 发送缓冲区大小
④. kern.ipc.somaxconn:并发连接数
⑤. net.core.netdev_max_backlog = 32768:进入包的最大设备队列
四. 常见服务占用端口
- 80 8080 443
- 20 21 22 23 25 53
- 135(RPC)137(NetBIOS/UDP)138(UDP)139(samba)
- 161 SNMP
- 1080 Socket 代理
- 3306 11211 8080 jboss tomcat 50170
五. 文件系统
1.(ext4)性能 安全性
2. 启动扇区 块组 超级块 inode 表格 block 块对照表 (Bitmap) inode 对照表
①. 超级块
- 记录整个文件系统的整体信息,包括 inode(记录文件的权限与属性)与 block(记录数据)总量、使用量、剩余量
②. inode 表格 = inode + 存储 block 号码的 block(ls - l 命令)
③. inode 本身不记录文件名,文件名的记录在目录的 block 中
④. 创建新的目录时,新目录的链接数是 2(产生了 /.),上层目录的链接数会增加 1(产生了 /..)
3. 读写文件会遇到的问题
①. 文件数据离散:文件很大、经常变动、无法写在连续的块中、机械臂移动大
- 复制出来、格式化、复制回去
②. 创建文件流程
- 查询目录权限
- 在日志记录块中记录准备写入的信息
- 查询 inode bitmap,向 inode 中写入权限和属性
- 查询 block bitmap,向 block 写入数据
- 更新 inode 指向 block
- 更新 inode bitmap 和 block bitmap 的状态,更新 superblock 内容
- 在日志记录块中完成文件记录
③. 读文件失败
- 块数据损坏
- inode 损坏:记录数据块号码的块损坏
④. 写文件失败
- 文件描述符不够
- 存储空间不够了(块不够、inode 不够)
4. hdfs 的一个 block 多大,为什么 128M?
①. 不能远小于 128M:减少硬盘寻道时间、减少 Namenode 内存消耗
②. 不能远大于 128M:
- Map 崩溃问题(数据块大,重新加载时间长)
- 预设时间间隔问题(从数据块的角度大概估算,数据块越大,时间越长)
- 问题分解问题:数据量大小和问题解决的复杂度成线性关系
- 约束 map 输出:map 之后的数据需要排序后再执行 reduce,大文件不利于归并排序的思想
5. ext4 文件系统的 block 多大?
- 4k
- HDFS 的块比磁盘块大,其目的是为了最小化寻址开销
6. 索引式文件系统:ext
7. 非索引式文件系统:FAT 碎片整理
8. cp/mv/rm 的区别(实现)
①. cp
- -a(pdr:连同文件属性一起、链接文件属性、递归)
- -u(新才复制)
- -l -s(复制为链接)
- -d 复制链接文件时,默认复制的是源文件,除非加 - d 参数,才会复制链接文件
②. 当目标文件存在时,cp 命令并不是先删除已经存在的目标文件,而是将原目标文件内容清空后再写入 。
③. mv 的主要功能就是检查初始文件和目标文件是否存在及是否有访问权限,之后执行 rename 系统调用,因而,当目标文件存在时,mv 的行为由 rename() 系统调用决定,即类似于删除文件后再重建一个同名文件 。
④. 删除文件名是指在原目录下不再含有此文件名,并不一定删除磁盘上文件的内容。只有在文件的链接数为 1,并且没有进程打开此文件的时候,unlink() 才会真正删除文件内容 。
9. 软硬连接(inode 这块,ln / ln -s)
①. 硬链接:一个 inode 节点对用不同的文件名
- 不创建新的 inode,每增加一个硬链接,inode 节点链接数加一
- rm 硬链接:删除的只是文件名,对应的数据块只有在 inode 节点链接数减少为 0 的时候才会被系统回收。
- 不能对目录创建硬链接,因为文件系统不能存在链接环,否则会导致文件便利操作的混乱(du,pwd 等命令的运作原理就是基于文件硬链接)
- 不能跨文件系统
- 不能对不存在的文件创建硬链接
②. 软链接:如果目标路径名较短则直接保存在 inode 中,如果较长则分配一个 block 存储
- 创建新的 inode,指向的数据块存放着源文件的路径
- 删除源文件,软链接失效
- 可以对目录 创建软连接,遍历操作会忽略目录的软链接
- 可以跨文件系统
- 可以对不存在的文件创建软链接
六. 开机启动过程
①. Mbr 与 gpt 的区别
②. BIOS、CMOS、MBR、Boot Loader、Grub2、Kernel、/sbin/init、/etc/init/.conf、/ect/inittab、/etc/rc.d/rc.sysinit、/etc/rc.d/rc.$runleave
③. 双系统
- 多重引导:MBR、各分区的启动扇区 boot sector
七. Shell 常用脚本
①. 从日志文件里面筛选出符合要求的 ip 或者其他信息
- cat logname | sort | uniq -c | sort -nr | head -n 10
②. 正则表达式匹配 IP 地址
- [0-9]{1,3}.[0-9]{1,3}.[0-9]{1-3}.{1,3}
- ^((25[0-5]|2[0-4]d|[1]{1}d{1}d{1}|[1-9]{1}d{1}|d{1})($|(?!\.$).)){4}$
- ((25[0-5]|2[0-4]d|((1d{2})|([1-9]?d))).){3}(25[0-5]|2[0-4]d|((1d{2})|([1-9]?d)))
③. 20G 大小的文件,内容都是 IP,有重复的,如何找出这里面的 top N?
- 分表、哈希
④. 统计 nginx 日志出现次数最多的 ip
awk ‘{print $1}’ urllogfile | sort | uniq -c | sort -nr -k1 | head -n 10
⑤. 查看 Web 服务器(Nginx Apache)的并发请求数及其 TCP 连接状态
- netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’
八. Swap
1. swap 分区是怎么设置的?
- 使用物理分区构建 swap:fdisk 分区(改分区类型 ID)、mkswap 格式化、swapon 启动、free 查看
- 使用文件构建 swap:dd、mkswap、swapon、free
2. 为什么要有 swap 分区,工作原理是什么?为什么云服务器上的 swap 没有开启?
- 内存不足时,将内存中暂时不使用的程序与数据放置到 swap 中
- 服务器休眠时,运行中的程序状态会被记录到 swap
- 某些程序运行时会利用 swap 的特性
九. Iptables
1. filter
- INPUT
- OUTPUT
- FORWARD
2. nat
- PREROUTING
- OUTPUT
- POSTROUTING
3. mangle
- PREROUTING
- INPUT
- FORWERD
- POSTROUTING
- OUTPUT
4. 语法
- iptables [-t 表名] <-A|I|D|R> 链名 -i| o 网卡名称 -p 协议类型 - s 源 IP –sport 源端口号 -d 目标 IP 地址 –dport 目标端口号 <-j 动作 >
- iptables -P INPUT DROP
- iptables -A INPUT -m state –state NEW -j DROP
- iptables -A INPUT -m state –state ESTABLISHED,RELATED -j ACCEPT
- iptables -A INPUT -p tcp -dport 445 -j ACCEPT
- iptables -A INPUT -p tcp -m multiport –dports 22,80 -j ACCEPT
- 只允许某个 IP 上网
十. Linux 面试题实战
- Linux 中主要有哪几种内核锁?
- Linux 中的用户模式和内核模式是什么含意?
- 怎样申请大块内核内存?
- 用户进程间通信主要哪几种方式?
- 通过伙伴系统申请内核内存的函数有哪些?
- Linux 虚拟文件系统的关键数据结构有哪些?(至少写出四个)
- 对文件或设备的操作函数保存在那个数据结构中?.
- Linux 中的文件包括哪些?
- 创建进程的系统调用有那些?
- 调用 schedule() 进行进程切换的方式有几种?
- Linux 调度程序是根据进程的动态优先级还是静态优先级来调度进程的?
写在最后
限于篇幅,面试题的答案就不在文中展示了,Linux 面试专题我已经整理好了一份完整的 PDF 文件,需要的朋友请点击下方传送门,免费领取!
传送门
即可免费领取,以下是部分面试题截图: