作者李传成
中国PG分会认证专家,瀚高软件资深内核研发工程师
https://zhuanlan.zhihu.com/p/...
PostgreSQL中的表会有一个RelFileNode值指定这个表在磁盘上的文件名(内部表、分区表除外)。个别状况下在pg_class表的relfilenode字段能够查出这个值,然而有一些特定表在relfilenode字段的查问后果是0,这个博客中将会探索这些非凡表relfilenode的内核解决。
失常表的Relfilenode
当咱们创立一张一般表时,在pg_class零碎表里能够查问出其relfilenode,能够看出在表刚刚创立时其oid和relfilenode都是16808,在磁盘上也能够查问到16808这个文件。事实上,这个文件存储了咱们向表t2插入的数据。
postgres**=#** **create** **table** t2(i int);**CREATE** **TABLE**postgres**=#** **select** oid,relname,relfilenode **from** pg_class **where** relname **=** 't2'; oid **|** relname **|** relfilenode_-------+---------+-------------_ 16808 **|** t2 **|** 16808(1 **row**)postgres**=#** qmovead**@**movead**-**PC:**/**h2**/**pgpgpg**/**bin$ ll ..**/data/**base**/**12835**/**16808 **-**rw_-------+ 1 movead movead 0 12月 31 17:11 ../data/base/12835/16808_movead**@**movead**-**PC:**/**h2**/**pgpgpg**/**bin$
在咱们对一张表执行truncate,vacuum full等操作后,会重写这个表的数据,会引发这个表relfilenode值的变更。如下测试能够看出truncate之后,t2表的relfilenode从16808变为了16811.
postgres**=#** **truncate** t2;**TRUNCATE** **TABLE**postgres**=#** **select** oid,relname,relfilenode **from** pg_class **where** relname **=** 't2'; oid **|** relname **|** relfilenode_-------+---------+-------------_ 16808 **|** t2 **|** 16811(1 **row**)postgres**=#** **checkpoint**;**CHECKPOINT**postgres**=#** qmovead**@**movead**-**PC:**/**h2**/**pgpgpg**/**bin$ ll ..**/data/**base**/**12835**/**16808ls: 无法访问'../data/base/12835/16808': 没有那个文件或目录movead**@**movead**-**PC:**/**h2**/**pgpgpg**/**bin$ ll ..**/data/**base**/**12835**/**16811**-**rw_-------+ 1 movead movead 0 12月 31 17:16 ../data/base/12835/16811_movead**@**movead**-**PC:**/**h2**/**pgpgpg**/**bin$
Nail表的Relfilenode
postgres**=#** **select** oid, relname, relfilenode,reltablespace**from** pg_class**where** relfilenode **=** 0 **and** relkind **=** 'r'**order** **by** reltablespace; oid **|** relname **|** relfilenode **|** reltablespace_------+-----------------------+-------------+---------------_ 1247 **|** pg_type **|** 0 **|** 0 1255 **|** pg_proc **|** 0 **|** 0 1249 **|** pg_attribute **|** 0 **|** 0 1259 **|** pg_class **|** 0 **|** 0 3592 **|** pg_shseclabel **|** 0 **|** 1664 1262 **|** pg_database **|** 0 **|** 1664 2964 **|** pg_db_role_setting **|** 0 **|** 1664 1213 **|** pg_tablespace **|** 0 **|** 1664 1261 **|** pg_auth_members **|** 0 **|** 1664 1214 **|** pg_shdepend **|** 0 **|** 1664 2396 **|** pg_shdescription **|** 0 **|** 1664 1260 **|** pg_authid **|** 0 **|** 1664 6000 **|** pg_replication_origin **|** 0 **|** 1664 6100 **|** pg_subscription **|** 0 **|** 1664(14 **rows**)postgres**=#**
上述查问能够看出,从pg_class零碎表中查问出的这些表的relfilenode为0。其中pg_type、pg_proc、pg_attribute、pg_class是非共享表,在内核中称他们为Nail表。残余的表是在pg_global表空间里的共享表。
pg_class表中relfilenode字段的意义是为了通知程序,某一张表在磁盘上存储的文件名。比方咱们查问t2表时,肯定会先到pg_class零碎表中获取其relfilenode,而后到磁盘找到这个文件,而后关上并扫描。可是如果咱们想查问pg_class零碎表在磁盘上的文件名时,应该去哪找到它的relfilenode?在PostgreSQL中提供了一组函数接口进行oid和relfilenode的转化。
postgres**=#** **select** pg_relation_filenode(1259); pg_relation_filenode_----------------------_ 16475(1 **row**)postgres**=#** **select** pg_filenode_relation(0,16475); pg_filenode_relation_----------------------_ pg_class(1 **row**)postgres**=#** **select** pg_filenode_relation(0,16475)::oid; pg_filenode_relation_----------------------_ 1259(1 **row**)postgres**=#**
通过pg_relation_filenode()能够将oid转化为relfilenode,
通过pg_filenode_relation能够将relfilenode转化为oid.
既然pg_class表中不存储oid和relfilenode的对应关系,那么PostgreSQL是怎么样保留这个映射关系的呢?
Nail表Relfilenode的存储机制
通过钻研发现,在数据目录里存在着pg_filenode.map文件,如下所示。
movead@movead-PC:/h2/pgpgpg/data/base/12835$ ll pg_filenode.map-rw-------+ 1 movead movead 512 12月 31 15:10 pg_filenode.mapmovead@movead-PC:/h2/pgpgpg/data/base/12835$movead@movead-PC:/h2/pgpgpg/data/global$ ll pg_filenode.map-rw-------+ 1 movead movead 512 12月 31 15:10 pg_filenode.mapmovead@movead-PC:/h2/pgpgpg/data/global$
在global目录下的pg_filenode.map文件里存储了shared表的oid和relfilenode的映射关系,12835目录下存储了OID为12835的数据库里nail表的oid和relfilenode的映射关系。
pg_filenode.map文件的构造为:
**typedef** **struct** RelMapping{ Oid mapoid; _/* OID of a catalog */_ Oid mapfilenode; _/* its filenode number */_} RelMapping;**typedef** **struct** RelMapFile{ int32 magic; _/* always RELMAPPER_FILEMAGIC */_ int32 num_mappings; _/* number of valid RelMapping entries */_ RelMapping mappings[MAX_MAPPINGS]; pg_crc32c crc; _/* CRC of all above */_ int32 pad; _/* to make the struct size be 512 exactly */_} RelMapFile;
结语
这个博客次要论述了在PostgreSQL中表的oid和relfilenode映射的两种不同表现形式,你只有记住应用pg_relation_filenode()永远会失去正确的后果,从pg_class零碎表中查问则可能会失去谬误的后果。
理解更多PostgreSQL技术干货、热点文集、行业动态、新闻资讯、精彩流动,请拜访中国PostgreSQL社区网站:www.postgresqlchina.com