巨杉数据库Sequoiadb咨询导入导出导入2300M的csv文件到数据库后用了4880M空间

31次阅读

共计 275 个字符,预计需要花费 1 分钟才能阅读完成。

【问题描述】
1、csv 文件 2300M 导入数据库之后用了 4880M 空间,是什么原因导致的?
2、4880M 的空间大概分为数据文件空间和索引文件空间各一半,为什么索引文件也会占用这么大的空间?
【解决办法】
1、由于 Sequoiadb 是以 bson 结构存储数据,与 csv 的结构比较多了 key 和数据类型的信息,因此以 bson 结构存储需要更大的存储空间。
2、当 csv 文件导入到 Sequoiadb 时,还会产生一个 oid,这是一个默认的唯一索引,Sequoiadb 是将数据文件和索引文件分开存储的,因此空间上会分为这两个部分,而索引文件的空间大小是与具体索引记录相关的。

正文完
 0