关于mysql:MySQL-中-FINDINSET-使用和性能

数据表设计的时候应用一个字段来存储多对多关系,比方表 user 中有一个字段叫 category, category存储的是 “1,3,9” 这样的类型的数据,实际上是 category 的 id 用逗号分隔开来的。

向 user 表录入 100万的数据,同时建设 user_category 表,每个user有 3 个分类,那么category表里有300万条记录。

CREATE TABLE `user` (  
  `id` int(11) NOT NULL AUTO_INCREMENT,  
  `name` varchar(50) DEFAULT NULL,  
  `category` varchar(50) DEFAULT NULL,  
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1;

CREATE TABLE `user_category` (  
  `id` int(11) NOT NULL AUTO_INCREMENT,  
  `user_id` int(11) DEFAULT NULL,  
  `category_id` int(11) DEFAULT NULL,  
  PRIMARY KEY (`id`),  
  KEY `category_id` (`category_id`),  
  KEY `user_id` (`user_id`)  
) ENGINE=InnoDB AUTO_INCREMENT=1;

当初比拟一下在百万级的数据量上应用 join 链接外键查问和find_in_set查问的性能

① 应用 find_in_set 查问,均匀工夫在2.2秒左右

SELECT SQL_NO_CACHE COUNT(*) FROM `user` WHERE FIND_IN_SET(65, category)

② 应用left join , 应用了右表中的索引,均匀工夫在0.2秒左右

SELECT SQL_NO_CACHE COUNT(DISTINCT(`user`.id)) FROM `user`   
LEFT JOIN `user_category` ON `user`.`id`= `user_category`.`user_id`  
WHERE `user_category`.`category_id`=75

评论

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

这个站点使用 Akismet 来减少垃圾评论。了解你的评论数据如何被处理