PHP & MySQL 「数据关联一对一」的最佳实践

jiezi

6 年前

前言
在开发过程中，通常会遇到很多一对一数据的处理情况。而很多时候我们会要取到的是一个列表，然后列表的单条记录的对应另外一张表，来实现业务。比如下面的商品信息和商品详情两个表，这里为了演示只是使用了基础字段，实际开发中可能会复杂的多，下方演示代码中数据库连接使用 PDO 进行处理。
表结构
goods

列
类型
注释

id
int(11) 自动增量

主键 ID

title
varchar(100)
商品名称

price
decimal(10,2)
商品价格

cover
varchar(100)
商品封面

goods_detail

列
类型
注释

id
int(11) 自动增量

主键 ID

goods_id
int(11)
商品 ID

content
varchar(5000)
商品图文介绍

初级
坦言，无论是在公司，还是在一些开源项目上，我都看到过如下的代码。
$query = $db->query(‘select * from goods’);
$result = $query->fetchAll();
// 方案一
foreach($result as $key => $item){
$query = $db->query(‘select * from goods_detail where goods_id=’ . $item[‘id’]);
$result[$key][‘goods_detail’] = $query->fetch();
}
var_dump($result);
// 方案二
foreach($result as &$item){
$query = $db->query(‘select * from goods_detail where goods_id=’ . $item[‘id’]);
$item[‘goods_detail’] = $query->fetch();
}
unset($item);
var_dump($result);
// 方案三
$result = array_map(function($item){
$query = $db->query(‘select * from goods_detail where goods_id=’ . $item[‘id’]);
$item[‘goods_detail’] = $query->fetch();
return $item;
},$result);
var_dump($result);
这是最暴力的方式，也是立杆见影，而且方案一看起来代码貌似还很繁琐，不是吗？如果学过引用这一节的朋友，应该知道第二种用法，直接用引用去操作源数据，当然最后最好别忘了 unset 掉 $item，除了第二种，我们还可以用第三种方式，使用 array_map，诚然，这和第二种方式没什么区别，但是这其中有着一个非常大的问题：数据库查询的 N +1。从执行中我们就可以看到，除了查询列表的一条 SQL 外，每查询一条记录对应的都需要执行一条 SQL，导致了额外的查询，想想一下如果查询没有 limit 限制。会是什么样子的情况？
进阶
看到这里，有人可能会想到了另一种方案来，先查询列表，然后取出列表里面的 goods_id 之后使用 in 查询，然后再循环分配给列表，看代码。
$goods_id = array_column($result,’id’);
$goods_id_str = implode(‘,’,$goods_id);
$query = $db->query(sprintf(‘select * from goods_detail where goods_id in (%s)’,$goods_id_str));
$goods_detail_list = $query->fetchAll();
foreach($result as &$item){
$item[‘goods_detail’] = array_first($goods_detail_list,function($item1){
return $item[‘id’] == $item1[‘goods_id’];
});
}
unset($item);
var_dump($result);
/**
* 来自 Laravel
*/
if (!function_exists(‘value’)) {
function value($value)
{
return $value instanceof Closure ? $value() : $value;
}
}
/**
* 来自 Laravel
*/
if (!function_exists(‘array_first’)) {
/**
* @param $array
* @param callable|null $callback
* @param null $default
* @return mixed
*/
function array_first($array, callable $callback = null, $default = null)
{
if (is_null($callback)) {
if (empty($array)) {
return value($default);
}

foreach ($array as $item) {
return $item;
}
}

foreach ($array as $key => $value) {
if (call_user_func($callback, $value, $key)) {
return $value;
}
}

return value($default);
}
}

在这个代码中，我们完美避开了 N+1 的窘境，使用了 in 查询，然后遍历数组，再使用 array_first 方法来查找后传递给 goods_detail 索引，虽然这样的效率相比第一次的要高了很多，但是并不完美，接下来来看最后一种方案。关于 array_first 可以看我的另一篇文章『PHP 多维数组中的 array_find』。
最佳实践
$goods_detail_list_by_keys = array_column($goods_detail_list,null,’goods_id’);
foreach($result as &$item){
$item[‘goods_detail’] = array_key_exists($goods_detail_list_by_keys,$item[‘id’]) ? $goods_detail_list_by_keys[$item[‘id’]] : null ;
// php 7.1+
// $item[‘goods_detail’] = $goods_detail_list_by_keys[$item[‘id’]] ?? null;
}
unset($item);
var_dump($result);
这一次，我们用到了其他两个函数。array_column、array_key_exists，接下里一一道来，其实在 array_column 的官方手册中的我们就能 Example #2 中就介绍了我们想要的方法。套用在这里就是重置 goods_detail_list 里面元素的 key 为单个元素下的 goods_id。在后面我们直接用 array_key_exists 判断是否存在，然后做出相应的处理就好了。在这里我们还可以做另外一个操作，那就是默认值，因为有时候，数据有可能会因对不上，如果查出来直接返回给前端，前端没有预料到这种情况没有做容错处理就会导致前端页面崩溃，下面来改写一下代码
// 在「进阶」板块中，我们用到了「array_first」函数，该函数第三个参数可以直接设置默认值，我们就不多讲了，主要讲讲最后一个
$goods_detail_default = [
‘content’ => ‘ 默认内容 ’,
‘id’ => null,
‘goods_id’=> null,
];
foreach($result as &$item){
$tmp = array_key_exists($goods_detail_list_by_keys,$item[‘id’]) ? $goods_detail_list_by_keys[$item[‘id’]] : [] ;
// php 7.1+
// $tmp = $goods_detail_list_by_keys[$item[‘id’]] ?? [];
$item[‘goods_detail’] = array_merge($goods_detail_default,$tmp);
}
unset($item);
var_dump($result);
结束
看到这里就算是完结了但是有的朋友会说，为什么不用 leftJoin 来处理？确实，在处理一对一关系中很多时候我们都会选择 innerJoin 或者 leftJoin 来进行处理，一条 SQL 就能搞定，很少会用到类似于这种方案，其实不然，在主流的框架中，默认的解决方案几乎都是这样处理的，比如 Laravel、ThinkPHP，考虑到的场景会有很多，比如有的时候我只是需要按需取一部分的，或者我需要根据我后面的业务结果来决定是不是要加载一对一，然而这种情况下 join 似乎就不太适合。