JS专题之数组去重

jiezi

6 年前

前言
数组去重在日常开发中的使用频率还是较高的，也是网上随便一抓一大把的话题，所以，我写这篇文章目的在于归纳和总结，既然很多人都在提的数组去重，自己到底了解多少呢。又或者是如果自己在开发中遇到了去重的需求，自己能想到更好的解决方案吗。
这次我们来理一理怎么做数组去重才能做得最合适，既要考虑兼容性，也要考虑性能和代码的优雅。
我的学习路径是模仿冴羽 (github: mqyqingfeng) 的学习方式，感谢像冴羽这样优秀的人在前面领跑，我不想光看不做，所以多实践多输出，希望未来能走出我自己的路。
一、入门方案
function unique(origin) {
var result = [];
for(var i = 0; i < origin.length; i++) {
var arrayItem = origin[i];

for(var j= 0; j< result.length; j++) {
var resultItem = result[j];

// 如果在结果数组循环中找到了该元素，则跳出循环，进入下一个源数组元素的判断
if(resultItem === arrayItem) {
break;
}
}

// 如果把结果数组循环完都没有找到该元素，就将该元素压入结果数组中
if(j === result.length) {
result.push(arrayItem);
}
}
return result;
}

// 如果对象中没有这个键，则将这个元素放入结果数组中去。
result.push(origin[i]);
}
}
return result;
}
这种方案的事件复杂度为 O(n), 但是对象的键，默认是字符串类型，这意味着什么呢，数字 1 和字符串 ‘1’，在键中是相等的，所以，上面这种方法不适合字符串和数字混合的去重。
所以我们将元素的类型也放入对象的键中：
function unique(origin) {
var result = [];
var hashTable = {};
for(var i = 0; i< origin.length; i++) {
var current = origin[i];
// 字符串拼接元素的类型和元素
var key = typeof(current) + current;
if(!hashTable[key]) {
hashTable[key] = true;
result.push(current);
}
}
return result;
}
五、数组的 sort 方法
function unique(origin) {
return origin.concat.sort().filter(function(item, index, array) {
// !index 表示第 0 个元素应该被返回。
return !index || item !== origin[index-1]
})
}

function unique(array) {
array.sort(); // 排序字符串
array.sort(function(a, b) {
return a-b; // 排序数字
})

for(let i=0; i<array.length; i++) {
if(array[i] === array[i+1]) {
array.splice(i, 1);
i–; // 应该将前一个数删除，而不是删除后一个数。是因为元素被删除之后，后面元素的索引会迁移，所以要 i–;
}
}
return array;
}
sort 方法的优点在于利用了排序，返回后一个和前一个不相等的元素。比较简洁和直观。缺点在于改变了元素的本来的排序位置。
六、ES6 Set
ES6 提供了新的数据结构 Set, 它类似于数组，但是成员的值都是唯一的，没有重复的值。向 Set 加入值的时候，不会发生类型转变，所以 5 和 ‘5’ 是两个不同的值。Set 内部判断两个值是否相同，用的是类似于 “===” 的算法，但是区别是，在 set 内部认为 NaN 等于 NaN；
Set 可以转换为数组，所以很容易实现去重
function unique(origin) {
return Array.from(new Set(origin));
}
七、ES6 Map
ES6 新增了 Map 数据结果，通过 has 和 set 方法就能很方便的对前面的 object key value 方案进行优化。
function unique(origin){
const map = new Map()
return origin.filter((item) => !map.has(item) && map.set(item, true))
}
八、类型判断
一些常见的数据类型是 === 和 indexOf 是无法检测的，举个例子：
console.log({} === {}) // false;

console.log(NaN === NaN) // false;

console.log(/a/ === /a/); // false;

console.log(1 === new String(‘1’)) // false;

var arr = [NaN];
console.log(arr.indexOf(NaN)); // -1
所以在判断的时候，如果数据里有 NaN 和对象时要避免使用 indexOf 和 ===;
前面 Set 那里说过了，所以 Set 方法是可以去重 NaN 的。
总结
数据去重在网上已经看烦了，但还是想专门写一篇文章来实践和总结，能在工作中多几个思路也是极好的。感谢那些热爱分享和喜欢输出的人。
欢迎关注我的个人公众号“谢南波”，专注分享原创文章。
掘金专栏 JavaScript 系列文章

JavaScript 之变量及作用域
JavaScript 之声明提升
JavaScript 之执行上下文
JavaScript 之变量对象
JavaScript 之原型与原型链
JavaScript 之作用域链
JavaScript 之闭包
JavaScript 之 this
JavaScript 之 arguments
JavaScript 之按值传递
JavaScript 之例题中彻底理解 this
JavaScript 专题之模拟实现 call 和 apply
JavaScript 专题之模拟实现 bind
JavaScript 专题之模拟实现 new
JS 专题之事件模型
JS 专题之事件循环
JS 专题之去抖函数
JS 专题之节流函数
JS 专题之函数柯里化
JS 专题之数组去重