工作中偶尔会根据字符串字段的长度来筛选一些数据,这时候可能会用到正则表达式,也可以用 mongodb 的 $where,正则表达式在不同的语言中,正确写法又有所差异,特此记录一下。
假如查找 comment 字段字符串长度大于 10 的数据,mongodb 命令行写法如下:
$where 写法:
find({“comment”:{“$exists”:true},”$where”:”this.comment.length>10″})
正则表达式写法:
find({“comment”:{“$regex”:/^.{10,}$/}})
go 语言中写法如下:
$where 写法:collection.Find(bson.M{“comment”: bson.M{“$exists”: true}, “$where”: “this.comment.length > 10”}) 正则表达式写法:collection.Find(bson.M{“comment”: bson.M{“$exists”: true, “$regex”: bson.RegEx{`^.{10,}$`, “”}}})
其他条件正则:^.{n,m}$ n <= 长度 <= m^.{n}$ 长度 = n
这个长度是字符的长度,比如 ” 正则表达式 ” 长度就是 5
至于查找性能方面,网上说正则比 $where 性能好,数据量不大的情况下简单测试,确实是正则查找性能好一点,后面有时间进行深一步的研究看看