关于java:Java-程序员常犯的-10-个-SQL-错误

Java 程序员编程时须要混合面向对象思维和个别命令式编程的办法，是否完满的将两者联合起来齐全得依附编程人员的水准：

技能（任何人都能容易学会命令式编程）
模式（有些人用“模式 - 模式”, 举个例子, 模式能够利用到任何中央，而且都能够归为某一类模式）
心情（首先，要写个好的面向对象程序是比命令式程序难的多，你得破费一些功夫）

但当 Java 程序员写 SQL 语句时，所有都不一样了。SQL 是说明性语言而非面向对象或是命令式编程语言。在 SQL 中要写个查问语句是很简略的。但在 Java 里相似的语句却不容易，因为程序员不仅要重复思考编程范式，而且也要思考算法的问题。

上面是 Java 程序员在写 SQL 时常犯的 10 个谬误（没有特定的程序）。

1、忘掉 NULL

Java 程序员写 SQL 时对 NULL 的误会可能是最大的谬误。兴许是因为（并非惟一理由）NULL 也称作 UNKNOWN。如果被称作 UNKNOWN，这还好了解些。另一个起因是，当你从数据库拿货色或是绑定变量时，JDBC 将 SQL NULL 和 Java 中的 null 对应了起来。这样导致了 NULL = NULL（SQL）和 null=null（Java）的误会。

对于 NULL 最大的误会是当 NULL 被用作行值表达式完整性约束条件时。另一个误会呈现在对于 NULL 在 NOT IN anti-joins 的利用中。

解决办法：

好好的训练你本人。当你写 SQL 时要不停得想到 NULL 的用法：
这个 NULL 完整性约束条件是正确的？
NULL 是否影响到后果？

2、在 Java 内存中解决数据

很少有 Java 开发者能将 SQL 了解的很好。偶然应用的 JOIN, 还有乖僻的 UNION，好吧，然而对于窗口函数呢？还有对汇合进行分组呢？许多的 Java 开发者将 SQL 数据加载到内存中，将这些数据转换成某些相近的汇合类型，而后再那些汇合下面应用边界循环控制结构（至多在 Java8 的汇合降级以前）执行令人生厌的数学运算。

然而一些 SQL 数据库反对先进的（而且是 SQL 规范反对的）OLAP 个性, 这一个性体现更好而且写起来也更加不便。一个（并不怎么规范的）例子就是 Oracle 超棒的 MODEL 分句。只让数据库来做解决而后只把后果带到 Java 内存中吧。因为毕竟所有十分聪慧的家伙曾经对这些低廉的产品进行了优化。因而实际上, 通过将 OLAP 移到数据库，你将取得一下两项益处：

便利性。这比在 Java 中编写正确的 SQL 可能更加的容易。
性能体现。数据库应该比你的算法解决起来更放慢. 而且更加重要的是, 你不用再去传递数百万条记录了。

解决办法：

每次你应用 Java 实现一个以数据为核心的算法时，问问本人：有没有一种办法能够让数据库代替为我做这种麻烦事。

3、应用 UNION 代替 UNION ALL

UNION ALL（容许反复）
UNION（去除了反复）

移除反复行不仅很少须要（有时甚至是错的），而且对于带很多行的大数据汇合会相当慢，因为两个子 select 须要排序，而且每个元组也须要和它的子序列元组比拟。

留神即便 SQL 标准规定了 INTERSECT ALL 和 EXCEPT ALL，很少数据库会实现这些没用的汇合操作符。

解决办法：

每次写 UNION 语句时，思考实际上是否须要 UNION ALL 语句。

4、通过 JDBC 分页技术给大量的后果进行分页操作

大部分的数据库都会反对一些分页命令实现分页成果，譬如 LIMIT..OFFSET,TOP..START AT,OFFSET..FETCH 语句等。即便没有反对这些语句的数据库，仍有可能对 ROWNUM（Oracle）或者是 ROW NUMBER()、OVER() 过滤（DB2、SQL Server2008 等），这些比在内存中实现分页更疾速。在解决大量数据中，成果尤其显著。

解决办法：

仅仅应用这些语句，那么一个工具（例如 JOOQ）就能够模仿这些语句的操作。

5、在 Java 内存中退出数据

从 SQL 的初期开始，当在 SQL 中应用 JOIN 语句时，一些开发者仍旧有不安的感觉。这是源自对退出 JOIN 后会变慢的固有恐怖。

如果基于老本的优化抉择去实现嵌套循环，在创立一张连贯表源前，可能加载所有的表在数据库内存中，这可能是真的。然而这事产生的概率太低了。通过适合的预测，束缚和索引，合并连贯和哈希连贯的操作都是相当的快。这齐全是是对于正确元数据（在这里我不可能援用 Tom Kyte 的太多）。而且，可能依然有不少的 Java 开发人员加载两张表通过离开查问到一个映射中，并且在某种程度上把他们加到了内存当中。

解决办法：

如果你在各个步骤中有从各种表的查问操作，好好想想是否能够表白你的查问操作在单条语句中。

6、在一个长期的笛卡尔积汇合中应用 DISTINCT 或 UNION 打消反复项

通过简单的连贯，人们可能会对 SQL 语句中表演要害角色的所有关系失去概念。特地的，如果这波及到多列外键关系的话，很有可能会遗记在 JOIN .. ON 子句中减少相干的判断。这会导致反复的记录，但或者只是在非凡的状况下。有些开发者因而可能抉择 DISTINCT 来打消这些重复记录。从三个方面来说这是谬误的：

它（兴许）解决了外表症状但并没有解决问题。它也有可能无奈解决极其状况下的症状。
对具备很多列的宏大的后果汇合来说它很慢。DISTINCT 要执行 ORDER BY 操作来打消反复。
对宏大的笛卡尔积汇合来说它很慢，还是须要加载很多的数据到内存中。

解决办法：

依据教训，如果你取得了不须要的重复记录，还是查看你的 JOIN 判断吧。可能在某个中央有一个很难发觉的笛卡尔积汇合。

7、不应用 MERGE 语句

这并不是一个差错，然而可能是短少常识或者对于强悍的 MERGE 语句信念有余。一些数据库了解其它模式的更新插入（UPSERT）语句，如 MYSQL 的反复主键更新语句，然而 MERGE 在数据库中确是很弱小，很重要，以至于大肆扩大 SQL 规范，例如 SQL SERVER。

解决办法：

如果你应用像联结 INSERT 和 UPDATE 或者联结 SELECT .. FOR UPDATE 而后在 INSERT 或 UPDATE 等更新插入时，请三思。你齐全能够应用一个更简略的 MERGE 语句来远离冒险竞争条件。

8、应用聚合函数代替窗口函数（window functions）

在介绍窗口函数之前，在 SQL 中聚合数据意味着应用 GROUP BY 语句与聚合函数相映射。在很多情景下都工作得很好，如聚合数据须要稀释惯例数据，那么就在 join 子查问中应用 group 查问。

然而在 SQL2003 中定义了窗口函数，这个在很多支流数据库都实现了它。窗口函数可能在后果集上聚合数据，然而却没有分组。事实上，每个窗口函数都有本人的、独立的 PARTITION BY 语句，这个工具对于显示报告太好了。

应用窗口函数：

使 SQL 更易读（但在子查问中没有 GROUP BY 语句业余）
晋升性能，像关系数据库管理系统可能更容易优化窗口函数

解决办法：

当你在子查问中应用 GROUP BY 语句时，请再三思考是否能够应用窗口函数实现。

9、应用内存间接排序

SQL 的 ORDER BY 语句反对很多类型的表达式，包含 CASE 语句，对于间接排序非常有用。你可能重来不会在 Java 内存中排序数据，因为你会想：

SQL 排序很慢
SQL 排序办不到

解决办法：

如果你在内存中排序任何 SQL 数据，请再三思考，是否不能在数据库中排序。这对于数据库分页数据非常有用。

10、一条一条地插入大量记录

JDBC“懂”批处理（batch），你应该不会忘了它。不要应用 INSERT 语句来一条一条的出入成千上万的记录，（因为）每次都会创立一个新的 PreparedStatement 对象。如果你的所有记录都插入到同一个表时，那么就创立一个带有一条 SQL 语句以及附带很多值汇合的插入批处理语句。你可能须要在达到一定量的插入记录后才提交来保障 UNDO 日志瘦小，这依赖于你的数据库和数据库设置。

解决办法：

总是应用批处理插入大量数据。

原文起源：http://blog.jooq.org/

译者：LianyouCQ, LeoXu, yale8848, 开源中国驻联合国理事, super0555

译文：https://www.oschina.net/trans…

近期热文举荐：

1.600+ 道 Java 面试题及答案整顿 (2021 最新版)

2. 终于靠开源我的项目弄到 IntelliJ IDEA 激活码了，真香！

3. 阿里 Mock 工具正式开源，干掉市面上所有 Mock 工具！

4.Spring Cloud 2020.0.0 正式公布，全新颠覆性版本！

5.《Java 开发手册（嵩山版）》最新公布，速速下载！

感觉不错，别忘了顺手点赞 + 转发哦！