前言
接口性能问题,对于从事后端开发的同学来说,是一个绕不开的话题。想要优化一个接口的性能,须要从多个方面着手。
本文将会接着接口性能优化这个话题,从实战的角度登程,聊聊我是如何优化一个慢查问接口的。
上周我优化了一下线上的批量评分查问接口,将接口性能从最后的20s,优化到目前的500ms以内。
总体来说,用三招就搞定了。到底经验了什么?
1. 案发现场
咱们每天早上下班前,都会收到一封线上查问接口汇总邮件,邮件中会展现接口地址、调用次数、最大耗时、均匀耗时和traceId等信息。
我看到其中有一个批量评分查问接口,最大耗时达到了20s,均匀耗时也有2s。
用skywalking查看该接口的调用信息,发现绝大数状况下,该接口响应还是比拟快的,大部分状况都是500s左右就能返回,但也有少部分超过了20s的申请。
这个景象就十分奇怪了。
莫非跟数据无关?
比方:要查某一个组织的数据,是十分快的。但如果要查平台,即组织的根节点,这种状况下,须要查问的数据量十分大,接口响应就可能会十分慢。
但事实证明不是这个起因。
很快有个共事给出了答案。
他们在结算单列表页面中,批量申请了这个接口,但他传参的数据量十分大。
怎么回事呢?
当初说的需要是这个接口给分页的列表页面调用,每页大小有:10、20、30、50、100,用户能够抉择。
换句话说,调用批量评估查问接口,一次性最多能够查问100条记录。
但理论状况是:结算单列表页面还蕴含了很多订单。基本上每一个结算单,都有多个订单。调用批量评估查问接口时,须要把结算单和订单的数据合并到一起。
这样导致的后果是:调用批量评估查问接口时,一次性传入的参数十分多,入参list中蕴含几百、甚至几千条数据都有可能。
2. 现状
如果一次性传入几百或者几千个id,批量查问数据还好,能够走主键索引,查问效率也不至于太差。
但那个批量评分查问接口,逻辑不简略。
伪代码如下:
public List<ScoreEntity> query(List<SearchEntity> list) { //后果 List<ScoreEntity> result = Lists.newArrayList(); //获取组织id List<Long> orgIds = list.stream().map(SearchEntity::getOrgId).collect(Collectors.toList()); //通过regin调用近程接口获取组织信息 List<OrgEntity> orgList = feginClient.getOrgByIds(orgIds); for(SearchEntity entity : list) { //通过组织id找组织code String orgCode = findOrgCode(orgList, entity.getOrgId()); //通过组合条件查问评估 ScoreSearchEntity scoreSearchEntity = new ScoreSearchEntity(); scoreSearchEntity.setOrgCode(orgCode); scoreSearchEntity.setCategoryId(entity.getCategoryId()); scoreSearchEntity.setBusinessId(entity.getBusinessId()); scoreSearchEntity.setBusinessType(entity.getBusinessType()); List<ScoreEntity> resultList = scoreMapper.queryScore(scoreSearchEntity); if(CollectionUtils.isNotEmpty(resultList)) { ScoreEntity scoreEntity = resultList.get(0); result.add(scoreEntity); } } return result;}
其实在实在场景中,代码比这个简单很多,这里为了给大家演示,简化了一下。
最要害的中央有两点:
在接口中近程调用了另外一个接口
须要在for循环中查问数据
其中的第1点,就是:在接口中近程调用了另外一个接口,这个代码是必须的。
因为如果在评估表中冗余一个组织code字段,万一哪天组织表中的组织code有批改,不得不通过某种机制,告诉咱们同步批改评估表的组织code,不然就会呈现数据不统一的问题。
很显然,如果要这样调整的话,业务流程上要改了,代码改变有点大。
所以,还是先放弃在接口中近程调用吧。
这样看来,能够优化的中央只能在:for循环中查问数据。
3. 第一次优化
因为须要在for循环中,每条记录都要依据不同的条件,查问出想要的数据。
因为业务零碎调用这个接口时,没有传id,不好在where条件中用id in (...),这形式批量查问数据。
其实,有一种方法不必循环查问,一条sql就能搞定需要:应用or关键字拼接,例如:(org_code='001' and category_id=123 and business_id=111 and business_type=1) or(org_code='002' and category_id=123 and business_id=112 and business_type=2) or(org_code='003' and category_id=124 and business_id=117 and business_type=1)...
这种形式会导致sql语句会十分长,性能也会很差。
其实还有一种写法:
where (a,b) in ((1,2),(1,3)...)
不过这种sql,如果一次性查问的数据量太多的话,性能也不太好。
竟然没法改成批量查问,就只能优化单条查问sql的执行效率了。
首先从索引动手,因为革新老本最低。
第一次优化是优化索引。
评估表之前建设一个business_id字段的一般索引,然而从目前来看效率不太现实。
因为咱们果决加了联结索引:
alter table user_score add index `un_org_category_business` (`org_code`,`category_id`,`business_id`,`business_type`) USING BTREE;
该联结索引由:org_code、category_id、business_id和business_type四个字段组成。
通过这次优化,成果空谷传声。
批量评估查问接口最大耗时,从最后的20s,缩短到了5s左右。
4. 第二次优化
因为须要在for循环中,每条记录都要依据不同的条件,查问出想要的数据。
只在一个线程中查问数据,显然太慢。
那么,为何不能改成多线程调用?
第二次优化,查询数据库由单线程改成多线程。
但因为该接口是要将查问出的所有数据,都返回回去的,所以要获取查问后果。
应用多线程调用,并且要获取返回值,这种场景应用java8中的CompleteFuture十分适合。
代码调整为:
CompletableFuture[] futureArray = dataList.stream() .map(data -> CompletableFuture .supplyAsync(() -> query(data), asyncExecutor) .whenComplete((result, th) -> { })).toArray(CompletableFuture[]::new);CompletableFuture.allOf(futureArray).join();
CompleteFuture的实质是创立线程执行,为了防止产生太多的线程,所以应用线程池是十分有必要的。
优先举荐应用ThreadPoolExecutor类,咱们自定义线程池。
具体代码如下:
ExecutorService threadPool = new ThreadPoolExecutor( 8, //corePoolSize线程池中外围线程数 10, //maximumPoolSize 线程池中最大线程数 60, //线程池中线程的最大闲暇工夫,超过这个工夫闲暇线程将被回收 TimeUnit.SECONDS,//工夫单位 new ArrayBlockingQueue(500), //队列 new ThreadPoolExecutor.CallerRunsPolicy()); //回绝策略
也能够应用ThreadPoolTaskExecutor类创立线程池:
@Configurationpublic class ThreadPoolConfig { /** * 外围线程数量,默认1 */ private int corePoolSize = 8; /** * 最大线程数量,默认Integer.MAX_VALUE; */ private int maxPoolSize = 10; /** * 闲暇线程存活工夫 */ private int keepAliveSeconds = 60; /** * 线程阻塞队列容量,默认Integer.MAX_VALUE */ private int queueCapacity = 1; /** * 是否容许外围线程超时 */ private boolean allowCoreThreadTimeOut = false; @Bean("asyncExecutor") public Executor asyncExecutor() { ThreadPoolTaskExecutor executor = new ThreadPoolTaskExecutor(); executor.setCorePoolSize(corePoolSize); executor.setMaxPoolSize(maxPoolSize); executor.setQueueCapacity(queueCapacity); executor.setKeepAliveSeconds(keepAliveSeconds); executor.setAllowCoreThreadTimeOut(allowCoreThreadTimeOut); // 设置回绝策略,间接在execute办法的调用线程中运行被回绝的工作 executor.setRejectedExecutionHandler(new ThreadPoolExecutor.CallerRunsPolicy()); // 执行初始化 executor.initialize(); return executor; }}
通过这次优化,接口性能也晋升了5倍。
从5s左右,缩短到1s左右。
但整体成果还不太现实。
5. 第三次优化
通过后面的两次优化,批量查问评估接口性能有一些晋升,但耗时还是大于1s。
呈现这个问题的根本原因是:一次性查问的数据太多。
那么,咱们为什么不限度一下,每次查问的记录条数呢?
第三次优化,限度一次性查问的记录条数。其实之前也做了限度,不过最大是2000条记录,从目前看成果不好。
限度该接口一次只能查200条记录,如果超过200条则会报错提醒。
如果间接对该接口做限度,则可能会导致业务零碎出现异常。
为了防止这种状况的产生,必须跟业务零碎团队一起讨论一下优化计划。
次要有上面两个计划:
5.1 前端做分页
在结算单列表页中,每个结算单默认只展现1个订单,多余的分页查问。
这样的话,如果依照每页最大100条记录计算的话,结算单和订单最多一次只能查问200条记录。
这就须要业务零碎的前端做分页性能,同时后端接口要调整反对分页查问。
但目前现状是前端没有多余开发资源。
因为人手不足的起因,这套计划目前只能临时搁置。
5.2 分批调用接口
业务零碎后端之前是一次性调用评估查问接口,当初改成分批调用。
比方:之前查问500条记录,业务零碎只调用一次查问接口。
当初改成业务零碎每次只查100条记录,分5批调用,总共也是查问500条记录。
这样不是变慢了吗?
答:如果那5批调用评估查问接口的操作,是在for循环中单线程程序的,整体耗时当然可能会变慢。
但业务零碎也能够改成多线程调用,只需最终汇总后果即可。
此时,有人可能会问题:在评估查问接口的服务器多线程调用,跟在其余业务零碎中多线程调用不是一回事?
还不如把批量评估查问接口的服务器中,线程池的最大线程数调大一点?
显然你疏忽了一件事:线上利用个别不会被部署成单点。绝大多数状况下,为了防止因为服务器挂了,造成单点故障,根本会部署至多2个节点。这样即便一个节点挂了,整个利用也能失常拜访。
当然也可能会呈现这种状况:如果挂了一个节点,另外一个节点可能因为拜访的流量太大了,扛不住压力,也可能因而挂掉。
换句话说,通过业务零碎中的多线程调用接口,能够将拜访接口的流量负载平衡到不同的节点上。
他们也用8个线程,将数据分批,每批100条记录,最初将后果汇总。
通过这次优化,接口性能再次晋升了1倍。
从1s左右,缩短到小于500ms。
舒适揭示一下,无论是在批量查问评估接口查询数据库,还是在业务零碎中调用批量查问评估接口,应用多线程调用,都只是一个长期计划,并不完满。
这样做的起因次要是为了先疾速解决问题,因为这种计划改变是最小的。
要从根本上解决问题,须要从新设计这一套性能,须要批改表构造,甚至可能须要批改业务流程。但因为牵涉到多条业务线,多个业务零碎,只能排期缓缓做了。