你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

: 环信即时通讯云
单聊、群聊、聊天室...

: 环信开发文档

: Demo体验
场景Demo，开箱即用

: RTE开发者社区
汇聚音视频领域技术干货，分享行业资讯

: 技术讨论区
技术交流、答疑

: 资源下载
收集了海量宝藏开发资源

: iOS Library
不需要辛辛苦苦的去找轮子, 这里都有

: Android Library
不需要辛辛苦苦的去找轮子, 这里都有

如何统一管理枚举类？

综合技术讨论

Hello，大家好，今天我们来聊一下关于系统中的枚举是如何统一进行管理的。业务场景我们公司有这样的一个业务场景前端表单中下拉选择的枚举值，是需要从后端获取的。那么这时候有个问题，我们不可能每次新增加一个枚举，都需要改造获取枚举的相关接口（getEnu...

继续阅读 »

Hello，大家好，今天我们来聊一下关于系统中的枚举是如何统一进行管理的。

业务场景

我们公司有这样的一个业务场景前端表单中下拉选择的枚举值，是需要从后端获取的。那么这时候有个问题，我们不可能每次新增加一个枚举，都需要改造获取枚举的相关接口（getEnum），所以我们就需要对系统中的所有枚举类，进行统一的一个管理。

核心思路

为了解决这个问题，我们采用了如下的方案

当服务启动时，统一对枚举类进行 注册发现

枚举管理类，对外暴露一个方法，可以根据我的key 去获取对应的枚举值

【谈一谈】Redis是AP还是CP?

综合技术讨论

【谈一谈】Redis是AP还是CP? 再说这个话题之前,这里的是AP和CP不是"A片"和"C骗"啊 !~哈哈哈,就离谱,博文后面我会解释下的我说下自己对Redis的感觉,我一直很好奇Redis,不仅仅是当缓存用那么简单,包括的它的底层设计所以,思考再三,...

继续阅读 »

【谈一谈】Redis是AP还是CP?

再说这个话题之前,这里的是AP和CP不是"A片"和"C骗"啊 !~哈哈哈,就离谱,博文后面我会解释下的

我说下自己对Redis的感觉,我一直很好奇Redis,不仅仅是当缓存用那么简单,包括的它的底层设计

所以,思考再三,我决定先从Redis基础开始写(基础是王道!~万丈高楼平地起,我米开始!~嘿嘿)

一、总纲图:

二、什么是CAP?

要想谈一谈我们本文的主题AP和CP,可能有的小伙伴会说: 这我也不是怎么熟悉啊!

那么我们先复习下大名鼎鼎的CAP 理论

`CAP`理论

看下面的这张图,我们会发现CAP对应的三个单词【建议自己画画图,印象深刻】

C: 一致性(Consistency)--

每次读取都会收到最新的写入数据或者错误信息

(注:这里面的一致性,指的是强一致性,不是市面上所说的所有节点在相同时间看到是一样的数据)

A:可用性(Availability)--

每个请求都会收到非错误地响应,但是这个响应的信息不保证是最新的 ,只保证可用

P:分区容错性(Partition Tolerance)--

就是网络节点间丢弃或者延迟一定数量(就是任意数量)信息,也不影响大局,系统还是能够正常运行

好了,我们言归正传,回到我们的主题上面

三、为啥说Redis是AP?不是CP?

我们知道,Redis是一个开源的内存数据库,且是执行单线程处理

但是网上,若是喜欢读博客的小伙伴,会发现很多人说这样一句话:

单机的Redis是CP的,集群的REDIS是AP的

这句话真的对吗? 大家在看下文前,倾思考思考!~我当时读到第一反应就是疑惑,于是我就去查询大量资料

有的人说:

CAP是针对分布式场景中,如果是单机REDIS,就压根儿和什么分布式不着边,都没 P了!!还说哈AP和 CP??

在单机的REDIS中,应为只有一个实例,那么他的一致性是有保障的,如果这个节点挂了,就没有可用性可言了,所以他是CP系统

我在这里说下,以上两个观点都特么错的!!!以偏概全,混淆是非!~就是AP!!

~哈哈哈!你可能会说:我去,那你证明啊,这特么为啥是错的啊!,别急嘛!我们往下读,让你心服口服,嘿嘿

`REDIS`是`AP`的理由

第一点: 一致性

我们都知道,REDIS的设计目标是高性能,高扩展和高可用性 ,

而且REDIS的一致性模型是最终一致性:

(什么意思呢?)就是在某个时间点读取的数据可能不是最新的,但殊途同归,最终会达到一致的状态

为什么`Redis`无法保持强一致性??

主要原因: 异步复制

因为Redis在分布式的设计中采用的是异步复制,者导致在节点之间存在数据在同步和延迟不一致的情况存在

换句话说:
- 当某个节点的数据发生改变,Redis会将这个节点的修改操作发送给其他节点进行同步~(这是正常步骤,没毛病是不,我们继续往下看)
- 但是(不怕一万,就怕万一来了,哈哈哈)因为网络传输的延迟,拥塞等原因,这些操作没有立即被被其他节点收到和执行,
- 从而产生节点之间数据不一致的情况!!!

抛开上面的影响点,节点故障对Redis的一致性影响也是很大的

举个例子:

当一个节点宕机时,这个节点的数据就可能同步不到其他节点上,这就会导致数据在节点间不一致

你可能有疑惑?那Redis不是有哨兵和复制等机制吗?

但是,问题就是但是,哈哈~这些机制是能提高系统的可用性和容错性,能完全解决吗?

~(你没看错,就是完全解决,能吗??)不能吧,自己主观推下也能想到那种万一场景吧!!!

你说既然异步不行,那么我就用同步机制就不好了!!不就是CP了???

~~no!no!NO !哈哈哈,年轻人,想的太简单了哈!

我们看看官网是怎么说的()

Redis客户端可以使用WAIT命令请求特定数据进行同步复制

使用WAIT,只能说发生故障时丢失写操作的概率会大大降低,且是在难以触发的故障模式情况下

但是!!

WAIT只能确保数据在Redis实例中有指定数量的副本被确认

不能将一组REdis转换为具有强一制性的CP系统

什么意思?

在故障转移期间,由于Redis的持久化配置,当中已确认的写操作,仍然可能会丢失

完结!~

士不可以不弘毅,任重而道远,诸君共勉!~

作者：泊云V
来源：juejin.cn/post/7338721296866574376

收起阅读 »

若依框架——防重复提交自定义注解

Java

防重复提交 1、自定义防重复提交注解 /** * 自定义注解防止表单重复提交 * * @author ruoyi * */ @Inherited @Target(ElementType.METHOD) @Retention(RetentionPol...

继续阅读 »

防重复提交

1、自定义防重复提交注解

/**

 * 自定义注解防止表单重复提交

 * 

 * @author ruoyi

 *

 */

@Inherited

@Target(ElementType.METHOD)

@Retention(RetentionPolicy.RUNTIME)

@Documented

public @interface RepeatSubmit

{

    /**

     * 间隔时间(ms)，小于此时间视为重复提交

     */

    public int interval() default 5000;



    /**

     * 提示消息

     */

    public String message() default "不允许重复提交，请稍候再试";

}

@Inherited：

该元注解表示如果一个类使用了这个 RepeatSubmit 注解，那么它的子类也会自动继承这个注解。这在某些需要对一组相关的控制器方法进行统一重复提交检查的场景下很有用，子类无需再次显式添加该注解。



@Target(ElementType.METHOD)：

表明这个注解只能应用在方法上。在实际应用中，通常会将其添加到控制器类的处理请求的方法上，比如 Spring MVC 的 @RequestMapping 注解修饰的方法。



@Retention(RetentionPolicy.RUNTIME)：

意味着该注解在运行时仍然存在，可以通过反射机制获取到。这样在运行时，通过 AOP（面向切面编程）等技术拦截方法调用时，就能够读取到注解的属性值，从而实现重复提交的检查逻辑。



@Documented：

这个元注解用于将注解包含在 JavaDoc 中。当生成项目文档时，使用了该注解的方法会在文档中显示该注解及其属性，方便其他开发者了解该方法具有防止重复提交的功能以及相关的配置参数。

    /**

     * 间隔时间(ms)，小于此时间视为重复提交

     */

    public int interval() default 5000;

定义了一个名为 interval 的属性，类型为 int，表示两次提交之间允许的最小时间间隔，单位是毫秒。默认值为 5000，即 5 秒。如果两次提交的时间间隔小于这个值，就会被视为重复提交。

    /**

     * 提示消息

     */

    public String message() default "不允许重复提交，请稍候再试";

定义了一个名为 message 的属性，类型为 String，用于在检测到重复提交时返回给客户端的提示消息。默认消息为 “不允许重复提交，请稍候再试”。开发者可以根据具体业务需求，在使用注解时自定义这个提示消息。

2、防止重复提交的抽象类

抽象类可以自己有具体方法

/**

 * 防止重复提交拦截器

 *

 * @author ruoyi

 */

@Component

public abstract class RepeatSubmitInterceptor implements HandlerInterceptor

{

    @Override

    public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) throws Exception

    {

        if (handler instanceof HandlerMethod)

        {

            HandlerMethod handlerMethod = (HandlerMethod) handler;

            Method method = handlerMethod.getMethod();

            RepeatSubmit annotation = method.getAnnotation(RepeatSubmit.class);

            if (annotation != null)

            {

                if (this.isRepeatSubmit(request, annotation))

                {

                    AjaxResult ajaxResult = AjaxResult.error(annotation.message());

                    ServletUtils.renderString(response, JSON.toJSONString(ajaxResult));

                    return false;

                }

            }

            return true;

        }

        else

        {

            return true;

        }

    }



    /**

     * 验证是否重复提交由子类实现具体的防重复提交的规则

     *

     * @param request 请求信息

     * @param annotation 防重复注解参数

     * @return 结果

     * @throws Exception

     */

    public abstract boolean isRepeatSubmit(HttpServletRequest request, RepeatSubmit annotation);

}

2.1、preHandle 方法

自定义抽象类拦截器 RepeatSubmitInterceptor 实现了 HandlerInterceptor 接口，重写 preHandle 方法

preHandle方法是负责拦截请求的

如果isRepeatSubmit方法返回true，表示当前请求是重复提交。此时会创建一个包含错误信息的AjaxResult对象，错误信息就是RepeatSubmit注解中设置的message。然后通过ServletUtils.renderString方法将AjaxResult对象转换为 JSON 字符串，并将其作为响应返回给客户端，同时返回false，阻止请求继续处理。

如果方法上不存在RepeatSubmit注解，或者isRepeatSubmit方法返回false，表示当前请求不是重复提交，就返回true，允许请求继续执行后续的处理流程。

@Override

    public boolean preHandle(HttpServletRequest request, HttpServletResponse response, Object handler) throws Exception

    {

        if (handler instanceof HandlerMethod)

        {

            HandlerMethod handlerMethod = (HandlerMethod) handler;

            Method method = handlerMethod.getMethod();

            RepeatSubmit annotation = method.getAnnotation(RepeatSubmit.class);

            if (annotation != null)

            {

                if (this.isRepeatSubmit(request, annotation))

                {

                    AjaxResult ajaxResult = AjaxResult.error(annotation.message());

                    ServletUtils.renderString(response, JSON.toJSONString(ajaxResult));

                    return false;

                }

            }

            return true;

        }

        else

        {

            return true;

        }

    }

参数说明：

HttpServletRequest request：提供了关于当前 HTTP 请求的信息，如请求头、请求参数、请求方法等。

HttpServletResponse response：用于设置 HTTP 响应，例如设置响应头、响应状态码、写入响应内容等。

Object handler：代表即将被执行的处理器对象，在 Spring MVC 中，它通常是一个 HandlerMethod，但也可能是其他类型。

方法解释：

 if (handler instanceof HandlerMethod)

        {

            HandlerMethod handlerMethod = (HandlerMethod) handler;

            Method method = handlerMethod.getMethod();

            RepeatSubmit annotation = method.getAnnotation(RepeatSubmit.class);

首先检查 handler 是否是 HandlerMethod 类型的，不是的话，直接放行，不做重复提交检查，因为该拦截器主要针对被 @RepeatSubmit 注解标记的方法进行处理。

如果 handler 是 HandlerMethod 类型的话，将 handler 转换成为 HandlerMethod 并获取对应的 Method 对象。

然后通过 getMethod（）方法获取方法，并通过 getAnnotation 方法获取 RepeatSubmit 注解，

if (annotation != null) {

                if (this.isRepeatSubmit(request, annotation)) {

                    AjaxResult ajaxResult = AjaxResult.error(annotation.message());

                    ServletUtils.renderString(response, JSON.toJSONString(ajaxResult));

                    return false;

                }

            }

            return true;

判断是否获取到 RepeatSubmit 注解，没有获取到，返回 true ，允许请求继续执行后续的处理流程。

运用 isRepeatSubmit 方法判断是否是重复提交

如果当前请求是重复提交将注解的错误信息封装给结果映射对象

并调用 renderString 方法将字符串渲染到客户端

    /**

     * 将字符串渲染到客户端

     * 

     * @param response 渲染对象

     * @param string 待渲染的字符串

     */

    public static void renderString(HttpServletResponse response, String string)

    {

        try

        {

            response.setStatus(200);

            response.setContentType("application/json");

            response.setCharacterEncoding("utf-8");

            response.getWriter().print(string);

        }

        catch (IOException e)

        {

            e.printStackTrace();

        }

    }

2.2、isRepeatSubmit 方法

判断是否重复提交 true 重复提交 false 不重复提交

    /**

     * 验证是否重复提交由子类实现具体的防重复提交的规则

     *

     * @param request 请求信息

     * @param annotation 防重复注解参数

     * @return 结果

     * @throws Exception

     */

    public abstract boolean isRepeatSubmit(HttpServletRequest request, RepeatSubmit annotation);

    public final String REPEAT_PARAMS = "repeatParams";



    public final String REPEAT_TIME = "repeatTime";



    // 令牌自定义标识

    @Value("${token.header}")

    private String header;   // token.header = "Authorization"



    @Autowired

    private RedisCache redisCache;	





	@SuppressWarnings("unchecked")

    @Override

    public boolean isRepeatSubmit(HttpServletRequest request, RepeatSubmit annotation)

    {

        String nowParams = "";

        if (request instanceof RepeatedlyRequestWrapper)

        {

            RepeatedlyRequestWrapper repeatedlyRequest = (RepeatedlyRequestWrapper) request;

            nowParams = HttpHelper.getBodyString(repeatedlyRequest);

        }



        // body参数为空，获取Parameter的数据

        if (StringUtils.isEmpty(nowParams))

        {

            nowParams = JSON.toJSONString(request.getParameterMap());

        }

        Map<String, Object> nowDataMap = new HashMap<String, Object>();

        nowDataMap.put(REPEAT_PARAMS, nowParams);

        nowDataMap.put(REPEAT_TIME, System.currentTimeMillis());



        // 请求地址（作为存放cache的key值）

        String url = request.getRequestURI();



        // 唯一值（没有消息头则使用请求地址）

        String submitKey = StringUtils.trimToEmpty(request.getHeader(header));



        // 唯一标识（指定key + url + 消息头）

        String cacheRepeatKey = CacheConstants.REPEAT_SUBMIT_KEY + url + submitKey;



        Object sessionObj = redisCache.getCacheObject(cacheRepeatKey);

        if (sessionObj != null)

        {

            Map<String, Object> sessionMap = (Map<String, Object>) sessionObj;

            if (sessionMap.containsKey(url))

            {

                Map<String, Object> preDataMap = (Map<String, Object>) sessionMap.get(url);

                if (compareParams(nowDataMap, preDataMap) && compareTime(nowDataMap, preDataMap, annotation.interval()))

                {

                    return true;

                }

            }

        }

        Map<String, Object> cacheMap = new HashMap<String, Object>();

        cacheMap.put(url, nowDataMap);

        redisCache.setCacheObject(cacheRepeatKey, cacheMap, annotation.interval(), TimeUnit.MILLISECONDS);

        return false;

    }

	@SuppressWarnings("unchecked")

注解 @SuppressWarnings("unchecked")：这个注解用于抑制编译器的 “unchecked” 警告。在代码中，可能存在一些未经检查的类型转换操作，使用该注解可以告诉编译器忽略这些警告。

String nowParams = "";

初始化一个字符串变量 nowParams 用于存储当前请求的参数。

 if (request instanceof RepeatedlyRequestWrapper)

        {

            RepeatedlyRequestWrapper repeatedlyRequest = (RepeatedlyRequestWrapper) request;

            nowParams = HttpHelper.getBodyString(repeatedlyRequest);

        }

判断当前请求是否是 RepeatedlyRequestWrapper 类型的

RepeatedlyRequestWrapper 是自定义的允许多次请求的请求体 （详情见备注）

如果是的话，强转对象，并且通过 getBodyString 方法 （详情见备注） 获取请求体的字符串内容，并且赋值给 nowParams

        // body参数为空，获取Parameter的数据

        if (StringUtils.isEmpty(nowParams))

        {

            nowParams = JSON.toJSONString(request.getParameterMap());

        }

        Map<String, Object> nowDataMap = new HashMap<String, Object>();

        nowDataMap.put(REPEAT_PARAMS, nowParams); //REPEAT_PARAMS = "repeatParams"

        nowDataMap.put(REPEAT_TIME, System.currentTimeMillis()); //REPEAT_TIME = "repeatTime"

if (StringUtils.isEmpty(nowParams))：如果通过上述方式获取的 nowParams 为空，说明请求体可能为空，此时通过 JSON.toJSONString(request.getParameterMap()) 将请求参数转换为 JSON 字符串，并赋值给 nowParams。这样无论请求参数是在请求体中还是在 URL 参数中，都能获取到。

Map<String, Object> nowDataMap = new HashMap<String, Object>(); 创建一个新的 HashMap 用于存储当前请求的数据。

nowDataMap.put(REPEAT_ PARAMS, nowParams); 将获取到的请求参数存入 nowDataMap 中，使用常量 REPEAT_PARAMS 作为键。

nowDataMap.put(REPEAT_TIME, System.currentTimeMillis()); 将当前时间戳存入 nowDataMap 中，使用常量 REPEAT_TIME 作为键。

		// 请求地址（作为存放cache的key值）

        String url = request.getRequestURI();



        // 唯一值（没有消息头则使用请求地址）

        String submitKey = StringUtils.trimToEmpty(request.getHeader(header));



        // 唯一标识（指定key + url + 消息头）

        String cacheRepeatKey = CacheConstants.REPEAT_SUBMIT_KEY + url + submitKey;

																// REPEAT_SUBMIT_KEY = "repeat_submit:"

String url = request.getRequestURI(); 获取当前请求的 URI。

String submitKey = StringUtils.trimToEmpty(request.getHeader(header)); 从请求头中获取指定的键值（header 变量可能是在类中定义的一个常量，表示要获取的请求头字段），并去除两端的空白字符。如果请求头中不存在该字段，则返回空字符串。

String cacheRepeatKey = CacheConstants . REPEAT_SUBMIT_KEY + url + submitKey; 使用一个常量 CacheConstants.REPEAT _SUBMIT_KEY 与请求 URI 和 submitKey 拼接生成一个唯一的缓存键 cacheRepeatKey。这个键用于在缓存中存储和检索与该请求相关的重复提交信息。

        Object sessionObj = redisCache.getCacheObject(cacheRepeatKey);

        if (sessionObj != null)

        {

            Map<String, Object> sessionMap = (Map<String, Object>) sessionObj;

            if (sessionMap.containsKey(url))

            {

                Map<String, Object> preDataMap = (Map<String, Object>) sessionMap.get(url);

                if (compareParams(nowDataMap, preDataMap) && compareTime(nowDataMap, preDataMap, annotation.interval()))

                {

                    return true;

                }

            }

        }

        Map<String, Object> cacheMap = new HashMap<String, Object>();

        cacheMap.put(url, nowDataMap);

        redisCache.setCacheObject(cacheRepeatKey, cacheMap, annotation.interval(), TimeUnit.MILLISECONDS);

		rerurn false;

通过缓存键先去 redis 中，看是否存在相同的缓存信息如果存在，说明之前有过类似的请求，进入判断

因为这里 redisCache.setCacheObject(cacheRepeatKey, cacheMap, annotation.interval(), TimeUnit.MILLISECONDS); 传了map，所以说 redisCache.getCacheObject(cacheRepeatKey); 得到的map，就是同样的类型的，所以键值就是 url 。

检查 sessionMap 这个 Map 中是否包含以当前请求的 url 作为键的记录。这一步是因为在缓存的数据结构中，url 被用作内层键来存储每个请求的具体数据。如果存在这个键，说明之前已经有针对该 url 的请求被缓存。

接下来

调用 compareParams 方法比较当前请求的数据 nowDataMap 和之前请求的数据 preDataMap 的参数是否相同，同时调用 compareTime 方法比较当前请求时间和之前请求时间的间隔是否小于 @RepeatSubmit 注解中配置的 interval 时间。如果参数相同且时间间隔小于设定值，说明当前请求可能是重复提交，返回 true。

如果缓存中不存在当前请求 url 的记录，或者当前请求不被判定为重复提交，则执行以下操作： Map<String, Object> cacheMap = new HashMap<String, Object>();：创建一个新的 HashMap 用于存储当前请求的数据。 cacheMap.put(url, nowDataMap);：将当前请求的 url 作为键，nowDataMap（包含当前请求参数和时间）作为值存入 cacheMap。 redisCache.setCacheObject(cacheRepeatKey, cacheMap, annotation.interval(), TimeUnit.MILLISECONDS);：将 cacheMap 以 cacheRepeatKey 为键存入 Redis 缓存中，缓存时间为 @RepeatSubmit 注解中配置的 interval 时间，时间单位为毫秒。这样下次相同 url 的请求过来时，就可以从缓存中获取到之前的请求数据进行比较。

2.2.1、compareParams 方法

    /**

     * 判断参数是否相同

     */

    private boolean compareParams(Map<String, Object> nowMap, Map<String, Object> preMap)

    {

        String nowParams = (String) nowMap.get(REPEAT_PARAMS);

        String preParams = (String) preMap.get(REPEAT_PARAMS);

        return nowParams.equals(preParams);

    }

2.2.2、compareTime 方法

   /**

     * 判断两次间隔时间

     */

    private boolean compareTime(Map<String, Object> nowMap, Map<String, Object> preMap, int interval)

    {

        long time1 = (Long) nowMap.get(REPEAT_TIME);

        long time2 = (Long) preMap.get(REPEAT_TIME);

        if ((time1 - time2) < interval)

        {

            return true;

        }

        return false;

    }

备注：

RepeatedlyRequestWrapper

一个自定义的请求包装类，允许多次读取请求体

/**

 * 构建可重复读取inputStream的request

 * 

 * @author ruoyi

 */

public class RepeatedlyRequestWrapper extends HttpServletRequestWrapper

{

    private final byte[] body;



    public RepeatedlyRequestWrapper(HttpServletRequest request, ServletResponse response) throws IOException

    {

        super(request);

        request.setCharacterEncoding(Constants.UTF8);

        response.setCharacterEncoding(Constants.UTF8);



        body = HttpHelper.getBodyString(request).getBytes(Constants.UTF8);

    }



    @Override

    public BufferedReader getReader() throws IOException

    {

        return new BufferedReader(new InputStreamReader(getInputStream()));

    }



    @Override

    public ServletInputStream getInputStream() throws IOException

    {

        final ByteArrayInputStream bais = new ByteArrayInputStream(body);

        return new ServletInputStream()

        {

            @Override

            public int read() throws IOException

            {

                return bais.read();

            }



            @Override

            public int available() throws IOException

            {

                return body.length;

            }



            @Override

            public boolean isFinished()

            {

                return false;

            }



            @Override

            public boolean isReady()

            {

                return false;

            }



            @Override

            public void setReadListener(ReadListener readListener)

            {



            }

        };

    }

}

getBodyString 方法

将二进制的输入流数据转换为易于处理的字符串形式，方便后续对请求体内容进行解析和处理

 public static String getBodyString(ServletRequest request)

    {

        StringBuilder sb = new StringBuilder();

        BufferedReader reader = null;

        try (InputStream inputStream = request.getInputStream())

        {

            reader = new BufferedReader(new InputStreamReader(inputStream, StandardCharsets.UTF_8));

            String line = "";

            while ((line = reader.readLine()) != null)

            {

                sb.append(line);

            }

        }

        catch (IOException e)

        {

            LOGGER.warn("getBodyString出现问题！");

        }

        finally

        {

            if (reader != null)

            {

                try

                {

                    reader.close();

                }

                catch (IOException e)

                {

                    LOGGER.error(ExceptionUtils.getMessage(e));

                }

            }

        }

        return sb.toString();

    }

作者：放纵日放纵
来源：juejin.cn/post/7460129833931849737

收起阅读 »

一次关键接口设计和优化带来的思考

Java

实习时负责实现一个任务新增的接口，本来以为应该可以轻松拿捏，结果在实现过程中发现还有点小复杂，优化了很多版，并且其中涉及到了很多之前学过的知识点，故记录一下。接口基本信息在无人机管理系统中，对无人机执行任务时的监控是非常重要的模块，系统的用户可以为无人机创...

继续阅读 »

实习时负责实现一个任务新增的接口，本来以为应该可以轻松拿捏，结果在实现过程中发现还有点小复杂，优化了很多版，并且其中涉及到了很多之前学过的知识点，故记录一下。

接口基本信息

在无人机管理系统中，对无人机执行任务时的监控是非常重要的模块，系统的用户可以为无人机创建新的飞行任务，除了任务的基本信息外，用户还需要为飞行任务分配负责人，设备，飞手（操作无人机的人），航线，栅栏（任务区域）等信息，而后端实现时需要做好各种校验，对用户数据进行整理转换并插入不同的数据库表中，考虑与系统其他模块的关系（例如航线稽查模块），在系统内通知相关用户，发送邮件给相关用户，另外还要考虑接口幂等性，数据库事务问题，接口的进一步优化。

接口实现

参数校验
- 参数非空校验，格式校验，业务上的校验。
- 其中业务上的校验比较复杂：要保证设备，飞手，航线都存在，且是一一对应关系；要确保任务的负责人有权限调动相关设备和人员（认证鉴权模块）；确保设备，飞手都是可用状态；要检查设备所在位置与任务区域；要检查设备在指定时间内是否已被占用。

幂等性校验
- 新增或编辑接口都可能会产生幂等性问题，尤其这种关键的新增接口一般都要保证幂等性。
- 这里我使用的方案是创建任务时生成一个token保存在redis中，并返回给前端，前端提交任务时在请求中携带token，后端检查到redis中有token证明是第一次访问，删除token并执行后续逻辑（去redis中查并删除token用lua脚本保证原子性），如果请求重复提交则后端查不到token直接返回。
- 也顺便研究了一下其他幂等性方案，包括前端防重复提交，唯一id限制数据库插入，防重表，全局唯一请求id等，发现还是目前使用redis的这种方案更简单高效。

生成任务对象，设置任务基本信息，并将下列得到信息赋予任务对象
- 从线程上下文获取到当前用户信息设为负责人
- 用设备id，用户id去对应表批量查找对应数据（注意一个任务中设备，飞手，航线是一一对应，为一个组合，一个任务中可能有多个这种组合）
- 将航线转化为多个地理点，保存到列表用于后续批量插入任务航线表
- 为每条航线创建稽查事务对象，保存到列表用于后续批量插入稽查表
- 将任务区域转化为多个地理点，保存到列表用于后续批量插入任务区域表

批量插入数据
- 将任务对象插入任务表，将之前保存的列表分别批量插入到航线表，区域表，稽查表。

任务创建成功
- 更新任务状态
- 通过Kafka异步发送邮件通知飞手和负责人

private final String LUA_SCRIPT =

    "if redis.call('EXISTS', KEYS[1]) == 1 then\n" +

    "    redis.call('DEL', KEYS[1])\n" +

    "    return true\n" +

    "else\n" +

    "    return false\n" +

    "end";



DefaultRedisScript<Boolean> script = new DefaultRedisScript<>(LUA_SCRIPT, Boolean.class);

Boolean success = redisTemplate.execute(script, Collections.singletonList(token));

if (success == null || !success) {

    throw new Exception(GlobalErrorCodeEnum.FAIL);

}

// 后续业务逻辑

接口优化

费尽九牛二虎之力写完接口，de完bug后，真正的挑战才开始，此时测试了一下接口的性能，好家伙，平均响应时间1000多ms，肯定是需要优化的，故开始思考优化方案以及测试方案。

压测方案

先屏蔽幂等性校验，设置好接口参数（多个设备，航线长度设置为较长，区域正常设置）

在三种场景下进行测试（弱压力场景：1分钟内100个用户访问。高并发场景：1秒内100个用户访问。高频率场景：2个用户以10QPS持续访问10秒）。以下图片是相关设置

主要关注接口的平均响应时间，吞吐量和错误率。同时CPU使用率，磁盘IO，网络IO也要关注。

优化方案1

首先是把接口中一些不必要的操作删除；并且需要多次查询和插入的数据库操作都改为了批量操作；调整好索引，确保查询能正常走索引。代码与压测结果如下：

注意本文提供的代码仅用于展示，只展示关键步骤，不包含完整实现，若代码中有错误请忽略，理解思路即可。

弱压力和高频率下接口的平均响应时间降低为200ms左右，高并发情况下仍然需要500ms以上，没有出现错误情况，吞吐量也正常。看来数据库操作还是主要耗时的地方。

@Transactional(propagation = Propagation.REQUIRED, rollbackFor = EcpException.class)

public boolean insertTask(TaskInfoVO taskInfoVO) {

    TaskInfo taskInfo = new TaskInfo();

    // 基本信息查询与填充，分配负责人

    // ...

    // 查询并分配设备

    // ...

    List<Devices> devices = deviceService.selectList(new QueryWrapper<dxhpDevices>().in("identity_auth_id", identityAuthIds));

    taskInfo.setDevice(getIdentityAuthId());

    // 查询并分配飞手

    // ...

    List<User> devicePerson = userService.selectBatchIds(devicePersonIds);

    taskInfo.setDevicePerson(getDevicePerson());

    // 处理并分配航线

    // ...

    List<TaskTrajectory> trajectoryList = getTrajectoryList(taskInfoVO.getTrajectoryList(), taskId);

    taskInfo.setTaskTrajectoryId(trajectorysId);

    // 对每条航线创建初始稽查记录

    // ...

    List<Check> checkList = getCheckList(taskInfoVO, taskId, trajectorysId);

    taskInfo.setCheckEventId(checkEventsId);

    // 分配区域

    // ...

    List<Range> taskRangeList = getTaskRange(range, taskId);

    taskInfo.setTaskRangeId(taskRangeId);

    // 插入任务表

    this.dao.insert(taskInfo);

    // 批量插入任务航线表

    trajectoryService.insertBatch(trajectoryList);

    // 批量插入任务区域表

    ...

    // 批量插入稽查表

    ...

}

优化方案2

这里发现数据库的主键使用了uuid，根据之前的学习，uuid是无序的，在插入数据库时会造成页分裂导致效率降低，故考虑把uuid改为数据库自增主键。压测结果如下：

三种情况下的接口平均响应时间都略有降低，但是我重复测试后又发现有时几乎与之前一样，效果不稳定，所以实际使用uuid插入是否真的比自增id插入效率低还不好说，要看具体业务场景。

后来问了导师为什么用uuid做主键，原因是使用uuid方便分库分表，因为不会重复，而自增id在分库分表时可能还要考虑每个表划分id起始点，比较麻烦。

另外，在分布式系统中分布式id的生成是个很重要的基础服务，除了uuid还有雪花算法，数据库唯一主键，redis递增主键，号段模式。

优化方案3

串行改为并行，开启多个线程去并行查询不同模块的数据并做数据库的插入操作，主要使用CompletableFuture类。代码和压测结果如下：

三种场景平均响应时间分别为：82ms，397ms，185ms。弱压力和高频率下性能有所提升，高并发下提升不明显，原因是高并发情况本身CPU就拉满了，再使用多线程去并行就没什么用了。

另外这里使用了自定义的线程池，实际业务中如果需要使用线程池，需要合理设置线程池的相关参数，例如核心线程池，最大线程数，线程池类型，阻塞队列，拒绝策略等，还要考虑线程池隔离。并且需要谨慎分析业务逻辑是否适合使用多线程，有时候加了多线程反而效果更差。

// 开启异步线程执行任务，指定线程池

CompletableFuture.runAsync(() -> {

   // 处理航线数据

   // ...

   List<TaskTrajectory> trajectoryList = getTrajectoryList(taskInfoVO.getTrajectoryList(), taskId);

   taskInfo.setTaskTrajectoryId(trajectorysId);

   // 批量插入数据库

   trajectoryService.insertBatch(trajectoryList)

}, executor);



// 其他模块的操作同理

优化方案4

开启Kafka，将插入操作都变为异步的，即任务表的数据插入后发消息到Kafka中，其他相关表的插入都通过去Kafka中读取消息后再慢慢执行。代码和压测结果如下：

弱压力和高频率下的性能差异不大，但是高并发情况下接口的响应时间又飙到了近1000ms。

经过排查，在高并发时CPU和网络IO都拉满了，应该是瞬时向Kafka发送大量消息导致网卡压力比较大，接口的消息发送不出去导致响应时间飙升。如果是正常生产环境下肯定有多台机器分散请求，同时发数据到Kafka，并且有Kafka集群分担接收压力，但是目前只能在我自己机器上测，故高并发场景下将1秒100个请求降为1秒20个请求，并且前面的优化重新测试，比较性能。结果如下

批量插入：接口平均响应时间354ms

uuid改为自增id：接口平均响应时间323ms

串行改并行：接口平均响应时间331ms

用kafka做异步插入：接口平均响应时间191ms

可以看出使用了异步插入后效果还是十分明显的，且CPU和网络IO也都处于合理的范围内。至此优化基本结束，从一开始的近1000ms的响应速度优化到200ms左右，还是有一定提升的。

// 生产者代码

  List<TaskTrajectory> trajectoryList = getTrajectoryList(taskInfoVO.getTrajectoryList(), taskId);

  String key = IdUtils.uuid();       // 标识不同数据，方便后续Kafka消息防重

  MessageVO messageVO = new MessageVO();

  messageVO.setMsgID("trajectoryService");      // 告知要操作的类

  messageVO.setMsgBody(JSON.toJSONString(trajectoryList)); // 要操作的数据

  // 发送消息并指定主题和分区

  kafkaTemplate.send("taskTopic", "Partition 1", JSON.toJSONString(messageVO));



// 消费者代码

  // 使用 @KafkaListener监听并指定对应的主题和分区

  @KafkaListener(id = "listener", topics = "taskTopic", topicPartitions = @TopicPartition(topic = "taskTopic", partitions = "0"))

  public void recvTaskMessage(String message, Acknowledgment acknowledgment) {

      //  接收消息

      MessageVO messageVo = JSON.parseObject(message, MessageVO.class);

      //  根据消息的唯一ID，配合redis判断消息是否重复

      ...

      //  消费消息

      List<TaskTrajectory> list = JSON.parseArray(messageVo.getMsgBody(), TaskTrajectory.class);

      trajectoryService.insertBatch(list);

      //手动确认消费完成，通知 Kafka 服务器该消息已经被处理。

      acknowledgment.acknowledge();

  }

其他问题

问题1

引入了Kafka后需要考虑的问题：消息重复消费，消息丢失，消息堆积，消息有序。

消息重复消费：生产者生成消息时带上唯一id，保存到redis中，消费者消费过后就把id从redis中删除，若有重复的消息到来，消费者去redis中找不到对应id则不处理。（与前面的接口幂等性方案类似）

消息丢失：生产者发送完消息后会回调判断消息是否发送成功，Kafka的Broker收到消息后要回复ACK给生产者，若没有发送成功要重试。Kafka自身则通过副本机制保证消息不丢失。消费者接收并处理完消息后才回复ACK，即设置手动提交offset。

消息堆积：加机器，提高配置，生产者限流。

消息有序：一个消费者消费一个partition，partition中的消息有序，消费者按顺序处理即可。若消费者开启多线程，则要考虑在内存中为每个线程开启队列，相同key的消息按顺序入队处理。

问题2

长事务问题：像新增任务这类接口肯定是需要加事务的，一开始我直接使用了spring的声明式事务，即@Transactional，并且我看其他业务接口好像也都是这样用的，后来思考了一下新增任务这个接口要先查好几个表，再批量插入好几个表，如果用@Transactional全锁住了那肯定会出问题，故后来使用TransactionTemplate编排式事务只对插入的操作加事务。

另外，远程调用的方法也不用加事务，因为无法回滚远程的数据库操作，除非加分布式事务（效率低），一般关键业务远程调用成功但是后续调用失败的话需要设计兜底方案，对远程调用操作的数据进行补偿，保证最终一致性。

// 避免长事务，不使用@Transactional，使用事务编排

transactionTemplate.execute(transactionStatus -> {

    try {

        this.dao.insert(taskInfo);

        trajectoryService.insertBatch(trajectoryList);

        ...

    } catch (Exception e) {

        transactionStatus.setRollbackOnly();  // 异常手动设置回滚

    }

    return true;

});

问题3

线程池隔离：一些关键的接口使用的线程池要与普通接口使用的线程池隔离，否则一旦普通接口把线程池打满，关键接口也会不可用。例如我上面的优化有使用了多线程，可能需要单独开一个线程池或者使用与其他普通接口不同的线程池。

第三方接口异常重试：如果说需要调用第三方接口或者远程服务，需要做好调用失败的兜底方案，根据业务考虑是重试还是直接失败，重试的时间和次数限制等。

接口的权限：黑白名单设置，可用Bloom过滤器实现

日志：关键的业务代码注意打日志进行监测，方便后续排查异常。

以上是我在设计实现一个重要接口，并对其进行优化时所思考的一些问题，当然上面提到的内容不一定完全正确，可能有很多还没考虑到的地方，有些问题也可能有更成熟的解决方案，但是整个思考过程还是很有收获的，期待能够继续成长。

作者：summer哥
来源：juejin.cn/post/7410601536126795811

收起阅读 »

各种O(PO,BO,DTO,VO等) 是不是人为增加系统复杂度？

Java

在Java和其他编程语言的开发过程中，经常会用到几个以"O"结尾的缩写，比如PO,BO,DTO,VO等等，O在这里是Object的缩写，不同的O代表了不同的数据类型，很多时候这些O看起来都是差不多的，干的事情好像也只是一个简单的封装，那么搞出这么多O出来是不是...

继续阅读 »

在Java和其他编程语言的开发过程中，经常会用到几个以"O"结尾的缩写，比如PO,BO,DTO,VO等等，O在这里是Object的缩写，不同的O代表了不同的数据类型，很多时候这些O看起来都是差不多的，干的事情好像也只是一个简单的封装，那么搞出这么多O出来是不是人为增加了系统的复杂度呢？

各种O都是干什么的？

想要搞清楚标题中的问题，我们首先得了解这些O都是什么东西？这里给大家介绍几种常见的O：

PO (Persistent Object) - 持久化对象。持久化对象通常对应数据库中的一个表，主要用于表示数据库中存储的数据。PO中的属性通常和数据表的列一一对应，用于ORM（对象关系映射）框架中，如Hibernate，JPA等。
BO (Business Object) - 业务对象。业务对象主要封装了业务逻辑。它可以包含多个PO，或者是一个PO的扩展，增加了业务处理的逻辑。BO通常在业务层被使用，用于实现业务操作，比如计算、决策等。
VO (Value Object) - 值对象。值对象是一种用于传输数据的简单对象，它通常不包含业务逻辑，只包含数据属性和get/set方法。值对象主要用于业务层与表示层之间的数据传递，它的数据可能是由多个PO组合而成。
DTO (Data Transfer Object) - 数据传输对象。数据传输对象类似于VO，它也是用于层与层之间的数据传递。DTO通常用于远程通信，比如Web服务之间的数据传递。DTO通常不包含任何业务逻辑，只是用于在不同层次或不同系统之间传输数据。

有时候我们还会看到DO、POJO等概念，它们又是什么呢？

DO (Domain Object) - 领域对象。领域对象是指在问题领域内被定义的对象，它可以包含数据和行为，并且通常代表现实世界中的实体。在DDD（领域驱动设计）中，领域对象是核心概念，用于封装业务逻辑和规则。这里需要注意DO和BO的区别，虽然都是搞业务逻辑，DO通常是业务领域中单一实体的抽象，它关注于单个业务实体的属性和行为；而BO则通常涉及到业务流程的实现，可能会协调多个DO来完成一个业务操作。
POJO (Plain Old Java Object) - 简单老式Java对象。 POJO是指没有遵循特定Java对象模型、约定或框架（如EJB）的简单Java对象。POJO通常用于表示数据结构，它们的实例化和使用不依赖于特定的容器或框架。

为什么要划分各种O？

在软件开发中划分不同的O主要是为了实现关注点分离（Separation of Concerns，SoC），提高代码的可维护性、可读性和可扩展性。

关注点分离的典型案例：MVC模式。

下面展开列举了一些划分这些对象的原因：

明确职责：通过将不同的职责分配给不同的对象，可以使每个对象都有明确的职责，这样代码更容易理解和维护。
减少耦合：不同层次之间通过定义清晰的接口（如特定的对象）交互，减少了直接的依赖关系，降低了耦合度。
抽象层次：通过定义不同的对象，可以在不同的抽象层次上操作，比如在数据层处理PO，在业务层处理BO，这样可以在合适的层次上做出决策。

- 灵活性：当系统需要变更时，由于职责和层次的清晰划分，更容易做出局部的修改而不影响到整个系统。不同的对象可能针对性能有不同的优化，例如PO可能被优化以提高数据库操作的性能。
- 安全性：通过使用不同的对象，可以控制敏感数据的暴露。例如，可以在DTO中排除一些不应该传输到前端的敏感信息。
- 测试性：分离的对象使得单元测试变得更加容易，因为可以针对每个对象进行独立的测试。

交互清晰：在不同的系统组件或层次之间传递数据时，清晰的对象定义可以让数据交互更加清晰，减少数据传递中的错误。

总之，通过划分各种“O”对象，开发者可以更好地组织代码，将复杂系统分解为更小、更易于管理的部分，同时也有助于团队成员之间的沟通和协作。这种划分在设计模式和软件工程实践中是一种常见且有效的方法。

OO不分的惨痛经历

说个实际的惨痛经验。

很多时候我会感觉这些O之间存在很多重复的代码，比如重复的属性定义、简单的方法封装，DRY（Don't Repeat Yourself）原则不是说让大家避免重复嘛，所以我也曾经尝试在程序中统一它们。

但是总有一些O之间存在或多或少的差异，比如：

这个O需要一个A属性，仅用于内部状态管理，不会暴露到外部，其它O都不需要。
还有这个接口需要返回一个B属性，其它接口都不需要。

这时候，你怎么办？如果使用同一个类型，那就得加上这些属性，尽管它们在某些时候用不到。根据你的选择，你可能在所有的地方都给这个属性赋值，也可能仅在业务需要的时候给他们赋值。

看个实际的例子：在一个复杂的电商系统中，商品的管理可能涉及到库存管理、价格策略、促销信息等多个方面。

// 商品类

public class Product {

    private Long id; // 来自商品表

    private String name; // 来自商品表

    private double price; // 来自商品表，传输时需要特殊格式

    private int stock; // 来自库存表，仅在下单判断中需要，展示层不需要

    private String promotionInfo; // 来自促销表，展示层需要



    // 构造器、getter和setter方法省略

}

但是这却带来了很大的危害：

调用接口的同学会问，这个属性什么时候会有值，什么时候会没值？
优化的同学会问，计算这个属性的值会影响性能，能删掉吗？
交接的同学会问，这个属性是干什么用的，为什么不给他赋值？

总之会增加了大量的沟通成本与维护难度。一旦这样做了，后边就会特别别扭，改不完，根本改不完。

在软件工程化的今天，各类O的设计看似增加了复杂度，但是实际上是对系统模块化、职责划分以及实际应用场景的合理抽象和封装，有助于提高软件质量和团队协作效率。

老老实实写吧，不同的O就是不同的东西，它们不是重复的，只是在代码上看着像，就像人有四肢，动物也有四肢，但是它们不能共用，否则出来的就是四不像。

图片来源：ozhanozturk.com/2018/01/28/…

当然如果只是一个很简单的程序或者一次性的程序，我们确实没必要划分这么多的O出来，直接在接口方法中访问数据库也不是不可以的。

前端中O的使用

虽然各种O一般活跃在各种后端程序中，但是前端也不乏O的身影，只是没有后端那么形式化。

以下是一些可能在前端开发中遇到的以“O”结尾的数据对象：

VO (View Object) - 视图对象。在前端框架中，VO可以代表专门为视图层定制的数据对象。这些对象通常是从后端接口获取的数据经过加工或格式化后，用于在界面上显示的对象。
DTO (Data Transfer Object) - 数据传输对象。虽然DTO通常用于后端服务间的数据传输，但在前端中也可以用来表示从后端接口获取的数据结构。前端的DTO通常是指通过Ajax或Fetch API从服务器获取的原始数据结构。
VMO (ViewModel Object) - 视图模型对象。在MVVM（Model-View-ViewModel）架构中，VMO可以代表视图模型对象，它是模型和视图之间的连接器。在Vue.js中，Vue实例本身就可以被看作是一个VMO，因为它包含了数据和行为，同时也是视图的反映。
SO (State Object) - 状态对象尽管不是标准的术语，但在使用如Vuex这样的状态管理库时，SO可以用来指代代表应用状态的对象。这些状态对象通常包含了应用的核心数据，如用户信息、应用设置等。

在实际的Vue开发过程中，开发者可能不会严格区分这些概念，而是更多地关注于组件的状态、属性（props）、事件和生命周期。组件内部的数据通常以数据属性（data）的形式存在，而组件间的数据传递通常使用属性（props）和事件（emits）。在处理与后端的数据交互时，开发者可能会定义一些专门的对象来适应后端的接口，但是这些都不是Vue框架强制的概念或规则。

简单地说，这些“O”其实就是帮我们把代码写得更清晰、更有条理，虽然一开始看着很麻烦，但时间一长，你会发现这样做能省下不少力气。就像我们的衣柜，虽然分类放好衣服需要点时间，但每天早上起来挑衣服的时候，不就轻松多了吗？

记住，合适的工具用在合适的地方，能让你事半功倍！

关注萤火架构，加速技术提升！

作者：萤火架构
来源：juejin.cn/post/7336020150867230757

收起阅读 »

如何实现一个通用的接口限流、防重、防抖机制

Java

介绍最近上了一个新项目，考虑到一个问题，在高并发场景下，我们无法控制前端的请求频率和次数，这就可能导致服务器压力过大，响应速度变慢，甚至引发系统崩溃等严重问题。为了解决这些问题，我们需要在后端实现一些机制，如接口限流、防重复提交和接口防抖，而这些是保证接口安全...

继续阅读 »

介绍

最近上了一个新项目，考虑到一个问题，在高并发场景下，我们无法控制前端的请求频率和次数，这就可能导致服务器压力过大，响应速度变慢，甚至引发系统崩溃等严重问题。为了解决这些问题，我们需要在后端实现一些机制，如接口限流、防重复提交和接口防抖，而这些是保证接口安全、稳定提供服务，以及防止错误数据和脏数据产生的重要手段。
而AOP适合在在不改变业务代码的情况下，灵活地添加各种横切关注点，实现一些通用公共的业务场景，例如日志记录、事务管理、安全检查、性能监控、缓存管理、限流、防重复提交等功能。这样不仅提高了代码的可维护性，还使得业务逻辑更加清晰专注，关于AOP不理解的可以看这篇文章。

接口限流

接口限流是一种控制访问频率的技术，通过限制在一定时间内允许的最大请求数来保护系统免受过载。限流可以在应用的多个层面实现，比如在网关层、应用层甚至数据库层。常用的限流算法有漏桶算法（Leaky Bucket）、令牌桶算法（Token Bucket）等。限流不仅可以防止系统过载，还可以防止恶意用户的请求攻击。

限流框架大概有

spring cloud gateway集成redis限流，但属于网关层限流
阿里Sentinel，功能强大、带监控平台
srping cloud hystrix，属于接口层限流，提供线程池与信号量两种方式
其他：redisson、redis手撸代码

本文主要是通过 Redisson 的分布式计数来实现的固定窗口模式的限流，也可以通过 Redisson 分布式限流方案(令牌桶)的的方式RRateLimiter。

在高并发场景下，合理地实施接口限流对于保障系统的稳定性和可用性至关重要。

自定义接口限流注解类 @AccessLimit

/**

 * 接口限流

 */

@Retention(RetentionPolicy.RUNTIME)

@Target(ElementType.METHOD)

public @interface AccessLimit {



    /**

     * 限制时间窗口间隔长度，默认10秒

     */

    int times() default 10;



    /**

     * 时间单位

     */

    TimeUnit timeUnit() default TimeUnit.SECONDS;



    /**

     * 上述时间窗口内允许的最大请求数量，默认为5次

     */

    int maxCount() default 5;



    /**

     * redis key 的前缀

     */

    String preKey();



    /**

     * 提示语

     */

    String msg() default "服务请求达到最大限制，请求被拒绝！";

}

利用AOP实现接口限流

/**

 * 通过AOP实现接口限流

 */

@Component

@Aspect

@Slf4j

@RequiredArgsConstructor

public class AccessLimitAspect {



    private static final String ACCESS_LIMIT_LOCK_KEY = "ACCESS_LIMIT_LOCK_KEY";



    private final RedissonClient redissonClient;



    @Around("@annotation(accessLimit)")

    public Object around(ProceedingJoinPoint point, AccessLimit accessLimit) throws Throwable {



        String prefix = accessLimit.preKey();

        String key = generateRedisKey(point, prefix);



        //限制窗口时间

        int time = accessLimit.times();

        //获取注解中的令牌数

        int maxCount = accessLimit.maxCount();

        //获取注解中的时间单位

        TimeUnit timeUnit = accessLimit.timeUnit();



        //分布式计数器

        RAtomicLong atomicLong = redissonClient.getAtomicLong(key);



        if (!atomicLong.isExists() || atomicLong.remainTimeToLive() <= 0) {

            atomicLong.set(0);

            atomicLong.expire(time, timeUnit);

        }



        long count = atomicLong.incrementAndGet();

        ;

        if (count > maxCount) {

            throw new LimitException(accessLimit.msg());

        }



        // 继续执行目标方法

        return point.proceed();

    }



    public String generateRedisKey(ProceedingJoinPoint point, String prefix) {

        //获取方法签名

        MethodSignature methodSignature = (MethodSignature) point.getSignature();

        //获取方法

        Method method = methodSignature.getMethod();

        //获取全类名

        String className = method.getDeclaringClass().getName();



        // 构建Redis中的key，加入类名、方法名以区分不同接口的限制

        return String.format("%s:%s:%s", ACCESS_LIMIT_LOCK_KEY, prefix, DigestUtil.md5Hex(String.format("%s-%s", className, method)));

    }

}

调用示例实现

@GetMapping("/getUser")

@AccessLimit(times = 10, timeUnit = TimeUnit.SECONDS, maxCount = 5, preKey = "getUser", msg = "服务请求达到最大限制，请求被拒绝！")

public Result getUser() {

    return Result.success("成功访问");

}

防重复提交

在一些业务场景中，重复提交同一个请求可能会导致数据的不一致，甚至严重影响业务逻辑的正确性。例如，在提交订单的场景中，重复提交可能会导致用户被多次扣款。为了避免这种情况，可以使用防重复提交技术，这对于保护数据一致性、避免资源浪费非常重要

自定义接口防重注解类 @RepeatSubmit

/**

* 自定义接口防重注解类

*/

@Documented

@Target(ElementType.METHOD)

@Retention(RetentionPolicy.RUNTIME)

public @interface RepeatSubmit {

    /**

     * 定义了两种防止重复提交的方式，PARAM 表示基于方法参数来防止重复，TOKEN 则可能涉及生成和验证token的机制

     */

    enum Type { PARAM, TOKEN }

    /**

     * 设置默认的防重提交方式为基于方法参数。开发者可以不指定此参数，使用默认值。

     * @return Type

     */

    Type limitType() default Type.PARAM;

 

    /**

     * 允许设置加锁的过期时间，默认为5秒。这意味着在第一次请求之后的5秒内，相同的请求将被视为重复并被阻止

     */

    long lockTime() default 5;

    

    //提供了一个可选的服务ID参数，通过token时用作KEY计算

    String serviceId() default ""; 

    

    /**

     * 提示语

     */

    String msg() default "请求重复提交！";

}

利用AOP实现接口防重处理

/**

 * 利用AOP实现接口防重处理

 */

@Aspect

@Slf4j

@RequiredArgsConstructor

@Component

public class RepeatSubmitAspect {



    private final String REPEAT_SUBMIT_LOCK_KEY_PARAM = "REPEAT_SUBMIT_LOCK_KEY_PARAM";



    private final String REPEAT_SUBMIT_LOCK_KEY_TOKEN = "REPEAT_SUBMIT_LOCK_KEY_TOKEN";



    private final RedissonClient redissonClient;



    private final RedisRepository redisRepository;



    @Pointcut("@annotation(repeatSubmit)")

    public void pointCutNoRepeatSubmit(RepeatSubmit repeatSubmit) {



    }



    /**

     * 环绕通知, 围绕着方法执行

     * 两种方式

     * 方式一：加锁 固定时间内不能重复提交

     * 方式二：先请求获取token，再删除token,删除成功则是第一次提交

     */

    @Around("pointCutNoRepeatSubmit(repeatSubmit)")

    public Object around(ProceedingJoinPoint joinPoint, RepeatSubmit repeatSubmit) throws Throwable {

        HttpServletRequest request = ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes()).getRequest();



        //用于记录成功或者失败

        boolean res = false;



        //获取防重提交类型

        String type = repeatSubmit.limitType().name();

        if (type.equalsIgnoreCase(RepeatSubmit.Type.PARAM.name())) {

            //方式一，参数形式防重提交

            //通过 redissonClient 获取分布式锁，基于IP地址、类名、方法名生成唯一key

            String ipAddr = IPUtil.getIpAddr(request);

            String preKey = repeatSubmit.preKey();

            String key = generateTokenRedisKey(joinPoint, ipAddr, preKey);



            //获取注解中的锁时间

            long lockTime = repeatSubmit.lockTime();

            //获取注解中的时间单位

            TimeUnit timeUnit = repeatSubmit.timeUnit();



            //使用 tryLock 尝试获取锁，如果无法获取（即锁已被其他请求持有），则认为是重复提交，直接返回null

            RLock lock = redissonClient.getLock(key);

            //锁自动过期时间为 lockTime 秒，确保即使程序异常也不会永久锁定资源，尝试加锁，最多等待0秒，上锁以后 lockTime 秒自动解锁 [lockTime默认为5s, 可以自定义]

            res = lock.tryLock(0, lockTime, timeUnit);



        } else {

            //方式二，令牌形式防重提交

            //从请求头中获取 request-token，如果不存在，则抛出异常

            String requestToken = request.getHeader("request-token");

            if (StringUtils.isBlank(requestToken)) {

                throw new LimitException("请求未包含令牌");

            }

            //使用 request-token 和 serviceId 构造Redis的key，尝试从Redis中删除这个键。如果删除成功，说明是首次提交；否则认为是重复提交

            String key = String.format("%s:%s:%s", REPEAT_SUBMIT_LOCK_KEY_TOKEN, repeatSubmit.serviceId(), requestToken);

            res = redisRepository.del(key);

        }



        if (!res) {

            log.error("请求重复提交");

            throw new LimitException(repeatSubmit.msg());

        }



        return joinPoint.proceed();

    }



    private String generateTokenRedisKey(ProceedingJoinPoint joinPoint, String ipAddr, String preKey) {

        //根据ip地址、用户id、类名方法名、生成唯一的key

        MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

        Method method = methodSignature.getMethod();

        String className = method.getDeclaringClass().getName();

        String userId = "seven";

        return String.format("%s:%s:%s", REPEAT_SUBMIT_LOCK_KEY_PARAM, preKey, DigestUtil.md5Hex(String.format("%s-%s-%s-%s", ipAddr, className, method, userId)));

    }

}

调用示例

@PostMapping("/saveUser")

@RepeatSubmit(limitType = RepeatSubmit.Type.PARAM,lockTime = 5,timeUnit = TimeUnit.SECONDS,preKey = "saveUser",msg = "请求重复提交")

public Result saveUser() {

    return Result.success("成功保存");

}

接口防抖

接口防抖是一种优化用户操作体验的技术，主要用于减少短时间内高频率触发的操作。例如，当用户快速点击按钮时，我们可以通过防抖机制，只处理最后一次触发的操作，而忽略前面短时间内的多次操作。防抖技术常用于输入框文本变化事件、按钮点击事件等场景，以提高系统的性能和用户体验。

后端接口防抖处理主要是为了避免在短时间内接收到大量相同的请求，特别是由于前端操作（如快速点击按钮）、网络重试或异常情况导致的重复请求。后端接口防抖通常涉及记录最近的请求信息，并在特定时间窗口内拒绝处理相同或相似的请求。

定义自定义注解 @AntiShake

// 该注解只能用于方法

@Target(ElementType.METHOD)

@Retention(RetentionPolicy.RUNTIME)// 运行时保留，这样才能在AOP中被检测到

public @interface AntiShake {



    String preKey() default "";



    // 默认防抖时间1秒

    long value() default 1000L;



    TimeUnit timeUnit() default TimeUnit.MILLISECONDS;

}

实现AOP切面处理防抖

@Aspect // 标记为切面类

@Component // 让Spring管理这个Bean

@RequiredArgsConstructor // 通过构造方法注入依赖

public class AntiShakeAspect {



    private final String ANTI_SHAKE_LOCK_KEY = "ANTI_SHAKE_LOCK_KEY";



    private final RedissonClient redissonClient;



    @Around("@annotation(antiShake)") // 拦截所有标记了@AntiShake的方法

    public Object aroundAdvice(ProceedingJoinPoint joinPoint, AntiShake antiShake) throws Throwable {

        HttpServletRequest request = ((ServletRequestAttributes) RequestContextHolder.getRequestAttributes()).getRequest();



        long currentTime = System.currentTimeMillis();



        // 获取方法签名和参数作为 Redis 键

        String ipAddr = IPUtil.getIpAddr(request);

        String key = generateTokenRedisKey(joinPoint, ipAddr, antiShake.preKey());



        RBucket bucket = redissonClient.getBucket(key);

        Long lastTime = bucket.get();



        if (lastTime != null && currentTime - lastTime < antiShake.value()) {

            // 如果距离上次调用时间小于指定的防抖时间，则直接返回，不执行方法

            return null; // 根据业务需要返回特定值

        }



        // 更新 Redis 中的时间戳

        bucket.set(currentTime, antiShake.value(), antiShake.timeUnit());

        return joinPoint.proceed(); // 执行原方法

    }



    private String generateTokenRedisKey(ProceedingJoinPoint joinPoint, String ipAddr, String preKey) {

        //根据ip地址、用户id、类名方法名、生成唯一的key

        MethodSignature methodSignature = (MethodSignature) joinPoint.getSignature();

        Method method = methodSignature.getMethod();

        String className = method.getDeclaringClass().getName();

        String userId = "seven";

        return String.format("%s:%s:%s", ANTI_SHAKE_LOCK_KEY, preKey, DigestUtil.md5Hex(String.format("%s-%s-%s-%s", ipAddr, className, method, userId)));

    }

}

调用示例代码

@PostMapping("/clickButton")

@AntiShake(value = 1000, timeUnit = TimeUnit.MILLISECONDS, preKey = "clickButton")

public Result clickButton() {

    return Result.success("成功点击按钮");

}

接口防抖整体思路与防重复提交思路类似，防重复提交代码也可重用于接口防抖

关于作者

来自一线程序员Seven的探索与实践，持续学习迭代中~
本文已收录于我的个人博客：http://www.seven97.top
公众号：seven97，欢迎关注~

作者：Seven97
来源：juejin.cn/post/7408859165433364490

收起阅读 »

MySQL误删数据怎么办？

综合技术讨论

一、背景某天，张三打算操作数据库，删除自己项目的无用数据，但是一不小心数据删多了。被误删的数据，如何恢复呢？本文将介绍相关方法，以及现成的一些工具。例子：有一个表 create table person ( id bigint primary k...

继续阅读 »

一、背景

某天，张三打算操作数据库，删除自己项目的无用数据，但是一不小心数据删多了。被误删的数据，如何恢复呢？本文将介绍相关方法，以及现成的一些工具。

例子：

有一个表

create table person

(

  id   bigint primary key auto_increment comment 'id',

  name varchar(50) comment '名称'

) engine = innodb;

原本是要执行这条SQL语句：

delete from person where id > 500000;

不小心执行了这条SQL语句：

delete from person;

二、解决方案

处理这个问题的解决思路就是，基于binlog找回被删除的数据，将被删除的数据重新插入到数据库。

对于binlog文件来说，实际上保存的是对于数据库的正向操作。比如说，插入数据insert，binlog中保存的也是insert语句；删除数据delete，binlog中保存的也是delete语句。

因此，想要恢复被删除的数据，主要有两种方式：

描述	优点	缺点
找到数据插入的位置，重新执行数据的插入操作	1. 比较方便，不需要生成逆向操作，直接执行sql脚本重新插入数据即可 2. 对binlog的模式没有限制，row模式、statement模式都能找到具体的数据	1. 如果数据插入之后还有更新操作，插入的数据不是最新的，会有问题 2. 如果被删除的数据比较多，插入的位置比较多，找到插入的位置比较困难
找到数据被删除的位置，生成逆向操作，重新执行插入操作	1. 只要找到数据被删除的位置即可找到所有被删除的数据，比较方便	1. 需要通过脚本生成逆向操作，才能将数据恢复 2. 需要保证binlog模式是row模式，才能找到被删除的数据。否则，statement模式不会找到具体的数据

下面就针对上面的两种方式，进行详细的讲解

1. 通用操作

首先介绍两种方式都需要使用到的一些通用的操作，主要用于设置binlog、找到binlog文件

1.1 确认binlog开启

1.1.1 查询开启状态

首先要保证binlog是开启的，不然数据肯定是没办法恢复回来的。

在MySQL中，可以通过执行以下SQL查询来检查是否已经开启了binlog：

SHOW VARIABLES LIKE 'log_bin';

这个查询将返回一个结果集，其中包含名为log_bin的系统变量的值。如果log_bin的值为ON，则表示binlog已经开启；如果值为OFF，则表示binlog没有开启。

mysql> SHOW VARIABLES LIKE 'log_bin';

+---------------+-------+

| Variable_name | Value |

+---------------+-------+

| log_bin       | ON    |

+---------------+-------+

1 row in set (0.01 sec)

1.1.2 开启binlog

如果发现没有开启，可以通过修改MySQL配置文件（通常是my.cnf或my.ini，Linux下MySQL的配置文件目录一般是/etc/mysql）中的[mysqld]部分来开启binlog。如果在配置文件中找到了类似以下的设置，则表示binlog已经开启：

[mysqld]

log-bin=mysql-bin

server-id=1

修改配置启用了binlog之后，需要重启MySQL服务才能使更改生效

mysql-bin表示binlog文件的前缀

server-id 设置了MySQL服务器的唯一ID，必须设置ID，否则没办法开启binlog

1.2 binlog模式

刚刚提到，对于delete操作，只有row模式才能找到被删除数据的具体值，因此需要确认开启的binlog模式。

1.2.1 查询binlog模式

要查询MySQL的binlog模式，您可以使用以下SQL命令：

SHOW VARIABLES LIKE 'binlog_format';

这将返回一个结果集，其中包含当前的binlog格式。可能的值有：

ROW：表示使用行模式（row-based replication），这是推荐的设置，因为它提供了更好的数据一致性。

STATEMENT：表示使用语句模式（statement-based replication），在这种模式下，可能会丢失一些数据，因为它仅记录执行的SQL语句。

MIXED：表示混合模式（mixed-based replication），在这种模式下，MySQL会根据需要自动切换行模式和语句模式。

1.2.2 配置binlog模式

可以通过修改MySQL配置文件（通常是my.cnf或my.ini，Linux下MySQL的配置文件目录一般是/etc/mysql）中的[mysqld]部分来修改binlog模式。

在[mysqld]部分下，添加或修改以下行，将binlog_format设置为想要的模式（ROW、STATEMENT或MIXED）：

[mysqld]

binlog_format=ROW

随后重启mysql服务使其生效

1.3 binlog信息查询

通过以下操作，我们可以找到binlog文件

1.3.1 查询当前使用的binlog文件

通过show master status;可以找到当前正在使用的binlog文件

mysql> show master status\G

*************************** 1. row ***************************

             File: mysql-bin.000217

         Position: 668127868

     Binlog_Do_DB: 

 Binlog_Ignore_DB: 

Executed_Gtid_Set: 29dc2bf9-f657-11ee-b369-08c0eb829a3c:1-291852745,

744ca9cd-5f86-11ef-98d6-0c42a131d16f:1-5374311

1 row in set (0.00 sec)

1.3.2 找到所有binlog文件名

show master logs;可以找到所有binlog文件名

mysql> show master logs;

+------------------+------------+

| Log_name         | File_size  |

+------------------+------------+

| mysql-bin.000200 | 1073818388 |

| mysql-bin.000201 | 1073757563 |

| mysql-bin.000202 | 1074635635 |

| mysql-bin.000203 | 1073801053 |

| mysql-bin.000204 | 1073856643 |

| mysql-bin.000205 | 1073910661 |

| mysql-bin.000206 | 1073742603 |

| mysql-bin.000207 | 1195256434 |

| mysql-bin.000208 | 1085915611 |

| mysql-bin.000209 | 1073990985 |

| mysql-bin.000210 | 1075942323 |

| mysql-bin.000211 | 1074716392 |

| mysql-bin.000212 | 1073763938 |

| mysql-bin.000213 | 1073780482 |

| mysql-bin.000214 | 1074029712 |

| mysql-bin.000215 | 1073832842 |

| mysql-bin.000216 | 1079999184 |

| mysql-bin.000217 |  668173793 |

+------------------+------------+

1.3.3 查询binlog保存位置

SHOW VARIABLES LIKE 'log_bin_basename'; 可以找到binlog文件保存的目录位置。比如说/var/lib/mysql/mysql-bin表示目录为/var/lib/mysql/下的以mysql-bin为前缀的文件。

我们通过文件的最后修改时间，可以看出binlog覆盖的时间范围。一般后缀的数字越大，表示越新。

mysql> SHOW VARIABLES LIKE 'log_bin_basename';

+------------------+--------------------------+

| Variable_name    | Value                    |

+------------------+--------------------------+

| log_bin_basename | /var/lib/mysql/mysql-bin |

+------------------+--------------------------+

1 row in set (0.00 sec)

bash-4.2# ls /var/lib/mysql/mysql-bin* -alh

-rw-r----- 1 mysql mysql 1.1G Sep  9 02:28 /var/lib/mysql/mysql-bin.000200

-rw-r----- 1 mysql mysql 1.1G Sep  9 02:32 /var/lib/mysql/mysql-bin.000201

-rw-r----- 1 mysql mysql 1.1G Sep  9 02:39 /var/lib/mysql/mysql-bin.000202

-rw-r----- 1 mysql mysql 1.1G Sep  9 02:45 /var/lib/mysql/mysql-bin.000203

-rw-r----- 1 mysql mysql 1.1G Sep  9 07:52 /var/lib/mysql/mysql-bin.000204

-rw-r----- 1 mysql mysql 1.1G Sep  9 12:10 /var/lib/mysql/mysql-bin.000205

-rw-r----- 1 mysql mysql 1.1G Sep 10 04:40 /var/lib/mysql/mysql-bin.000206

-rw-r----- 1 mysql mysql 1.2G Sep 10 07:00 /var/lib/mysql/mysql-bin.000207

-rw-r----- 1 mysql mysql 1.1G Sep 11 07:54 /var/lib/mysql/mysql-bin.000208

-rw-r----- 1 mysql mysql 1.1G Sep 12 03:03 /var/lib/mysql/mysql-bin.000209

-rw-r--r-- 1 root  root   24M Sep 11 09:06 /var/lib/mysql/mysql-bin.000209.event.log

-rw-r----- 1 mysql mysql 1.1G Sep 12 03:30 /var/lib/mysql/mysql-bin.000210

-rw-r----- 1 mysql mysql 1.1G Sep 12 08:33 /var/lib/mysql/mysql-bin.000211

-rw-r----- 1 mysql mysql 1.1G Sep 12 08:35 /var/lib/mysql/mysql-bin.000212

-rw-r----- 1 mysql mysql 1.1G Sep 12 22:00 /var/lib/mysql/mysql-bin.000213

-rw-r----- 1 mysql mysql 1.1G Sep 13 10:26 /var/lib/mysql/mysql-bin.000214

-rw-r----- 1 mysql mysql 1.1G Sep 13 10:29 /var/lib/mysql/mysql-bin.000215

-rw-r----- 1 mysql mysql 1.1G Sep 14 01:42 /var/lib/mysql/mysql-bin.000216

-rw-r----- 1 mysql mysql 637M Sep 14 06:11 /var/lib/mysql/mysql-bin.000217

-rw-r----- 1 mysql mysql 4.1K Sep 14 01:42 /var/lib/mysql/mysql-bin.index

2. 方案一：找到insert语句，重新插入

需要执行以下几个步骤：

确认insert插入数据的时间，找到对应的binlog文件

解析该binlog文件，指定时间点，在binlog文件中找到插入数据的位置

重新解析binlog文件，指定binlog位置。对解析出来的文件进行重放。

2.1 找到binlog文件

比如说，数据是在9月12日12:00插入的，那么我们看上方的所有binlog文件，可以看出插入语句应该保存在mysql-bin.000213文件中。

2.2 根据时间点解析binlog文件

通过mysqlbinlog将binlog文件解析成可读的sql文件。

mysqlbinlog --base64-output=decode-rows -v --start-datetime="2024-09-12 11:59:00" --stop-datetime="2024-09-12 12:01:00" mysql-bin.000213 > binlog.sql

--base64-output=decode-rows：将二进制日志中的行事件解码为 SQL 语句。

-v 或 --verbose：输出详细的事件信息。

--start-datetime="2024-09-12 11:59:00"：从指定的日期和时间开始读取二进制日志。通过指定时间范围，可以减小解析出来的sql文件，避免太多无用信息使得查询位置比较困难。

--stop-datetime="2024-09-12 12:01:00"：在指定的日期和时间停止读取二进制日志。

mysql-bin.000213：要解析的二进制日志文件的路径和名称。

>：将命令的输出重定向到指定的文件。

binlog.sql：保存解码后的 SQL 语句的文件名。

2.2.1 statement模式确认binlog位置

我们可以找到insert int0 person values (1, 'first')，并且分别在前后的BEGIN和COMMIT找到position。

BEGIN往前找有一个position at 219，COMMIT往后找有一个position at 445，这就是插入语句的实际binlog范围。

# at 219

#240914 17:14:26 server id 1  end_log_pos 300 CRC32 0xb8159bc1 	Query	thread_id=1267	exec_time=0	error_code=0

SET TIMESTAMP=1726305266/*!*/;

SET @@session.pseudo_thread_id=1267/*!*/;

SET @@session.foreign_key_checks=1, @@session.sql_auto_is_null=0, @@session.unique_checks=1, @@session.autocommit=1/*!*/;

SET @@session.sql_mode=1436549120/*!*/;

SET @@session.auto_increment_increment=1, @@session.auto_increment_offset=1/*!*/;

/*!\C latin1 *//*!*/;

SET @@session.character_set_client=8,@@session.collation_connection=8,@@session.collation_server=8/*!*/;

SET @@session.lc_time_names=0/*!*/;

SET @@session.collation_database=DEFAULT/*!*/;

BEGIN

/*!*/;

# at 300

#240914 17:14:26 server id 1  end_log_pos 414 CRC32 0xb7e0263b 	Query	thread_id=1267	exec_time=0	error_code=0

use `tests`/*!*/;

SET TIMESTAMP=1726305266/*!*/;

insert int0 person values (1, 'first')

/*!*/;

# at 414

#240914 17:14:26 server id 1  end_log_pos 445 CRC32 0x9345e6ca 	Xid = 30535

COMMIT/*!*/;

# at 445

2.2.2 row模式确认binlog位置

row模式下，与statement模式下的binlog格式有少许差别，但方法是一致的。

我们可以找到以 ###开头的几行，包含INSERT INTO语句。并且分别在前后的BEGIN和COMMIT找到position。

BEGIN往前找有一个position at 219，COMMIT往后找有一个position at 426，这就是插入语句的实际binlog范围。

# at 219

#240914 17:16:36 server id 1  end_log_pos 292 CRC32 0xe9082d52 	Query	thread_id=20	exec_time=0	error_code=0

SET TIMESTAMP=1726305396/*!*/;

SET @@session.pseudo_thread_id=20/*!*/;

SET @@session.foreign_key_checks=1, @@session.sql_auto_is_null=0, @@session.unique_checks=1, @@session.autocommit=1/*!*/;

SET @@session.sql_mode=1436549120/*!*/;

SET @@session.auto_increment_increment=1, @@session.auto_increment_offset=1/*!*/;

/*!\C latin1 *//*!*/;

SET @@session.character_set_client=8,@@session.collation_connection=8,@@session.collation_server=8/*!*/;

SET @@session.lc_time_names=0/*!*/;

SET @@session.collation_database=DEFAULT/*!*/;

BEGIN

/*!*/;

# at 292

#240914 17:16:36 server id 1  end_log_pos 345 CRC32 0x1832ced4 	Table_map: `tests`.`person` mapped to number 111

# at 345

#240914 17:16:36 server id 1  end_log_pos 395 CRC32 0x32d6a21b 	Write_rows: table id 111 flags: STMT_END_F

### INSERT INTO `tests`.`person`

### SET

###   @1=1

###   @2='first'

# at 395

#240914 17:16:36 server id 1  end_log_pos 426 CRC32 0x07619928 	Xid = 149

COMMIT/*!*/;

# at 426

2.3 根据binlog位置解析binlog文件

上一步，我们已经找到了具体的位置，现在我们可以重新解析binlog文件，指定binlog位置。内容和上方实际上没有太大差异。

mysqlbinlog --start-position=219 --stop-position=426 mysql-bin.000213 > binlog.sql

需要注意的是，这个解析语句，删掉了--base64-output=decode-rows -v 参数。因为这些参数是用于解码binlog的，是让开发人员更方便看到binlog被解析之后的格式。但是对mysql来说是没办法使用的。

2.4 重放数据

解析的这个文件就是一个sql脚本文件，通过往常的方式执行sql脚本即可

mysql -uroot -proot < binlog.sql

或者mysql客户端登陆之后，通过source命令执行

source binlog.sql;

3. 方案二：找到delete语句，生成逆向操作，重新insert

3.1 找到binlog文件

比如说，数据是在9月12日12:00删除的，那么我们看上方的所有binlog文件，可以看出插入语句应该保存在mysql-bin.000213文件中。

3.2 根据时间点解析binlog文件

操作和上方2.2的操作没有差异，我们主要来比较一下statement模式和row模式的差别。我们会发现statement模式下，没办法找到所有被删除的数据的具体数据，而row模式能找到。

3.2.1 statement模式

我们可以看到binlog只保存了一句 delete from person。很遗憾，啥数据都没有，也没办法根据它生成逆向操作。

# at 445

#240914 17:15:13 server id 1  end_log_pos 510 CRC32 0x6a7a66e4 	Anonymous_GTID	last_committed=1	sequence_number=2	rbr_only=no

SET @@SESSION.GTID_NEXT= 'ANONYMOUS'/*!*/;

# at 510

#240914 17:15:13 server id 1  end_log_pos 591 CRC32 0x55e4225b 	Query	thread_id=1267	exec_time=0	error_code=0

SET TIMESTAMP=1726305313/*!*/;

BEGIN

/*!*/;

# at 591

#240914 17:15:13 server id 1  end_log_pos 685 CRC32 0x10938b9d 	Query	thread_id=1267	exec_time=0	error_code=0

SET TIMESTAMP=1726305313/*!*/;

delete from person

/*!*/;

# at 685

#240914 17:15:13 server id 1  end_log_pos 716 CRC32 0x1ea4a681 	Xid = 30610

COMMIT/*!*/;

# at 716

3.2.2 row模式

可以看到binlog以 ###开头的几行，WHERE之后，把被删除数据的每一个字段都作为条件嵌入到sql语句中了。条件的顺序，就是表结构的字段顺序。比如说@1对应的就是id，@2对应的就是name。

# at 1574

#240914 17:16:38 server id 1  end_log_pos 1642 CRC32 0x944b1b94 	Query	thread_id=20	exec_time=1260	error_code=0

SET TIMESTAMP=1726305398/*!*/;

BEGIN

/*!*/;

# at 1642

#240914 17:16:38 server id 1  end_log_pos 1695 CRC32 0x435282e2 	Table_map: `tests`.`person` mapped to number 111

# at 1695

#240914 17:16:38 server id 1  end_log_pos 1745 CRC32 0x3063bf8c 	Delete_rows: table id 111 flags: STMT_END_F

### DELETE FROM `tests`.`person`

### WHERE

###   @1=1

###   @2='first'

# at 1745

#240914 17:16:38 server id 1  end_log_pos 1776 CRC32 0x086c2270 	Xid = 3391

COMMIT/*!*/;

3.3 生成逆向操作

根据上面的binlog文件，我们可以通过脚本生成逆向操作。

insert int0 person values (1, 'first');

3.4 重放数据

与 2.4 一致

三、常见工具

目前有一些开源的工具，可以帮助我们解析binlog，并且自动生成binlog记录的操作的逆向操作。

1. binlog2mysql

binlog2sql由美团点评DBA团队(上海)出品，python脚本实现。主要原理是伪装成slave，向master获取binlog，并且根据binlog生成逆向操作。

下载地址：GitHub - danfengcao/binlog2sql: Parse MySQL binlog to SQL you want

在执行之前，需要确认mysql server已设置以下参数：

[mysqld]

server_id = 1

log_bin = /var/log/mysql/mysql-bin.log

max_binlog_size = 1G

binlog_format = row

binlog_row_image = full

获取正向操作：

> python binlog2sql.py -h127.0.0.1 -P13306 -uroot -p --start-file=mysql-bin.000002

Password:

INSERT INTO `tests`.`person`(`id`, `name`) VALUES (1, 'first'); #start 4 end 395 time 2024-09-14 17:16:36

DELETE FROM `tests`.`person` WHERE `id`=1 AND `name`='first' LIMIT 1; #start 426 end 667 time 2024-09-14 17:16:38

通过命令，输入用户名、密码、端口号、地址等，并且指定binlog文件

通过输出，可以看出所有正向操作，以及每个正向操作的时间、binlog位置

获取逆向操作：

> python binlog2sql.py -h127.0.0.1 -P13306 -uroot -p --start-file=mysql-bin.000002 --flashback

Password:

INSERT INTO `tests`.`person`(`id`, `name`) VALUES (1, 'first'); #start 426 end 667 time 2024-09-14 17:16:38

DELETE FROM `tests`.`person` WHERE `id`=1 AND `name`='first' LIMIT 1; #start 4 end 395 time 2024-09-14 17:16:36

命令中，新增一个参数 --flashback，用于指定回滚

通过输出，可以看出所有逆向操作。并且可以看出相对于正向操作来说，逆向操作的顺序是相反的，按时间从后往前排序

还有其他工具，比如说MyFlash等，大家可以自行研究

MyFlash：GitHub - Meituan-Dianping/MyFlash: flashback mysql data to any point

四、总结

我们可以通过binlog找回误删的数据，前提是开启了binlog。建议binlog模式为row模式，否则没办法根据正向操作生成逆向操作。

有一些开源工具可以自动解析binlog，并且生成逆向操作。

作者：掂过碌蔗
来源：juejin.cn/post/7416737238614589503

收起阅读 »

Spring Boot3，启动时间缩短 10 倍！

Java

前面松哥写了一篇文章和大家聊了 Spring6 中引入的新玩意 AOT（见Spring Boot3 新玩法，AOT 优化！）。文章发出来之后，有小伙伴问松哥有没有做性能比较，老实说，这个给落下了，所以今天再来一篇文章，和小伙伴们梳理比较小当我们利用 Nati...

继续阅读 »

前面松哥写了一篇文章和大家聊了 Spring6 中引入的新玩意 AOT（见Spring Boot3 新玩法，AOT 优化！）。

文章发出来之后，有小伙伴问松哥有没有做性能比较，老实说，这个给落下了，所以今天再来一篇文章，和小伙伴们梳理比较小当我们利用 Native Image 的时候，Spring Boot 启动性能从参数上来说，到底提升了多少。

先告诉大家结论：启动速度提升 10 倍以上。

1. Native Image

1.1 GraalVM

不知道小伙伴们有没有注意到，现在当我们新建一个 Spring Boot 工程的时候，再添加依赖的时候有一个 GraalVM Native Support，这个就是指提供了 GraalVM 的支持。

那么什么是 GraalVM 呢？

GraalVM 是一种高性能的通用虚拟机，它为 Java 应用提供 AOT 编译和二进制打包能力，基于 GraalVM 打出的二进制包可以实现快速启动、具有超高性能、无需预热时间、同时需要非常少的资源消耗，所以你把 GraalVM 当作 JVM 来用，是没有问题的。

在运行上，GraalVM 同时支持 JIT 和 AOT 两种模式：

JIT 是即时编译（Just-In-Time Compilation）的缩写。它是一种在程序运行时将代码动态编译成机器码的技术。与传统的静态编译（Ahead-of-Time Compilation）不同，静态编译是在程序执行之前将代码编译成机器码，而 JIT 编译器在程序运行时根据需要将代码片段编译成机器码，然后再运行。所以 JIT 的启动会比较慢，因为编译需要占用运行时资源。我们平时使用 Oracle 提供的 Hotspot JVM 就属于这种。

AOT 是预先编译（Ahead-of-Time Compilation）的缩写。它是一种在程序执行之前将代码静态编译成机器码的技术。与即时编译（JIT）不同，即时编译是在程序运行时动态地将代码编译成机器码。AOT 编译器在程序构建或安装阶段将代码转换为机器码，然后在运行时直接执行机器码，而无需再进行编译过程。这种静态编译的方式可以提高程序的启动速度和执行效率，但也会增加构建和安装的时间和复杂性。AOT 编译器通常用于静态语言的编译过程，如 C、C++ 等。

如果我们在 Java 应用程序中使用了 AOT 技术，那么我们的 Java 项目就会被直接编译为机器码可以脱离 JVM 运行，运行效率也会得到很大的提升。

那么什么又是 Native Image 呢？

1.2 Native Image

Native Image 则是 GraalVM 提供的一个非常具有特色的打包技术，这种打包方式可以将应用程序打包为一个可脱离 JVM 在本地操作系统上独立运行的二进制包，这样就省去了 JVM 加载和字节码运行期预热的时间，提升了程序的运行效率。

Native Image 具备以下特点：

即时启动：由于不需要 JVM 启动和类加载过程，Native Image 可以实现快速启动和即时执行。

减少内存占用：编译成本地代码后，应用程序通常会有更低的运行时内存占用，因为它们不需要 JVM 的额外内存开销。

静态分析：在构建 Native Image 时，GraalVM 使用静态分析来确定应用程序的哪些部分是必需的，并且只包含这些部分，这有助于减小最终可执行文件的大小。

即时性能：虽然 JVM 可以通过JIT（Just-In-Time）编译在运行时优化代码，但 Native Image 提供了即时的、预先优化的性能，这对于需要快速响应的应用程序特别有用。

跨平台兼容性：Native Image 可以为不同的操作系统构建特定的可执行文件，包括 Linux、macOS 和 Windows，即在 Mac 和 Linux 上自动生成系统可以执行的二进制文件，在 Windows 上则自动生成 exe 文件。

安全性：由于 Native Image 不依赖于 JVM，因此减少了 JVM 可能存在的安全漏洞的攻击面。

与 C 语言互操作：Native Image 可以与本地 C 语言库更容易地集成，因为它们都是在同一环境中运行的本地代码。

根据前面的介绍大家也能看到，GraalVM 所做的事情就是在程序运行之前，该编译的就编译好，这样当程序跑起来的时候，运行效率就会高，而这一切，就是利用 AOT 来实现的。

但是！对于一些涉及到动态访问的东西，GraalVM 似乎就有点力不从心了，原因很简单，GraalVM 在编译构建期间，会以 main 函数为入口，对我们的代码进行静态分析，静态分析的时候，一些无法触达的代码会被移除，而一些动态调用行为，例如反射、动态代理、动态属性、序列化、类延迟加载等，这些都需要程序真正跑起来才知道结果，这些就无法在编译构建期间被识别出来。

而反射、动态代理、序列化等恰恰是我们 Java 日常开发中最最重要的东西，不可能我们为了 Native Image 舍弃这些东西！因此，从 Spring6（Spring Boot3）开始支持 AOT Processing！AOT Processing 用来完成自动化的 Metadata 采集，这个采集主要就是解决反射、动态代理、动态属性、条件注解动态计算等问题，在编译构建期间自动采集相关的元数据信息并生成配置文件，然后将 Metadata 提供给 AOT 编译器使用。

道理搞明白之后，接下来通过一个案例来感受下 Native Image 的威力吧！

2. 准备工作

首先需要我们安装 GraalVM。

GraalVM 下载地址：

http://www.graalvm.org/downloads/

下载下来之后就是一个压缩文件，解压，然后配置一下环境变量就可以了，这个默认大家都会，我就不多说了。

GraalVM 配置好之后，还需要安装 Native Image 工具，命令如下：

gu install native-image

装好之后，可以通过如下命令检查安装结果：

另一方面，Native Image 在进行打包的时候，会用到一些 C/C++ 相关的工具，所以还需要在电脑上安装 Visual Studio 2022，这个我们安装社区版就行了（visualstudio.microsoft.com/zh-hans/dow…

下载后双击安装就行了，安装的时候选择 C++ 桌面应用开发。

如此之后，准备工作就算完成了。

3. 实践

接下来我们创建一个 Spring Boot 工程，并且引入如下两个依赖：

然后我们开发一个接口：

@RestController

public class HelloController {



    @Autowired

    HelloService helloService;



    @GetMapping("/hello")

    public String hello() {

        return helloService.sayHello();

    }

}

@Service

public class HelloService {

    public String sayHello() {

        return "hello aot";

    }

}

这是一个很简单的接口，接下来我们分别打包成传统的 jar 和 Native Image。

传统 jar 包就不用我多说了，大家执行 mvn package 即可：

mvn package

打包完成之后，我们看下耗时时间：

耗时不算很久，差不多 3.7s 左右，算是比较快了，最终打成的 jar 包大小是 18.9MB。

再来看打成原生包，执行如下命令：

mvn clean native:compile -Pnative

这个打包时间就比较久了，需要耐心等待一会：

可以看到，总共耗时 4 分 54 秒。

Native Image 打包的时候，如果我们是在 Windows 上，会自动打包成 exe 文件，如果是 Mac/Linux，则生成对应系统的可执行文件。

这里生成的 aot_demo.exe 文件大小是 82MB。

两种不同的打包方式，所耗费的时间完全不在一个量级。

再来看启动时间。

先看 jar 包启动时间：

耗时约 1.326s。

再来看 exe 文件的启动时间：

好家伙，只有 0.079s。

1.326/0.079=16.78

启动效率提升了 16.78 倍！

我画个表格对比一下这两种打包方式：

	jar	Native Image
包大小	18.9MB	82MB
编译时间	3.7s	4分54s
启动时间	1.326s	0.079s

从这张表格中我们可以看到，Native Image 在打包的时候比较费时间，但是一旦打包成功，项目运行效率是非常高的。Native Image 很好的解决了 Java 冷启动耗时长、Java 应用需要预热等问题。

最后大家可以自行查看打包成 Native Image 时候的编译结果，如下图：

看过松哥之前将的 Spring 源码分析的小伙伴，这块的代码应该都很好明白，这就是直接把 BeanDefinition 给解析出来了，不仅注册了当前 Bean，也把当前 Bean 所需要的依赖给注入了，将来 Spring 执行的时候就不用再去解析 BeanDefinition 了。

同时我们可以看到在 META-INF 中生成了 reflect、resource 等配置文件。这些是我们添加的 native-maven-plugin 插件所分析出来的反射以及资源等信息，也是 Spring AOT Processing 这个环节处理的结果。

作者：江南一点雨
来源：juejin.cn/post/7330071686489817128

收起阅读 »

CMS垃圾回收器的工作原理是什么？为什么它会被官方废弃？

Java

你好，我是猿java。 1. 网上关于 CMS的文章很多，为什么要重复造车轮？答：网上很多关于 CMS收集器的文章写得不够具体，有的甚至一知半解，更多的是不假思索的转载，想通过自己对 CMS的理解以及大量资料的佐证，提供更具体形象正确的分析。 2. CMS已...

继续阅读 »

你好，我是猿java。

1. 网上关于 CMS的文章很多，为什么要重复造车轮？

答：网上很多关于 CMS收集器的文章写得不够具体，有的甚至一知半解，更多的是不假思索的转载，想通过自己对 CMS的理解以及大量资料的佐证，提供更具体形象正确的分析。

2. CMS已经被弃用，为什么还要分析它？

答：首先，CMS收集器依然是面试中的一个高频问题；
其次，CMS作为垃圾收集器的一个里程碑，作为 Java程序员，不了解原理，于情于理说不过去；

3. JVM已经把垃圾回收自动化了，为什么还要讲解 CMS？

答：排查生产环境的各种内存溢出，内存泄漏，垃圾回收导致性能瓶颈等技术问题，如果不懂原理，如何排查和优化？

温馨提示：如果没有特殊说明，本文提及的虚拟机默认为 HotSpot虚拟机。

背景

首先，了解下 HotSpot虚拟机中 9款垃圾回收器的发布时间及其对应的 JDK版本，如下图：

接着，了解下 CMS垃圾回收器的生命线：

2002年9月，JDK 1.4.1 版本，CMS实验性引入；

2003年6月，JDK 1.4.2 版本，CMS正式投入使用；

2017年9月，JDK 9 版本，CMS被标记弃用；

2020年3月，JDK 14 版本，CMS从 JDK中移除；

效力 18年，一代花季回收器，从此退出历史舞台；

什么是垃圾

既然分析的是垃圾回收器，那么，我们首先需要知道：在 JVM 中，什么是“垃圾”？

这里的“垃圾”用了双引号，是因为它和我们生活中理解的垃圾不一样。在 JVM中，垃圾（Garbage）是指那些不再被应用程序使用的对象，也就是说这些对象不再可达，即对象已死。

如何判断对象不可达（已死）？

在 JVM中，通过一种可达性分析（Reachability Analysis）算法来判断对象是否可达。该算法的基本思路是：通过 GC Roots 集合里的根对象作为起始点，一直追踪所有存在引用关系的对象（这条引用关系链路叫做引用链 Reference Chain），如果某对象到 GC Roots之间没有引用链，那么该对象就是不可达。如下图，obj4， obj5，obj6 尽管相互直接关联，但是没有 GC Root连接，所以是不可达，同理 obj7也不可达：

关于可达性分析，还有一种方法是引用技术算法，该方法的思路是：在对象中添加一个计数器，增加一次引用计数器 +1，减少一次引用计数器 -1，当计数器始终为 0时代表不被使用，这种方法一般是用于 Python的CPython 和微软的COM（Component Object Model）等技术中，JVM中使用的是可达性分析算法，这点需要特别注意。

哪些对象可以作为 GC Roots？

GC Roots 是 GC Root的集合，本质上是一组必须活跃的对象引用，主要包含以下几种类型：

虚拟机栈中的引用对象：每个线程的虚拟机栈中的局部变量表中的引用。这些引用可能是方法的参数、局部变量或临时状态。

方法区中的类静态属性引用对象：所有加载的类的静态字段。静态属性是类级别的，因此它们在整个Java虚拟机中是全局可访问的。

方法区中的常量引用对象：方法区中的常量池（例如字符串常量池）中的引用。

本地方法栈中的JNI引用：由 Java本地接口（JNI）代码创建的引用，例如，Java代码调用了本地 C/C++库。

活跃的 Java线程：每个执行中的Java线程本身也是一个GC Root。

同步锁（synchronized block）持有的对象：被线程同步持有的对象。

Java虚拟机内部的引用：比如基本数据类型对应的Class对象，一些常见的异常对象（如NullPointerException、OutOfMemoryError）的实例，系统类加载器。

反射引用的对象：通过反射API持有的对象。

临时状态：例如，从Java代码到本地代码的调用。

这里举个简单的例子来解释 GC Root 以及 GC Root可达对象，如下代码：

	

public class RootGcExample {

    private static Object sObj = new Object(); // 静态字段 sObj是 Gc Root



    private static void staticMethod() {

      Object mObj = new Object(); // 方法局部变量 mObj是 Gc Root

      //  ...

    }



    public static void main(String[] args) {

        Object obj = new Object(); // 局部变量obj 是 Gc Root

        staticMethod();

    }

}

上述例子中，sObj 是一个静态变量引用，指向了一个 Object对象，因此，sObj是一个 Gc Root，在staticMethod静态方法中，mObj 是一个方法局部变量，它也是一个 Gc Root，在 main方法中，obj也是一个Gc Root。堆中的 Object对象就是 GC Root可达对象，上述关系可以描绘成下图：

回收哪里的垃圾？

从 CMS 简介可以知道 CMS是用于老年代的垃圾回收，但是对于这种抽象的文字描述，很多小伙伴肯定还是没有体感，因此，我们把视角放眼到整个 JVM运行时的内存结构上，从整体上看看垃圾回收器到底回收的是哪些区域的垃圾， CMS 又是回收哪里的垃圾，如下图：

垃圾在哪里？

在了解了“垃圾”在 JVM中是如何定义之后，我们不禁会问到：这些“垃圾”存放在哪里呢？

在回答这个问题之前，我们先来了解 JVM的内存结构，根据 Java虚拟机规范，JVM内存包含以下几个运行时区域，如下图：

为了更好地理解 JVM内存结构，这里对各个区域做一个详细的介绍：

堆空间（Heap）：它是 JVM内存中最大的一块线程共享的区域，用于存放 Java应用创建的对象实例和数组。堆空间进一步细分为几个区域：

年轻代：Young Generation，大部分的对象都是在这里创建。年轻代又分为一个 Eden区和两个 Survivor区（S0和S1）。这里的大部分对象生命周期比较短，会被垃圾回收器快速回收。

老年代：Old Generation 或 Tenured Generation，在年轻代中经过多次垃圾回收仍然存活的对象会被移动到老年代，或者一些大对象会直接被分配到老年代，这里的对象一般存活时间较长，垃圾回收频率较低。

永久代：Permanent Generation，PermGen，Java 8之前版本的叫法，用于存放类信息、方法信息、常量等。在 Java 8及之后的版本，永久代被元空间（Metaspace）所替代。

元空间：Metaspace，Java 8及之后版本的叫法，用于存放类的元数据信息，它使用本地物理内存，不在 JVM堆内。

方法区（Method Area）：方法区是堆的一个逻辑区域，它是线程共享的，用于存储已被 JVM加载的类结构信息，常量、静态变量、即时编译后的代码缓存等数据。为了和堆区分开来，它也被叫做“非堆（Non-Heap）”。这个区域的回收对象主要是常量池和类型的卸载，而且回收的效果比较差。

关于方法区有一个误区：JDK 8以前，HotSpot虚拟机为了像堆一样管理方法区的垃圾回收，就使用永久代来实现方法区，因此有人就把方法区直接叫做永久代，而其它虚拟机不存在永久代的概念，因此，方法区如何实现属于虚拟机内部的机制，不是 JVM统一规范。另外，HotSpot发现永久代实现方法区这种做法会导致内存溢出，因此从 JDK8开始，把永久代彻底废除，改用和 JRockit一样的元空间。方法区也改用本地内存实现。

程序计数器（Program Counter Register）：这是一个较小的线程私有内存空间，用于存储当前线程执行的字节码的行号指示器。每个线程都有自己的程序计数器，但这部分内存通常不涉及垃圾回收。

虚拟机栈（Java Virtual Machine Stack）：每个 Java方法执行时都会创建一个线程私有的栈帧，用于存储局部变量表、操作数栈、动态链接和方法出口信息等。虚拟机栈在方法执行完毕后会自动清理，因此也不是垃圾回收的重点。

本地方法栈（Native Method Stack）：用于支持本地方法的执行（即通过JNI调用的非Java代码），它是线程私有的。本地方法栈也会在方法执行完毕后自动清理。

通过上述 JVM内存区域的介绍，我们可以发现 JVM各个内存区域都可能产生垃圾，只是程序计算器，本地方法区，虚拟机栈 3个区域随线程而生，随线程而亡，垃圾被自动回收，方法区回收效果比较差，而堆中的“垃圾”才是回收器关注的重点，因此，垃圾收集器重点关注的是 JVM的堆，而 CMS回收的是堆中的老年代，如下图：

到这里为止，我们已经从 JVM内存结构视角上掌握了垃圾收集器回收的区域以及 CMS 负责的区域。

接下来，分析一下 GC回收常用的几个重要技术点：三色标记法（Tricolor Marking），卡表（Card Table），写屏障（Write Barrier），理解它们可以帮助我们更好地去理解 GC回收的原理。

几个重要技术点

三色标记法

在垃圾收集器中，主要采用三色标记算法来标记对象的可达性：

白色：表示对象尚未被访问。初始状态时，所有的对象都被标记为白色。

灰色：表示对象已经被标记为存活，但其引用的对象还没有全部被扫描。灰色对象可能会引用白色对象。

黑色：表示对象已经被标记为存活，并且该对象的所有引用都已经被扫描过。黑色对象不会引用任何白色对象。

三色标记算法的工作流程大致如下：

初始化时，所有对象都标记为白色。

将所有的 GC Roots 对象标记为灰色，并放入灰色集合。

从集合中选择一个灰色对象，将其标记为黑色，并将其引用的所有白色对象标记为灰色，然后放入灰色集合。

重复步骤3，直到灰色集合为空。

最后，所有黑色对象都是活跃的，白色对象都是垃圾。

卡表

对于分代垃圾回收器，势必存在一个跨代引用的问题，通常会使用一种名为记忆集（Remembered Set）的数据结构，它是一种用于记录从非收集区指向收集区的指针集合的数据结构。

而卡表就是最常用的一种记忆集，它是一个字节数组，用于记录堆内存的映射关系，下面是 HotSpot虚拟机默认的卡表标记逻辑：

// >> 9 代表右移 9位，即 2^9 = 512 字节

CARD_TABLE[this address >> 9] = 0;

每个元素都对应着其标识的内存区域中一块特定大小的内存块，这个内存块叫做“卡页（Card Page）”。因为卡页代表的是一个区域，所以可能存在很多对象，只要有一个对象存在跨代引用，就把数组的值设为1，称该元素“变脏（Dirty）”，该卡页叫“脏页（Dirty Page）”，如下：

	// >> 9 代表右移 9位，即2^9=512

CARD_TABLE[this address >> 9] = 1;

当垃圾回收时，只要筛选卡表中有变脏的元素，即数组值为 1，就能判断出其对应的内存区域存在对象跨代引用，卡表和卡页的关系如下图：

写屏障

在 HotSpot虚拟机中，写屏障本质上是引用字段被赋值这个事件的一个环绕切面（Around AOP），即一个引用字段被赋值的前后可以为程序提供额外的动作（比如更新卡表），写屏障分为：前置写屏障（Pre-Write-Barrier）和后置写屏障（Post-Write-Barrier）2种类型。

需要注意的是：这里的写屏障和多线程并发中的内存屏障不是一个概念。

分析完几个重要的技术点之后，接下来，我们正式分析 CMS回收器。

CMS 简介

CMS 是 Concurrent Mark Sweep 的简称，中文翻译为并发标记清除，它的目标是减少垃圾回收时应用线程的停顿时间，并且实现应用线程和 GC线程并发执行。

CMS 用于老年代的垃圾回收，使用的是标记-清除算法。通过 -XX:+UseConMarkSweepGC 参数即可启动 CMS回收器。

在 CMS之前的 4款回收器（Serial，Serial Old，ParNew，Parallel Scavenge），应用线程和 GC线程无法并发执行，必须 Stop The World（将应用线程全部挂起），并且它们关注的是可控的吞吐量，而 CMS回收器，应用线程和 GC线程可以并发执行，目标是缩短回收时应用线程的停顿时间，这是 CMS和其它 4款回收器本质上的区别，也是它作为里程碑的一个标志。

CMS 回收过程

从整体上看，CMS 垃圾回收主要包含 5个步骤（网上很多 4，6，7个步骤的版本，其实都大差不差，没有本质上的差异）：

Initial Mark（初始标记）：会Stop The World

Concurrent Marking（并发标记）

Remark（重复标记）：会Stop The World

Concurrent Sweep（并发清除）

Resetting（重置）

整个过程可以抽象成下图：

在讲解回收过程之前，先分析三色标记法，这样可以帮助我们更好地去理解 GC的原理。

1. 初始标记

初始标记阶段会 Stop The World（STW），即所有的应用线程（也叫 mutator线程）被挂起。

该阶段主要任务是：枚举出 GC Roots以及标识出 GC Roots直接关联的存活对象，包括那些可能从年轻代可达的对象。

那么，GC Roots是如何被枚举的？GC Roots的直接关联对象是什么？为什么需要 STW？

GC Roots是如何被枚举的？

通过上文对 GC Roots的描述可知，作为 GC Roots的对象类型有很多种，遍及 JVM中的多个区域，对于现如今这种大内存的 VM，如果需要临时去扫描各区域来获取 GC Roots，那将是很大的一个工程量，因此，JVM采用了一种名为 OopMap（Object-Oriented Programming Map）的数据结构，它用于在垃圾收集期间快速地定位和更新堆中的对象引用（OOP，Object-Oriented Pointer）。

OopMap是在 JVM在编译期间生成的，主要作用是提供一个映射，通过这个映射垃圾收集器可以知道在特定的程序执行点（如safepoint）哪些位置（比如在栈或寄存器中）存放着指向堆中对象的引用，这样就可以快速定位 GC Roots。

使用OopMap的优点包括：

提高效率：OopMap使得垃圾收集器能够快速准确地找到和更新所有的对象引用，从而减少垃圾收集的时间。

减少错误：手动管理对象引用的位置容易出错，OopMap提供了一种自动化的方式来追踪这些信息。

便于优化：由于 OopMap是在编译时生成的，编译器可以进行优化，比如减少需要记录的引用数量，从而减少垃圾收集的开销。

在 HotSpot虚拟机中，OopMap是实现精确垃圾收集的关键组件之一。

什么是 GC Roots直接关联的对象？

所谓直接关联对象就是 GC Root直接引用的对象，下面以一个示例来说明，如下代码：

	

public class AssociatedObjectExample {



  public static void main(String[] args) {

    Associated obj = new Associated(); // Associated 是 GC Root obj 直接关联

    ((Associated) obj).bObj = new BigObject(); // BigObject是 GC Root obj 的间接关联的对象，BigObject是一个大对象，直接分配到老年代

  }



  static class Associated {

    BigObject bObj; // 与Associated对象直接关联的对象

  }



  static class BigObject {

    // 其它代码

  }

}

上述例子中，obj是一个 GC Root，Associated对象就是它的直接关联对象，bObj是一个 GC Root，BigObject对象是它的直接关联对象，obj可以通过 Associated对象间接关联到 BigObject对象，但 BigObject对象不是 obj的直接关联对象，而是间接关联对象。整个关联关系可以描绘成下图：

为什么需要 STW？

为什么初始标记阶段需要 Stop The World？这里主要归纳成两个原因：

确定 Roots集合：初始标记阶段的主要任务是识别出所有的 GC Roots，这是后续并发标记阶段的起点。在多线程运行的环境中，如果应用线程和垃圾回收线程同时运行，应用线程可能会改变对象引用关系，导致 Roots集合不准确。因此，需要暂停应用线程，以确保 GC Roots的准确性和一致性。

避免并发问题：在初始标记阶段，垃圾回收器需要更新一些共享的数据结构，例如标记位图或者引用队列。如果应用线程在此时运行，可能会引入并发修改的问题，导致数据不一致。STW可以避免这种情况的发生。

2.并发标记**

这里的并发是指应用线程和 GC线程可以并发执行。

在并发标记阶段主要完成 2个事情：

遍历对象图，标记从 GC Roots可以追踪到所有可达的存活对象；

处理并发修改

因为应用线程仍在继续工作，因此老年代的对象可能会发生以下几种变化：

新生代的对象晋升到老年代；

直接在老年代分配对象；

老年代对象的引用关系发生变更；

为了防止这些并发修改被遗漏，CMS 使用了后置写屏障（Write Barrier）机制，确保这些更改会被记录在“卡表（Card Table）”中，同时将相应的卡表条目标记为脏（dirty），以便后续处理。

如下图：从 GC Roots追溯哦所有可达对象，并将它们修改为已标记，即黑色。

当老年代中，D 到 E到引用被修改时，就会触发写屏障机制，最终 E就会被写进脏页，如下图：

并发标记会出现对象可达性误判问题，如下图：假如对象 D对象被标记成黑色，E对象被标记为灰色（图左半部分），这时，工作线程将 E对象修改成不再指向F，并将 D对象指向 F对象（图右半部分），按照三色标记算法，D对象为黑色，不会再往下追溯，所以 F对象就无法被标记从而变成垃圾，“存活”对象凭空消失了，这是很可怕的问题，那么 CMS是如何解决这种问题的呢？

解决这种问题，通常有两种方案：

增量更新（Incremental Update）

当新增黑色对象指向白色对象关系时（D->F），需要记录这次新增，等并发扫描结束后，将这些黑色的对象作为 GC Root，重新扫描一次，也就是把这些黑色对象看成灰色对象，它们指向的白色对象就可以被正常标记。CMS采取的就是这种方式。

原始快照（Snapshot At The Beginning，SATB）

当删除灰色对象指向白色对象关系时（E->F），需要记录这次删除，等并发扫描结束后，将这些灰色的对象作为 GC Root，按照删除 E对象指向 F对象前一刻的快照（也就是E->F 还是可达的）重新扫描一次，即不管关系删除与否，都会按照删除前那一刻快照的对象图来进行搜索标记。G1，Shenandoah采取的是这种方式。

3.重新标记

重复标记阶段也会 Stop The World，即挂起所有的应用程序线程，该阶段主要完成事情是：

并发预清理：在重新标记阶段之前，CMS可能会执行一个可选的并发预清理步骤，以尽量减少重新标记阶段的工作量。(该过程在很多文章中会单独成一个大步骤讲解)

修正标记结果：由于在并发标记阶段导致的并发修改，导致漏标，错标，因此需要暂停应用线程（STW），确保修正这些标记结果。

处理卡表：检查并发标记阶段修改的这些脏卡，并重新标记引用的对象，以确保所有可达对象都被正确识别。

处理最终可达对象：处理那些在并发标记阶段被识别出的“最终可达”（Finalizable）对象。这些对象需要执行它们的 finalize方法，finalize方法可能会使对象重新变为可达状态。

处理弱引用、软引用、幻象引用等：处理各种不同类型的引用，确保它们按照预期被处理。例如，弱引用在 GC后会被清除，软引用在内存不足时会被清除，而幻象引用则在对象被垃圾收集器回收时被放入引用队列。

4.并发清除

这里的并发也是指应用线程和 GC线程可以并发执行，并发清除阶段主要完成 2个事情：

清除并发标记阶段标记为死亡的对象；

并发清除结束后，CMS 会利用空闲列表（free-list）将未被标记的内存（即垃圾对象占据的内存）收集起来，组成一个空闲列表，用于新对象的内存分配；

5.重置

清理和重置 CMS回收器的内部数据结构，为下一次垃圾回收做准备。

到此，回收过程就分析完毕，接下来总结下 CMS的优点和缺点。

CMS 的优点

低停顿时间

相对 Serial，Serial Old，ParNew，Parallel Scavenge 4款回收器，CMS收集器的主要优势是减少垃圾收集时的停顿时间，特别是减少了Full GC的停顿时间，这对于延迟敏感的应用程序非常有利。

并发收集

CMS在回收过程中，应用线程和 GC线程可以并发执行，从而减少了垃圾收集对应用程序的影响。

适合多核处理器

由于CMS利用了并发执行，它能够更好地利用现代多核处理器的能力，将垃圾收集的工作分散到多个CPU核心。

CMS 的缺点

浮动垃圾

在并发清除阶段，因为应用线程可以并发工作，可能会产生垃圾，这些垃圾在当前 GC无法处理，需要到下一次 GC才能进行处理，因此，这些垃圾就叫做“浮动垃圾”。

Concurrent Mode Failure

JDK5 默认设置下，当老年代使用了68%的空间后就会被激活 CMS回收，从JDK 6开始，垃圾回收启动阈值默认提升至92%，我们可以通过 -XX:CMSInitiatingOccupancyFraction 参数自行调节。

如果阈值是 68%，可能导致空间没有完全利用，频繁产生 GC，如果是92%，又会更容易面临另一种风险，要是预留的内存无法满足程序分配新对象的需要，就会出现一次 Concurrent Mode Failure（并发失败），因此会引发 FullGC。

这时候虚拟机将不得不启动后备预案：冻结用户线程的执行，临时启用Serial Old收集器来重新进行老年代的垃圾收集，但这样停顿时间就很长了。

内存碎片

因为 CMS采用的是标记-清理算法，当清理之后就会产生很多不连续的内存空间，这就叫做内存碎片。如果老年代无法使用连续空间来分配对象，就会出发 Full GC。为了解决这个问题，CMS收集器提供了 -XX：+UseCMS-CompactAtFullCollection 参数进行碎片压缩整理，参数默认是开启的，不过从JDK 9开始废弃。

总结

本文不仅讲解了 CMS回收器，更是铺垫了很多 GC相关的基础知识，比如安全点，三色标记法，卡表，写屏障。

CMS 是 Concurrent Mark Sweep 的简称，中文翻译为并发标记清除，它的目标是减少垃圾回收时应用线程的停顿时间，并且实现应用线程和 GC线程并发执行。

CMS 用于老年代的垃圾回收，使用的是标记-清除算法。通过 -XX:+UseConMarkSweepGC 参数即可启动 CMS收集器。

CMS 主要包含：初始标记，并发标记，重新标记，并发清除，重置 5个过程。

CMS 收集器使用三色标记法来标记对象，采用写屏障，卡表和脏页的方式来防止并发标记中修改的引用被漏标。

CMS 收集器有 3大缺点：浮动垃圾，并发失败以及内存碎片。

尽管 CMS收集器已经被官方废弃了，但是它这种优化思路值得我们日常开发中借鉴。

希望文章可以给你带来收获和思考，如果有任何疑问，欢迎评论区留言讨论。如果本文对你有帮助，请帮忙点个在看，点个赞，或者转发给更多的小伙伴，获取三色标记法相关资料，请关注公众号，回复：三色

CiteSeerX的特点包括：

自动引文索引：CiteSeerX使用算法自动从文档中提取引文，并创建文献之间的引用链接。

自动元数据提取：它能自动识别文档的元数据，如标题、作者、出版年份等。

相关文档推荐：根据用户的搜索和查看历史，CiteSeerX可以推荐相关的文档。

文档更新：CiteSeerX会自动在网络上查找和索引新文档，以保持数据库的更新。

CiteSeerX由宾夕法尼亚州立大学的信息科学与技术学院维护和管理。该项目是科研人员和学生获取计算机科学和相关学科文献的重要资源之一。

参考

HotSpot Virtual Machine Garbage Collection Tuning Guide

Java Garbage Collection Basics

Why does CMS collector collect root references from young generation on Initial Mark phase?

Memory Management in the Java HotSpot Virtual Machine

Why does Concurrent-Mark-Sweep (CMS) remark phase need to re-examine the thread-stacks instead of just looking at the mutator’s write-queues?

A Generational Mostly-concurrent Garbage Collector

The JVM Write Barrier - Card Marking

原创好文

9款常见的 JVM垃圾回收器

美团一面：Git 是如何工作的？(推荐阅读）

阿里 P7二面：Redis 执行 Lua，能保证原子性吗？

当下环境，程序员需要修炼的 3项技能

AI是打工人的下一个就业风口吗?

和斯坦福博士写代码的一个月

肝了一周，这下彻底把 MySQL的锁搞懂了

作者：猿java
来源：juejin.cn/post/7445517512609447951

收起阅读 »

升级到 Java 21 是值得的

Java

升级到 Java 21 是值得的又到了一年中的这个时候——New Relic 的年度“State of the Java Ecosystem”调查结果出来了，我一如既往地深入研究了它。虽然我认为该报告做得很好并且提出了很好的问题，但我对有多少 Java 开发...

继续阅读 »

升级到 Java 21 是值得的

又到了一年中的这个时候——New Relic 的年度“State of the Java Ecosystem”调查结果出来了，我一如既往地深入研究了它。虽然我认为该报告做得很好并且提出了很好的问题，但我对有多少 Java 开发人员正在使用低版本感到沮丧。

您使用的是 Java 21 吗？确实应该使用了。

在开始调查之前，作为一名 Java 爱好者，我想谈谈我最喜欢的关于 Java 21 的一些事情。

首先我要说的是，Spring Boot 3.x 是当前 Java 虚拟机 (JVM) 上最流行的服务器端技术栈，至少需要 Java 17。它不支持 Java 8，这是第二个版本。根据调查，最常用的版本。

我很高兴看到 Java 17 的采用进展相对较快，但您确实应该使用 Java 21。Java 21 比 Java 8 好得多。它在所有方面都在技术上优越。它更快、更安全、更易于操作、性能更高、内存效率更高。

道德上也很优越。当您的孩子发现您在生产中使用 Java 8 时，您不会喜欢他们眼中流露出羞愧和悲伤的表情。

做正确的事，成为你希望在世界上看到的改变：使用 Java 21。它充满了优点，基本上是自 Java 7 以来的一种全新语言：Lambdas，Multiline strings。Smart switch expressions。 var 。Pattern matching。Named tuples（在 Java 中称为 records ）。

当然，最重要的是虚拟线程。虚拟线程是一件大事。它们提供了与 async / await 或 suspensions 相同的优点，但没有其他语言中冗长代码。

是的，你明白我的意思了。与其他语言相比，Java 的虚拟线程提供了更好的解决方案，并且代码更少。

如果你不知道我在说什么，并且使用其他语言，那么你现在会很生气。java？比您最喜欢的语言更简洁？不可能的！但我并没有错。

为什么虚拟线程很重要

要了解virtual threads，您需要了解创建它们是为了解决的问题。如果您还没有体验过虚拟线程，那么它们有点难以描述。我会尽力。

Java 有阻塞操作——比如 Thread.sleep(long) 、 InputStream.read 和 OutputStream.write 。如果您调用其中一个方法，程序将不会前进到下一行，直到这些方法完成它们正在做的事情并返回。

大多数网络服务都是 I/O 密集的，这意味着它们将大部分时间花在输入和输出方法上，例如 InputStream.read 和 OutputStream.write 。

任务提交到线程池中却没有更多线程的服务是很常见的，但仍然无法返回响应，因为所有现有线程都在等待某些 I/O 操作发生，例如跨线程的 I/O HTTP 边界、数据库或消息队列的 I/O。

有多种方法可以解锁 I/O。您可以使用 java.nio ，它非常复杂，会引起焦虑。您可以使用reactive式编程，它的工作原理是范式的(paradigmatically)，但它是对整个代码库的完整重构。

因此，我们的想法是：如果编译器知道您何时执行了可能会阻塞的操作（例如 InputStream.read ）并重新排序代码的执行，这不是很好吗？因此，当您执行阻塞操作时，等待代码将从当前执行线程移出，直到阻塞操作完成，然后在准备好恢复执行后将其放回另一个线程。

这样，您就可以继续使用阻塞语义。第一行在第二行之前执行。这提高了可调试性和可扩展性。您不再垄断线程只是为了在等待某些事情完成时浪费它们。这将是两全其美：非阻塞 I/O 的可扩展性与更简单的阻塞 I/O 的明显简单性、可调试性和可维护性。

许多其他语言，如 Rust、Python、C#、TypeScript 和 JavaScript，都支持 async / await 。 Kotlin 支持 suspend 。这些关键字提示运行时您将要做一些阻塞的事情，并且它应该重新排序执行。这是一个 JavaScript 示例：

async function getCustomer(){ /* call a database */ }

const result = await getCustomer();

问题症结在于要调用 async 函数，还必须位于 async 函数中：

async function getCustomer(){ /* call a database */ }



async function main(){ 

  const result = await getCustomer();

}

async 关键字是病毒式的。它蔓延开来。最终，你的代码会陷入 async / await 的泥潭——你为什么在任何可能的地方使用async/await呢？因为，它比使用低级、非阻塞 I/O 或反应式编程要好，但也只是勉强好。

Java 提供了一种更好的方法。只需为您的线程使用不同的工厂方法即可。

如果您使用 ExecutorService 创建新线程，请使用创建虚拟线程的新版本。

var es = Executors.newVirtualThreadPerTaskExecutor(); 

// ^- this is different and you'll probably only do it once 

// or twice in a typical application

var future = es.submit(() -> System.out.println("hello, virtual threads!"));

如果您直接在较低级别创建线程，则使用新的工厂方法：

// this is different

var thread = Thread.ofVirtual().start(() -> System.out.println("hello, virtual threads!"));

您的大部分代码保持完全不变，但现在您的可扩展性得到了显着提高。如果您创建数百万个线程，运行时不会喘息。我无法预测您的结果会是什么，但您很有可能不再需要运行给定服务的几乎同样多的实例来处理负载。

如果您使用的是 Spring Boot 3.2（您是，不是吗？），那么您甚至不需要执行任何操作。只需在 application.properties 中指定 spring.threads.virtual.enabled=true ，然后向管理层请求加薪，费用由大幅降低的云基础设施成本支付。

并非每个应用程序都可以在技术上实现跨越，但其中绝大多数可以而且应该。

使用情况报告分析

最后，这让我回到了 New Relic 报告。不要误会我的意思：它做得非常好，值得一读。就像莎士比亚悲剧一样，它写得很好，讲述了一个悲伤的故事。

有一个完整的部分证实了显而易见的事实：天空是蓝色的，云彩无处不在。在容器中部署工作负载似乎是主流模式，受访者表示 70% 的 Java 工作负载使用容器。坦白说，我很惊讶它这么低。

同样令人感兴趣的是从单核配置转向多核的趋势。根据调查，30% 的容器化应用程序正在使用 Java 9 的 -XX:MaxRAMPercentage 标志，该标志限制了 RAM 使用。 G1 是最流行的垃圾收集器。一切都很好。

当涉及到 Java 版本时，该报告发生了悲剧性的转变。超过一半的应用程序（56%）在生产中使用 Java 11，而 2022 年这一比例为 48%。Java 8（十年前的 2014 年发布）紧随其后，近 33% 的应用程序在生产中使用它。根据调查，三分之一的应用程序仍在使用 Java 版本，该版本在《Flappy Bird》游戏被下架、《冰桶挑战》横扫 Vine、《Ellen DeGeneres 奥斯卡》自拍照火爆的同一年推出。

多个用户使用 Amazon 的 OpenJDK 分发版。该报告表明，这是因为甲骨文暂时为其发行引入了更严格的许可。但我想知道其中有多少只是 Amazon Web Services（最多产的基础设施即服务 (IaaS) 供应商）上 Java 工作负载默认分布的函数。自几年前推出以来，该发行版已受到广泛欢迎。 2020年，它的市场份额为2.18%，现在则为31%。如果这么多人可以如此迅速地迁移到完全不同的发行版，那么他们应该能够使用同一发行版的新版本，不是吗？

我想，趋势中还是有一些希望的。 Java 17 用户采用率一年内增长了 430%。因此，也许我们会在 Java 21 中看到类似的数字——Java 21 已经全面发布近六个月了。

你还在等什么？

正如我在 Voxxed Days 的演讲中所说，我相信现在是成为 Java 和 Spring Boot 开发人员的最佳时机。 Java 和 Spring 开发人员拥有最好的玩具。我什至还没有提到 GraalVM 本机映像，它可以显着缩短给定 Java 应用程序的启动时间并减少内存占用。这已经与 Java 21 完美配合。

这些东西就在这里，它们太棒了。能否实现这一跳跃取决于我们。这并不难。试试看。

安装 SDKMan，运行 sdk install java 21.0.2-graalce 然后运行 sdk default java 21.0.2-graalce 。这将为您提供 Java 21 和 GraalVM 本机映像编译器。访问 Spring Initializr，这是我在网络上第二喜欢的地方（仅次于生产），网址为 start.spring.io。配置一个新项目。选择 Java 21（自然！）。添加 GraalVM Native Support 。添加 Web 。点击 Generate 按钮并将其加载到您的 IDE 中。在 application.properties 中指定 spring.threads.virtual.enabled=true 。创建一个简单的 HTTP 控制器：

@Controller

class Greetings {



 @GetMapping("/hi")

 String hello(){ 

    return "hello, Java 21!";

 }

}

将其编译为 GraalVM 本机映像： ./gradlew nativeCompile 。运行 build 文件夹中的二进制文件。

现在，您已经有了一个应用程序，该应用程序只占用非 GraalVM 本机映像所需 RAM 的一小部分，并且还能够扩展到每秒更多的请求。简单，而且令人惊奇。

原文地址:We CAN Have Nice Things: Upgrading to Java 21 Is Worth It - The New Stack

作者：xuejianxinokok
来源：juejin.cn/post/7345763454814765083

收起阅读 »

工作中 Spring Boot 五大实用小技巧，来看看你掌握了几个？

Java

0. 引入 Spring Boot 以其简化配置、快速开发和微服务支持等特点，成为了 Java 开发的首选框架。本文将结合我在实际工作中遇到的问题，分享五个高效的 Spring Boot 的技巧。希望这些技巧能对你有所帮助。 1. Spring Boot 执行...

继续阅读 »

0. 引入

Spring Boot 以其简化配置、快速开发和微服务支持等特点，成为了 Java 开发的首选框架。本文将结合我在实际工作中遇到的问题，分享五个高效的 Spring Boot 的技巧。希望这些技巧能对你有所帮助。

1. Spring Boot 执行初始化逻辑

1.1 背景

项目的某次更新，数据库中的某张表新增了一个字段，且与业务有关联，需要对新建的字段根据对应的业务进行赋值操作。

一种解决方案就是，更新前手动写 SQL 更新字段的值，但这样做的效率太低，而且每给不同环境更新一次，就需要手动执行一次，容易出错且效率低。

另一种方案则是在项目启动时进行初始化操作，完成字段对应值的更新，这种方案效率更高且不容易出错。

1.2 实现

Spring Boot 提供了多种方案用于项目启动后执行初始化的逻辑。

实现CommandLineRunner接口，重写run方法。

@Slf4j

@Component

public class InitListen implements CommandLineRunner {



    @Override

    public void run(String... args) {

      // 初始化相关逻辑...

    }





}

实现ApplicationRunner接口，重写run方法。

@Slf4j

@Component

public class InitListen implements ApplicationRunner {



    @Override

    public void run(ApplicationArguments args) {

      // 初始化相关逻辑...

    }





}

实现ApplicationListener接口

@Slf4j

@Configuration

public class StartClientListener implements ApplicationListener<ContextRefreshedEvent> {



    @Override

    public void onApplicationEvent(ContextRefreshedEvent arg0) {

        // 初始化逻辑

    }

}

针对于上述这个需求，如何实现仅更新一次字段的值？

可在数据库字典表中设置一个更新标识字段，每次执行初始化逻辑之前，校验判断下字典中的这个值，确认是否已经更新，如果已经更新，就不需要再执行更新操作了。

2. Spring Boot 动态控制数据源的加载

2.1 背景

期望通过在application.yml文件中，添加一个开关来控制是否加载数据库。

2.2 实现

启动类上添加注解 @SpringBootApplication(exclude = { DataSourceAutoConfiguration.class })，代表禁止 Spring Boot 自动注入数据源。

新建 DataSourceConfig配置类，用于初始化数据源。

在DataSourceConfig配置类上添加条件注解 @ConditionalOnProperty(name = "spring.datasource.enabled", havingValue = "true"，代表只有当 spring.datasource.enabled 为 true时，加载数据库，其余情况不加载数据库。

仓库类 XxxRepository 的注入，需要使用注解 @Autowired(required = false)

详细可见文章：
Spring Boot 如何动态配置数据库的加载

3. Spring Boot 根据不同环境加载配置文件

3.1 背景

实际开发工作中，针对同一个项目，可能会存在开发环境、测试环境、正式环境等，不同环境的配置内容可能会不一致，如：数据库、Redis等等。期望在项目在启动时能够针对不同的环境来加载不同的配置文件。

3.2 实现

Spring 提供 Profiles 特性，通过启动时设置指令-Dspring.profiles.active指定加载的配置文件，同一个配置文件中不同的配置使用---来区分。

启动 jar 包时执行命令：

java -jar test.jar -Dspring.profiles.active=dev

-Dspring.profiles.active=dev代表激活 profiles 为 dev 的相关配置。

## 用---区分环境，不同环境获取不同配置

---

# 开发环境

spring:

  profiles: dev

  cloud:

    nacos:

      discovery:

        server-addr: 127.0.0.1:8848

        # 命名空间为默认，所以不需要写命名空间

      config:

        server-addr: ${spring.cloud.nacos.discovery.server-addr}

        extension-configs[0]:

          data-id: database-base.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[1]:

          # 本地单机Redis

          data-id: redis-base-auth.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[2]:

          data-id: master-base-auth.yaml

          group: DEFAULT_GR0UP

          refresh: true

---

#测试环境

spring:

  profiles: test

  cloud:

    nacos:

      discovery:

        server-addr: 192.168.0.111:8904

        # 测试环境注册的命名空间

        namespace: b80b921d-cd74-4f22-8025-333d9b3d0e1d

      config:

        server-addr: ${spring.cloud.nacos.discovery.server-addr}

        extension-configs[0]:

          data-id: database-base-test.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[1]:

          data-id: redis-base-test.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[2]:

          data-id: master-auth-test.yaml

          group: DEFAULT_GR0UP

          refresh: true



---

# 生产环境

spring:

  profiles: prod

  cloud:

    nacos:

      discovery:

        server-addr: 192.168.0.112:8848

      config:

        server-addr: ${spring.cloud.nacos.discovery.server-addr}

        extension-configs[0]:

          # 生产环境

          data-id: database-auth.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[1]:

          # 生产环境

          data-id: redis-base-auth.yaml

          group: DEFAULT_GR0UP

          refresh: true

        extension-configs[2]:

          data-id: master-base-auth.yaml

          group: DEFAULT_GR0UP

          refresh: true

也可以定义多个配置文件，如在application.yml中定义和环境无关的配置，而application-{profile}.yml则根据环境做不同区分，如在 application-dev.yml 中定义开发环境相关配置、application-test.yml 中定义测试环境相关配置。

启动时指定环境命令同上，仍为：

java -jar test.jar -Dspring.profiles.active=dev

4. Spring Boot 配置文件加密

4.1 背景

配置文件中包含的敏感信息（如数据库密码）都会以明文的形式存储，这种情况可能会存在安全风险，期望通过加密配置文件，确保应用程序的安全。

4.2 实现

pom.xml 文件中引入依赖。

<dependency>

   <groupId>com.github.ulisesbocchio</groupId>

   <artifactId>jasypt-spring-boot-starter</artifactId>

   <version>2.1.2</version>

</dependency>

如果遇到 Unresolved dependency: 'com.github.ulisesbocchio:jasypt-spring-boot-starter:jar:2.1.2' 的错误，可执行mvn clean install -U强制更新依赖。

application.yml 文件中增加配置如下：

jasypt:

  encryptor:

    password: G0C3D17o2n6

    algorithm: PBEWithMD5AndDES

执行测试用例，获取加密后的内容。

@RunWith(SpringRunner.class)

@SpringBootTest

public class DatabaseTest {



    @Autowired

    private StringEncryptor encryptor;



    @Test

    public void getPass() {

        String url = encryptor.encrypt("jdbc:mysql://localhost:3306/demo");

        String name = encryptor.encrypt("root");

        String password = encryptor.encrypt("123456");

        System.out.println("database url: " + url);

        System.out.println("database name: " + name);

        System.out.println("database password: " + password);

        Assert.assertTrue(url.length() > 0);

        Assert.assertTrue(name.length() > 0);

        Assert.assertTrue(password.length() > 0);

    }

}

根据测试用例获取的结果，将加密后的字符串替换明文。

启动程序，验证数据库能否正常连接。

为了防止 jasypt.encryptor.password 泄露，反解出密码，有两种方案：

将 jasypt.encryptor.password 设置为环境变量，如：
vim /etc/profile

export jasypt.encryptor.password=YOUR_SECRET_KEY
将 jasypt.encryptor.password 作为启动程序的参数，如：
java -jar xxx.jar -Djasypt.encryptor.password=YOUR_SECRET_KEY

5. Spring Boot对打包好的jar包瘦身

5.1 背景

Sprng Boot项目的 jar 包动辄几百MB，如果有小的需求更新或者是Bug修复，就需要重新打包部署，改了一行代码，却上传几百MB的文件，这样会很浪费时间。

期望通过给 jar 包瘦身，从而节省部署的时间。

5.2 实现

pom.xml 文件中添加如下配置：

<build>

  <plugins>

   <plugin>

    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-maven-plugin</artifactId>

    <configuration>

     <executable>true</executable>

     <layout>ZIP</layout>

     <!--这里是填写需要包含进去的jar，

          必须项目中的某些模块，会经常变动，那么就应该将其坐标写进来

          如果没有则nothing ，表示不打包依赖 -->

     <includes>

      <include>

       <groupId>nothing</groupId>

       <artifactId>nothing</artifactId>

      </include>

     </includes>

    </configuration>

   </plugin>



   <!--拷贝依赖到jar外面的lib目录-->

   <plugin>

    <groupId>org.apache.maven.plugins</groupId>

    <artifactId>maven-dependency-plugin</artifactId>

    <executions>

     <execution>

      <id>copy</id>

      <phase>package</phase>

      <goals>

       <goal>copy-dependencies</goal>

      </goals>

      <configuration>

       <!--指定的依赖路径-->

       <outputDirectory>

        ${project.build.directory}/lib

       </outputDirectory>

      </configuration>

     </execution>

    </executions>

   </plugin>

  </plugins>

 </build>

执行mvn clean package得到 jar 包，在项目启动时，需要通过 -Dloader.path指定lib的路径，如：

java -Dloader.path=./lib -jar testProject-0.0.1-SNAPSHOT.jar

效果如下：

通过分析 jar 包的结构可以得知，jar 包的 “大” 实际上是因为在打包时，会将项目所依赖的 jar 包放在 lib 夹文件中。而这部分依赖在版本迭代稳定后，基本是不会变化的。

上述这种给 jar 包瘦身的方案，实际上是在打包的时候忽略 lib 文件夹中的这些依赖，将这部分不变的依赖提前放到服务器上，打出来的 jar 包就变小了，从而提升发版效率。

参考资料

zhuanlan.zhihu.com/p/646593227

cloud.tencent.com/developer/a…

作者：离开地球表面_99
来源：juejin.cn/post/7424906244215193636

收起阅读 »

go的生态真的一言难尽

综合技术讨论

前言标题党了，原生go很好用，只不过我习惯了java封装大法。最近在看golang，因为是javaer，所以突发奇想，不如开发一个类似于 Maven 或 Gradle 的构建工具来管理 Go 项目的依赖，众所周知，构建和发布是一个复杂的任务，但通过合理的设...

继续阅读 »

前言

标题党了，原生go很好用，只不过我习惯了java封装大法。最近在看golang，因为是javaer，所以突发奇想，不如开发一个类似于 Maven 或 Gradle 的构建工具来管理 Go 项目的依赖，众所周知，构建和发布是一个复杂的任务，但通过合理的设计和利用现有的工具与库，可以实现一个功能强大且灵活的工具。

正文分为两部分：项目本身和如何使用

一、项目本身

1. 项目需求分析

核心需求

依赖管理：
- 解析和下载 Go 项目的依赖。
- 支持依赖版本控制和冲突解决。

构建管理：
- 支持编译 Go 项目。
- 支持跨平台编译。
- 支持自定义构建选项。

发布管理：
- 打包构建结果。
- 支持发布到不同的平台（如 Docker Hub、GitHub Releases）。

任务管理：
- 支持定义和执行自定义任务（如运行测试、生成文档）。

插件系统：
- 支持扩展工具的功能。

可选需求

缓存机制：缓存依赖和构建结果以提升速度。

并行执行：支持并行下载和编译。

2. 技术选型

2.1 编程语言

Go 语言：由于我们要构建的是 Go 项目的构建工具，选择 Go 语言本身作为开发语言是合理的。

2.2 依赖管理

Go Modules：Go 自带的依赖管理工具已经很好地解决了依赖管理的问题，可以直接利用 Go Modules 来解析和管理依赖。

2.3 构建工具

Go 标准库：Go 的标准库提供了强大的编译和构建功能（如 go build, go install 等命令），可以通过调用这些命令或直接使用相关库来进行构建。

2.4 发布工具

Docker：对于发布管理，可能需要集成 Docker 来构建和发布 Docker 镜像。

upx：用于压缩可执行文件。

2.5 配置文件格式

YAML 或 TOML：选择一种易于阅读和编写的配置文件格式，如 YAML 或 TOML。

3. 系统架构设计

3.1 模块划分

依赖管理模块：
- 负责解析和下载项目的依赖。

构建管理模块：
- 负责编译 Go 项目，支持跨平台编译和自定义构建选项。

发布管理模块：
- 负责将构建结果打包和发布到不同平台。

任务管理模块：
- 负责定义和执行自定义任务。

插件系统：
- 提供扩展点，允许用户编写插件来扩展工具的功能。

3.2 系统流程

初始化项目：读取配置文件，初始化项目环境。

依赖管理：解析依赖并下载。

构建项目：根据配置文件进行项目构建。

执行任务：执行用户定义的任务（如测试）。

发布项目：打包构建结果并发布到指定平台。

4. 模块详细设计与实现

4.1 依赖管理模块

4.1.1 设计

利用 Go Modules 现有的功能来管理依赖。可以通过 go list 命令来获取项目的依赖：

4.1.2 实现

package dependency



import (

    "fmt"

    "os/exec"

)



// ListDependencies 列出项目所有依赖

func ListDependencies() ([]byte, error) {

    cmd := exec.Command("go", "list", "-m", "all")

    return cmd.Output()

}



// DownloadDependencies 下载项目所有依赖

func DownloadDependencies() error {

    cmd := exec.Command("go", "mod", "download")

    output, err := cmd.CombinedOutput()

    if err != nil {

        return fmt.Errorf("download failed: %s", output)

    }

    return nil

}

4.2 构建管理模块

4.2.1 设计

调用 Go 编译器进行构建，支持跨平台编译和自定义构建选项。

4.2.2 实现

package build



import (

    "fmt"

    "os/exec"

    "runtime"

    "path/filepath"

)



// BuildProject 构建项目

func BuildProject(outputDir string) error {

    // 设置跨平台编译参数

    var goos, goarch string

    switch runtime.GOOS {

    case "windows":

        goos = "windows"

    case "linux":

        goos = "linux"

    default:

        goos = runtime.GOOS

    }

    goarch = "amd64"



    output := filepath.Join(outputDir, "myapp")

    cmd := exec.Command("go", "build", "-o", output, "-ldflags", "-X main.version=1.0.0")

    output, err := cmd.CombinedOutput()

    if err != nil {

        return fmt.Errorf("build failed: %s", output)

    }

    fmt.Println("Build successful")

    return nil

}

4.3 发布管理模块

4.3.1 设计

打包构建结果并发布到不同平台。例如，构建 Docker 镜像并发布到 Docker Hub。

4.3.2 实现

package release



import (

    "fmt"

    "os/exec"

)



// BuildDockerImage 构建 Docker 镜像

func BuildDockerImage(tag string) error {

    cmd := exec.Command("docker", "build", "-t", tag, ".")

    output, err := cmd.CombinedOutput()

    if err != nil {

        return fmt.Errorf("docker build failed: %s", output)

    }

    fmt.Println("Docker image built successfully")

    return nil

}



// PushDockerImage 推送 Docker 镜像

func PushDockerImage(tag string) error {

    cmd := exec.Command("docker", "push", tag)

    output, err := cmd.CombinedOutput()

    if err != nil {

        return fmt.Errorf("docker push failed: %s", output)

    }

    fmt.Println("Docker image pushed successfully")

    return nil

}

5. 任务管理模块

允许用户定义和执行自定义任务：

package task



import (

    "fmt"

    "os/exec"

)



type Task func() error



func RunTask(name string, task Task) {

    fmt.Println("Running task:", name)

    err := task()

    if err != nil {

        fmt.Println("Task failed:", err)

        return

    }

    fmt.Println("Task completed:", name)

}



func TestTask() error {

    cmd := exec.Command("go", "test", "./...")

    output, err := cmd.CombinedOutput()

    if err != nil {

        return fmt.Errorf("tests failed: %s", output)

    }

    fmt.Println("Tests passed")

    return nil

}

6. 插件系统

可以通过动态加载外部插件或使用 Go 插件机制来实现插件系统：

package plugin



import (

    "fmt"

    "plugin"

)



type Plugin interface {

    Run() error

}



func LoadPlugin(path string) (Plugin, error) {

    p, err := plugin.Open(path)

    if err != nil {

        return nil, err

    }

    symbol, err := p.Lookup("PluginImpl")

    if err != nil {

        return nil, err

    }

    impl, ok := symbol.(Plugin)

    if !ok {

        return nil, fmt.Errorf("unexpected type from module symbol")

    }

    return impl, nil

}

5. 示例配置文件

使用 YAML 作为配置文件格式，定义项目的构建和发布选项：

name: myapp

version: 1.0.0

build:

  options:

    - -ldflags

    - "-X main.version=1.0.0"

release:

  docker:

    image: myapp:latest

    tag: v1.0.0

tasks:

  - name: test

    command: go test ./...

6. 持续改进

后续我将持续改进工具的功能和性能，例如：

增加更多的构建和发布选项。

优化依赖管理和冲突解决算法。

提供更丰富的插件。

二、如何使用

1. 安装构建工具

我已经将构建工具发布到 GitHub 并提供了可执行文件，用户可以通过以下方式安装该工具。

1.1 使用安装脚本安装

我将提供一个简单的安装脚本，开发者可以通过 curl 或 wget 安装构建工具。

使用 `curl` 安装

curl -L https://github.com/yunmaoQu/GoForge/releases/download/v1.0.0/install.sh | bash

使用 `wget` 安装

wget -qO- https://github.com//yunmaoQu/GoForge/releases/download/v1.0.0/install.sh | bash

1.2 手动下载并安装

如果你不想使用自动安装脚本，可以直接从 GitHub Releases 页面手动下载适合你操作系统的二进制文件。

访问 GitHub Releases 页面。

下载适合你操作系统的二进制文件：
- Linux: GoForge-linux-amd64
- macOS: GoForge-darwin-amd64
- Windows: GoForge-windows-amd64.exe

将下载的二进制文件移动到系统的 PATH 路径（如 /usr/local/bin/），并确保文件有执行权限。

# 以 Linux 系统为例

mv GoForge-linux-amd64 /usr/local/bin/GoForge

chmod +x /usr/local/bin/GoForge

2. 创建 Go 项目并配置构建工具

2.1 初始化 Go 项目

假设你已经有一个 Go 项目或你想创建一个新的 Go 项目。首先，初始化 Go 模块：

mkdir my-go-project

cd my-go-project

go mod init github.com/myuser/my-go-project

2.2 创建 `build.yaml` 文件

在项目根目录下创建 build.yaml 文件，这个文件类似于 Maven 的 pom.xml 或 Gradle 的 build.gradle，用于配置项目的依赖、构建任务和发布任务。

示例 `build.yaml`

project:

  name: my-go-project

  version: 1.0.0



dependencies:

  - name: github.com/gin-gonic/gin

    version: v1.7.7

  - name: github.com/stretchr/testify

    version: v1.7.0



build:

  output: bin/my-go-app

  commands:

    - go build -o bin/my-go-app main.go



tasks:

  clean:

    command: rm -rf bin/



  test:

    command: go test ./...

  

  build:

    dependsOn: 

      - test

    command: go build -o bin/my-go-app main.go



publish:

  type: github

  repo: myuser/my-go-project

  token: $GITHUB_TOKEN

  assets:

    - bin/my-go-app

配置说明：

project: 定义项目名称和版本。

dependencies: 列出项目的依赖包及其版本号。

build: 定义构建输出路径和构建命令。

tasks: 用户可以定义自定义任务（如 clean、test、build 等），并可以配置任务依赖关系。

publish: 定义发布到 GitHub 的配置，包括发布的仓库和需要发布的二进制文件。

3. 执行构建任务

构建工具允许你通过命令行执行各种任务，如构建、测试、清理、发布等。以下是一些常用的命令。

3.1 构建项目

执行以下命令来构建项目。该命令会根据 build.yaml 文件中定义的 build 任务进行构建，并生成二进制文件到指定的 output 目录。

GoForge build

构建过程会自动执行依赖任务（例如 test 任务），确保在构建之前所有测试通过。

3.2 运行测试

如果你想单独运行测试，可以使用以下命令：

GoForge test

这将执行 go test ./...，并运行所有测试文件。

3.3 清理构建产物

如果你想删除构建生成的二进制文件等产物，可以运行 clean 任务：

GoForge clean

这会执行 rm -rf bin/，清理 bin/ 目录下的所有文件。

3.4 列出所有可用任务

如果你想查看所有可用的任务，可以运行：

GoForge tasks

这会列出 build.yaml 文件中定义的所有任务，并显示它们的依赖关系。

4. 依赖管理

构建工具会根据 build.yaml 中的 dependencies 部分来处理 Go 项目的依赖。

4.1 安装依赖

当执行构建任务时，工具会自动解析依赖并安装指定的第三方库（类似于 go mod tidy）。

你也可以单独运行以下命令来手动处理依赖：

GoForge deps

4.2 更新依赖

如果你需要更新依赖版本，可以在 build.yaml 中手动更改依赖的版本号，然后运行 mybuild deps 来更新依赖。

5. 发布项目

构建工具提供了发布项目到 GitHub 等平台的功能。根据 build.yaml 中的 publish 配置，你可以将项目的构建产物发布到 GitHub Releases。

5.1 配置发布相关信息

确保你在 build.yaml 中正确配置了发布信息：

publish:

  type: github

  repo: myuser/my-go-project

  token: $GITHUB_TOKEN

  assets:

    - bin/my-go-app

type: 发布的目标平台（GitHub 等）。

repo: GitHub 仓库路径。

token: 需要设置环境变量 GITHUB_TOKEN，用于认证 GitHub API。

assets: 指定发布时需要上传的二进制文件。

5.2 发布项目

确保你已经完成构建，并且生成了二进制文件。然后，你可以执行以下命令来发布项目：

GoForge publish

这会将 bin/my-go-app 上传到 GitHub Releases，并生成一个新的发布版本。

5.3 测试发布（Dry Run）

如果你想在发布之前测试发布流程（不上传文件），可以使用 --dry-run 选项：

GoForge publish --dry-run

这会模拟发布过程，但不会实际上传文件。

6. 高级功能

6.1 增量构建

构建工具支持增量构建，如果你在 build.yaml 中启用了增量构建功能，工具会根据文件的修改时间戳或内容哈希来判断是否需要重新构建未被修改的部分。

build:

  output: bin/my-go-app

  incremental: true

  commands:

    - go build -o bin/my-go-app main.go

6.2 插件机制

你可以通过插件机制来扩展构建工具的功能。例如，你可以为工具增加自定义的任务逻辑，或在构建生命周期的不同阶段插入钩子。

在 build.yaml 中定义插件：

plugins:

  - name: custom-task

    path: plugins/custom-task.go

编写 custom-task.go，并实现你需要的功能。

7. 调试和日志

如果你在使用时遇到了问题，可以通过以下方式启用调试模式，查看详细的日志输出：

GoForge --debug build

这会输出工具在执行任务时的每一步详细日志，帮助你定位问题。

总结

通过这个构建工具，你可以轻松管理 Go 项目的依赖、构建过程和发布任务。以下是使用步骤的简要总结：

安装构建工具：使用安装脚本或手动下载二进制文件。

配置项目：创建 build.yaml 文件，定义依赖、构建任务和发布任务。

执行任务：通过命令行执行构建、测试、清理等任务。

发布项目：将项目的构建产物发布到 GitHub 或其他平台。

作者：justseeit
来源：juejin.cn/post/7431545806085423158

收起阅读 »

不是，哥们，谁教你这样处理生产问题的？

综合技术讨论

你好呀，我是歪歪。最近遇到一个生产问题，我负责的一个服务触发了内存使用率预警，收到预警的时候我去看了内存使用率已经到了 80%，看了一眼 GC 又发现还没有触发 FullGC，一次都没有。基于这个现象，当时推测有两种可能，一种是内存溢出，一种是内存泄漏。 ...

继续阅读 »

你好呀，我是歪歪。

最近遇到一个生产问题，我负责的一个服务触发了内存使用率预警，收到预警的时候我去看了内存使用率已经到了 80%，看了一眼 GC 又发现还没有触发 FullGC，一次都没有。

基于这个现象，当时推测有两种可能，一种是内存溢出，一种是内存泄漏。

好，假设现在是面试，面试官目前就给了这点信息，他问你到底是溢出还是泄漏，你怎么回答？

在回答之前，我们得现明确啥是溢出，啥情况又是泄漏。

内存溢出（OutOfMemoryError）：内存溢出指的是程序请求的内存超出了 JVM 当前允许的最大内存容量。当 JVM 试图为一个对象分配内存时，如果当前可用的堆内存不足以满足需求，就会抛出 java.lang.OutOfMemoryError 异常。这通常是因为堆空间太小或者由于某些原因导致堆空间被占满。

内存泄漏 (Memory Leak)：内存泄漏是指不再使用的内存空间没有被释放，导致这部分内存无法再次被使用。虽然内存泄漏不会立即导致程序崩溃，但它会逐渐消耗可用内存，最终可能导致内存溢出。

虽然都与内存相关，但它们发生的时机和影响有所不同。内存溢出通常发生在程序运行时，当数据结构的大小超过预设限制时，常见的情况是你要分配一个大对象，比如一次从数据中查到了过多的数据。

而内存泄漏和“过多”关系不大，是一个细水长流的过程，一次内存泄漏的影响可能微乎其微，但随着时间推移，多次内存泄漏累积起来，最终可能导致内存溢出。

概念就是这个概念，这两个玩意经常被大家搞混，所以多嘴提一下。

概念明确了，回到最开始这个问题，你怎么回答？

你回答不了。

因为这些信息太不完整了，所以你回答不了。

面试的时候面试官就喜欢出这种全是错误选项的题目来迷惑你，摸摸你的底子到底怎么样。

首先，为什么不能判断，是因为前面说了：一次 FullGC 都没有。

虽然现在内存使用率已经到 80% 了，万一一次 FullGC 之后，内存使用率又下去了呢，说明程序没有任何问题。

如果没有下去，说明大概率是内存溢出了，需要去代码里面找哪里分配了大对象了。

那如果下去了，能说明一定没有内存泄漏吗？

也不能，因为前面又说了：内存泄漏是一个细水长流的过程。

关于内存溢出，如果监控手段齐全到位的话，你就记住左边这个走势图：

一个缓慢的持续上升的内存趋势图，最后疯狂触发 GC，但是并没有内存被回收，最后程序直接崩掉。

内存泄漏，一眼定真假。

这个图来自我去年写的这篇文章：《虽然是我遇到的一个棘手的生产问题，但是我写出来之后，就是你的了。》

里面就是描述了一个内存泄漏的问题，通过分析 Dump 文件的方式，最终成功定位到泄漏点，修复代码。

一个不论多么复杂的内存泄漏问题，处理起来都是有方法论的。

不过就是 Dump 文件分析、工具的使用以及足够的耐心和些许的运气罢了。

所以我不打算赘述这些东西了，我想要分享的是我这次是怎么对应文章开始说的内存预警的。

我的处理方式就是：重启服务。

是的，常规来说都是会保留现场，然后重启服务。但是我的处理方式是：直接执行重启服务的预案。没有后续动作了。

我当时脑子里面的考虑大概是这样的。

首先，这个服务是一个边缘服务，它所承载的数据量不多，其业务已经超过一年多没有新增，存量数据正在慢慢的消亡。代码近一两年没啥改动，只有一些升级 jar 包，日志埋点这类的横向改造。

其次，我看了一下这个服务已经有超过四个月没有重启过了，这期间没有任何突发流量，每天处理的数据呈递减趋势，内存走势确实是一个缓慢上升的过程，我初步怀疑是有内存泄漏。

然后，这个服务是我从别的团队那边接手的一个服务，基于前一点，业务正在消亡这个因素，我也只是知道大概的功能，并不知道内部的细节，所以由于对系统的熟悉度不够，如果要定位问题，会较为困难。

最后，基于公司制度，虽然我知道应该怎么去排查问题，命令和工具我都会使用，但是我作为开发人员是没有权限使用运维人员的各类排查工具和排查命令的，所以如果要定位问题，我必须请求协调一个运维同事帮忙。

于是，在心里默默的盘算了一下投入产出比，我决定直接重启服务，不去定位问题。

按照目前的频率，程序正常运行四五个月后可能会触发内存预警，那么大不了就每隔三个月重启一次服务嘛，重启一次只需要 30s。一年按照重启 4 次算，也就是才 2 分钟。

这个业务我们就算它要五年后才彻底消亡，那么也就才 10 分钟而已。

如果我要去定位到底是不是内存泄露，到底在哪儿泄露的，结合我对于系统的熟悉程度和公司必须有的流程，这一波时间消耗，少说点，加起来得三五个工作日吧。

10 分钟和三五个工作日，这投入产出比，该选哪个，一目了然了吧？

我分享这个事情的目的，其实就是想说明我在这个事情上领悟到的一个点：在工作中，你遇到的问题，不是每一个都必须被解决的，也可以选择绕过问题，只要最终结果是好的就行。

如果我们抛开其他因素，只是从程序员的本职工作来看，那么遇到诸如内存泄漏的问题的时候，就是应该去定位问题、解决问题。

但是在职场中，其实还需要结合实际情况，进行分析。

什么是实际情况呢？

我前面列出来的那个“首先，其次，然后，最后”，就是我这个问题在技术之外的实际情况。

这些实际情况，让我决定不用去定位这个问题。

这也不是逃避问题，这是权衡利弊之后的最佳选择。

同样是一天的时间，我可以去定位这个“重启就能解决”的问题，也可以去做其他的更有价值事情，敲一些业务价值更大的代码。

这个是需要去权衡的，一个重要的衡量标准就是前面说的：投入产出比。

关于“不是所有的问题都必须被解决的，也可以选择绕过问题”这个事情，我再给你举一个我遇到的真实的例子。

几年前，我们团队遇到一个问题，我们使用的 RPC 框架是 Dubbo，有几个核心服务在投产期间滚动发布的时候，流量老是弄不干净，导致服务已经下线了，上游系统还在调用。

当时安排我去调研一下解决方案。

其实这就是一个优雅下线的问题，但是当时资历尚浅，我认真研究了一段时间，确实没研究出问题的根本解决方案。

后来我们给出的解决方案就是做一个容错机制，如果投产期间有因为流量不干净的问题导致请求处理失败的，我们把这些数据记录下来，然后等到投产完成后再进行重发。

没有解决根本问题，选择绕过了问题，但是从最终结果上看，问题是被解决了。

再后来，我们搭建了双中心。投产之前，A，B 中心都有流量，每次投产的时候，先把所有流量从 A 中心切到 B 中心去，在 A 中心没有任何流量的情况下，进行服务投产。B 中心反之。

这样，从投产流程上就规避了“流量老是弄不干净”的问题，因为投产的时候对应的服务已经没有在途流量了，不需要考虑优雅的问题了，从而规避了优雅下线的问题。

问题还是没有被解决，但是问题被彻底绕过。

最后，再举一个我在知乎上看到的一个回答，和我想要表达的观点，有异曲同工之妙：

http://www.zhihu.com/question/63…

这个回答下面的评论也很有意思，有兴趣的可以去翻一下，我截取两个我觉得有意思的：

在职场上，甚至在生活中，一个虽然没有解决方案但是可以被绕过的问题，我认为不是问题。

但是这个也得分情况，不是所有问题都能绕开的，假如是一个关键服务，那肯定不能置之不理，硬着头皮也得上。

关键是，我在职场上和生活中遇到过好多人，遇到问题的时候，似乎只会硬着头皮往上冲。

只会硬着头皮往上冲和知道什么时候应该硬着头皮往上冲，是两种截然不同的职场阶段。

所以有时候，遇到问题的时候，不要硬上，也让头皮休息一下，看看能不能绕过去。

作者：why技术
来源：juejin.cn/post/7417842116506058771

收起阅读 »

三行五行的 SQL 只存在于教科书和培训班

综合技术讨论

教科书中 SQL 例句通常都很简单易懂，甚至可以当英语来读，这就给人造成 SQL 简单易学的印象。但实际上，这种三行五行的 SQL 只存在于教科书和培训班，我们在现实业务中写的 SQL 不会论行，而是以 K 计的，一条 SQL 几百行 N 层嵌套，写出 3K...

继续阅读 »

教科书中 SQL 例句通常都很简单易懂，甚至可以当英语来读，这就给人造成 SQL 简单易学的印象。

但实际上，这种三行五行的 SQL 只存在于教科书和培训班，我们在现实业务中写的 SQL 不会论行，而是以 K 计的，一条 SQL 几百行 N 层嵌套，写出 3K5K 是常事，这种 SQL，完全谈不上简单易学，对专业程序员都是恶梦。

以 K 计本身倒不是大问题，需求真地复杂时，也只能写得长，Python/Java 代码可能会更长。但 SQL 的长和其它语言的长不一样，SQL 的长常常会意味着难写难懂，而且这个难写难懂和任务复杂度不成比例。除了一些最简单情况外，稍复杂些的任务，SQL 的难度就会陡增，对程序员的智商要求很高，所以经常用作应聘考题。

这是为什么呢？

其中一个原因是我们之前讲过的，SQL 像英语而缺乏过程性，要把很多动作搅合在一句中，凭空地增大思维难度。

但是我们会发现，即使 SQL 增加了步骤化的 CTE 语法，面对稍复杂的任务时，仍然会写的非常难懂。

这是因为，SQL 的描述能力还有不少重要的缺失，这导致程序员不能按自然思维写代码，要换着方法绕。

我们通过一个简单的例子来看一下。

简化的销售业绩表 T 有三个字段：sales 销售员，product 产品，amount 销售额。我们想知道空调和电视销售额都在前 10 名的销售员名单。

这个问题并不难，可以很自然地设计出计算过程：

1．按空调销售额排序，找出前 10 名；

2．按电视销售额排序，找出前 10 名；

3．对 1、2 的结果取交集，得到我们想要的

用 CTE 语法后 SQL 可以写成这样：

with A as (select top 10 sales from T where product='AC' order by amount desc),

     B as (select top 10 sales from T where product='TV' order by amount desc)

select * from A intersect B

这个句子不太短，但思路还是清晰的。

现在，我们把问题复杂化一点，改为计算所有产品销售额都在前 10 名的销售员，延用上述的思路很容易想到：

1. 列出所有产品；

2. 算出每种产品销售额的前 10 名，分别保存；

3. 针对这些前 10 名取交集；

遗憾开始出现，CTE 语法只能写出确定个数的中间结果。而我们事先不知道总共有多个产品，也就是说 WITH 子句的个数是不确定的，这就写不出来了。

好吧，换一种思路：

1．将数据按产品分组，将每组排序，计算出每组前 10 名；

2．针对这些前 10 名取交集；

这需要把第一步的分组结果保存起来，而这个中间结果是一个表，其中有个字段要存储对应的分组成员的前 10 名，也就是字段的取值将是个集合，SQL 不支持这种数据类型，还是写不出来。

我们可以再转换思路。按产品分组后，计算每个销售员在所有分组的前 10 名中出现的次数，若与产品总数相同，则表示该销售员在所有产品销售额中均在前 10 名内。

select sales from ( 

    select sales from (

        select sales, rank() over (partition by product order by amount desc ) ranking

        from T ) where ranking <=10 )

group by sales having count(*)=(select count(distinct product) from T)

在窗口函数支持下，终于能写出来了。但是，这样的思路，绕不绕呢，有多少人想到并写出来呢？

前两种简单的思路无法用 SQL 实现，只能采用第三种迂回的思路。这里的原因在于 SQL 的一个重要缺失：集合化不彻底。

SQL 有集合概念，但并未把集合作为一种基础数据类型提供，不允许字段取值是集合，除了表之外也没有其它集合形式的数据类型，这使得大量集合运算在思维和书写时都非常绕。

我们刚才用了关键字 top，事实上关系代数理论中没有这个东西，这不是 SQL 的标准写法。

没有 top 如何找前 10 名呢？

大体思路是这样：找出比自己大的成员个数作为是名次，然后取出名次不超过 10 的成员

select sales from (

    select A.sales sales, A.product product,

        (select count(*)+1 from T

         where A.product=product and A.amount<=amount) ranking

    from T A )where product='AC' and ranking<=10

注意，这里的子查询没办法用 CTE 语法分步写，因为它用到了主查询中的信息作为参数。

或可以用连接来写，这样子查询倒是可以用 CTE 语法分步了：

select sales from (

    select A.sales sales, A.product product, count(*)+1 ranking from T A, T B

    where A.sales=B.sales and A.product=B.product and A.amount<=B.amount

    gr0up by A.sales,A.product )

where product='AC' and ranking<=10

无论如何，这种东西都太绕了，专业程序员也要想一阵子，仅仅是计算了一个前 10 名。

造成这个现象的原因就是 SQL 的另一个缺失：缺乏有序支持。SQL 继承了数学上的无序集合，与次序有关的计算相当困难，而可想而知，与次序有关的计算会有多么普遍（诸如比上月、比去年同期、前 20%、排名等）。

SQL2003 标准中增加的窗口函数提供了一些与次序有关的计算能力，这在一定程度上缓解 SQL 有序计算的困难，前 10 名可以这样写：

select sales from ( 

    select sales, rank() over (partition by product order by amount desc ) ranking

    from T )

where ranking <=10

还是要用子查询。

窗口函数并没有根本改变 SQL 无序集合的基础，还是会有许多有序运算难以解决。比如我们经常用来举例的，计算一支股票最长连续上涨了多少天：

select max(ContinuousDays) from (

    select count(*) ContinuousDays from (

        select sum(UpDownTag) over (order by TradeDate) NoRisingDays from (

            select TradeDate,case when Price>lag(price) over ( order by TradeDate) then 0 else 1 end UpDownTag from Stock ))

    group by NoRisingDays )

自然思维是这样，按日期排序后开始计数，碰到涨了就加 1，跌了就清 0，看计数器最大计到几。但这个思路写不出 SQL，只能绕成这样多层嵌套的。

这个问题真地是当作应聘考题的，通过率不到 20%。

这么一个简单的例子就能暴露出 SQL 缺失的能力，SQL 缺失的内容还有更多，限于篇幅，这里就不再深入讨论了。

反正结果就是，SQL 实现查询时无法应用自然思路，经常需要绕路迂回，写得又长又难懂。

现实任务要远远比这些例子复杂，过程中会面临诸多大大小小的困难。这个问题绕一下，那个问题多几行，一个稍复杂的任务写出几百行多层嵌套的 SQL 也就不奇怪了，过两月自己也看不懂也不奇怪了。

事实上 SQL 一点也不容易。

下面是广告时间。

SQL 很难写怎么办？用 esProc SPL!

esProc SPL 是个 Java 写的开源软件，在这里github.com/SPLWare/esP…

SPL 在 SQL 已有的集合化基础上增加了离散性，从而获得了彻底的集合化和有序能力，上面的例子就 SPL 就可以延用自然思路写出来：

所有产品销售额都在前 10 名的销售员，按产品分组，取每个组的前 10 名再算交集；

T.group(product).(~.top(10;-amount)).isect()

SPL 支持集合的集合，top 也只是常规的聚合计算，有了这些基础，实现自然思路很容易。

一支股票最长连续上涨了多少天，只要按自然思路写就行了

cnt=0

Stock.sort(TradeDate).max(cnt=if(Price>Price[-1],cnt+1,0))

SPL 有强大的有序计算能力，即使实现和上面 SQL 同样的逻辑也非常轻松：

Stock.sort(TradeDate).group@i(Price<Price[-1]).max(~.len())

作者：LAOZEI
来源：juejin.cn/post/7441756894094491689

收起阅读 »

✨Try-Catch✨竟然会影响性能

Java

前言一朋友问我Try-Catch写多了会不会让程序变慢，我不加思索的回答肯定不会，毕竟曾经研究过Java异常相关的字节码指令，只要被Try-Catch的代码不抛出异常，那么代码执行链路是不会加深的。可事后我反复思考这个看似简单实则也不复杂的问题，我觉得顺着...

继续阅读 »

前言

一朋友问我Try-Catch写多了会不会让程序变慢，我不加思索的回答肯定不会，毕竟曾经研究过Java异常相关的字节码指令，只要被Try-Catch的代码不抛出异常，那么代码执行链路是不会加深的。

可事后我反复思考这个看似简单实则也不复杂的问题，我觉得顺着这个问题往下，还有一些东西可以思考，如果你感兴趣，那就跟随本文的视角一起来看下吧。

正文

首先郑重声明，单纯的针对一段代码添加Try-Catch，是 不会 影响性能的，我们可以通过下面的示例代码并结合字节码指令来看下。

示例代码如下所示。

public class TryCatchPerformance {



    public Response execute(String state) {

        return innerHandle(state);

    }



    public Response innerHandle(String state) {

        // todo 暂无逻辑

        return null;

    }



    public static class Response {

        private int state;



        public Response(int state) {

            this.state = state;

        }



        public int getState() {

            return state;

        }



        public void setState(int state) {

            this.state = state;

        }

    }



}

我们依次执行如下语句为上述代码生成字节码指令。

# 编译Java文件

javac .\TryCatchPerformance.java

# 反汇编字节码文件

javap -c .\TryCatchPerformance.class

可以得到execute() 方法的字节码指令如下。

public com.lee.learn.exception.TryCatchPerformance$Response execute(java.lang.String);

  Code:

      0: aload_0

      1: aload_1

      2: invokevirtual #2                  // Method innerHandle:(Ljava/lang/String;)Lcom/lee/learn/exception/TryCatchPerformance$Response;

      5: areturn

现在对execute() 方法添加Try-Catch，如下所示。

public class TryCatchPerformance {



    public Response execute(String state) {

        try {

            return innerHandle(state);

        } catch (Exception e) {

            return new Response(500);

        }

    }



    public Response innerHandle(String state) {

        // todo 暂无逻辑

        return null;

    }



    public static class Response {

        private int state;



        public Response(int state) {

            this.state = state;

        }



        public int getState() {

            return state;

        }



        public void setState(int state) {

            this.state = state;

        }

    }



}

查看execute() 方法的字节码指令如下所示。

public com.lee.learn.exception.TryCatchPerformance$Response execute(java.lang.String);

  Code:

      0: aload_0

      1: aload_1

      2: invokevirtual #2                  // Method innerHandle:(Ljava/lang/String;)Lcom/lee/learn/exception/TryCatchPerformance$Response;

      5: areturn

      6: astore_2

      7: new           #4                  // class com/lee/learn/exception/TryCatchPerformance$Response

     10: dup

     11: sipush        500

     14: invokespecial #5                  // Method com/lee/learn/exception/TryCatchPerformance$Response."":(I)V

     17: areturn

  Exception table:

      from    to  target type

          0    5     6   Class java/lang/Exception

虽然添加Try-Catch后，字节码指令增加了很多条，但是通过Exception table（异常表）我们可知，只有指令0到5在执行过程中抛出了Exception，才会跳转到指令6开始执行，换言之只要不抛出异常，那么在执行完指令5后方法就结束了，此时和没添加Try-Catch时的代码执行链路是一样的，也就是不抛出异常时，Try-Catch不会影响程序性能。

我们添加Try-Catch，其实就是为了做异常处理，也就是我们天然的认为被Try-Catch的代码就是会抛出异常的，而异常一旦发生，此时程序性能就会受到一定程度的影响，表现在如下两个方面。

异常对象创建有性能开销。具体表现在异常对象创建时会去爬栈得到方法调用链路信息；

Try-Catch捕获到异常后会让代码执行链路变深。

由此可见Try-Catch其实不会影响程序性能，但是异常的出现的的确确会影响，无论是JVM创建的异常，还是我们在代码中new出来的异常，都是会影响性能的。

所以现在我们来看看如下代码有什么可以优化的地方。

public class TryCatchPerformance {



    public Response execute(String state) {

        try {

            return innerHandle(state);

        } catch (Exception e) {

            return new Response(500);

        }

    }



    public Response innerHandle(String state) {

        if (state == null || state.isEmpty()) {

            // 通过异常中断执行

            throw new IllegalStateException();

        } else if ("success".equals(state)) {

            return new Response(200);

        } else {

            return new Response(400);

        }

    }



    public static class Response {

        private int state;



        public Response(int state) {

            this.state = state;

        }



        public int getState() {

            return state;

        }



        public void setState(int state) {

            this.state = state;

        }

    }



}

上述代码的问题出现在innerHandle() ，仗着调用方有Try-Catch做异常处理，就在入参非法时通过创建异常来中断执行，我相信在实际的工程开发中，很多时候大家都是这么干的，因为有统一异常处理，那么通过抛出异常来中断执行并在统一异常处理的地方返回响应，是一件再平常不过的事情了，但是通过前面的分析我们知道，创建异常有性能开销，捕获异常并处理也有性能开销，这些性能开销其实是可以避免的，例如下面这样。

public class TryCatchPerformance {



    public Response execute(String state) {

        try {

            return innerHandle(state);

        } catch (Exception e) {

            return new Response(500);

        }

    }



    public Response innerHandle(String state) {

        if (state == null || state.isEmpty()) {

            // 通过提前返回响应的方式中断执行

            return new Response(500);

        } else if ("success".equals(state)) {

            return new Response(200);

        } else {

            return new Response(400);

        }

    }



    public static class Response {

        private int state;



        public Response(int state) {

            this.state = state;

        }



        public int getState() {

            return state;

        }



        public void setState(int state) {

            this.state = state;

        }

    }



}

如果当某个分支执行到了，我们也确切的知道该分支下的响应是什么，此时直接返回响应，相较于抛出异常后在统一异常处理那里返回响应，性能会更好。

总结

Try-Catch其实不会影响程序性能，因为在没有异常发生时，代码执行链路不会加深。

但是如果出现异常，那么程序性能就会受到影响，表现在如下两个方面。

异常对象创建有性能开销。具体表现在异常对象创建时会去爬栈得到方法调用链路信息；

Try-Catch捕获到异常后会让代码执行链路变深。

因此在日常开发中，可以适当增加防御性编程来防止JVM抛出异常，也建议尽量将主动的异常抛出替换为提前返回响应，总之就是尽量减少非必要的异常出现。

作者：半夏之沫
来源：juejin.cn/post/7458929387784077349

收起阅读 »

又整新活，新版 IntelliJ IDEA 2024.1 有点东西！

综合技术讨论

就在上周，Jetbrains 又迎来了一波大版本更新，这也是 JetBrains 2024首个大动作！ JetBrains 为其多款 IDE 发布了 2024 年度首个大版本更新 (2024.1)。作为旗下重要的产品之一，IntelliJ IDEA当然也不...

继续阅读 »

就在上周，Jetbrains 又迎来了一波大版本更新，这也是 JetBrains 2024首个大动作！

JetBrains 为其多款 IDE 发布了 2024 年度首个大版本更新 (2024.1)。

作为旗下重要的产品之一，IntelliJ IDEA当然也不例外。这不，现如今 IntelliJ IDEA 也来到了 2024.1 大版本了！

据官方介绍，这次 2024.1 新版本进行了数十项改进。

下面就针对本次新版 IntelliJ IDEA 的一些主要更新和特性做一个梳理和介绍，希望能对大家有所帮助。

全行代码补全

IntelliJ IDEA Ultimate 2024.1 带有针对 Java 和 Kotlin 的全行代码补全。

该项功能由无缝集成到 IDE 中的高级深度学习模型来提供支持。它可以基于上下文分析预测和建议整行代码，以助于提高编码效率。

对 Java 22 的支持

IntelliJ IDEA 2024.1 提供了对 2024 年 3 月刚发布的 JDK 22 中的功能集的支持。

支持覆盖未命名变量与模式的最终迭代、字符串模板与隐式声明的类的第二个预览版，以及实例main方法。此外，这次更新还引入了对super(...)之前预览状态下的 new 语句支持。

新终端加持

IntelliJ IDEA 2024.1推出了重构后的新终端，具有可视化和功能增强，有助于简化命令行任务。

此更新为既有工具带来了全新的外观，命令被分为不同的块，扩展的功能集包括块间丝滑导航、命令补全和命令历史记录的轻松访问等。

编辑器中的粘性行

此次新版本更新在编辑器中引入了粘性行，旨在简化大文件的处理和新代码库的探索。滚动时，此功能会将类或方法的开头等关键结构元素固定到编辑器顶部。

这样一来作用域将始终保持在视野中，用户可以点击固定的行快速浏览代码。

AI Assistant 改进

在本次新版中，AI Assistant 获得了多项有价值的更新，包括改进的测试生成和云代码补全、提交消息的自定义提示语、从代码段创建文件的功能，以及更新的编辑器内代码生成。

不过需要注意的事，在这次 2024.1 版中，AI Assistant 已解绑，现在作为独立插件提供。这一改动是为了在使用 AI 赋能的技术方面提供更多的决策灵活度，让用户能够在工作环境中更好地控制偏好设置和要求。

索引编制期间 IDE 功能对 Java 和 Kotlin 的可用

这次新版本中，代码高亮显示和补全等基本 IDE 功能可在项目索引编制期间用于 Java 和 Kotlin，这将会增强用户项目的启动体验。

此外，用户可以在项目仍在加载时即使用 Go to class（转到类）和 Go to symbol（转到符号）来浏览代码。

更新的 New Project（新建项目）向导

为了减轻用户在配置新项目时的认知负担，新版微调了 New Project（新建项目）向导的布局。语言列表现在位于左上角，使最常用的选项更加醒目。

用于缩小整个 IDE 的选项

新版支持可以将 IDE 缩小到 90%、80% 或 70%，从而可以灵活地调整 IDE 元素的大小。

对Java支持的更新

字符串模板中的语言注入

IntelliJ IDEA 2024.1 引入了将语言注入字符串模板的功能。

用户既可以使用注解（注解会自动选择所需语言），也可以使用 Inject language or reference（注入语言或引用）来从列表中手动选择语言。

改进的日志工作流

由于日志记录是日常开发的重要环节，新版本引入了一系列更新来增强 IntelliJ IDEA 在日志方面的用户体验。

比如现在用户可以从控制台中的日志消息中轻松导航到生成它们的代码。

此外，IDE会在有需要的位置建议添加记录器，并简化插入记录器语句的操作，即便记录器实例不在作用域内。

新检查与快速修复

新版本为 Java 实现了新的检查和快速修复，帮助用户保持代码整洁无误。

比如，IDE 现在会检测可被替换为对 Long.hashCode() 或 Double.hashCode() 方法的调用的按位操作。

此外，新的快速修复也可以根据代码库的要求简化隐式和显式类声明之间的切换。

另一项新检查为匹配代码段建议使用现有 static 方法，使代码可以轻松重用，而无需引入额外 API。此外，IDE现在可以检测并报告永远不会执行的无法访问的代码。

重构的 Conflicts Detected（检测到冲突）对话框

这次版本 2024.1 重构了 Conflicts Detected（检测到冲突）对话框以提高可读性。

现在，对话框中的代码反映了编辑器中的内容，使用户可以更清楚地了解冲突，并且 IDE 会自动保存窗口大小调整以供将来使用。

另外，这次还更新了按钮及其行为以简化重构工作流，对话框现在可以完全通过键盘访问，用户可以使用快捷键和箭头键进行无缝交互。

Rename（重命名）重构嵌入提示

为了使重命名流程更简单、更直观，新版推出了一个新的嵌入提示，在更改的代码元素上显示。要将代码库中的所有引用更新为新版本，点击此提示并确认更改即可。

版本控制系统改进

编辑器内的代码审查

IntelliJ IDEA 2024.1 为 GitHub 和 GitLab 用户引入了增强的代码审查体验。

该功能与编辑器集成，以促进作者与审查者直接互动。在检查拉取/合并请求分支时，审查模式会自动激活，并在装订区域中显示粉色标记，表明代码更改可供审查。

点击这些标记会弹出一个显示原始代码的弹出窗口，这样用户就能快速识别哪些代码已被更改。

装订区域图标可以帮助用户迅速发起新讨论，以及查看和隐藏现有讨论。另外这些图标还可以让用户更方便地访问评论，从而更轻松地完成查看、回复等功能。

Log（日志）标签页中显示审查分支更改的选项

新版通过提供分支相关更改的集中视图来简化了代码审查工作流。

对于 GitHub、GitLab 和 Space，用户现在可以在 Git 工具窗口中的单独 Log（日志）标签页中查看具体分支中的更改。用户可以点击 Pull Requests（拉取请求）工具窗口中的分支名称，然后从菜单中选择 Show in Git Log（在 Git 日志中显示）。

对代码审查评论回应的支持

新版开始支持对 GitHub 拉取请求和 GitLab 合并请求的审查评论发表回复，目前已有一组表情符号可供选择。

从推送通知创建拉取/合并请求

成功将更改推送到版本控制系统后，新版IDE将会发布一条通知，提醒用户已成功推送并建议创建拉取/合并请求的操作。

防止大文件提交到仓库

为了帮助用户避免由于文件过大而导致版本控制拒绝，新版IDE现在包含预提交检查，以防止用户提交此类文件并通知用户该限制。

构建工具改进

针对 Maven 项目的打开速度提升

新版 IDEA 现在通过解析 pom.xml 文件构建项目模型。这使得有效项目结构可以在几秒钟内获得，具有所有依赖项的完整项目模型则同时在后台构建，这样一来用户就无需等待完全同步即可开始处理项目。

从快速文档弹出窗口直接访问源文件

快速文档弹出窗口现在提供了一种下载源代码的简单方式。

现在当用户需要查看库或依赖项的文档并需要访问其源代码时，按 F1 即可。

更新后的弹出窗口将提供一个直接链接，用户可以使用它来下载所需的源文件，以简化工作流。

Maven 工具窗口中的 Maven 仓库

Maven 仓库列表及其索引编制状态现在直接显示在 Maven 工具窗口中，而不是以前 Maven 设置中的位置。

Gradle 版本支持更新

从这个新版本开始，IntelliJ IDEA 将不再支持使用低于 Gradle 版本 4.5 的项目，并且 IDE 不会对带有不支持的 Gradle 版本的项目执行 Gradle 同步。

运行/调试更新

多语句的内联断点

新版IDEA为在包含 lambda 函数或 return 语句的行中的断点设置提供了更方便的工作流。

点击装订区域设置断点后，IDE会自动显示可在其中设置额外断点的内联标记。每个断点都可以独立配置，释放高级调试功能。

条件语句覆盖

2024.1 新版使 IntelliJ IDEA 距离实现全面测试覆盖又近了一步。该项更新的重点是确定测试未完全覆盖代码中的哪些条件语句。

现在，IntelliJ IDEA 既显示哪一行具有未覆盖的条件，还会指定未覆盖的条件分支或变量值。这项功能默认启用。

框架和技术

针对 Spring 的改进 Bean 补全和自动装配

IntelliJ IDEA Ultimate 现在为应用程序上下文中的所有 Bean 提供自动补全，并自动装配 Bean。

如果 Bean 通过构造函数自动装配依赖项，则相关字段也会通过构造函数自动装配。同样，如果依赖项是通过字段或 Lombok 的 @RequiredArgsConstructor 注解注入，则新 Bean 会自动通过字段装配。

增强的 Spring 图表

新版的 Spring 模型图表更易访问。用户可以使用 Bean 行标记或对 Spring 类使用意图操作 (⌥⏎) 进行调用。

同时新版为 Spring 图表引入了新的图标，增强了 Spring 原型（如组件、控制器、仓库和配置 Bean）的可视化。此外，用户现在可以方便地切换库中 Bean 的可见性（默认隐藏）。

除此之外，其他包括像数据库工具、其他框架、语言和技术的支持等方面的更新和说明，大家也可参阅jetbrains.com/zh-cn/idea/whatsnew。

注：本文在GitHub开源仓库「编程之路」 github.com/rd2coding/R… 中已经收录，里面有我整理的6大编程方向(岗位)的自学路线+知识点大梳理、面试考点、我的简历、几本硬核pdf笔记，以及程序员生活和感悟，欢迎star。

作者：CodeSheep
来源：juejin.cn/post/7355389990531907636

收起阅读 »

身份认证的尽头竟然是无密码 ?

综合技术讨论

概述几乎所有的系统都会面临安全认证相关的问题，但是安全相关的问题是一个很麻烦的事情。因为它不产生直接的业务价值，而且处理起来复杂繁琐，所以很多时都容易被忽视。很多后期造成重大的安全隐患，往往都是前期的不重视造成的。但庆幸的是安全问题是普遍存在的，而且大家面临...

继续阅读 »

概述

几乎所有的系统都会面临安全认证相关的问题，但是安全相关的问题是一个很麻烦的事情。因为它不产生直接的业务价值，而且处理起来复杂繁琐，所以很多时都容易被忽视。很多后期造成重大的安全隐患，往往都是前期的不重视造成的。但庆幸的是安全问题是普遍存在的，而且大家面临的问题几乎相同，所以可以制定行业标准来规范处理，甚至是可以抽出专门的基础设施（例如：AD、LDAP 等）来专门解决这类共性的问题。总之，关于安全问题非常复杂而且麻烦，对于大多数 99% 的系统来说，不要想着在安全问题领域上搞发明和创新，容易踩坑。而且行业的标准解决方案已经非常成熟了。经过长时间的检验。所以在安全领域，踏踏实实的遵循规范和标准就是最好的安全设计。

HTTP 认证

HTTP 认证协议的最初是在 HTTP/1.1标准中定义的，后续由 IETF 在 RFC 7235 中进行完善。HTTP 协议的主要涉及两种的认证机制。

基本认证

常见的叫法是 HTTP Basic，是一种对于安全性不高，以演示为目的的简单的认证机制（例如你家路由器的登录界面），客户端用户名和密码进行 Base64 编码（注意是编码，不是加密）后，放入 HTTP 请求的头中。服务器在接收到请求后，解码这个字段来验证用户的身份。示例：

GET /some-protected-resource HTTP/1.1

Host: example.com

Authorization: Basic dXNlcjpwYXNzd29yZA==

虽然这种方式简单，但并不安全，因为 base64 编码很容易被解码。建议仅在 HTTPS 协议下使用，以确保安全性。

摘要认证

主要是为了解决 HTTP Basic 的安全问题，但是相对也更复杂一些，摘要认证使用 MD5 哈希函数对用户的密码进行加密，并结合一些盐值（可选）生成一个摘要值，然后将这个值放入请求头中。即使在传输过程中被截获，攻击者也无法直接从摘要中还原出用户的密码。示例：

GET /dir/index.html HTTP/1.1

Host: example.com

Authorization: Digest username="user", realm="example.com", nonce="dcd98b7102dd2f0e8b11d0f600bfb0c093", uri="/dir/index.html", qop=auth, nc=00000001, cnonce="0a4f113b", response="6629fae49393a05397450978507c4ef1", opaque="5ccc069c403ebaf9f0171e9517f40e41"

**补充：**另在 RFC 7235 规范中还定义当用户没有认证访问服务资源时应返回 401 Unauthorized 状态码，示例：

HTTP/1.1 401 Unauthorized

WWW-Authenticate: Basic realm="Restricted Area"

这一规范目前应用在所有的身份认证流程中，并且沿用至今。

Web 认证

表单认证

虽然 HTTP 有标准的认证协议，但目前实际场景中大多应用都还是基于表单认证实现，具体步骤是：

前端通过表单收集用户的账号和密码

通过协商的方式发送服务端进行验证的方式。

常见的表单认证页面通常如下：

html>

<html>

<head>

    <title>Login Pagetitle>

head>

<body>

    <h2>Login Formh2>

    <form action="/perform_login" method="post">

        <div class="container">

            <label for="username"><b>Usernameb>label>

            <input type="text" placeholder="Enter Username" name="username" required>

            

            <label for="password"><b>Passwordb>label>

            <input type="password" placeholder="Enter Password" name="password" required>

            

            <button type="submit">Loginbutton>

        div>

    form>

body>

html>

为什么表单认证会成为主流？主要有以下几点原因：

界面美化：开发者可以创建定制化的登录界面，可以与应用的整体设计风格保持一致。而 HTTP 认证通常会弹出一个很丑的模态对话框让用户输入凭证。

灵活性：可以在表单里面自定义更多的逻辑和流程，比如多因素认证、密码重置、记住我功能等。这些功能对于提高应用的安全性和便利性非常重要。

安全性：表单认证可以更容易地结合现代的安全实践，背后也有 OAuth 2 、Spring Security 等框架的主持。

表单认证传输内容和格式基本都是自定义本没啥规范可言。但是在 2019 年之后 web 认证开始发布标准的认证协议。

WebAuthn

WebAuthn 是一种彻底抛弃传统密码的认证，完全基于生物识别技术和实体密钥作为身份识别的凭证（有兴趣的小伙伴可以在 github 开启 Webauhtn 的 2FA 认证体验一下）。在 2019 年 3 月，W3C 正式发布了 WebAuthn 的第一版规范。

相比于传统的密码，WebAuthn 具有以下优势：

减少密码泄露：传统的用户名和密码登录容易受到钓鱼攻击和数据泄露的影响。WebAuthn，不依赖于密码，不存在密码丢失风险。

提高用户体验：用户不需要记住复杂的密码，通过使用生物识别等方式可以更快捷、更方便地登录。

多因素认证：WebAuthn 可以作为多因素认证过程中的一部分，进一步增强安全性。使用生物识别加上硬件密钥的方式进行认证，比短信验证码更安全。

总的来说，WebAuthn 是未来的身份认证方式，通过提供一个更安全、更方便的认证方式，目的是替代传统的基于密码的登录方法，从而解决了网络安全中的一些长期问题。WebAuthn 目前已经得到流程的浏览器厂商（Chrome、Firefox、Edge、Safari）、操作系统（WIndows、macOS、Linux）的广泛支持。

实现效果

当你的应用接入 WebAuthn 后，用户便可以通过生物识别设备进行认证，效果如下：

实现原理

WebAuthn 实现较为复杂，这里不做详细描述，具体可参看权威的官方文档，大概交互过程可以参考以下时序图：

登录流程大致可以分为以下步骤：

用户访问登录页面，填入用户名后即可点击登录按钮。

服务器返回随机字符串 Challenge、用户 UserID。

浏览器将 Challenge 和 UserID 转发给验证器。

验证器提示用户进行认证操作。

服务端接收到浏览器转发来的被私钥加密的 Challenge，以此前注册时存储的公钥进行解密，如果解密成功则宣告登录成功。

WebAuthn 采用非对称加密的公钥、私钥替代传统的密码，这是非常理想的认证方案，私钥是保密的，只有验证器需要知道它，连用户本人都不需要知道，也就没有人为泄漏的可能；

备注：你可以通过访问 webauthn.me 了解到更多消息的信息

文章不适合加入过多的演示代码，想要手上体验的可以参考 okta 官方给出基于 Java 17 和 Maven 构建的 webauthn 示例程序，如下：

访问地址：github.com/oktadev/web…

作者：肖卫卫讲编程
来源：juejin.cn/post/7354632375446061083

收起阅读 »

太惨了，凌晨4 点替别人修复bug……

Java

差点翻车前两个月的某天凌晨，我司全新的一个营销工具，在全国如期上线。然而整个发布过程并非一帆风顺，在线上环境全量发布后，有同事观测到他所负责模块的监控曲线有异常！监控曲线在发布的时刻近乎于直线下跌。经过初步排查，故障影响是：一部分新用户无法使用营销优惠~ ...

继续阅读 »

差点翻车

前两个月的某天凌晨，我司全新的一个营销工具，在全国如期上线。然而整个发布过程并非一帆风顺，在线上环境全量发布后，有同事观测到他所负责模块的监控曲线有异常！监控曲线在发布的时刻近乎于直线下跌。

经过初步排查，故障影响是：一部分新用户无法使用营销优惠~ 影响面非常大，所幸在凌晨的业务低峰期，实际影响有限，但是需要快速修复！不然等天亮用户请求量上来了，故障影响和定级就更大了！

目前接近凌晨4 点，时间很紧张！虽然这部分内容并非我负责，但我是当天的现场值班人，必须上！肝！

屎海无涯

我喝了一口红牛，打开电脑就扎进了陌生代码的汪洋大海中……

看着看着，我察觉到味道不对劲。我觉得这部分代码不是汪洋大海，而是一片屎海…… 代码堆砌如屎山，单个方法竟超过500行；嵌套的if else结构深不可测；日志更是完全缺失；职责不但不单一，反而极度混乱。总之，整个代码简直如同一团乱麻，排查难度极大。

四五个同事一起在排查代码，虽然他们负责过这部分代码，但是大家都十分挠头，找不到 bug 在哪。

当局者迷，旁观者清。经过了30分钟的细致分析，终于，我率先找到了 bug 原因。激动地心颤抖的手，我开了 5 分钟的 bug 发布会，通报了 bug 根因和修复方案。

破案了！

确定 bug 根因后，其他人默默去休息了……

接下来我负责修 bug、测试、打包、发版、验证…… 不知不觉，天空破晓，一直搞到早上 8 点多…… 在线上完成验证，监控曲线恢复正常！bug 修复完成！

bug根因

由于公司代码保密，所以我使用伪代码解释。

业务逻辑是遍历所有的优惠活动，若任意一个优惠活动需要限制新用户使用，那么就需要去查询当前用户是否新用户。

bug 代码如下！（实际的屎山代码，比这部分代码要复杂得多！）

boolean newUserCheckEnabled = false;

for ( Activity activity : activityList ) {

     newUserCheckEnabled = activity.isLimitNewUser();

}

想必大家一眼就能看出问题所在！这样写代码， newUserCheckEnabled 等于最后一个活动的值，如果最后一个活动不限制新用户使用，那么 newUserCheckEnabled 就是 false，然而中间的活动可能需要限制新用户，于是 bug 产生了！

老板亲自指导写代码

正确的代码应该这样写，我按照如下方式修复了 bug，但是老板对代码不满意！

boolean newUserCheckEnabled = false;

for ( Activity activity : activityList ) {

     if (activity.isLimitNewUser()) {

         newUserCheckEnabled = true;

     }

}

”一行代码就能解决的事，不需要使用 if “ ，老板看完我的代码后，说道。

他给出的代码示例如下，使用 || 表达式

boolean newUserCheckEnabled = false;

for ( Activity activity : activityList ) {

     newUserCheckEnabled = newUserCheckEnabled || activity.isLimitNewUser();

}

if 代码被替换如下！

newUserCheckEnabled = newUserCheckEnabled || activity.isLimitNewUser();

"这能行吗”？我的大脑飞速运转…… 这两段代码等价吗？似乎等价，但不是十分确定……

老板面前，不能暴露自己没跟上节奏，否则暴露智商。

我假装立刻明白，于是吹了一句，“卧槽，牛逼，这样写确实更加简洁吖！👍🏻”。（大家觉得应该怎么拍马屁，更合适？）

私底下，我还在心里嘀咕，两者真的等价吗？

现在我可以肯定：确实是等价的！

作者：五阳
来源：juejin.cn/post/7425875126527918130

收起阅读 »

旧Android手机改为个人服务器，不需要root

综合技术讨论

一、前言随着手机更新换代的加速，每个人都有一些功能正常，但是闲置的手机，其实现在的手机都是ARM架构的，大多数手机内存还不小，相对于现在各大厂商提供的云服务器来讲，配置已经很不错了，所以这么好的资源能利用起来还是非常不错的~ 二、工具介绍目前能用的工具有很...

继续阅读 »

一、前言

随着手机更新换代的加速，每个人都有一些功能正常，但是闲置的手机，其实现在的手机都是ARM架构的，大多数手机内存还不小，相对于现在各大厂商提供的云服务器来讲，配置已经很不错了，所以这么好的资源能利用起来还是非常不错的~

二、工具介绍

目前能用的工具有很多，比如BusyBox、Linux Deploy、juice ssh、termux，但是很多都是需要手机能够root的，但是root并不是所有手机都能够简单获取到的，所以我这里选取Termux进行操作。

三、什么是Termux

Termux 是一款运行于 Android 系统的开源终端模拟器。提供了 Linux 环境，即使设备不具备 root 权限也可使用。通过自带的包管理器（Pacman、 APT），Termux 可以安装许多现代化的开发和系统维护工具，例如 zsh、Python、Ruby、NodeJS、MySQL 等软件。

四、开始改造

4.1 Termux安装

Termux下载：github.com/termux/term…

安装完成后，可以执行以下命令更新一下各软件包：

pkg update && pkg upgrade

4.2 安装openSSH

成功安装Termux之后，虽然手机是可以像服务器一样执行一些操作，但是毕竟手机管理配置起来没有PC方便，所以可以安装SSH服务，方便PC来远程操作。

# 安装openssh

pkg install openssh



# 默认端口为8022，修改端口

sshd -p 8888



# 启动ssh服务

sshd

4.3 远程连接SSH

要远程连接可以使用终端或者SSH客户端（如：PuTTY、Termius、XShell、MobaXterm等），使用以下命令连接到Termux服务。

ssh -p 8022 <username>@<device_ip>

username

在Android手机上使用Termux搭建服务器，并通过SSH让PC进行登录和操作时，**默认的用户名通常是u0_aXXX，**可以通过以下方式获取到你的用户名是什么：

# 查询termux服务用户名

whoami

device_ip

通过以下命令获取手机的IP，这里的IP是局域网IP。

# 获取设备IP

ifconfig wlan0

连接时需要密码，由于termux服务默认密码为空，所以需要设置一个密码，具体方式如下：

# 切换管理员账户（如果有）

su



# 设置密码

passwd

五、注意点

5.1 保持服务在线

由于Termux是直接运行到Android手机上的，也是一个APP程序，所以需要注意Termux程序不要退出了。

5.2 内网服务

虽然经过上述方式已经实现了服务器的常规基础配置和操作功能，但是毕竟是在手机上的一个服务，也是受到网络环境限制的，因此如果要保证服务可用，需要保证手机和使用端在同意局域网内。

六、扩展

如果对手机作为网站服务器以及移动无线硬盘相关的内容，欢迎关注，后续会尽快分享相关方法。

作者：一念三千_
来源：juejin.cn/post/7459816593230397494

收起阅读 »

小米正式官宣开源！杀疯了！

综合技术讨论

最近，和往常一样在刷 GitHub Trending 热榜时，突然看到又一个开源项目冲上了 Trending 榜单。一天之内就狂揽数千 star，仅仅用两三天时间，star 数就迅速破万，增长曲线都快干垂直了！出于好奇，点进去看了看。好家伙，这居然还是...

继续阅读 »

最近，和往常一样在刷 GitHub Trending 热榜时，突然看到又一个开源项目冲上了 Trending 榜单。

一天之内就狂揽数千 star，仅仅用两三天时间，star 数就迅速破万，增长曲线都快干垂直了！

出于好奇，点进去看了看。

好家伙，这居然还是小米开源的项目，相信不少小伙伴也刷到了。

这个项目名为：ha_xiaomi_home。

全称：Xiaomi Home Integration for Home Assistant。

原来这就是小米开源的 Home Assistant 米家集成，一个由小米官方提供支持的 Home Assistant 集成组件，它可以让用户在 Home Assistant 平台中使用和管理小米 IoT 智能设备。

Home Assistant 大家知道，这是一款开源的家庭自动化智能家居平台，以其开放性和兼容性著称，其允许用户将家中的智能设备集成到一个统一的系统中进行管理和控制，同时支持多种协议和平台。

通过 Home Assistant，用户可以轻松地实现智能家居的自动化控制，如智能灯光、智能安防、智能温控等，所以是不少智能家居爱好者的选择。

另外通过安装集成（Integration），用户可以在 Home Assistant 上实现家居设备的自动化场景创建，并且还提供了丰富的自定义功能，所以一直比较受 DIY 爱好者们的喜爱。

大家知道，小米在智能家居领域的战略布局一直还挺大的，IoT 平台的连接设备更是数以亿记，大到各种家电、电器，小到各种摄像头、灯光、开关、传感器，产品面铺得非常广。

那这次小米开源的这个所谓的米家集成组件，讲白了就是给 Home Assistant 提供官方角度的支持。

而这对于很多喜欢折腾智能家居或者 IoT 物联网设备的小伙伴来说，无疑也算是一个不错的消息。

ha_xiaomi_home 的安装方法有好几种，包括直接 clone 安装，借助 HACS 安装，或者通过 Samba 或 FTPS 来手动安装等。

但是官方是推荐直接使用 git clone 命令来下载并安装。

cd config

git clone https://github.com/XiaoMi/ha_xiaomi_home.git

cd ha_xiaomi_home

./install.sh /config

原因是，这样一来当用户想要更新至特定版本时，只需要切换相应 Tag 即可，这样会比较方便。

比如，想要更新米家集成版本至 v1.0.0，只需要如下操作即可。

cd config/ha_xiaomi_home

git checkout v1.0.0

./install.sh /config

安装完成之后就可以去 Home Assistant 的设置里面去添加集成了，然后使用小米账号登录即可。

其实在这次小米官方推出 Home Assistant 米家集成之前，市面上也有一些第三方的米家设备集成，但是多多少少会有一些不完美的地方，典型的比如设备状态响应延时，所以导致体验并不是最佳。

与这些第三方集成相比，小米这次新推出的官方米家集成无论是性能还是安全性都可以更期待一下。

如官方所言，Home Assistant 米家集成提供了官方的 OAuth 2.0 登录方式，并不会在 Home Assistant 中保存用户的账号密码，同时账号密码也不再需提供给第三方，因此也就避免了账号密码泄露的风险。

但是这里面仍然有一个问题需要注意，项目官方也说得很明确：虽说 Home Assistant 米家集成提供了 OAuth 的登录方式，但由于 Home Assistant 平台的限制，登录成功后，用户的小米用户信息（包括设备信息、证书、 token 等）会明文保存在 Home Assistant 的配置文件中。因此用户需要保管好自己的 Home Assistant 配置文件，确保不要泄露。

这个项目开源之后，在网上还是相当受欢迎的，当然讨论的声音也有很多。
小米作为一家商业公司，既然专门搞了这样一个开源项目来做 HA 米家集成，这对于他们来说不管是商业还是产品，肯定都是有利的。

不过话说回来，有了这样一个由官方推出的开源集成组件，不论是用户体验还是可玩性都会有所提升，这对于用户来说也未尝不是一件好事。

那关于这次小米官方开源的 Home Assistant 米家集成项目，大家怎么看呢？

作者：CodeSheep
来源：juejin.cn/post/7454170332712386572

收起阅读 »

悲惨！刚入职没几天，无意间把数据库删了，很尴尬，原因很奇葩

综合技术讨论

1. offer收割机，就职新公司 5年前的就业环境非常好，当时面试了很多家公司，收到了很多 offer。最终我决定入职一家互联网教育公司，新的公司福利非常好，各种零食随便吃，据说还能正点下班，一切都超出我的期望，“可算让我找着神仙公司了”，我的心里一阵窃喜。...

继续阅读 »

1. offer收割机，就职新公司

5年前的就业环境非常好，当时面试了很多家公司，收到了很多 offer。最终我决定入职一家互联网教育公司，新的公司福利非常好，各种零食随便吃，据说还能正点下班，一切都超出我的期望，“可算让我找着神仙公司了”，我的心里一阵窃喜。

在熟悉环境之后，我趁着上厕所的时候，顺便去旁边的零食摊挑了点零食。接下来的一天里，我专注地配置开发环境、阅读新人文档，当然我也不忘兼顾手边的零食。

入职几天后，领导给安排了一个小需求，我和同事沟通完技术方案后，就开始开发了。

2. 单元测试有点奇怪

完成开发后，我决定写个单元测试验证下，在研究单元测试代码后，我发现这种单测写法和我之前的写法不太一样。

这家公司的单测好像没有启动整个项目，仅加载了部分类，而且不能访问测试环境数据库~ 于是我决定按照前东家写单测的方式重新写单元测试。

于是我新增了一个单测基类，在单测中启动整个SpringBoot，直接访问测试环境数据库。然而也并不是很顺利，启动阶段总是会遇到各种异常报错，需要一个一个排查…… 所幸项目排期不紧张，还有充足时间。

我做梦也没有想到，此刻，已经铸成大错。

3. 故障现场

我身边的工位旁慢慢地聚集了越来越多的人，本来我还在安安静静的调试单元测试，注意力不自觉的被吸引了过去。

“测试环境为什么这么多异常，访问不通啊。到处都是 500 报错”，不知道谁在说话。

“嗯，我们还在排查，稍等一下”，我旁边的同事一边认真排查日志，一边轻声回复道。

“为什么数据库报的异常是，查不到数据呢？” ，同事在小声嘀咕，然后打开命令行，立即登上 MySQL。

我亲眼看着他在操作，奇怪的是数据库表里的数据全部被删掉了，其他的几个表数据也都被删除了。

简直太奇怪了，此刻的我还处于吃瓜心态。

有一个瞬间我在考虑，是否和我执行的单元测试有关系？但我很快就否决掉了这个想法，因为我只是在调试单元测试，我没有删数据库啊，单测里也不可能删库啊。我还在笑话自己胡思乱想……

很快 DBA 就抱着电脑过来，指着电脑说，你们看这些日志，确实有人把这些表删除了。

"有 IP 吗，定位下是谁删除的，另外线上环境有问题吗？”，旁边的大组长过来和 DBA 说。

“嗯，我找到ip 了，我找运维看下，这个ip是谁的”。DBA 回复道。

4. 庭审现场

当 DBA 找到我的时候，我感到无辜和无助，我懵逼了，我寻思我啥也没干啊，我怎么可能删库呢。（他们知道我刚入职，我现在怀疑：那一刻他们可能会怀疑我是友商派过来的卧底、间谍，执行删库的秘密任务）

经过一系列的掰扯和分析，最终定位 确实是我新增的单元测试把数据库删了。

5. 故障原因

需要明确的是，原单元测试执行时不会删除数据库；测试环境启动时也不会删除数据库。

只要在单元测试中连接测试数据库，就会删除掉数据库的所有数据。为什么呢？

5.1 为什么单元测试删除了所有数据？

原单元测试使用的是 H2 内存数据库，即Java 开发的嵌入式(内存级别)数据库，它本身只是一个类库，也就是只有一个 jar 文件，可以直接嵌入到项目中。H2数据库又被称为内存数据库，因为它支持在内存中创建数据库和表。所以如果我们使用H2数据库的内存模式，那么我们创建的数据库和表都只是保存在内存中，一旦应用重启，那么内存中的数据库和表就不存在了。 所以非常适合用来做单元测试。

H2 数据库在启动阶段，需要执行用户指定的 SQL 脚本，脚本中一般包含表创建语句，用来构建需要使用的表。

但是我司的 SQL 脚本除了创建表语句，还包含了删除表语句。即在创建表之前先删除表。为什么呢？据他们说，是因为这个 SQL 脚本可能会重复执行，当重复执行时创建表语句会报错。所以他们在创建表之前，先尝试删除表。这样确保 SQL 脚本可重复执行。（其实可以用 Create if not exists ）

故障的原因就是：测试数据库执行了这个删表再建表的 SQL 脚本，导致所有数据都被清除了。

5.2 为什么测试数据库会执行这条 SQL 脚本呢？

1）我新建的单元测试把H2 内存数据库换成了测试数据库。

2） spring.data.initialize=默认值为 true；默认情况下，会自动执行 sql 脚本。

所以测试数据库执行了 SQL 脚本。

5.3 为什么在测试环境正常启动时，没有问题，不会删除所有数据呢？

只有单测引入测试数据库才会出问题，在测试环境正常启动项目是没问题的。

当编译项目时，测试目录下的文件、代码和正式代码编译后的结果不会放到一起。因为 SQL脚本被放在了测试目录下，所以正式代码在测试环境启动时，不会执行到这个 SQL脚本，自然不会有问题。

6. 深刻教训

最终数据被修复了，DBA有测试数据库的备份，然而快照并非实时的，不可避免地还是丢失了一部分数据。

所幸的是出问题的是测试环境，并非线上环境。否则，我会不会被起诉，也未可知。

后续的改进措施包括

收回了数据库账户的部分权限，只有管理账户才可以修改数据库表结构。代码中执行 DML语句的账户不允许执行 DDL 语句。

DBA 盘点测试数据库的快照能力，确保快照间隔足够短，另外新增一个调研课题：删库后如何快速恢复，参照下其他公司的方案。

所有的项目 spring.data.initialize 全部声明为 false。不自动执行 SQL 脚本

SQL脚本一律不许出现删除表的语句。SQL不能重复执行的问题，想其他办法解决。

另外的一个项目急需人手，把新来的那谁调到其他项目上

这可能是程序员们在技术上越来越保守的原因……不经意的一个调整可能引发无法承受的滔天巨浪

作者：五阳
来源：juejin.cn/post/7412490391935893541

收起阅读 »

用java做物品识别和姿态识别

Java

前言之前搞得语音识别突然发现浏览器就有接口可以直接用，而且识别又快又准，参考：使用 JavaScript 的 SpeechRecognition API 实现语音识别_speechrecognition js-CSDN博客进入正题这个功能首先要感谢一下作...

继续阅读 »

前言

之前搞得语音识别突然发现浏览器就有接口可以直接用，而且识别又快又准，参考：使用 JavaScript 的 SpeechRecognition API 实现语音识别_speechrecognition js-CSDN博客

进入正题

这个功能首先要感谢一下作者常康，仓库地址(gitee.com/agriculture… 这个项目很早之前就关注了，最近这段时间正好要用才真正实践了一下，只是初步测试了一下，在性能方面还需要进一步测试，本人电脑就很拉识别就很卡。

先看效果

改动

主要对姿态识别做了一些小改动，将原图片识别改成视频视频识别，如果要调用摄像头将video.open(0);的代码注释放开即可

package cn.ck;



import ai.onnxruntime.OnnxTensor;

import ai.onnxruntime.OrtEnvironment;

import ai.onnxruntime.OrtException;

import ai.onnxruntime.OrtSession;

import cn.ck.config.PEConfig;

import cn.ck.domain.KeyPoint;

import cn.ck.domain.PEResult;

import cn.ck.utils.Letterbox;

import nu.pattern.OpenCV;

import org.opencv.core.Mat;

import org.opencv.core.Point;

import org.opencv.core.Scalar;

import org.opencv.core.Size;

import org.opencv.highgui.HighGui;

import org.opencv.imgproc.Imgproc;

import org.opencv.videoio.VideoCapture;

import org.opencv.videoio.Videoio;



import java.nio.FloatBuffer;

import java.util.ArrayList;

import java.util.Collections;

import java.util.List;



/*

 *  姿态识别，可以识别动作等等.,比如跳绳技术

 */

public class PoseEstimation {



    static {

        // 加载opencv动态库

        //System.load(ClassLoader.getSystemResource("lib/opencv_java470-无用.dll").getPath());

        OpenCV.loadLocally();

    }



    public static void main(String[] args) throws OrtException {



        String model_path = "src\main\resources\model\yolov7-w6-pose-nms.onnx";

        // 加载ONNX模型

        OrtEnvironment environment = OrtEnvironment.getEnvironment();

        OrtSession.SessionOptions sessionOptions = new OrtSession.SessionOptions();

        OrtSession session = environment.createSession(model_path, sessionOptions);

        // 输出基本信息

        session.getInputInfo().keySet().forEach(x -> {

            try {

                System.out.println("input name = " + x);

                System.out.println(session.getInputInfo().get(x).getInfo().toString());

            } catch (OrtException e) {

                throw new RuntimeException(e);

            }

        });



        VideoCapture video = new VideoCapture();



//        video.open(0);  //获取电脑上第0个摄像头



        //可以把识别后的视频在通过rtmp转发到其他流媒体服务器，就可以远程预览视频后视频，需要使用ffmpeg将连续图片合成flv 等等，很简单。

        if (!video.isOpened()) {

            System.err.println("打开视频流失败,未检测到监控,请先用vlc软件测试链接是否可以播放！,下面试用默认测试视频进行预览效果！");

            video.open("video/test2.mp4");

        }

        // 跳帧检测，一般设置为3，毫秒内视频画面变化是不大的，快了无意义，反而浪费性能

        int detect_skip = 4;



        // 跳帧计数

        int detect_skip_index = 1;



        // 最新一帧也就是上一帧推理结果

        float[][] outputData   = null;



        //当前最新一帧。上一帧也可以暂存一下

        Mat img = new Mat();





// 在这里先定义下线的粗细、关键的半径(按比例设置大小粗细比较好一些)

        int minDwDh = Math.min((int)video.get(Videoio.CAP_PROP_FRAME_WIDTH), (int)video.get(Videoio.CAP_PROP_FRAME_HEIGHT));

        int thickness = minDwDh / PEConfig.lineThicknessRatio;

        int radius = minDwDh / PEConfig.dotRadiusRatio;

            // 转换颜色空间

            Mat image = new Mat();



            // 图像预处理

            Letterbox letterbox = new Letterbox();

            letterbox.setNewShape(new Size(960, 960));

            letterbox.setStride(64);





// 使用多线程和GPU可以提升帧率，线上项目必须多线程！！！,一个线程拉流，将图像存到[定长]队列或数组或者集合，一个线程模型推理，中间通过变量或者队列交换数据,代码示例仅仅使用单线程

        while (video.read(img)) {

            if ((detect_skip_index % detect_skip == 0) || outputData == null) {

                Imgproc.cvtColor(img, image, Imgproc.COLOR_BGR2RGB);

                image = letterbox.letterbox(image);

                int rows = letterbox.getHeight();

                int cols = letterbox.getWidth();

                int channels = image.channels();

                // 将图像转换为模型输入格式

                float[] pixels = new float[channels * rows * cols];

                for (int i = 0; i < rows; i++) {

                    for (int j = 0; j < cols; j++) {

                        double[] pixel = image.get(j, i);

                        for (int k = 0; k < channels; k++) {

                            pixels[rows * cols * k + j * cols + i] = (float) pixel[k] / 255.0f;

                        }

                    }

                }

                detect_skip_index = 1;

                OnnxTensor tensor = OnnxTensor.createTensor(environment, FloatBuffer.wrap(pixels), new long[]{1L, (long) channels, (long) rows, (long) cols});

                OrtSession.Result output = session.run(Collections.singletonMap(session.getInputInfo().keySet().iterator().next(), tensor));



                // 处理输出结果并绘制

               outputData = ((float[][]) output.get(0).getValue());

            }else{

                detect_skip_index = detect_skip_index + 1;

            }

            double ratio = letterbox.getRatio();

            double dw =letterbox.getDw();

            double dh = letterbox.getDh();

            List<PEResult> peResults = new ArrayList<>();

            for (float[] outputDatum : outputData) {

                PEResult result = new PEResult(outputDatum);

                if (result.getScore() > PEConfig.personScoreThreshold) {

                    peResults.add(result);

                }

            }



            // 对结果进行非极大值抑制

            peResults = nms(peResults, PEConfig.IoUThreshold);



            for (PEResult peResult: peResults) {

                System.out.println(peResult);

                // 画框

                Point topLeft = new Point((peResult.getX0()-dw)/ratio, (peResult.getY0()-dh)/ratio);

                Point bottomRight = new Point((peResult.getX1()-dw)/ratio, (peResult.getY1()-dh)/ratio);

                // Imgproc.rectangle(img, topLeft, bottomRight, new Scalar(255,0,0), thickness);

                List<KeyPoint> keyPoints = peResult.getKeyPointList();

                // 画点

                keyPoints.forEach(keyPoint->{

                    if (keyPoint.getScore()>PEConfig.keyPointScoreThreshold) {

                        Point center = new Point((keyPoint.getX()-dw)/ratio, (keyPoint.getY()-dh)/ratio);

                        Scalar color = PEConfig.poseKptColor.get(keyPoint.getId());

                        Imgproc.circle(img, center, radius, color, -1); //-1表示实心

                    }

                });

                // 画线

                for (int i = 0; i< PEConfig.skeleton.length; i++){

                    int indexPoint1 = PEConfig.skeleton[i][0]-1;

                    int indexPoint2 = PEConfig.skeleton[i][1]-1;

                    if ( keyPoints.get(indexPoint1).getScore()>PEConfig.keyPointScoreThreshold &&

                            keyPoints.get(indexPoint2).getScore()>PEConfig.keyPointScoreThreshold ) {

                        Scalar coler = PEConfig.poseLimbColor.get(i);

                        Point point1 = new Point(

                                (keyPoints.get(indexPoint1).getX()-dw)/ratio,

                                (keyPoints.get(indexPoint1).getY()-dh)/ratio

                        );

                        Point point2 = new Point(

                                (keyPoints.get(indexPoint2).getX()-dw)/ratio,

                                (keyPoints.get(indexPoint2).getY()-dh)/ratio

                        );

                        Imgproc.line(img, point1, point2, coler, thickness);

                    }

                }

            }

            //服务器部署：由于服务器没有桌面，所以无法弹出画面预览，主要注释一下代码

            HighGui.imshow("result", img);



            // 多次按任意按键关闭弹窗画面，结束程序

            if(HighGui.waitKey(1) != -1){

                break;

            }

        }



        HighGui.destroyAllWindows();

        video.release();

        System.exit(0);



    }



    public static List<PEResult> nms(List<PEResult> boxes, float iouThreshold) {

        // 根据score从大到小对List进行排序

        boxes.sort((b1, b2) -> Float.compare(b2.getScore(), b1.getScore()));

        List<PEResult> resultList = new ArrayList<>();

        for (int i = 0; i < boxes.size(); i++) {

            PEResult box = boxes.get(i);

            boolean keep = true;

            // 从i+1开始，遍历之后的所有boxes，移除与box的IOU大于阈值的元素

            for (int j = i + 1; j < boxes.size(); j++) {

                PEResult otherBox = boxes.get(j);

                float iou = getIntersectionOverUnion(box, otherBox);

                if (iou > iouThreshold) {

                    keep = false;

                    break;

                }

            }

            if (keep) {

                resultList.add(box);

            }

        }

        return resultList;

    }

    private static float getIntersectionOverUnion(PEResult box1, PEResult box2) {

        float x1 = Math.max(box1.getX0(), box2.getX0());

        float y1 = Math.max(box1.getY0(), box2.getY0());

        float x2 = Math.min(box1.getX1(), box2.getX1());

        float y2 = Math.min(box1.getY1(), box2.getY1());

        float intersectionArea = Math.max(0, x2 - x1) * Math.max(0, y2 - y1);

        float box1Area = (box1.getX1() - box1.getX0()) * (box1.getY1() - box1.getY0());

        float box2Area = (box2.getX1() - box2.getX0()) * (box2.getY1() - box2.getY0());

        float unionArea = box1Area + box2Area - intersectionArea;

        return intersectionArea / unionArea;

    }

}

姿态识别模型提取链接，
通过网盘分享的文件：yolov7-w6-pose-nms.onnx
链接: pan.baidu.com/s/1UdAUPWr1… 提取码: du6y

后言

就像原作者说的，不是每个同学都会python,不是每个项目都是python语言开发，不是每个岗位都会深度学习。

希望java在AI领域能有更好的发展

作者：北冥有鱼518
来源：juejin.cn/post/7413234304278970404

收起阅读 »

当我入手一台 MacBookPro 之后

Java

从 13 年实习开始，开发环境从 Ubuntu 转战 MacOS，中间换了好几次电脑，每次都是直接用 Mac 自带的 Time Machine 来迁移数据，仅需一块移动硬盘或者一根 type c 线，经过一个晚上的数据迁移，第二天就可以用新电脑工作了，除了配置...

继续阅读 »

从 13 年实习开始，开发环境从 Ubuntu 转战 MacOS，中间换了好几次电脑，每次都是直接用 Mac 自带的 Time Machine 来迁移数据，仅需一块移动硬盘或者一根 type c 线，经过一个晚上的数据迁移，第二天就可以用新电脑工作了，除了配置升级了，几乎感受不到换电脑的乐趣，并且升级过程中，也积累了不少系统升级的旧疾，这次从Intel芯片到 M3 Max 芯片，我打算从零开始，重新蒸腾一番，顺带更新一下工具库，说干就干，Go！
先介绍下新电脑的配置

太空黑：从经典的银色、到太空灰，这次体验一下太空黑

14 寸：用了大概 3 年的 14 寸，就一直用 15/16寸，因为这台不是用于办公，考虑携带方便，所以入手 14 寸（大屏幕肯定爽，但是在家主要也是外接显示器）

M3 Max：想要体验一下本地大模型，直接入手 Max（找个借口🤐）

64G 内存：一直有在 macbook 上装虚拟机（Parallels Desktop）运行 Windows的习惯，升级了一下内存

2TB SSD：以前 512 的时候，由于各种 npm 包、docker 镜像，还是隔一段时间就要重启一下、硬盘清理等方式来释放空间，一步到位

后面还换过几台，从最开始的 touchbar ，蝶式键盘，再到取消 touchbar，这时候更多的是工作工具的更换，连拍照的激情都没有🥱🥱

开发工具

科学上网工具

作为开发，第一件事情是需要一个趁手的科学上网工具，不然类似下载 Google Chrome、安装 Homebrew 等基础的工具都会十分麻烦
我的科学上网工具，支持按照规则配置自动代理，同时也支持终端代理，以下是终端代理，这里不方便推荐具体工具

# 防止终端命令无法确定是否需要科学上网，不建议把这个命令持久化到 bashrc/zshrc,在需要时打开终端输入即可

 export https_proxy=http://127.0.0.1:1235 http_proxy=http://127.0.0.1:1235 all_proxy=socks5://127.0.0.1:1234

Xcode

Xcode 命令行工具，许多开发工具和依赖所需的基础，运行一下命令，选择安装，稍等一会即可

xcode-select --install

Homebrew

通过 homebrew 来管理一些开发工具包，如 git、node等等，由于需要下载 github 地址，这里需要借助你的翻墙工具

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

然后按照提示，把命令加到 PATH

(echo; echo 'eval "$(/opt/homebrew/bin/brew shellenv)"') >> ~/.zprofile

eval "$(/opt/homebrew/bin/brew shellenv)"

Git/Tig

brew install git

# brew install git-gui 

# brew install tig 个人是 vim 用户，偏向这种终端 gui

# 这里会自动安装 zsh 的自动补全工具，后续安装 zsh 可用

# /opt/homebrew/share/zsh/site-functions

安装 git 和 tig 都会默认新增 zsh 的补全方法，好吧，这是提醒我要立马安装 zsh
tigrc 可以用来自定义 tig 的一些配置和快捷键绑定

A sample of the default configuration has been installed to:

  /opt/homebrew/opt/tig/share/tig/examples/tigrc

to override the system-wide default configuration, copy the sample to:

  /opt/homebrew/etc/tigrc



zsh completions and functions have been installed to:

  /opt/homebrew/share/zsh/site-functions

在任意已经初始化 git 的项目，打入 tig ，然后你就可以使用 vim 的方式来操作了 jk 等等

另外，使用 git 我还会额外安装两个 git 相关的小插件
一个是 tj 大神开发的 git-extras

brew install git-extras



# 添加到 ~/.zshrc

source /opt/homebrew/opt/git-extras/share/git-extras/git-extras-completion.zsh

详细的命令可查看文档，我比较常用了是 git summary、git undo、git setup

然后通过git 的 alias 来实现一个自定义的命令，git up 来实现每次切换到一个仓库时，有意思的更新一下最新代码

git config --global alias.up '!git remote update -p && git pull --rebase && git submodule update --init --recursive'

iTerm

实现通过 command + ecs 键，快速切换显示/隐藏 iTerm

设置默认终端

安装 shell integration

选配色：Solarized

安装 oh-my-zsh

sh -c "$(curl -fsSL https://raw.github.com/ohmyzsh/ohmyzsh/master/tools/install.sh)"

修改主题，配置插件等等

brew install zsh-syntax-highlighting

brew install zsh-autosuggestions 

brew install autojump

brew install fzf

#ZSH_THEME="robbyrussell"

#ZSH_THEME="agnoster"

#ZSH_THEME="miloshadzic"

#ZSH_THEME="sunrise"

# ZSH_THEME="ys"

ZSH_THEME="gnzh"



plugins=(git ruby autojump osx rake rails lighthouse sublime)

plugins=(bgnotify)

plugins=(web-search)

plugins=(node)



source /opt/homebrew/share/zsh-syntax-highlighting/zsh-syntax-highlighting.zsh

source /opt/homebrew/share/zsh-autosuggestions/zsh-autosuggestions.zsh

[ -f /opt/homebrew/etc/profile.d/autojump.sh ] && . /opt/homebrew/etc/profile.d/autojump.sh

source <(fzf --zsh)

这就起飞了！看看效果

Docker Desktop

作为开发，docker 技能必不可少，mac 下直接使用 docker desktop，可以省掉很多事情，特别是当你如果需要在本地跑 k8s 环境时，直接勾上 Enable Kubernetes 即可；另外新版本查看镜像，也可以扫描镜像每一层是否有安全漏洞，十分方便

VSCode

vscode 不仅适合前端开发，对于 Go、Rust 等开发者，整体体验都不错。安装后的第一件事，就是把 code 命令加到 Terminal

然后第二件事就是安装 github 的 Copilot 插件，开发、看源码现在是少不了它了

第三件事就是在 vscode 开启 vim 模式（安装 vim 插件)从 vim - sublime - vscode，一直保留 vim 的使用习惯，改不掉了😂
其他的就是各种高亮、开发辅助插件，大家按需安装即可

其他

前端
- NVM：node 版本管理
- pnpm：上一台电脑只有 512G，在动不动就几个 G 的前端项目，硬盘一直告警，至此只用 pnpm

Go
- GVM： go 版本管理
- GoLand：虽然 vscode 可以开发 go，但是整体体验还是比不上收费的 goland

环境搭建可参考 Go + React 指北

效率工具

ChatGPT

说到效率工具，ChatGPT 绝对是提高效率神器，从日常问题到开发、图片生成、画图等等，哦，还可以帮忙挑西瓜🍉

对了，用了苹果芯片，ChatGPT app 直接通过 option + space 即可随时调出，支持实时对话、支持截屏问问题等等，好用程度大幅上升⬆️⬆️⬆️

Bartender($)

吐血推荐，让你状态栏更加一目了然
支持自定义显示哪些 icon，配置哪些 icon 始终不显示，哪些第二状态栏显示

快捷键切换第二状态栏，一下子清爽颜值高

iStat Menus($)

拥有时刻关注着网速、CPU使用率、内存使用率的强迫症，绝对不少

Yoink

当你要把一个文件从一个地方移到另外一个地方时，当你想快速复制一张图片时，剪切板记录、跨设备文件接力等等，这个小小的工具都能帮助你
有时候通过截屏软件截图，可以一次性把需要的截屏操作完，然后在剪贴板直接拖下来使用，十分方便！

BettersnapTool

一款小而美的工具，用来快速调整你的窗口，比如当前窗口在两个显示屏直接切换；全屏，左右分屏等等

iShot

本来我一直使用 Skitch 的，但是这次切换新电脑之后，发现它下架了，之前有朋友推荐了，也使用了一段时间，感觉很不错，除了普通的截图，还有长截图、带壳截图；还有其他的小工具，官方宣传是
截图、长截图、全屏带壳截图、贴图、标注、取色、录屏、录音、OCR、翻译一个顶十个，样样皆优秀！

Draw.io

好吧，这个绝对画图神器，日常写文档几乎离不开他，在线版直接打开即可使用，也可以安装 vscode 插件，不过我还是习惯下载一个 app，这样本地的文件，直接打开即可使用
距离成为架构师，你只差一个 draw.io

Parallels Desktop

如果你有使用 Windows 的诉求，那么我建议你花点钱买个 pd，融合模式一开，原来我的 16 年的机器，玩个魔兽、英雄联盟完全没问题
安装直接点击下载 Windows 11，网速好的话，10 来分钟就安装成功了

融合模式，应用和直接使用 mac 的应用没任何差别

全屏模式，可以看到截图的时候有一部分黑色，应该是没有兼容刘海屏的原因

Markdown 编辑器

Quiver，原来所有的笔记、文档基本都靠它来记录，21 年的时候作者停止维护了，再加上使用纯 markdown 工具，还需要自己找图床，最后都转到语雀、飞书等在线文档
中间还用过其他的、Mweb、Typora 等等，如果自己搭建图床，推荐使用 Typora

Mweb 包含PC 和移动端，通过 iCloud 同步，也是十分方便！

图床工具

原来写 markdown 的时候，使用的是微博免费的图床，2 年后，然后发现图片都失效了！失效了！

所以，图床还是自己维护比较靠谱！

PicList，免费开源，我自己是购买了阿里云按量付费的 OSS，简单配置一下 aks，即可上传图片，配合 Typora，轻松完成写作

配置好之后，图片拖到 markdown 编辑框，即可实现自动上传

BreakTime 定时提醒工具

为了你的健康，你可以让电脑提醒你，每隔30分钟休息一下，倒杯水，看看风景

DaisyDisk （付费）磁盘空间，文件大小分析工具

~~作为只能买 256G 的屌丝，每天困扰我的一件事就是磁盘空间不足~~
现在我是 2T 了，可以不用了
也可以使用腾讯柠檬用过一段时间，也很好用

微信输入法

~~搜狗输入法、RIME、百度输入法（作恶多端，还用）~~
上一次推荐，我还是使用搜狗输入法，有朋友推荐微信输入法，体验了一把，简洁、功能齐全，所以手机、PC 全部改用微信输入法
推荐跨设备复制黏贴，速度比苹果自带的快了许多

思维导图：Xmind, MindNode

脑图应用，一般在项目开发过程中用于需求分解，Model Design 等等。

其他小应用

Caffeine

Manico, 在 macOS 强大的触摸板下，一直认为这个软件没什么用, 而且快捷键还有很多冲突

tmate, 搞基神器，结对编程，定位问题必备神器

Chrome 插件推荐

Vimium, 通过键盘快捷键操作网页，比如打开，关闭，查找书签等等

FeHelper(前端助手)：JSON自动格式化、手动格式化，支持排序、解码、下载等，更多功能可在配置页按需安装

Axure RP Extension for Chrome

Grammarly for Chrome，语法检查

Octotree，github源码查看神器

OneTab，节省高达95％的内存，并减轻标签页混乱现象

Postman Interceptor

React Developer Tools

Redux DevTools

Yet Another Drag and Go：超级拖拽.向四个方向拖拽文字即可进行相应的搜索.拖拽链接可在前台/后台,左侧/右侧打开

掘金

Sider: ChatGPT 侧边栏 + GPT-4o, Claude 3.5, Gemini 1.5 & AI工具”的产品徽标图片 Sider: ChatGPT 侧边栏 + GPT-4o, Claude 3.5, Gemini 1.5 & AI工具

xSwitch：前端开发代理神器，在线 debug 问题，把线上资源代理到本地，方便复现问题

作者：Justin_lu
来源：juejin.cn/post/7398351048777842729

收起阅读 »

MyBatis里面写模糊查询，like怎么用才对呢？

Java

深入浅出：MyBatis中的模糊查询技巧在数据库操作的世界里，模糊查询堪称是一项既基本又极其强大的功能。特别是在处理大量数据，需要根据某些不完全匹配的条件进行搜索时，模糊查询的价值就显得尤为重要。🔍 MyBatis作为一个广泛使用的持久层框架，为实现这一功能...

继续阅读 »

深入浅出：MyBatis中的模糊查询技巧

在数据库操作的世界里，模糊查询堪称是一项既基本又极其强大的功能。特别是在处理大量数据，需要根据某些不完全匹配的条件进行搜索时，模糊查询的价值就显得尤为重要。🔍 MyBatis作为一个广泛使用的持久层框架，为实现这一功能提供了便捷的途径。但不少开发者对其模糊查询的实现方式仍然感到困惑。本文将试图消除这种困惑，通过一步步的解析，带领大家正确使用MyBatis进行模糊查询。

引言

简述模糊查询在数据处理中的重要性

模糊查询是数据库操作中不可或缺的一部分，尤其在处理文本数据时，它能够根据不完全或模糊的条件，帮助开发者快速定位并检索出所需的数据行。例如，在一个拥有成千上万用户信息的系统中，通过模糊查询姓名或地址，能够高效地筛选出符合条件的信息。🚀

为什么要掌握MyBatis中的模犹如查询技术

掌握MyBatis中的模糊查询，可以使数据库操作更加灵活高效。对于已经选择MyBatis作为数据层框架的项目，能准确运用模糊查询，意味着能在保持代码的可维护性和清晰结构的同时，实现强大的数据检索功能。

模犹如查询基础

SQL中的LIKE语句

在SQL中，LIKE语句是实现模糊查询的关键。它通常与%（表示任意多个字符）和_（表示一个任意字符）这两个通配符一起使用。例如：

%apple%：匹配任何包含"apple"的字符串。

_apple%：匹配以任意字符开头，后面跟着"apple"的字符串。

LIKE语句的常见使用模式

基于LIKE语句的模糊查询可以有多种不同的用法，选择合适的模式可以大幅提升查询的效率和准确度。

MyBatis简介

MyBatis的核心功能

MyBatis是一种半ORM（对象关系映射）框架，它桥接了Java对象和数据库之间的映射，通过XML或注解的方式，将SQL语句与Java方法关联起来，从而简化了数据操作层的代码。

如何在MyBatis中配置和使用Mapper

在MyBatis中，Mapper的配置主要通过Mapper.xml文件进行。每一个Mapper.xml文件都对应一个Mapper接口，文件中定义了与接口方法相对应的SQL语句。使用Mapper非常简单，只需在相关的Service层中引入Mapper接口，MyBatis框架会自动代理这些接口，使得调用数据库操作像调用Java方法一样简单。

MyBatis中的模犹如查询实现

MyBatis中LIKE语句的基本用法

在Mapper.xml中使用#{variable}占位符

<select id="findUserByName" resultType="com.example.User">

  SELECT * FROM users WHERE name LIKE CONCAT('%', #{name}, '%')

</select>

此处使用了CONCAT函数和#{variable}占位符，动态地将输入的变量与%通配符结合起来，实现了基本的模犹如查询功能。

使用${variable}拼接SQL

虽然使用${variable}进行SQL拼接能提供更灵活的查询方法，但需要谨慎使用，以避免SQL注入风险。

<select id="findUserByName" resultType="com.example.User">

  SELECT * FROM users WHERE name LIKE '%${name}%'

</select>

动态SQL与模犹如查询

`<if>`标签的使用

<select id="findUserByCondition" parameterType="map" resultType="com.example.User">

  SELECT * FROM users

  <where>

    <if test="name != null">

      AND name LIKE CONCAT('%', #{name}, '%')

    </if>

    ... // 更多条件

  </where>

</select>

`<choose>`、`<when>`、`<otherwise>`的结合使用

<select id="findUserByDynamicCondition" parameterType="map" resultType="com.example.User">

  SELECT * FROM users

  <where>

    <choose>

      <when test="name != null">

        AND name LIKE CONCAT('%', #{name}, '%')

      </when>

      <when test="email != null">

        AND email LIKE CONCAT('%', #{email}, '%')

      </when>

      <otherwise>

        AND id > 0 // 默认条件

      </otherwise>

    </choose>

  </where>

</select>

实践案例

假设我们有一个用户管理系统，需要根据用户的姓名进行模糊查询。

场景描述

在用户管理系统中，后台需要根据前端传来的姓名关键字，模糊匹配数据库中的用户姓名，返回匹配的用户列表。

代码实现

Mapper接口定义

public interface UserMapper {

  List<User> findUserByName(String name);

}

Mapper.xml配合LIKE的具体写法

<select id="findUserByName" resultType="com.example.User">

  SELECT * FROM users WHERE name LIKE CONCAT('%', #{name}, '%')

</select>

结果验证

调用findUserByName方法，传入关键字，即可得到所有姓名中包含该关键字的用户数据。

高级技巧与最佳实践

使用`trim`标签优化LIKE查询

<select id="findUserByName" parameterType="string" resultType="com.example.User">

  SELECT * FROM users

  WHERE name LIKE

  <trim prefix="%" suffix="%" prefixOverrides="%" suffixOverrides="%">

    #{name}

  </trim>

</select>

小技巧：避免模糊查询带来的性能问题

尽量避免以%开头的模糊查询，因为这会使数据库全表扫描，极大地影响查询性能。

安全性考虑：防止SQL注入

在使用${}进行SQL拼接时，一定要确保变量来源可控或已做过适当校验，防止SQL注入攻击。

总结与展望

虽然模糊查询在数据库操作中极其有用，但它也不是万能的。在使用MyBatis实现模糊查询时，既要考虑到其便捷性和灵活性，也不能忽视潜在的性能和安全风险。我们希望通过本文，你能更准确、更高效地使用MyBatis进行模糊查询。

未来随着技术的发展，MyBatis和相关的数据库技术仍将不断进化，但基本的原则和最佳实践应该是不变的。掌握这些，将能使你在使用MyBatis进行数据库操作时更加得心应手。

附录

欲了解更多MyBatis的高级功能和最佳实践，可以参考：

MyBatis官方文档

相关技术社区和论坛

Q&A环节：如果你有任何关于MyBatis模糊查询的问题，欢迎在评论区留言交流。📢

希望本文能帮助你更好地理解和使用MyBatis进行模糊查询，欢迎分享和交流你的经验！🚀

作者：lsoxvxe
来源：juejin.cn/post/7343225969237671972

收起阅读 »

面试官：limit 100w,10为什么慢？如何优化？

综合技术讨论

在 MySQL 中，limit X,Y 的查询中，X 值越大，那么查询速度也就越慢，例如以下示例： limit 0,10：查询时间大概在 20 毫秒左右。 limit 1000000,10：查询时间可能是 15 秒左右（1秒等于 1000 毫秒），甚至更长时...

继续阅读 »

在 MySQL 中，limit X,Y 的查询中，X 值越大，那么查询速度也就越慢，例如以下示例：

limit 0,10：查询时间大概在 20 毫秒左右。

limit 1000000,10：查询时间可能是 15 秒左右（1秒等于 1000 毫秒），甚至更长时间。

所以，可以看出，limit 中 X 值越大，那么查询速度都越慢。

这个问题呢其实就是 MySQL 中典型的深度分页问题。那问题来了，为什么 limit 越往后查询越慢？如何优化查询速度呢？

为什么limit越来越慢？

在数据库查询中，当使用 LIMIT x, y 分页查询时，如果 x 值越大，查询速度可能会变慢。这主要是因为数据库需要扫描和跳过 x 条记录才能返回 y 条结果。随着 x 的增加，需要扫描和跳过的记录数也增加，从而导致性能下降。

例如 limit 1000000,10 需要扫描 1000010 行数据，然后丢掉前面的 1000000 行记录，所以查询速度就会很慢。

优化手段

对于 MySQL 深度分页比较典型的优化手段有以下两种：

起始 ID 定位法：使用最后查询的 ID 作为起始查询的 ID。

索引覆盖+子查询。

1.起始ID定位法

起始 ID 定位法指的是 limit 查询时，指定起始 ID。而这个起始 ID 是上一次查询的最后一条 ID。例如上一次查询的最后一条数据的 ID 为 6800000，那我们就从 6800001 开始扫描表，直接跳过前面的 6800000 条数据，这样查询的效率就高了，具体实现 SQL 如下：

select name, age, gender

from person

where id > 6800000 -- 核心实现 SQL

order by id limit 10;

其中 id 字段为表的主键字段。

为什么起始ID查询效率高呢？

因此这种查询是以上一次查询的最后 ID 作为起始 ID 进行查询的，而上次的 ID 已经定位到具体的位置了，所以只需要遍历 B+ 树叶子节点的双向链表（主键索引的底层数据结构）就可以查询到后面的数据了，所以查询效率就比较高，如下图所示：

如果上次查询结果为 9，之后再查询时，只需要从 9 之后再遍历 N 条数据就能查询出结果了，所以效率就很高。

优缺点分析

这种查询方式，只适合一页一页的数据查询，例如手机 APP 中刷新闻时那种瀑布流方式。

但如果用户是跳着分页的，例如查询完第 1 页之后，直接查询第 250 页，那么这种实现方式就不行了。

2.索引覆盖+子查询

此时我们为了查询效率，可以使用索引覆盖加子查询的方式，具体实现如下。

假设，我们未优化前的 SQL 如下：

select name, age, gender

from person

order by createtime desc 

limit 1000000,10;

在以上 SQL 中，createtime 字段创建了索引，但查询效率依然很慢，因为它要取出 100w 完整的数据，并需要读取大量的索引页，和进行频繁的回表查询，所以执行效率会很低。

此时，我们可以做以下优化：

SELECT p1.name, p1.age, p1.gender

FROM person p1

JOIN (

    SELECT id FROM person ORDER BY createtime desc LIMIT 1000000, 10

) AS p2 ON p1.id = p2.id;

相比于优化前的 SQL，优化后的 SQL 将不需要频繁回表查询了，因为子查询中只查询主键 ID，这时可以使用索引覆盖来实现。那么子查询就可以先查询出一小部分主键 ID，再进行查询，这样就可以大大提升查询的效率了。

索引覆盖（Index Coverage）是一种数据库查询优化技术，它指的是在执行查询时，数据库引擎可以直接从索引中获取所有需要的数据，而不需要再回表（访问主键索引或者表中的实际数据行）来获取额外的信息。这种方式可以减少磁盘 I/O 操作，从而提高查询性能。

课后思考

你还知道哪些深度分页的优化手段呢？欢迎评论区留下你的答案。

本文已收录到我的面试小站 http://www.javacn.site，其中包含的内容有：Redis、JVM、并发、并发、MySQL、Spring、Spring MVC、Spring Boot、Spring Cloud、MyBatis、设计模式、消息队列等模块。

作者：Java中文社群
来源：juejin.cn/post/7410987368343765046

收起阅读 »

SpringBoot引入Flyway

Java

1 缘起与目的最近遇到一个项目要部署到很多不同的地方，在每个地方升级时如何管理数据库升级脚本就成了一个叩待解决的问题。本文引入flyway工具来解决这个问题。 2 依赖 <dependency> <groupId>org.fl...

继续阅读 »

1 缘起与目的

最近遇到一个项目要部署到很多不同的地方，在每个地方升级时如何管理数据库升级脚本就成了一个叩待解决的问题。本文引入flyway工具来解决这个问题。

2 依赖

<dependency>

    <groupId>org.flywaydb</groupId>

    <artifactId>flyway-core</artifactId>

    <version>7.15.0</version>

</dependency>

此处笔者MySQL版本为5.7，上述版本依赖可生效。此处踩坑过程见踩坑记录。

3 yml

spring:

  # flyway 配置

  flyway:

    # 启用或禁用 flyway

    enabled: false

    # flyway 的 clean 命令会删除指定 schema 下的所有 table, 生产务必禁掉。这个默认值是 false 理论上作为默认配置是不科学的。

    clean-disabled: true

    # SQL 脚本的目录,多个路径使用逗号分隔 默认值 classpath:db/migration   {vendor}对应数据库类型,可选值 https://github.com/spring-projects/spring-boot/blob/v2.3.3.RELEASE/spring-boot-project/spring-boot/src/main/java/org/springframework/boot/jdbc/DatabaseDriver.java

    locations: classpath:sql/{vendor}

    #  metadata 版本控制信息表 默认 flyway_schema_history

    table: flyway_schema_history

    # 如果没有 flyway_schema_history 这个 metadata 表， 在执行 flyway migrate 命令之前, 必须先执行 flyway baseline 命令

    # 设置为 true 后 flyway 将在需要 baseline 的时候, 自动执行一次 baseline。

    baseline-on-migrate: false

    # 指定 baseline 的版本号,默认值为 1, 低于该版本号的 SQL 文件, migrate 时会被忽略

    baseline-version: 1

    # 字符编码 默认 UTF-8

    encoding: UTF-8

    # 是否允许不按顺序迁移 开发建议 true  生产建议 false

    out-of-order: false

    # 执行迁移时是否自动调用验证   当你的 版本不符合逻辑 比如 你先执行了 DML 而没有 对应的DDL 会抛出异常

    validate-on-migrate: true

4 表结构

配好后依赖和yml直接启动项目会自动创建表结构。

值得一说的是checksum。可以理解为校验字符串，每次执行完sql脚本后会针对脚本生成checknum，后续如果之前执行过的脚本出现改动与前面的checknum不一致会直接报错。

4 脚本命名

命名规则如下：

V版本号__版本名.sql

例如: V2.1.5__create_user_ddl.sql、V4.1_2__add_user_dml.sql

因为配置的baseline-version=1，所以只有1以上版本才会被执行，上图V0.0.1__base.sql是不会被执行的。上图只是为了展示命名规则。

5 踩坑记录

5.1 Unsupported Database: MySQL 5.7

笔者最开始的依赖如下：

<dependency>

    <groupId>org.flywaydb</groupId>

    <artifactId>flyway-core</artifactId>

</dependency>

报错如下：

org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'asyncBeanPriorityLoadPostProcessor' defined in class path resource [io/github/linyimin0812/async/AsyncBeanAutoConfiguration.class]: Initialization of bean failed; nested exception is org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name 'efpxInitQuartzJob': Unsatisfied dependency expressed through constructor parameter 0; nested exception is org.springframework.beans.factory.UnsatisfiedDependencyException: Error creating bean with name 'sysJobServiceImpl' defined in file [E:\java\project\pm2\pm_modularity\efp-plugins\target\classes\com\sdecloud\modules\quartz\service\impl\SysJobServiceImpl.class]: Unsatisfied dependency expressed through constructor parameter 1; nested exception is org.springframework.beans.factory.BeanCreationException: Error creating bean with name 'flywayInitializer' defined in class path resource [org/springframework/boot/autoconfigure/flyway/FlywayAutoConfiguration$FlywayConfiguration.class]: Invocation of init method failed; nested exception is org.flywaydb.core.api.FlywayException: Unsupported Database: MySQL 5.7

	at org.springframework.beans.factory.support.AbstractAutowireCapableBeanFactory.doCreateBean(AbstractAutowireCapableBeanFactory.java:628)

	at org.springframework.beans.factory.support.AbstractAutowireCapableBeanFactory.createBean(AbstractAutowireCapableBeanFactory.java:542)

	at org.springframework.beans.factory.support.AbstractBeanFactory.lambda$doGetBean$0(AbstractBeanFactory.java:335)

	at org.springframework.beans.factory.support.DefaultSingletonBeanRegistry.getSingleton(DefaultSingletonBeanRegistry.java:234)

此处笔者检索到了互联网文章【原创】Flyway 8.2.1及以后版本不再支持MySQL？！_unsupported database: mysql 8.0-CSDN博客，阅读后笔者表示？？？还是去官网一探究竟吧。

通过官网（documentation.red-gate.com/flyway/flyw… 对MySQL支持的说明，修改依赖如下：

<dependency>

    <groupId>org.flywaydb</groupId>

    <artifactId>flyway-core</artifactId>

</dependency>

<dependency> 

    <groupId>org.flywaydb</groupId>

    <artifactId>flyway-mysql</artifactId> 

</dependency>

结果依然报错如下

MySQL 5.7 is no longer supported by Flyway Community Edition, but still supported by Flyway Teams Edition.

通过stack overflow（stackoverflow.com/questions/7… ）查询发现：

（1）Flyway Community Edition 8.0.0-beta1放弃了对5年以上数据库的支持，包括MySQL 5.7
在这次提交中，MySQL的最低支持版本从5.7增加到8.0，这是在Flyway 8.0.0-beta1中引入的。目前，支持MySQL 5.7的最新社区版本是Flyway 7.15.0。

（2）从Flyway第10版（2023年10月）起，此限制不再有效。我们已经更新了Flyway，使其适用于所有支持的数据库版本，因此如果您升级到版本10，您可以访问所有支持的MySQL版本。

笔者回退到7.15.0后再无报错。即最终依赖为标题1所示。

作者：roc98
来源：juejin.cn/post/7330463614954209334

收起阅读 »

比Spring参数校验更优雅！使用函数式编程把参数检验玩出花来！

Java

比Spring参数校验更优雅！使用函数式编程把参数检验玩出花来！未经允许禁止转载！使用 Vavr 验证库来替代标准的 Java Bean Validation（如 @NotBlank, @Size 等注解）可以通过函数式的方式来处理验证逻辑。Vavr 是一...

继续阅读 »

比Spring参数校验更优雅！使用函数式编程把参数检验玩出花来！

未经允许禁止转载！

使用 Vavr 验证库来替代标准的 Java Bean Validation（如 @NotBlank, @Size 等注解）可以通过函数式的方式来处理验证逻辑。Vavr 是一个支持不可变数据结构和函数式编程的库，可以让代码更加简洁和函数式。

要使用 Vavr 的验证器，我们可以利用 Vavr 下Validation 类，它提供了一种函数式的方式来处理验证，允许收集多个错误，而不仅仅是遇到第一个错误就终止。

1. BeanValidator 实现的问题

以下是使用BeanValidator实现参数校验的代码：

@Data

public class User {

  // bean validator 使用注解实现参数校验

  @NotBlank(message = "用户姓名不能为空")

  private String name;



  @NotBlank(message = "密码不能为空")

  @Size(min = 6, message = "密码长度不能少于6位")

  private String password;



  @Min(value = 0, message = "年龄不能小于0岁")

  @Max(value = 150, message = "年龄不应超过150岁")

  private Integer age;

  

  @Pattern(regexp = "^((13[0-9])|(15[^4])|(18[0-9])|(17[0-9])|(147))\d{8}$", message = "手机号格式不正确")

  private String phone;

}

Spring 提供了对 BeanValidator 的支持，可以在不同的层级（controller、service、repository）使用。

缺点：

要求被验证的对象是可变的 JavaBean（具有getter，setter方法），JavaBean是一种常见的反模式。

校验逻辑的复杂应用有很大的学习成本，比如自定义验证注解、分组校验等。

异常处理逻辑一般需要配合Spring全局异常处理。

最佳实践：

PlanA: 实践中建议仅在 controller 层面校验前端传入的 json 参数，不使用自定义注解，分组校验等复杂功能。

PlanB: 直接使用函数式验证。

2. 使用 Vavr 重新设计 `User` 类的验证逻辑

2.1 使用到的函数式思想：

校验结果视为值，返回结果为和类型，即异常结果或正常结果。这里的异常结果指的是校验失败的参数列表，正常结果指的是新创建的对象。

复用函数，这里具体指校验逻辑和构造器方法（或者静态方法创建对象）

Applicative functor，本文不想讨论难以理解的函数式概念。这里可以简单理解成封装函数、同时支持 apply（map）的容器。

收集所有校验异常结果，此处的处理和提前返回（卫模式、短路操作）不同。

以下是使用 Vavr 中参数校验的代码：

PersonValidator personValidator = new PersonValidator();



// Valid(Person(John Doe, 30))

Validation<Seq<String>, Person> valid = personValidator.validatePerson("John Doe", 30);



// Invalid(List(Name contains invalid characters: '!4?', Age must be greater than 0))

Validation<Seq<String>, Person> invalid = personValidator.validatePerson("John? Doe!4", -1);

首先，需要定义一个验证器类，而不是直接在 User 类上使用注解。这个验证器类会对 User 的字段进行验证，并返回一个 Validation 对象。

2.2 验证器实现

// 使用实体类，这个类是无状态的

public class UserValidator {



    // 验证用户

    public Validation<Seq<String>, User> validateUser(String name, String password, Integer age, String phone) {

        return Validation.combine(

                validateName(name),

                validatePassword(password),

                validateAge(age),

                validatePhone(phone))

          .ap(User::new);

    }



    // 验证用户名

    private Validation<String, String> validateName(String name) {

        return (name == null || name.trim().isEmpty())

                ? Invalid("用户姓名不能为空")

                : Valid(name);

    }



    // 验证密码

    private Validation<String, String> validatePassword(String password) {

        if (password == null || password.isEmpty()) {

            return Invalid("密码不能为空");

        }

        if (password.length() < 6) {

            return Invalid("密码长度不能少于6位");

        }

        return Valid(password);

    }



    // 验证年龄

    private Validation<String, Integer> validateAge(Integer age) {

        if (age == null) {

            return Invalid("年龄不能为空");

        }

        if (age < 0) {

            return Invalid("年龄不能小于0岁");

        }

        if (age > 150) {

            return Invalid("年龄不应超过150岁");

        }

        return Valid(age);

    }



    // 验证手机号

    private Validation<String, String> validatePhone(String phone) {

        String phoneRegex = "^((13[0-9])|(15[^4])|(18[0-9])|(17[0-9])|(147))\\d{8}$";

        if (phone == null || !phone.matches(phoneRegex)) {

            return Invalid("手机号格式不正确");

        }

        return Valid(phone);

    }

}

2.3 使用

public class UserValidationExample {



    public static void main(String[] args) {

        UserValidator validator = new UserValidator();



        // 示例：测试一个有效用户

        Validation<Seq<String>, User> validUser = validator.validateUser("Alice", "password123", 25, "13912345678");



        if (validUser.isValid()) {

            System.out.println("Valid user: " + validUser.get());

        } else {

            System.out.println("Validation errors: " + validUser.getError());

        }



        // 示例：测试一个无效用户

        Validation<Seq<String>, User> invalidUser = validator.validateUser("", "123", -5, "12345");



        if (invalidUser.isValid()) {

            System.out.println("Valid user: " + invalidUser.get());

        } else {

            System.out.println("Validation errors: " + invalidUser.getError());

        }

    }

}

Validation.combine()：将多个验证结果组合起来。每个验证返回的是 Validation<String, T>，其中 String 是错误消息，T 是验证成功时的值。

User::new：这是一个方法引用，表示如果所有的字段都验证成功，就调用 User 的构造函数创建一个新的 User 对象。

验证错误的收集：Vavr 的验证机制允许收集多个错误，而不是像传统 Java Bean Validation 那样一旦遇到错误就停止。这样，你可以返回所有的验证错误，让用户一次性修复。

2.4 结果示例

对于一个有效的用户：

Valid user: User(name=Alice, password=password123, age=25, phone=13912345678)

对于一个无效的用户：

Validation errors: List(用户姓名不能为空, 密码长度不能少于6位, 年龄不能小于0岁, 手机号格式不正确)

3. 源码解析

如果你仅关注使用的话，此段内容可以跳过。

此处仅分析其核心代码：

// Validation#combine 返回 Builder 类型

final class Builder<E, T1, T2> {

    private Validation<E, T1> v1;

    private Validation<E, T2> v2;



    public <R> Validation<Seq<E>, R> ap(Function2<T1, T2, R> f) {

 				// 注意这里的执行顺序: v1#ap -> v2#ap

        return v2.ap(v1.ap(Validation.valid(f.curried())));

    }

}

f.curried 返回结果为 T1 => T2 => R，valid 方法使用 Validation 容器封装了函数：

// validation 为和类型，有且仅有两种实现

public interface Validation<E, T> extends Value<T>, Serializable {

  static <E, T> Validation<E, T> valid(T value) {

      return new Valid<>(value);

  }



  static <E, T> Validation<E, T> invalid(E error) {

      Objects.requireNonNull(error, "error is null");

      return new Invalid<>(error);

  }

}

最关键的代码为 ap（apply的缩写）：

default <U> Validation<Seq<E>, U> ap(Validation<Seq<E>, ? extends Function<? super T, ? extends U>> validation) {

    Objects.requireNonNull(validation, "validation is null");

    if (isValid()) {

        if (validation.isValid()) {

          	// 正常处理逻辑

            final Function<? super T, ? extends U> f = validation.get();

            final U u = f.apply(this.get());

            return valid(u);

        } else {

          	// 保留原有的失败结果

            final Seq<E> errors = validation.getError();

            return invalid(errors);

        }

    } else {

        if (validation.isValid()) {

          	// 初始化失败结果

            final E error = this.getError();

            return invalid(List.of(error));

        } else {

          	// 校验失败，收集失败结果

            final Seq<E> errors = validation.getError();

            final E error = this.getError();

            return invalid(errors.append(error));

        }

    }

}

这里的实现非常巧妙，柯里化的函数在正常处理逻辑中不断执行，最后调用成功，返回正确的函数结果。执行流程中有异常结果后，分成三中情况进行处理，分别是初始化，保留结果，进一步收集结果。

4. 总结与最佳实践

这种方式使用 Vavr 提供的函数式验证工具，使得验证逻辑更加简洁、灵活，并且可以收集多个错误进行统一处理，避免散弹枪问题。

对于需要返回单一错误的情况（实际上不多），也可以使用这种方法，然后取用任意一条结果。

Validation支持多条无关参数的校验。当涉及到多参数的校验时，建议进行手动编码。

record Person(name, age) {}

static final String ADULT_CONTENT = "adult";

static final int ADULT_AGE = 18;



public Validation<Seq<String>, Person> validatePerson2(String name, int age) {

    return Validation.combine(validateName(name), validateAge(age)).ap(Person::new)

        .flatMap(this::validateAdult);

}



private Validation<Seq<String>, Person> validateAdult(Person p) {

    return p.age < ADULT_AGE && p.name.contains(ADULT_CONTENT)

        ? Validation.invalid(API.List("Illegal name"))

        : Validation.valid(p);

}

此外，对于某些参数传参，建议使用对象组合，比如range参数有两种做法，第一种可以传入 from, to, 校验条件为 from < to, 校验后对象包含属性Range，之后在额外校验中校验 Range；第二种可以限制传入参数为 Range。

作者：桦说编程
来源：juejin.cn/post/7416605082688962610

收起阅读 »

shardingjdbc有点坑，数据库优化别再无脑回答分库分表了

综合技术讨论

故事背景在八股文中，说到如何进行数据库的优化，除了基本的索引优化，经常会提到分库分表，说是如果业务量剧增，数据库性能会到达瓶颈，如果单表数据超过两千万，数据查询效率就会变低，就要引入分库分表巴拉巴拉。我同事也问我，我们数据表有些是上亿数据的，为什么不用分库分...

继续阅读 »

故事背景

在八股文中，说到如何进行数据库的优化，除了基本的索引优化，经常会提到分库分表，说是如果业务量剧增，数据库性能会到达瓶颈，如果单表数据超过两千万，数据查询效率就会变低，就要引入分库分表巴拉巴拉。我同事也问我，我们数据表有些是上亿数据的，为什么不用分库分表，如果我没接触过分库分表我也会觉得大数据表就要分库分表呀，这是八股文一直以来教导的东西。但是我就跟他说，分库分表很坑爹，最近才让我遇到一个BUG......

系统复杂度upup

业务中有个设备表数据量很大，到现在为止已经有5、6亿数据了。在4年前，前人们已经尝试了分库分表技术，分了4个库，5个表，我只是负责维护这个业务发现他们用了分库分表。但是在查询表数据的时候看到是查询ES的，我就问为什么要用ES？同事回答查询分库分表一定要带分片才能走到路由，否则会查询全部库和全部表，意思是不查分片字段，单表只用一个SQL，但是分库分表要用20个SQL.....所以引入了ES进行数据查询。但是引入ES之后又引入一个新的问题，就是ES和数据库的数据同步问题。他们使用了logstash做数据同步，但不是实时的，在logstash设置了每20秒同步一次。

因为要使用分库分表，引入了shardingjdbc，因为查询方便引入了es，因为要处理数据同步问题引入了logstash......所以系统复杂度不是高了一点半点，之前发现有个字段长度设置小了，还要改20张表。

分页问题

最近遇到一个奇怪的bug，在一个设备的单表查询翻页失败，怎么翻都只显示第一页的数据，一开始我以为是分页代码有问题，看了半天跟其他表是一样的，其他表分页没问题，见鬼了。后面再细看发现这个单表的数据源是设备数据源，用的是shardingjdbc的配置。

之前就看过shardingjdbc有一些sql是不支持的，怀疑就是这个原因，百度了一下果然是有bug。

想了一下有两个解决办法，第一个是升级shardingjdbc的版本，据说是4.1之后修复了该问题，但是还没有尝试。

第二个办法是把分库分表业务的数据源跟单表区分开，单表业务使用普通的数据源后分页数据正常显示。

关于数据库优化

一般来说数据库优化，可以从几个角度进行优化：

1、硬件优化

(1) 提升存储性能

使用SSD：替换传统机械硬盘（HDD），SSD能提供更快的随机读写速度。

增加存储带宽：采用RAID（推荐RAID 10）提高数据存储的读写速度和冗余。

内存扩展：尽量让数据库缓存更多的数据，减少IO操作。

(2) 增强CPU性能

使用多核高频率CPU，支持更高并发。

分析数据库对CPU的利用情况，确保不被CPU性能瓶颈限制。

(3) 提高网络带宽

优化服务器与客户端之间的网络延迟和带宽，尤其是分布式数据库的场景中。

使用高速网络接口（如10GbE网卡）。

2、软件层面优化

(1) 数据库配置

调整数据库缓冲池（Buffer Pool）的大小，确保能缓存大部分热数据。

优化日志文件的写入（如MySQL中调整innodb_log_buffer_size）。

使用内存数据库或缓存技术（如Redis、Memcached）加速访问速度。

(2) 分布式架构

对于高并发需求，采用分布式数据库（如TiDB、MongoDB）进行读写分离或数据分片。

(3) 数据库索引

选择合适的索引类型：如B+树索引、哈希索引等，根据查询特点选择适配的索引。

避免冗余索引，定期清理无用索引。

(4) 数据库版本升级

保持数据库版本为最新的稳定版本，利用最新的优化特性和Bug修复。

3. SQL层面优化

(1) 查询优化

减少不必要的字段：只查询需要的列，避免使用SELECT *。

加速排序和分组：在ORDER BY和GR0UP BY字段上建立索引。

拆分复杂查询：将复杂的SQL分解为多个简单查询或视图。

分页查询优化：如避免大OFFSET分页，可以使用索引条件替代（如WHERE id > last_seen_id）。

(2) 合理使用索引

对频繁用于WHERE、JOIN、GR0UP BY等的字段建立索引。

避免在索引列上使用函数或隐式转换。

(3) 减少锁定

尽量使用小事务，减少锁定范围。

使用合适的事务隔离级别，避免不必要的资源等待。

(4) SQL调优工具

使用数据库自带的分析工具（如MySQL的EXPLAIN、SQL Server的性能监控工具）来分析查询计划并优化执行路径。

4. 综合优化

定期进行性能分析：定期查看慢查询日志，优化慢查询。

清理历史数据：对于不再使用的历史数据，可存储到冷数据仓库，减少主数据库的负载。

使用连接池：通过数据库连接池（如HikariCP）管理和复用连接，降低创建和销毁连接的开销。

tips:

现网的数据库是64核128G内存，测试环境是32核64G，加上现网数据库配置的优化，现网数据库查询大表的速度是测试环境的3倍！所以服务器硬件配置和数据库配置都很重要。下面是数据库的配置文件，仅供参考

[universe]

bakupdir = /data/mysql/backup/7360

iops = 0

mem_limit_mb = 0

cpu_quota_percentage = 0

quota_limit_mb = 0

scsi_pr_level = 0

mycnf = /opt/mysql/etc/7360/my.cnf

run_user = actiontech-mysql

umask_dir = 0750

umask = 0640

id = mysql-mt1cbg

group_id = mysql-test



[mysql]

no-auto-rehash

prompt = '\\u@\\h:\\p\\R:\\m:\\s[\\d]> '

#default-character-set = utf8mb4

#tee = /data/mysql_tmp/mysql_operation.log



[mysqld]

super_read_only = 1

# DO NOT MODIFY, Universe will generate this part

port = 7360

server_id = 123

basedir = /opt/mysql/base/5.7.40

datadir = /data/mysql/data/7360

log_bin = /opt/mysql/log/binlog/7360/mysql-bin

tmpdir = /opt/mysql/tmp/7360

relay_log = /opt/mysql/log/relaylog/7360/mysql-relay

innodb_log_group_home_dir = /opt/mysql/log/redolog/7360

log_error = /data/mysql/data/7360/mysql-error.log

# 数据库ip

report_host = xxx



# BINLOG

binlog_error_action = ABORT_SERVER

binlog_format = row

binlog_rows_query_log_events = 1

log_slave_updates = 1

master_info_repository = TABLE

max_binlog_size = 250M

relay_log_info_repository = TABLE

relay_log_recovery = 1

sync_binlog = 1



# GTID #

gtid_mode = ON

enforce_gtid_consistency = 1

binlog_gtid_simple_recovery = 1



# ENGINE

default_storage_engine = InnoDB

innodb_buffer_pool_size = 64G

innodb_data_file_path = ibdata1:1G:autoextend

innodb_file_per_table = 1

innodb_flush_log_at_trx_commit = 1

innodb_flush_method = O_DIRECT

innodb_io_capacity = 1000

innodb_log_buffer_size = 64M

innodb_log_file_size = 2G

innodb_log_files_in_group = 2

innodb_max_dirty_pages_pct = 60

innodb_print_all_deadlocks = 1

#innodb_stats_on_metadata = 0

innodb_strict_mode = 1

#innodb_undo_logs = 128                 #Deprecated In 5.7.19

#innodb_undo_tablespaces=3          #Deprecated In 5.7.21

innodb_max_undo_log_size = 4G

innodb_undo_log_truncate = 1

innodb_read_io_threads = 8

innodb_write_io_threads = 8

innodb_purge_threads = 4

innodb_buffer_pool_load_at_startup = 1

innodb_buffer_pool_dump_at_shutdown = 1

innodb_buffer_pool_dump_pct = 25

innodb_sort_buffer_size = 8M

#innodb_page_cleaners = 8

innodb_buffer_pool_instances = 8

innodb_lock_wait_timeout = 10

innodb_io_capacity_max = 2000

innodb_flush_neighbors = 1

#innodb_large_prefix = 1

innodb_thread_concurrency = 64

innodb_stats_persistent_sample_pages = 64

innodb_autoinc_lock_mode = 2

innodb_online_alter_log_max_size = 1G

innodb_open_files = 4096

innodb_temp_data_file_path = ibtmp1:12M:autoextend:max:50G

innodb_rollback_segments = 128

#innodb_numa_interleave = 1



# CACHE

key_buffer_size = 16M

tmp_table_size = 64M

max_heap_table_size = 64M

table_open_cache = 2000

query_cache_type = 0

query_cache_size = 0

max_connections = 3000

thread_cache_size = 200

open_files_limit = 65535

binlog_cache_size = 1M

join_buffer_size = 8M

sort_buffer_size = 2M

read_buffer_size = 8M

read_rnd_buffer_size = 8M

table_definition_cache = 2000

table_open_cache_instances = 8





# SLOW LOG

slow_query_log = 1

slow_query_log_file = /data/mysql/data/7360/mysql-slow.log

log_slow_admin_statements = 1

log_slow_slave_statements = 1

long_query_time = 1



# SEMISYNC #

plugin_load = "rpl_semi_sync_master=semisync_master.so;rpl_semi_sync_slave=semisync_slave.so"

rpl_semi_sync_master_enabled = 1

rpl_semi_sync_slave_enabled = 0

rpl_semi_sync_master_wait_for_slave_count = 1

rpl_semi_sync_master_wait_no_slave = 0

rpl_semi_sync_master_timeout = 30000



# CLIENT_DEPRECATE_EOF

session_track_schema = 1

session_track_state_change = 1

session_track_system_variables = '*'



# MISC

log_timestamps = SYSTEM

lower_case_table_names = 1

max_allowed_packet = 64M

read_only = 1

skip_external_locking = 1

skip_name_resolve = 1

skip_slave_start = 1

socket = /data/mysql/data/7360/mysqld.sock

pid_file = /data/mysql/data/7360/mysqld.pid

disabled_storage_engines = ARCHIVE,BLACKHOLE,EXAMPLE,FEDERATED,MEMORY,MERGE,NDB

log-output = TABLE,FILE

character_set_server = utf8mb4

secure_file_priv = ""

performance-schema-instrument = 'wait/lock/metadata/sql/mdl=ON'

performance-schema-instrument = 'memory/% = COUNTED'

expire_logs_days = 7

max_connect_errors = 1000000

interactive_timeout = 1800

wait_timeout = 1800

log_bin_trust_function_creators = 1



# MTS

slave-parallel-type = LOGICAL_CLOCK

slave_parallel_workers = 16

slave_preserve_commit_order = ON

slave_rows_search_algorithms = 'INDEX_SCAN,HASH_SCAN'



##BaseConfig

collation_server = utf8mb4_bin

explicit_defaults_for_timestamp = 1

transaction_isolation = READ-COMMITTED



##Unused

#plugin-load-add = validate_password.so

#validate_password_policy = MEDIUM

总结

如果我没用过分库分表，面试官问我数据库优化，我可能也会回答分库分表。但是踩过几个坑之后可能会推荐其他的方式。

1、按业务分表，比如用户表放在用户库，订单表放在订单库，用微服务的思想切割数据库减少数据库压力。

2、如果数据量超过10E，可以考虑上分布式数据库，融合了OLAP和OLTP的优点，毕竟mysql其实不适合做大数据量的查询统计。评论区也可以推荐一下有哪些好的数据库。

3、按时间归档数据表，每天或者每个月把历史数据存入历史数据表，适用于大数据量且历史数据查询较少的业务。

每个技术都有它的利弊，比如微服务、分库分表、分布式数据库等。按需选择技术类型，切勿过度设计！

作者：玛奇玛丶
来源：juejin.cn/post/7444014749321461811

收起阅读 »

Mybatis-Plus的insert执行之后，id是怎么获取的？

Java

在日常开发中，会经常使用Mybatis-Plus 当简单的插入一条记录时，使用mapper的insert是比较简洁的写法 @Data public class NoEo { Long id; String no; } NoEo noEo = ...

继续阅读 »

在日常开发中，会经常使用Mybatis-Plus

当简单的插入一条记录时，使用mapper的insert是比较简洁的写法

@Data

public class NoEo {

    Long id;

    String no;

}

NoEo noEo = new NoEo();

noEo.setNo("321");

noMapper.insert(noEo);

System.out.println(noEo);

这里可以注意到一个细节，就是不管我们使用的是什么类型的id，好像都不需要去setId，也能执行insert语句

不仅不需要setId，在insert语句执行完毕之后，我们还能通过实体类获取到这条insert的记录的id是什么

这背后的原理是什么呢？

自增类型ID

刚学Java的时候，插入了一条记录还要再select一次来获取这条记录的id，比较青涩

后面误打误撞才发现可以直接从insert的实体类中拿到这个id

难道框架是自己帮我查了一次嘛

先来看看自增id的情况

首先要先把yml中的mp的id类型设置为auto

mybatis-plus:

  global-config:

    db-config:

      id-type: auto

然后从insert语句开始一直往下跟进

noMapper.insert(noEo);

后面会来到这个方法

// com.baomidou.mybatisplus.core.executor.MybatisSimpleExecutor#doUpdate

@Override

public int doUpdate(MappedStatement ms, Object parameter) throws SQLException {

    Statement stmt = null;

    try {

        Configuration configuration = ms.getConfiguration();

        StatementHandler handler = configuration.newStatementHandler(this, ms, parameter, RowBounds.DEFAULT, null, null);

        stmt = prepareStatement(handler, ms.getStatementLog(), false);

        return stmt == null ? 0 : handler.update(stmt);

    } finally {

        closeStatement(stmt);

    }

}

在执行了下面这个方法之后

handler.update(stmt)

实体类的id就赋值上了

继续往下跟

// org.apache.ibatis.executor.statement.PreparedStatementHandler#update

@Override

public int update(Statement statement) throws SQLException {

  PreparedStatement ps = (PreparedStatement) statement;

  ps.execute();

  int rows = ps.getUpdateCount();

  Object parameterObject = boundSql.getParameterObject();

  KeyGenerator keyGenerator = mappedStatement.getKeyGenerator();

  keyGenerator.processAfter(executor, mappedStatement, ps, parameterObject);

  return rows;

}

最后的赋值在这一行

keyGenerator.processAfter

可以看到会有一个KeyGenerator做一个后置增强，它具体的实现类是Jdbc3KeyGenerator

// org.apache.ibatis.executor.keygen.Jdbc3KeyGenerator#processAfter

@Override

public void processAfter(Executor executor, MappedStatement ms, Statement stmt, Object parameter) {

  processBatch(ms, stmt, parameter);

}

// org.apache.ibatis.executor.keygen.Jdbc3KeyGenerator#processBatch

public void processBatch(MappedStatement ms, Statement stmt, Object parameter) {

  final String[] keyProperties = ms.getKeyProperties();

  if (keyProperties == null || keyProperties.length == 0) {

    return;

  }

  try (ResultSet rs = stmt.getGeneratedKeys()) {

    final ResultSetMetaData rsmd = rs.getMetaData();

    final Configuration configuration = ms.getConfiguration();

    if (rsmd.getColumnCount() < keyProperties.length) {

      // Error?

    } else {

      assignKeys(configuration, rs, rsmd, keyProperties, parameter);

    }

  } catch (Exception e) {

    throw new ExecutorException("Error getting generated key or setting result to parameter object. Cause: " + e, e);

  }

}

// org.apache.ibatis.executor.keygen.Jdbc3KeyGenerator#assignKeys

private void assignKeys(Configuration configuration, ResultSet rs, ResultSetMetaData rsmd, String[] keyProperties,

    Object parameter) throws SQLException {

  if (parameter instanceof ParamMap || parameter instanceof StrictMap) {

    // Multi-param or single param with @Param

    assignKeysToParamMap(configuration, rs, rsmd, keyProperties, (Map<String, ?>) parameter);

  } else if (parameter instanceof ArrayList && !((ArrayList<?>) parameter).isEmpty()

      && ((ArrayList<?>) parameter).get(0) instanceof ParamMap) {

    // Multi-param or single param with @Param in batch operation

    assignKeysToParamMapList(configuration, rs, rsmd, keyProperties, (ArrayList<ParamMap<?>>) parameter);

  } else {

    // Single param without @Param

    // 当前case会走这里

    assignKeysToParam(configuration, rs, rsmd, keyProperties, parameter);

  }

}

// org.apache.ibatis.executor.keygen.Jdbc3KeyGenerator#assignKeysToParam

private void assignKeysToParam(Configuration configuration, ResultSet rs, ResultSetMetaData rsmd,

    String[] keyProperties, Object parameter) throws SQLException {

  Collection<?> params = collectionize(parameter);

  if (params.isEmpty()) {

    return;

  }

  List<KeyAssigner> assignerList = new ArrayList<>();

  for (int i = 0; i < keyProperties.length; i++) {

    assignerList.add(new KeyAssigner(configuration, rsmd, i + 1, null, keyProperties[i]));

  }

  Iterator<?> iterator = params.iterator();

  while (rs.next()) {

    if (!iterator.hasNext()) {

      throw new ExecutorException(String.format(MSG_TOO_MANY_KEYS, params.size()));

    }

    Object param = iterator.next();

    assignerList.forEach(x -> x.assign(rs, param));

  }

}

// org.apache.ibatis.executor.keygen.Jdbc3KeyGenerator.KeyAssigner#assign

protected void assign(ResultSet rs, Object param) {

  if (paramName != null) {

    // If paramName is set, param is ParamMap

    param = ((ParamMap<?>) param).get(paramName);

  }

  MetaObject metaParam = configuration.newMetaObject(param);

  try {

    if (typeHandler == null) {

      if (metaParam.hasSetter(propertyName)) {

        // 获取主键的类型

        Class<?> propertyType = metaParam.getSetterType(propertyName);

        // 获取主键类型处理器

        typeHandler = typeHandlerRegistry.getTypeHandler(propertyType,

            JdbcType.forCode(rsmd.getColumnType(columnPosition)));

      } else {

        throw new ExecutorException("No setter found for the keyProperty '" + propertyName + "' in '"

            + metaParam.getOriginalObject().getClass().getName() + "'.");

      }

    }

    if (typeHandler == null) {

      // Error?

    } else {

      // 获取主键的值

      Object value = typeHandler.getResult(rs, columnPosition);

      // 设置主键值

      metaParam.setValue(propertyName, value);

    }

  } catch (SQLException e) {

    throw new ExecutorException("Error getting generated key or setting result to parameter object. Cause: " + e,

        e);

  }

}

// com.mysql.cj.jdbc.result.ResultSetImpl#getObject(int, java.lang.Class<T>)

@Override

public <T> T getObject(int columnIndex, Class<T> type) throws SQLException {

        // ...

        else if (type.equals(Long.class) || type.equals(Long.TYPE)) {

            checkRowPos();

            checkColumnBounds(columnIndex);

            return (T) this.thisRow.getValue(columnIndex - 1, this.longValueFactory);



        }

        // ...

}

最后可以看到这个自增id是在ResultSet的thisRow里面

然后后面的流程就是去解析这个字节数据获取这个long的id

就不往下赘述了

雪花算法ID

yml切换回雪花算法

mybatis-plus:

  global-config:

    db-config:

      id-type: assign_id

在使用雪花算法的时候，也是会走到这个方法

// com.baomidou.mybatisplus.core.executor.MybatisSimpleExecutor#doUpdate

@Override

public int doUpdate(MappedStatement ms, Object parameter) throws SQLException {

    Statement stmt = null;

    try {

        Configuration configuration = ms.getConfiguration();

        StatementHandler handler = configuration.newStatementHandler(this, ms, parameter, RowBounds.DEFAULT, null, null);

        stmt = prepareStatement(handler, ms.getStatementLog(), false);

        return stmt == null ? 0 : handler.update(stmt);

    } finally {

        closeStatement(stmt);

    }

}

但是不同的是，执行完这一行之后，实体类的id字段就已经赋值上了

StatementHandler handler = configuration.newStatementHandler(this, ms, parameter, RowBounds.DEFAULT, null, null);

继续往下跟进

// org.apache.ibatis.session.Configuration#newStatementHandler

public StatementHandler newStatementHandler(Executor executor, MappedStatement mappedStatement, Object parameterObject, RowBounds rowBounds, ResultHandler resultHandler, BoundSql boundSql) {

  StatementHandler statementHandler = new RoutingStatementHandler(executor, mappedStatement, parameterObject, rowBounds, resultHandler, boundSql);

  statementHandler = (StatementHandler) interceptorChain.pluginAll(statementHandler);

  return statementHandler;

}

// org.apache.ibatis.executor.statement.RoutingStatementHandler#RoutingStatementHandler

public RoutingStatementHandler(Executor executor, MappedStatement ms, Object parameter, RowBounds rowBounds, ResultHandler resultHandler, BoundSql boundSql) {



  switch (ms.getStatementType()) {

    // ...

    case PREPARED:

      delegate = new PreparedStatementHandler(executor, ms, parameter, rowBounds, resultHandler, boundSql);

      break;

    // ...

  }



}

最后跟进到一个构造器，会有一个processParameter的方法

// com.baomidou.mybatisplus.core.MybatisParameterHandler#MybatisParameterHandler

public MybatisParameterHandler(MappedStatement mappedStatement, Object parameter, BoundSql boundSql) {

    this.typeHandlerRegistry = mappedStatement.getConfiguration().getTypeHandlerRegistry();

    this.mappedStatement = mappedStatement;

    this.boundSql = boundSql;

    this.configuration = mappedStatement.getConfiguration();

    this.sqlCommandType = mappedStatement.getSqlCommandType();

    this.parameterObject = processParameter(parameter);

}

在这个方法里面会去增强参数

// com.baomidou.mybatisplus.core.MybatisParameterHandler#processParameter

public Object processParameter(Object parameter) {

    /* 只处理插入或更新操作 */

    if (parameter != null

        && (SqlCommandType.INSERT == this.sqlCommandType || SqlCommandType.UPDATE == this.sqlCommandType)) {

        //检查 parameterObject

        if (ReflectionKit.isPrimitiveOrWrapper(parameter.getClass())

            || parameter.getClass() == String.class) {

            return parameter;

        }

        Collection<Object> parameters = getParameters(parameter);

        if (null != parameters) {

            parameters.forEach(this::process);

        } else {

            process(parameter);

        }

    }

    return parameter;

}

// com.baomidou.mybatisplus.core.MybatisParameterHandler#process

private void process(Object parameter) {

    if (parameter != null) {

        TableInfo tableInfo = null;

        Object entity = parameter;

        if (parameter instanceof Map) {

            Map<?, ?> map = (Map<?, ?>) parameter;

            if (map.containsKey(Constants.ENTITY)) {

                Object et = map.get(Constants.ENTITY);

                if (et != null) {

                    entity = et;

                    tableInfo = TableInfoHelper.getTableInfo(entity.getClass());

                }

            }

        } else {

            tableInfo = TableInfoHelper.getTableInfo(parameter.getClass());

        }

        if (tableInfo != null) {

            //到这里就应该转换到实体参数对象了,因为填充和ID处理都是争对实体对象处理的,不用传递原参数对象下去.

            MetaObject metaObject = this.configuration.newMetaObject(entity);

            if (SqlCommandType.INSERT == this.sqlCommandType) {

                populateKeys(tableInfo, metaObject, entity);

                insertFill(metaObject, tableInfo);

            } else {

                updateFill(metaObject, tableInfo);

            }

        }

    }

}

最终生成id并赋值的操作是在populateKeys中

// com.baomidou.mybatisplus.core.MybatisParameterHandler#populateKeys

protected void populateKeys(TableInfo tableInfo, MetaObject metaObject, Object entity) {

    final IdType idType = tableInfo.getIdType();

    final String keyProperty = tableInfo.getKeyProperty();

    if (StringUtils.isNotBlank(keyProperty) && null != idType && idType.getKey() >= 3) {

        final IdentifierGenerator identifierGenerator = GlobalConfigUtils.getGlobalConfig(this.configuration).getIdentifierGenerator();

        Object idValue = metaObject.getValue(keyProperty);

        if (StringUtils.checkValNull(idValue)) {

            if (idType.getKey() == IdType.ASSIGN_ID.getKey()) {

                if (Number.class.isAssignableFrom(tableInfo.getKeyType())) {

                    metaObject.setValue(keyProperty, identifierGenerator.nextId(entity));

                } else {

                    metaObject.setValue(keyProperty, identifierGenerator.nextId(entity).toString());

                }

            } else if (idType.getKey() == IdType.ASSIGN_UUID.getKey()) {

                metaObject.setValue(keyProperty, identifierGenerator.nextUUID(entity));

            }

        }

    }

}

在tableInfo中可以得知Id的类型

如果是雪花算法类型，那么生成雪花id；UUID同理

总结

insert之后，id被赋值到实体类的时机要根据具体情况具体讨论：

如果是自增类型的id，那么要在插入数据库完成之后，在ResultSet的ByteArrayRow中获取到这个id

如果是雪花算法id，那么在在插入数据库之前，会通过参数增强的方式，提前生成一个雪花id，然后赋值给实体类

作者：我爱果汁
来源：juejin.cn/post/7319541656399102002

收起阅读 »

第一次排查 Java 内存泄漏，别人觉得惊险为什么我觉得脸红害羞呢

Java

今天前端一直在群里说，服务是不是又挂了？一直返回 503。我一听这不对劲，赶紧看了一眼 K8S 的 pod 状态，居然重启了4次。测试环境只有一个副本，所以赶紧把副本数给上调到了3个。堵住前端的嘴，免得破坏我在老板心目中的形象，我害怕下次加薪名单没有我，而优...

继续阅读 »

今天前端一直在群里说，服务是不是又挂了？一直返回 503。我一听这不对劲，赶紧看了一眼 K8S 的 pod 状态，居然重启了4次。测试环境只有一个副本，所以赶紧把副本数给上调到了3个。

堵住前端的嘴，免得破坏我在老板心目中的形象，我害怕下次加薪名单没有我，而优化名单有我。

暂时安抚好前端之后我得立马看看哪里出问题了，先看看 K8S 为什么让这个容器领盒饭了。

Last State: Terminated 

Reason: OOMKilled

看起来是 JVM 胃口太大，被 K8S 嫌弃从而被赶走了。看看最近谁提交部署了，把人拉过来拷问一番。

代码摆出来分析，发现这小子每次使用http调用都会 new 一个连接池对象。一次业务请求使用了 6 次 http 调用，也就是会 new 6 个连接池对象。有可能是这里的问题，抓紧改了发上去测试看看。

不出意外的话又出意外了，上去之后也没缓解，那就不是这个问题了。要找到具体的原因还是不能瞎猜，得有专业的工具来进行分析才行。之前为了省点镜像空间，所以使用了 jre 的基础镜像。

总所周知，jre 只有一个运行环境，是没有开发工具的。所以我们得使用 jdk。你说我为省那点空间干什么？都想抽自己了。我们应该以 "让打靶老板花钱"为荣，以 "为打靶老板省钱"为耻。

把JDK准备好之后，就要开始我的第一次了。开始之前总是需要洗白白的，把一些影响心情的东西全部处理掉，就像这个 Skywalking，之前一直跟着我。但现在影响到我了，我得暂时把它放一边。不然他会在进行的过程中一直蹦出来烦人。

使用 Skywalking 需要设置此环境变量，每一次执行Java相关的命令都会执行 Skywalking 的一些操作，可以使用 unset 命令把环境变量临时置空。因为等我做完还是需要他来继续给我工作的。

unset JAVA_TOOL_OPTIONS

琐碎事处理完了之后，就得挑个技师才行。这行命令一把梭就会打印出所有 java 进程信息，这主要是为了获取到 vmid，也就是技师的编号。

jps -lv

root@xxx-ext-6464577d8-vvz2n:/app# jps -lv

608 sun.tools.jps.Jps -Denv.class.path=.:/usr/local/java/lib/rt.jar:/usr/local/java/lib/dt.jar:/usr/local/java/lib/tools.jar -Dapplication.home=/usr/local/openjdk-8 -Xms8m

7 /root/app/xxx-ext.jar -javaagent:/skywalking/agent/skywalking-agent.jar -Dfile.encoding=UTF-8 -Xms1024m -Xmx2048m

568 sun.tools.jstat.Jstat -javaagent:/skywalking/agent/skywalking-agent.jar -Denv.class.path=.:/usr/local/java/lib/rt.jar:/usr/local/java/lib/dt.jar:/usr/local/java/lib/tools.jar -Dapplication.home=/usr/local/openjdk-8 -Xms8m

这里总共查到3个Java进程，608 jps、7 xxx-ext 和 568 jstat。中间这个 7 号技师 xxx-ext 就是我相中的，我将会把第一次交给他。

选完技师就正式开始了，过程中要时刻关心对方的身体状态。隔几秒钟就问一下状态怎么样？为了方便时刻了解对方的身体状态，可以用这个命令每隔5s就问一下。如果你对自己的能力有信心可以把间隔设置短一些。

# jstat -gcutil {vmid} {间隔毫秒}

jstat -gcutil 7 5000

root@xxx-ext-6464577d8-vvz2n:/app# jstat -gcutil 7 5000

  S0     S1     E      O      M     CCS    YGC     YGCT    FGC    FGCT     GCT

 99.96   0.00 100.00 100.00  95.85  94.74    178    8.047     8    3.966   12.012

 99.97   0.00 100.00 100.00  95.50  94.33    178    8.047    11    8.072   16.118

 99.99   0.00 100.00 100.00  95.51  94.33    178    8.047    14   12.408   20.455

100.00   0.00 100.00 100.00  95.48  94.30    178    8.047    18   17.140   25.187

100.00   0.00 100.00 100.00  95.48  94.30    178    8.047    23   22.730   30.776

100.00   0.00 100.00 100.00  95.48  94.30    178    8.047    27   27.035   35.082

100.00   0.00 100.00 100.00  95.49  94.30    178    8.047    32   32.614   40.661

虽然是第一次，但对方给回来的信息务必要了然于胸。知己知彼胜券在握，所以要把下面的心法记住。这会影响我们下一步的动作。

S0/S1 是Survivor区空间使用率

E 是新生代空间使用率

O 是老年代空间使用率

YGC 是 Young GC 次数

YGCT 是 Young GC 总耗时

FGC 是 Full GC 次数

FGCT 是 Full GC 总耗时

当对方的状态到达一个关键点的时候，一般是老年代满，或者是新生代满，这就表示对方快溢出来了。像我提供的这个示例，E 和 O 的使用率都是100，就说明对方不仅满了，还快噶了。我们得赶紧把这个关键时刻详细探究一下，看看是哪个对象让对方感觉到满的。

用这个命令查询对方体内对象占用排名，不用贪多，前10个就绰绰有余了。你能把前10个全部弄清楚就够牛了。

jmap -histo:live 7 | head -n 10

root@xxx-ext-6464577d8-vvz2n:/app# jmap -histo:live 7 | head -n 10



 num     #instances         #bytes  class name

----------------------------------------------

   1:        454962     1852234368  [C

   2:       1773671       56757472  java.util.HashMap$Node

   3:        881987       30188352  [B

   4:         55036       19781352  [Ljava.util.HashMap$Node;

   5:        857235       13715760  java.lang.Integer

   6:        852094       13633504  com.knuddels.jtokkit.ByteArrayWrapper

   7:        454195       10900680  java.lang.String

   8:        104386        6436624  [Ljava.lang.Object;

   9:        191593        6130976  java.util.concurrent.ConcurrentHashMap$Node

  10:         63278        5568464  java.lang.reflect.Method

可以看到对方已经在边缘了，我们要抓紧分析了。我提供的这个示例，排名前三分别是 [C、java.util.HashMap$Node 和 [B，[C 表示字符数组，[B 表示字节数组。看来对方偏爱 [C，占用差不多1.7G，需要重点分析它。

这一步就到了十字路口，关键点在于我们能不能从这里分析得到对方偏爱的对象，从而定位到代码中的问题点。一旦我们定位到代码中的问题点，那就证明对方已经被我们拿捏了，流程结束。

那就开始分析吧，先看看最近哪个瘪犊子提交了代码，把他拉过来。然后看最近改动的代码哪里和 [C 相关，一般是 List<String>、StringBuffer 这类对象。

我没想到小丑竟是我自己🤡，有一个接口入参是一个 List<ID>，当这个 list 传了空的时候，就会把库里的所有数据都查出来。

破案了，这次把对方完全拿捏了，流程结束。

如果上一步无法拿捏，那就不要讲武德了。把对方的一举一动dump下来，最终导出成堆快照来分析。

dump 时间取决于数据量

jmap -dump:live,format=b,file=heap.hprof 7

root@xxx-ext-6464577d8-vvz2n:/app# jmap -dump:live,format=b,file=heap.hprof 7

Dumping heap to /app/heap.hprof ...

Heap dump file created

将dump文件从pod中复制出来

kubectl cp <ns>/<pod>:/app/heap.hprof ./heap.hprof

kubectl cp test/xxx-ext-6464577d8-vvz2n:/app/heap.hprof ./heap.hprof

我摊牌了，这一步我压根没做。

当我想从pod中把对快照复制出来的时候磁盘空间不够，然后pod就被 K8S 这个暴脾气干了，只剩下我颤抖的手无力地放在键盘上。

Ref

juejin.cn/post/700622…

作者：纸仓
来源：juejin.cn/post/7426189830562906149

收起阅读 »

SpringBoot 实战：文件上传之秒传、断点续传、分片上传

Java

文件上传功能几乎是每个 Web 应用不可或缺的一部分。无论是个人博客中的图片上传，还是企业级应用中的文档管理，文件上传都扮演着至关重要的角色。今天，松哥和大家来聊聊文件上传中的几个高级玩法——秒传、断点续传和分片上传。一文件上传的常见场景在日常开发中，文...

继续阅读 »

文件上传功能几乎是每个 Web 应用不可或缺的一部分。无论是个人博客中的图片上传，还是企业级应用中的文档管理，文件上传都扮演着至关重要的角色。今天，松哥和大家来聊聊文件上传中的几个高级玩法——秒传、断点续传和分片上传。

一文件上传的常见场景

在日常开发中，文件上传的场景多种多样。比如，在线教育平台上的视频资源上传，社交平台上的图片分享，以及企业内部的知识文档管理等。这些场景对文件上传的要求也各不相同，有的追求速度，有的注重稳定性，还有的需要考虑文件大小和安全性。因此，针对不同需求，我们有了秒传、断点续传和分片上传等解决方案。

二秒传、断点上传与分片上传

秒传

秒传，顾名思义，就是几乎瞬间完成文件上传的过程。其实现原理是通过计算文件的哈希值（如 MD5 或 SHA-1），然后将这个唯一的标识符发送给服务器。如果服务器上已经存在相同的文件，则直接返回成功信息，避免了重复上传。这种方式不仅节省了带宽，也大大提高了用户体验。

断点续传

断点续传是指在网络不稳定或者用户主动中断上传后，能够从上次中断的地方继续上传，而不需要重新开始整个过程。这对于大文件上传尤为重要，因为它可以有效防止因网络问题导致的上传失败，同时也能节约用户的流量和时间。

分片上传

分片上传则是将一个大文件分割成多个小块分别上传，最后再由服务器合并成完整的文件。这种做法的好处是可以并行处理多个小文件，提高上传效率；同时，如果某一部分上传失败，只需要重传这一部分，不影响其他部分。

三秒传实战

后端实现

在 SpringBoot 项目中，我们可以使用 MessageDigest 类来计算文件的 MD5 值，然后检查数据库中是否存在该文件。

@RestController

@RequestMapping("/file")

public class FileController {

    @Autowired

    FileService fileService;



    @PostMapping("/upload1")

    public ResponseEntity<String> secondUpload(@RequestParam(value = "file",required = false) MultipartFile file,@RequestParam(required = false,value = "md5") String md5) {

        try {

            // 检查数据库中是否已存在该文件

            if (fileService.existsByMd5(md5)) {

                return ResponseEntity.ok("文件已存在");

            }

            // 保存文件到服务器

            file.transferTo(new File("/path/to/save/" + file.getOriginalFilename()));

            // 保存文件信息到数据库

            fileService.save(new FileInfo(file.getOriginalFilename(), DigestUtils.md5DigestAsHex(file.getInputStream())));

            return ResponseEntity.ok("上传成功");

        } catch (Exception e) {

            return ResponseEntity.status(HttpStatus.INTERNAL_SERVER_ERROR).body("上传失败");

        }

    }

}

前端调用

前端可以通过 JavaScript 的 FileReader API 读取文件内容，通过 spark-md5 计算 MD5 值，然后发送给后端进行校验。

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <title>秒传</title>

    <script src="spark-md5.js"></script>

</head>

<body>

<input type="file" id="fileInput" />

<button onclick="startUpload()">开始上传</button>

<hr>

<script>

    async function startUpload() {

        const fileInput = document.getElementById('fileInput');

        const file = fileInput.files[0];

        if (!file) {

            alert("请选择文件");

            return;

        }



        const md5 = await calculateMd5(file);

        const formData = new FormData();

        formData.append('md5', md5);



        const response = await fetch('/file/upload1', {

            method: 'POST',

            body: formData

        });



        const result = await response.text();

        if (response.ok) {

            if (result != "文件已存在") {

                // 开始上传文件

            }

        } else {

            console.error("上传失败: " + result);

        }

    }



    function calculateMd5(file) {

        return new Promise((resolve, reject) => {

            const reader = new FileReader();

            reader.onloadend = () => {

                const spark = new SparkMD5.ArrayBuffer();

                spark.append(reader.result);

                resolve(spark.end());

            };

            reader.onerror = () => reject(reader.error);

            reader.readAsArrayBuffer(file);

        });

    }

</script>

</body>

</html>

前端分为两个步骤：

计算文件的 MD5 值，计算之后发送给服务端确定文件是否存在。

如果文件已经存在，则不需要继续上传文件；如果文件不存在，则开始上传文件，上传文件和 MD5 校验请求类似，上面的案例代码中我就没有重复演示了，松哥在书里和之前的课程里都多次讲过文件上传，这里不再啰嗦。

四分片上传实战

分片上传关键是在前端对文件切片，比如一个 10MB 的文件切为 10 份，每份 1MB。每次上传的时候，需要多一个参数记录当前上传的文件切片的起始位置。

比如一个 10MB 的文件，切为 10 份，每份 1MB，那么：

第 0 片，从 0 开始，一共是 1024*1024 个字节。

第 1 片，从 1024*1024 开始，一共是 1024*1024 个字节。

第 2 片...

把这个搞懂，后面的代码就好理解了。

后端实现

private static final String UPLOAD_DIR = System.getProperty("user.home") + "/uploads/";

/**

 * 上传文件到指定位置

 *

 * @param file 上传的文件

 * @param start 文件开始上传的位置

 * @return ResponseEntity<String> 上传结果

 */

@PostMapping("/upload2")

public ResponseEntity<String> resumeUpload(@RequestParam("file") MultipartFile file, @RequestParam("start") long start,@RequestParam("fileName") String fileName) {

    try {

        File directory = new File(UPLOAD_DIR);

        if (!directory.exists()) {

            directory.mkdirs();

        }

        File targetFile = new File(UPLOAD_DIR + fileName);

        RandomAccessFile randomAccessFile = new RandomAccessFile(targetFile, "rw");

        FileChannel channel = randomAccessFile.getChannel();

        channel.position(start);

        channel.transferFrom(file.getResource().readableChannel(), start, file.getSize());

        channel.close();

        randomAccessFile.close();

        return ResponseEntity.ok("上传成功");

    } catch (Exception e) {

        System.out.println("上传失败: "+e.getMessage());

        return ResponseEntity.status(500).body("上传失败");

    }

}

后端每次处理的时候，需要先设置文件的起始位置。

前端调用

前端需要将文件切分成多个小块，然后依次上传。

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <meta name="viewport" content="width=device-width, initial-scale=1.0">

    <title>分片示例</title>

</head>

<body>

    <input type="file" id="fileInput" />

    <button onclick="startUpload()">开始上传</button>



    <script>

        async function startUpload() {

            const fileInput = document.getElementById('fileInput');

            const file = fileInput.files[0];

            if (!file) {

                alert("请选择文件");

                return;

            }



            const filename = file.name;

            let start = 0;



            uploadFile(file, start);

        }



        async function uploadFile(file, start) {

            const chunkSize = 1024 * 1024; // 每个分片1MB

            const total = Math.ceil(file.size / chunkSize);



            for (let i = 0; i < total; i++) {

                const chunkStart = start + i * chunkSize;

                const chunkEnd = Math.min(chunkStart + chunkSize, file.size);

                const chunk = file.slice(chunkStart, chunkEnd);



                const formData = new FormData();

                formData.append('file', chunk);

                formData.append('start', chunkStart);

                formData.append('fileName', file.name);



                const response = await fetch('/file/upload2', {

                    method: 'POST',

                    body: formData

                });



                const result = await response.text();

                if (response.ok) {

                    console.log(`分片 ${i + 1}/${total} 上传成功`);

                } else {

                    console.error(`分片 ${i + 1}/${total} 上传失败: ${result}`);

                    break;

                }

            }

        }

    </script>

</body>

</html>

五断点续传实战

断点续传的技术原理类似于分片上传。

当文件已经上传了一部分之后，断了需要重新开始上传。

那么我们的思路是这样的：

前端先发送一个请求，检查要上传的文件在服务端是否已经存在，如果存在，目前大小是多少。

前端根据已经存在的大小，继续上传文件即可。

后端案例

先来看后端检查的接口，如下：

@GetMapping("/check")

public ResponseEntity<Long> checkFile(@RequestParam("filename") String filename) {

    File file = new File(UPLOAD_DIR + filename);

    if (file.exists()) {

        return ResponseEntity.ok(file.length());

    } else {

        return ResponseEntity.ok(0L);

    }

}

如果文件存在，则返回已经存在的文件大小。

如果文件不存在，则返回 0，表示前端从头开始上传该文件。

前端调用

<!DOCTYPE html>

<html lang="en">

<head>

    <meta charset="UTF-8">

    <meta name="viewport" content="width=device-width, initial-scale=1.0">

    <title>断点续传示例</title>

</head>

<body>

<input type="file" id="fileInput"/>

<button onclick="startUpload()">开始上传</button>



<script>

    async function startUpload() {

        const fileInput = document.getElementById('fileInput');

        const file = fileInput.files[0];

        if (!file) {

            alert("请选择文件");

            return;

        }



        const filename = file.name;

        let start = await checkFile(filename);



        uploadFile(file, start);

    }



    async function checkFile(filename) {

        const response = await fetch(`/file/check?filename=${filename}`);

        const start = await response.json();

        return start;

    }



    async function uploadFile(file, start) {

        const chunkSize = 1024 * 1024; // 每个分片1MB

        const total = Math.ceil((file.size - start) / chunkSize);



        for (let i = 0; i < total; i++) {

            const chunkStart = start + i * chunkSize;

            const chunkEnd = Math.min(chunkStart + chunkSize, file.size);

            const chunk = file.slice(chunkStart, chunkEnd);



            const formData = new FormData();

            formData.append('file', chunk);

            formData.append('start', chunkStart);

            formData.append('fileName', file.name);



            const response = await fetch('/file/upload2', {

                method: 'POST',

                body: formData

            });



            const result = await response.text();

            if (response.ok) {

                console.log(`分片 ${i + 1}/${total} 上传成功`);

            } else {

                console.error(`分片 ${i + 1}/${total} 上传失败: ${result}`);

                break;

            }

        }

    }

</script>

</body>

</html>

这个案例实际上是一个断点续传+分片上传的案例，相关知识点并不难，小伙伴们可以自行体会下。

六总结

好了，以上就是关于文件上传中秒传、断点续传和分片上传的实战分享。通过这些技术的应用，我们可以极大地提升文件上传的效率和稳定性，改善用户体验。希望各位小伙伴在自己的项目中也能灵活运用这些技巧，解决实际问题。

本文完整案例：github.com/lenve/sprin…

作者：江南一点雨
来源：juejin.cn/post/7436026758438453274

收起阅读 »

MyBatis-Plus 效能提升秘籍：掌握这些注解，事半功倍！

Java

MyBatis-Plus是一个功能强大的MyBatis扩展插件，它提供了许多便捷的注解，让我们在开发过程中能够更加高效地完成数据库操作，本文将带你一一了解这些注解，并通过实例来展示它们的魅力。一、@Tablename注解这个注解用于指定实体类对应的数据库表...

继续阅读 »

MyBatis-Plus是一个功能强大的MyBatis扩展插件，它提供了许多便捷的注解，让我们在开发过程中能够更加高效地完成数据库操作，本文将带你一一了解这些注解，并通过实例来展示它们的魅力。

一、@Tablename注解

这个注解用于指定实体类对应的数据库表名。如果你的表名和实体类名不一致，就需要用到它：

@TableName("user_info")

public class UserInfo {

    // 类的属性和方法

}

在上述代码中，即使实体类名为UserInfo，但通过@TableName注解，我们知道它对应数据库中的"user_info"表。

二、@Tableld注解

每个数据库表都有主键，@TableId注解用于标识实体类中的主键属性。通常与@TableName配合使用，确保主键映射正确。

AUTO(0),

NONE(1),

INPUT(2),

ASSIGN_ID(3),

ASSIGN_UUID(4),

/** @deprecated */

@Deprecated

ID_WORKER(3),

/** @deprecated */

@Deprecated

ID_WORKER_STR(3),

/** @deprecated */

@Deprecated

UUID(4);

INPUT 如果开发者没有手动赋值，则数据库通过自增的方式给主键赋值，如果开发者手动赋值，则存入该值。

AUTO 默认就是数据库自增，开发者无需赋值。

ASSIGN_ID MP 自动赋值，雪花算法。

ASSIGN_UUID 主键的数据类型必须是 String，自动生成 UUID 进行赋值。

// 自己赋值

    //@TableId(type = IdType.INPUT)

    // 默认使用的雪花算法，长度比较长，所以使用Long类型，不用自己赋值

    @TableId

    private Long id;

测试

@Test

    void save(){

        // 由于id加的有注解，这里就不用赋值了

        Student student = new Student();

        student.setName("天明");

        student.setAge(18);

        mapper.insert(student);

}

雪花算法

雪花算法是由Twitter公布的分布式主键生成算法，它能够保证不同表的主键的不重复性，以及相同表的主键的有序性。

核心思想：

长度共64bit（一个long型）。

首先是一个符号位，1bit标识，由于long基本类型在Java中是带符号的，最高位是符号位，正数是0，负数是1，所以id一般是正数，最高位是0。

41bit时间截(毫秒级)，存储的是时间截的差值（当前时间截 - 开始时间截)，结果约等于69.73年。

10bit作为机器的ID（5个bit是数据中心，5个bit的机器ID，可以部署在1024个节点）。

12bit作为毫秒内的流水号（意味着每个节点在每毫秒可以产生 4096 个 ID）。

优点： 整体上按照时间自增排序，并且整个分布式系统内不会产生ID碰撞，并且效率较高。

三、@TableField注解

当你的实体类属性名与数据库字段名不一致时，@TableField注解可以帮助你建立二者之间的映射关系。

映射非主键字段，value 映射字段名；

exist 表示是否为数据库字段 false，如果实体类中的成员变量在数据库中没有对应的字段，则可以使用 exist，VO、DTO；

select 表示是否查询该字段；

fill 表示是否自动填充，将对象存入数据库的时候，由 MyBatis Plus 自动给某些字段赋值，create_time、update_time。

自动填充

1）给表添加 create_time、update_time 字段。

2）实体类中添加成员变量。

package com.md.entity;



import com.baomidou.mybatisplus.annotation.*;

import com.md.enums.StatusEnum;

import lombok.Data;

import java.util.Date;



@Data

@TableName(value = "student")

public class Student {

    @TableId

    private Long id;



    // 当该字段名称与数据库名字不一致

    @TableField(value = "name")

    private String name;



    // 不查询该字段

    @TableField(select = false)

    private Integer age;



    // 当数据库中没有该字段，就忽略

    @TableField(exist = false)

    private String gender;



    // 第一次添加填充

    @TableField(fill = FieldFill.INSERT)

    private Date createTime;



    // 第一次添加的时候填充，但之后每次更新也会进行填充

    @TableField(fill = FieldFill.INSERT_UPDATE)

    private Date updateTime;



}

3）创建自动填充处理器。

注意：不要忘记添加 @Component 注解。

package com.md.handler;



import com.baomidou.mybatisplus.core.handlers.MetaObjectHandler;

import org.apache.ibatis.reflection.MetaObject;

import org.springframework.stereotype.Component;



import java.util.Date;



/**

 * @author md

 * @Desc 对实体类中使用的自动填充注解进行编写

 * @date 2020/10/26 17:29

 */

// 加入注解才能生效

@Component

public class MyMetaObjectHandler implements MetaObjectHandler {



    @Override

    public void insertFill(MetaObject metaObject) {

        this.setFieldValByName("createTime", new Date(), metaObject);

        this.setFieldValByName("updateTime", new Date(), metaObject);

    }



    @Override

    public void updateFill(MetaObject metaObject) {

        this.setFieldValByName("updateTime", new Date(), metaObject);

    }

}

4）测试

@Test

    void save(){

        // 由于id加的有注解，这里就不用赋值了

        Student student = new Student();

        student.setName("韩立");

        student.setAge(11);

        // 时间自动填充

        mapper.insert(student);

}

5）更新

当该字段发生变化的时候时间会自动更新。

@Test

    void update(){

        Student student = mapper.selectById(1001);

        student.setName("韩信");

        mapper.updateById(student);

}

四、@TableLogic注解

在很多应用中，数据并不是真的被删除，而是标记为已删除状态。@TableLogic注解用于标识逻辑删除字段，通常配合逻辑删除功能使用。

1、逻辑删除

物理删除： 真实删除，将对应数据从数据库中删除，之后查询不到此条被删除的数据。

逻辑删除： 假删除，将对应数据中代表是否被删除字段的状态修改为“被删除状态”，之后在数据库中仍旧能看到此条数据记录。

使用场景： 可以进行数据恢复。

2、实现逻辑删除

step1： 数据库中创建逻辑删除状态列。

step2： 实体类中添加逻辑删除属性。

@TableLogic

@TableField(value = "is_deleted")

private Integer deleted;

3、测试

测试删除： 删除功能被转变为更新功能。

-- 实际执行的SQL

update user set is_deleted=1 where id = 1 and is_deleted=0

测试查询： 被逻辑删除的数据默认不会被查询。

-- 实际执行的SQL

select id,name,is_deleted from user where is_deleted=0

你还在苦恼找不到真正免费的编程学习平台吗?可以试试【云端源想】！课程视频、知识库、微实战、云实验室、一对一咨询……你想要的全部学习资源这里都有，重点是现在还是免费的！点这里即可查看！

五、@Version注解

乐观锁是一种并发控制策略，@Version注解用于标识版本号字段，确保数据的一致性。

乐观锁

标记乐观锁，通过 version 字段来保证数据的安全性，当修改数据的时候，会以 version 作为条件，当条件成立的时候才会修改成功。

version = 2

线程1：update … set version = 2 where version = 1

线程2：update … set version = 2 where version = 1

1.数据库表添加 version 字段，默认值为 1。

2.实体类添加 version 成员变量，并且添加 @Version。

package com.md.entity;



import com.baomidou.mybatisplus.annotation.*;

import com.md.enums.StatusEnum;

import lombok.Data;

import java.util.Date;



@Data

@TableName(value = "student")

public class Student {

    @TableId

    private Long id;

    @TableField(value = "name")

    private String name;

    @TableField(select = false)

    private Integer age;

    @TableField(exist = false)

    private String gender;

    @TableField(fill = FieldFill.INSERT)

    private Date createTime;

    @TableField(fill = FieldFill.INSERT_UPDATE)

    private Date updateTime;

    

    @Version

    private Integer version; //版本号

  

}

3.注册配置类

在 MybatisPlusConfig 中注册 Bean。

package com.md.config;



import com.baomidou.mybatisplus.extension.plugins.OptimisticLockerInterceptor;

import com.baomidou.mybatisplus.extension.plugins.PaginationInterceptor;

import org.springframework.context.annotation.Bean;

import org.springframework.context.annotation.Configuration;



/**

 * @author md

 * @Desc

 * @date 2020/10/26 20:42

 */

@Configuration

public class MyBatisPlusConfig {

    /**

    * 乐观锁

    */

    @Bean

    public OptimisticLockerInterceptor optimisticLockerInterceptor(){

        return new OptimisticLockerInterceptor();

    }

}

六、@EnumValue注解

mp框架对枚举进行处理的一个注解。

使用场景： 创建枚举类，在需要存储数据库的属性上添加@EnumValue注解。

public enum SexEnum {



 MAN(1, "男"),

 WOMAN(2, "女");



 @EnumValue

 private Integer key;

}

MyBatis-Plus的注解是开发者的好帮手，它们简化了映射配置，提高了开发效率。希望以上的介绍能帮助新手朋友们快速理解和运用这些常用注解，让你们在MyBatis-Plus的世界里游刃有余！记得实践是最好的学习方式，快去动手试试吧！

作者：云端源想
来源：juejin.cn/post/7340471458949169215

收起阅读 »

Java 语法糖，你用过几个？

Java

你好，我是猿java。这篇文章，我们来聊聊 Java 语法糖。什么是语法糖？语法糖（Syntactic Sugar）是编程语言中的一种设计概念，它指的是在语法层面上对某些操作提供更简洁、更易读的表示方式。这种表示方式并不会新增语言的功能，而只是使代码更简...

继续阅读 »

你好，我是猿java。

这篇文章，我们来聊聊 Java 语法糖。

什么是语法糖？

语法糖（Syntactic Sugar）是编程语言中的一种设计概念，它指的是在语法层面上对某些操作提供更简洁、更易读的表示方式。这种表示方式并不会新增语言的功能，而只是使代码更简洁、更直观，便于开发者理解和维护。

语法糖的作用：

提高代码可读性：语法糖可以使代码更加贴近自然语言或开发者的思维方式，从而更容易理解。

减少样板代码：语法糖可以减少重复的样板代码，使得开发者可以更专注于业务逻辑。

降低出错率：简化的语法可以减少代码量，从而降低出错的概率。

因此，语法糖不是 Java 语言特有的，它是很多编程语言设计中的一些语法特性，这些特性使代码更加简洁易读，但并不会引入新的功能或能力。

那么，Java中有哪些语法糖呢？

Java 语法糖

1. 自动装箱与拆箱

自动装箱和拆箱 (Autoboxing and Unboxing)是 Java 5 引入的特性，用于在基本数据类型和它们对应的包装类之间自动转换。

// 自动装箱

Integer num = 10; // 实际上是 Integer.valueOf(10)



// 自动拆箱

int n = num; // 实际上是 num.intValue()

2. 增强型 for 循环

增强型 for 循环（也称为 for-each 循环）用于遍历数组或集合。

int[] numbers = {1, 2, 3, 4, 5};

for (int number : numbers) {

    System.out.println(number);

}

3. 泛型

泛型（Generics）使得类、接口和方法可以操作指定类型的对象，提供了类型安全的检查和消除了类型转换的需要。

List<String> list = new ArrayList<>();

list.add("Hello");

String s = list.get(0); // 不需要类型转换

4. 可变参数

可变参数（Varargs）允许在方法中传递任意数量的参数。

public void printNumbers(int... numbers) {

    for (int number : numbers) {

        System.out.println(number);

    }

}



printNumbers(1, 2, 3, 4, 5);

5. try-with-resources

try-with-resources 语句用于自动关闭资源，实现了 AutoCloseable 接口的资源会在语句结束时自动关闭。

try (BufferedReader br = new BufferedReader(new FileReader("file.txt"))) {

    System.out.println(br.readLine());

} catch (IOException e) {

    e.printStackTrace();

}

6. Lambda 表达式

Lambda 表达式是 Java 8 引入的特性，使得可以使用更简洁的语法来实现函数式接口（只有一个抽象方法的接口）。

List<String> list = Arrays.asList("a", "b", "c");

list.forEach(s -> System.out.println(s));

7. 方法引用

方法引用（Method References）是 Lambda 表达式的一种简写形式，用于直接引用已有的方法。

list.forEach(System.out::println);

8. 字符串连接

从 Java 5 开始，Java 编译器会将字符串的连接优化为 StringBuilder 操作。

String message = "Hello, " + "world!"; // 实际上是 new StringBuilder().append("Hello, ").append("world!").toString();

9. Switch 表达式

Java 12 引入的 Switch 表达式使得 Switch 语句更加简洁和灵活。

int day = 5;

String dayName = switch (day) {

    case 1 -> "Sunday";

    case 2 -> "Monday";

    case 3 -> "Tuesday";

    case 4 -> "Wednesday";

    case 5 -> "Thursday";

    case 6 -> "Friday";

    case 7 -> "Saturday";

    default -> "Invalid day";

};

10. 类型推断 (Type Inference)

Java 10 引入了局部变量类型推断，通过 var 关键字来声明变量，编译器会自动推断变量的类型。

var list = new ArrayList<String>();

list.add("Hello");

这些语法糖使得 Java 代码更加简洁和易读，但需要注意的是，它们并不会增加语言本身的功能，只是对已有功能的一种简化和封装。

总结

本文，我们介绍了 Java 语言中的一些语法糖，从上面的例子可以看出，Java 语法糖只是一些简化的语法，可以使代码更简洁易读，而本身并不增加新的功能。

学习交流

如果你觉得文章有帮助，请帮忙转发给更多的好友，或关注公众号：猿java，持续输出硬核文章。

作者：猿java
来源：juejin.cn/post/7412672643633791039

收起阅读 »

即时通讯 - 短轮询、长轮询、长连接、WebSocket

综合技术讨论

实现即时通讯主要有四种方式，它们分别是短轮询、长轮询、长连接、WebSocket 1. 短轮询 1.1 说明传统的web通信模式。后台处理数据，需要一定时间，前端想要知道后端的处理结果，就要不定时的向后端发出请求以获得最新情况，得到想要的结果，或者超出规定的...

继续阅读 »

实现即时通讯主要有四种方式，它们分别是短轮询、长轮询、长连接、WebSocket

1. 短轮询

1.1 说明

传统的web通信模式。后台处理数据，需要一定时间，前端想要知道后端的处理结果，就要不定时的向后端发出请求以获得最新情况，得到想要的结果，或者超出规定的最长时间就终止再发请求。

1.2 优点：

前后端程序编写比较容易

1.3 缺点：

效率低：轮询的请求间隔时间一般是固定的，无论服务器是否有新的数据，都需要等待一段固定的时间。当数据更新的频率较低时，大部分请求都是无效的；

实时性差：如果数据在两次请求间发生了更新，那么用户只能在下一次轮询时才能得到最新数据；

浪费资源：高频率的操作功能，或者页面访问，导致的大量用户使用轮询时，会占用大量的网络资源，降低整体网络速度

1.4 基础实现：

每隔一段时间发送一个请求即可，得到想要的结果，或者超出规定的最长时间就终止再发请求。

let count = 0;

const timer = null;

// 超时时间

const MAX_TIME = 10 * 1000;

// 心跳间隙

const HEARTBEAT_INTERVAL = 1000; 



/**

 * @description: 模拟请求后端数据 （第6次时返回true）

 */

const fetchData = () => {

  return new Promise((resolve, reject) => {

    setTimeout(() => {

      console.log('fetch data...', count)

      count += 1 

      if(count === 5) {

        resolve(true);

      }else {

        resolve(false);

      }

    }, 1000)

  });

};



/**

 * @description: 异步轮询，当超时时或者接口返回true时，中断轮询

 */

const doSomething = async () => {

  try {

    let startTime = 0;

    const timer = setInterval(async ()=>{

      const res = await fetchData();

      startTime += HEARTBEAT_INTERVAL;

      if(res || startTime > MAX_TIME) {

        clearInterval(timer)

      }

    }, HEARTBEAT_INTERVAL)



  } catch (err) {

    console.log(err);

  }

};



doSomething();

2. 长轮询

2.1 说明

客户端向服务器发送Ajax请求，服务器接到请求后hold住连接，直到有新消息才返回响应信息并关闭连接，客户端处理完响应信息后再向服务器发送新的请求

长轮询的实现原理与轮询类似，只是客户端的请求会保持打开状态，直到服务器返回响应或超时。在服务器端，可以使用阻塞方式处理长轮询请求，即服务器线程会一直等待直到有新的数据或事件，然后返回响应给客户端。客户端收到响应后，可以处理数据或事件，并随后发送下一个长轮询请求。

2.2 优点

长轮询相较于轮询技术来说，减少了不必要的网络流量和请求次数，降低了服务器和客户端的资源消耗

2.3 缺点

但是相对于传统的轮询技术，长轮询的实现更加复杂，并且需要服务器支持长时间保持连接的能力。

2.4 基础实现

超时和未得到想要的结果都需要重新执行原方法（递归实现）

async function subscribe() {

  let response = await fetch("/subscribe");



  if (response.status == 502) {

    // 状态 502 是连接超时错误，

    // 连接挂起时间过长时可能会发生，

    // 远程服务器或代理会关闭它

    // 让我们重新连接

    await subscribe();

  } else if (response.status != 200) {

    // 一个 error —— 让我们显示它

    showMessage(response.statusText);

    // 一秒后重新连接

    await new Promise(resolve => setTimeout(resolve, 1000));

    await subscribe();

  } else {

    // 获取并显示消息

    let message = await response.text();

    showMessage(message);

    // 再次调用 subscribe() 以获取下一条消息

    await subscribe();

  }

}



subscribe();

3. 长链接

3.1 说明

HTTP keep-alive 也称为 HTTP 长连接。它通过重用一个 TCP 连接来发送/接收多个 HTTP请求，来减少创建/关闭多个 TCP 连接的开销

3.1.1 为什么HTTP是短连接？

HTTP是短连接，客户端向服务器发送一个请求，得到响应后，连接就关闭。

例如，用户通过浏览器访问一个web站点上的某个网页，当网页内容加载完毕之后（已得到响应），用户可能需要花费几分钟甚至更多的时间来浏览网页内容，此时完全没有必要继续维持底层连。当用户需要访问其他网页时，再创建新的连接即可。

因此，HTTP连接的寿命通常都很短。这样做的好处是，可以极大的减轻服务端的压力。一般而言，一个站点能支撑的最大并发连接数也是有限的，

面对这么多客户端浏览器，不可能长期维持所有连接。每个客户端取得自己所需的内容后，即关闭连接，更加合理。

3.1.2 为什么要引入keep-alive（也称HTTP长连接）

通常一个网页可能会有很多组成部分，除了文本内容，还会有诸如：js、css、图片等静态资源，有时还会异步发起AJAX请求。

只有所有的资源都加载完毕后，我们看到网页完整的内容。然而，一个网页中，可能引入了几十个js、css文件，上百张图片，

如果每请求一个资源，就创建一个连接，然后关闭，代价实在太大了。

基于此背景，我们希望连接能够在短时间内得到复用，在加载同一个网页中的内容时，尽量的复用连接，这就是HTTP协议中keep-alive属性的作用。

HTTP 1.0 中默认是关闭的，需要在http头加入"Connection: Keep-Alive"，才能启用Keep-Alive；

HTTP 1.1 中默认启用Keep-Alive，如果加入"Connection: close "，才关闭

注意：这里复用的是 TCP连接，并不是复用request

HTTP 的 Keep-Alive 也叫 HTTP 长连接，该功能是由「应用程序」实现的，可以使得用同一个 TCP 连接来发送和接收多个 HTTP 请求/应答，减少了 HTTP 短连接带来的多次 TCP 连接建立和释放的开销。

TCP 的 Keepalive 也叫 TCP 保活机制，该功能是由「内核」实现的，当客户端和服务端长达一定时间没有进行数据交互时，内核为了确保该连接是否还有效，就会发送探测报文，来检测对方是否还在线，然后来决定是否要关闭该连接

4. WebSocket

4.1 说明

Websocket是基于HTTP协议的，在和服务端建立了链接后，服务端有数据有了变化后会主动推送给前端；

一般可以用于股票交易行情分析、聊天室、在线游戏，替代轮询和长轮询。

4.2 优点

请求响应快，不浪费资源。（传统的http请求，其并发能力都是依赖同时发起多个TCP连接访问服务器实现的(因此并发数受限于浏览器允许的并发连接数)，而websocket则允许我们在一条ws连接上同时并发多个请求，即在A请求发出后A响应还未到达，就可以继续发出B请求。由于TCP的慢启动特性（新连接速度上来是需要时间的），以及连接本身的握手损耗，都使得websocket协议的这一特性有很大的效率提升；http协议的头部太大，且每个请求携带的几百上千字节的头部大部分是重复的，websocket则因为复用长连接而没有这一问题。）

4.3 缺点

主流浏览器支持的Web Socket版本不一致；

服务端没有标准的API。

4.4 基础实现

这里使用了一个网页和打印app的通信举例（部分敏感代码已省略）

const printConnect = () => {

    try {

      const host = 'ws://localhost:13888'

      cloundPrintInfo.webSocket = new WebSocket(host)



      // 通信

      cloundPrintInfo.webSocket.onopen = () => {

        // 获取打印机列表

        cloundPrintInfo.webSocket.send(

        JSON.stringify({

          cmd: 'getPrinters',

          version: '1.0',

        })

      )

      }



      // 通信返回

      cloundPrintInfo.webSocket.onmessage = (msg: any) => {

        

        const { data: returnData } = msg

     

        // code  1000: 全部成功  1001: 部分失败  1002: 全部失败

        const { cmd } = JSON.parse(`${returnData}`)

       

        // 获取打印机数据

        if (cmd === 'GETPRINTERS') {

          printerInfoSet(returnData)

        }



        // 处理发送打印请求结果

        if (cmd === 'PRINT') {

          handlePrintResult(returnData)

        }



        // 批量推送打印结果

        if (cmd === 'NOTIFYPRINTRESULT') {

          cloudPrintTip(returnData)

        }

      }



      // 通信失败

      cloundPrintInfo.webSocket.onerror = () => {

        printClose()

      }



      // 关闭通信

      cloundPrintInfo.webSocket.onclose = () => {

        printClose()

      }

    } catch (exception) {

      console.log('建立连接失败', exception)

      printClose()

    }

  }

在实际应用中，你可能需要处理更复杂的情况，比如重连逻辑、心跳机制来保持连接活跃、以及安全性问题等

重连逻辑：当WebSocket连接由于网络问题或其他原因断开时，客户端可能需要自动尝试重新连接

var socket;

var reconnectInterval = 5000; // 重连间隔时间，例如5秒



function connect() {

  socket = new WebSocket('ws://localhost:3000');



  socket.onopen = function(event) {

    console.log('Connected to the WebSocket server');

  };



  socket.onclose = function(event) {

    console.log('WebSocket connection closed. Reconnecting...');

    setTimeout(connect, reconnectInterval); // 在指定时间后尝试重连

  };



  socket.onerror = function(error) {

    console.error('WebSocket error:', error);

    socket.close(); // 确保在错误后关闭连接，触发重连

  };

}



connect(); // 初始连接

心跳机制：指定期发送消息以保持连接活跃的过程。这可以防止代理服务器或负载均衡器因为长时间的不活动而关闭连接

function heartbeat() {

  if (socket.readyState === WebSocket.OPEN) {

    socket.send('ping'); // 发送心跳消息，内容可以是'ping'

  }

}



// 每30秒发送一次心跳

var heartbeatInterval = setInterval(heartbeat, 30000);



// 清除心跳定时器，通常在连接关闭时调用

function clearHeartbeat() {

  clearInterval(heartbeatInterval);

}



socket.onclose = function(event) {

  clearHeartbeat();

};

4种对比

从兼容性角度考虑，短轮询>长轮询>长连接SSE>WebSocket；

从性能方面考虑，WebSocket>长连接SSE>长轮询>短轮询。

参考文章：

Http——Keep-Alive机制

作者：椰子鑫
来源：juejin.cn/post/7451612338408521743

收起阅读 »

面试官：MySQL单表过亿数据，如何优化count(*)全表的操作？

综合技术讨论

本文首发于公众号：托尼学长，立个写 1024 篇原创技术面试文章的flag，欢迎过来视察监督~ 最近有好几个同学跟我说，他在技术面试过程中被问到这个问题了，让我找时间系统地讲解一下。其实从某种意义上来说，这并不是一个严谨的面试题，接下来 show me t...

继续阅读 »

本文首发于公众号：托尼学长，立个写 1024 篇原创技术面试文章的flag，欢迎过来视察监督~

最近有好几个同学跟我说，他在技术面试过程中被问到这个问题了，让我找时间系统地讲解一下。

其实从某种意义上来说，这并不是一个严谨的面试题，接下来 show me the SQL，我们一起来看一下。

如下图所示，一张有 3000多万行记录的 user 表，执行全表 count 操作需要 14.8 秒的时间。

接下来我们稍作调整再试一次，神奇的一幕出现了，执行全表 count 操作竟然连 1 毫秒的时间都用不上。

这是为什么呢？

其实原因很简单，第一次执行全表 count 操作的时候，我用的是 MySQL InnoDB 存储引擎，而第二次则是用的 MySQL MyISAM 存储引擎。

这两者的差别在于，前者在执行 count(*) 操作的时候，需要将表中每行数据读取出来进行累加计数，而后者已经将表的总行数存储下来了，只需要直接返回即可。

当然，InnoDB 存储引擎对 count(*) 操作也进行了一些优化，如果该表创建了二级索引，其会通过全索引扫描的方式来代替全表扫描进行累加计数，

毕竟，二级索引值只存储了索引列和主键列两个字段，遍历计数肯定比存储所有字段的数据表的 IO 次数少很多，也就意味着其执行效率更高。

而且，MySQL 的优化器会选择最小的那个二级索引的索引文件进行遍历计数。

所以，这个技术面试题严谨的问法应该是 —— MySQL InnoDB 存储引擎单表过亿数据，如何优化 count(*) 全表的操作？

下面我们就来列举几个常见的技术解决方案，如下图所示：

（1）Redis 累加计数

这是一种最主流且简单直接的实现方式。

由于我们基本上不会对数据表执行 delete 操作，所以当有新的数据被写入表的时候，通过 Redis 的 incr 或 incrby 命令进行累加计数，并在用户查询汇总数据的时候直接返回结果即可。

如下图所示：

该实现方式在查询性能和数据准确性上两者兼得，Redis 需要同时负责累加计数和返回查询结果操作，缺点在于会引入缓存和数据库间的数据一致性的问题。

（2）MySQL 累加计数表 + 事务

这种实现方式跟“Redis 累加计数”大同小异，唯一的区别就是将计数的存储介质从 Redis 换成了 MySQL。

如下图所示：

但这么一换，就可以将写入表操作和累加计数操作放在一个数据库事务中，也就解决了缓存和数据库间的数据一致性的问题。

该实现方式在查询性能和数据准确性上两者兼得，但不如“Redis 累加计数”方式的性能高，在高并发场景下数据库会成为性能瓶颈。

（3）MySQL 累加计数表 + 触发器

这种实现方式跟“MySQL 累加计数表 + 事务”的表结构是一样的，如下图所示：

****

唯一的区别就是增加一个触发器，不用在工程代码中通过事务进行实现了。

CREATE TRIGGER `user_count_trigger` AFTER INSERT ON `user` FOR EACH ROW BEGIN    UPDATE user_count SET count = count + 1 WHERE id = NEW.id;END

该实现方式在查询性能和数据准确性上两者兼得，与“MySQL 累加计数表 + 事务”方式相比，最大的好处就是不用污染工程代码了。

（4）MySQL 增加并行线程

在 MySQL 8.014 版本中，总算增加了并行查询的新特性，其通过参数 innodb_parallel_read_threads 进行设定，默认值为 4。

下面我们做个实验，将这个参数值调得大一些：

set local innodb_parallel_read_threads = 16;

然后，我们再来执行一次上文中那个 3000 多万行记录 user 表的全表 count 操作，结果如下所示：

参数调整后，执行全表 count 操作的时间由之前的 14.8 秒，降低至现在的 6.1 秒，是可以看到效果的。

接下来，我们继续将参数值调整得大一些，看看是否还有优化空间：

set local innodb_parallel_read_threads = 32;

然后，我们再来执行一次上文中那个 3000 多万行记录 user 表的全表 count 操作，结果如下所示：

参数调整后，执行全表 count 操作的时间竟然变长了，从原来的 6.1 秒变成了 6.8 秒，看样子优化空间已经达到上限了，再多增加执行线程数量只会适得其反。

该实现方式一样可以保证数据准确性，在查询性能上有所提升但相对有限，其最大优势是只需要调整一个数据库参数，在工程代码上不会有任何改动。

不过，如果数据库此时的负载和 IOPS 已经很高了，那开启并行线程或者将并行线程数量调大，会加速消耗数据库资源。

（5）MySQL 增加二级索引

还记得我们在上文中说的内容吗？

InnoDB 存储引擎对 count() 操作也进行了一些优化，如果该表创建了二级索引，其会通过全索引扫描的方式来代替全表扫描进行累加计数，*

毕竟，二级索引值只存储了索引列和主键列两个字段，遍历计数肯定比存储所有字段的数据表的IO次数少很多，也就意味着执行效率更高。

而且，MySQL 的优化器会选择最小的那个二级索引的索引文件进行遍历计数。

为了验证这个说法，我们给 user 表中最小的 sex 字段加一个二级索引，然后通过 EXPLAIN 命令看一下 SQL 语句的执行计划：

果然，这个 SQL 语句的执行计划会使用新建的 sex 索引，接下来我们执行一次看看时长：

果不其然，执行全表 count 操作走了 sex 二级索引后，SQL 执行时间由之前的 14.8 秒降低至现在的 10.6 秒，还是可以看到效果的。

btw：大家可能会觉得效果并不明显，这是因为我们用来测试的 user 表中算上主键 ID 只有七个字段，而且没有一个大字段。

反之，user 表中的字段数量越多，且包含的大字段越多，其优化效果就会越明显。

该实现方式一样可以保证数据准确性，在查询性能上有所提升但相对有限，其最大优势是只需要创建一个二级索引，在工程代码上不会有任何改动。

（6）SHOW TABLE STATUS

如下图所示，通过 SHOW TABLE STATUS 命令也可以查出来全表的行数：

我们常用于查看执行计划的 EXPLAIN 命令也能实现：

只不过，通过这两个命令得出来的表记录数是估算出来的，都不太准确。那到底有多不准确呢，我们来计算一下。

公式为：33554432 / 33216098 = 1.01

就这个 case 而言，误差率大概在百分之一左右。

该实现方式一样可以保证查询性能，无论表中有多大量级的数据都能毫秒级返回结果，且在工程代码方面不会有任何改动，但数据准确性上相差较多，只能用作大概估算。

作者：托尼学长
来源：juejin.cn/post/7444919285170307107

收起阅读 »

订单超时自动取消，这7种方案真香！

Java

大家好，我是苏三，又跟大家见面了。前言在电商、外卖、票务等系统中，订单超时未支付自动取消是一个常见的需求。这个功能乍一看很简单，甚至很多初学者会觉得："不就是加个定时器么？" 但真到了实际工作中，细节的复杂程度往往会超乎预期。这里我们从基础到高级，逐步分析各种...

继续阅读 »

大家好，我是苏三，又跟大家见面了。

前言

在电商、外卖、票务等系统中，订单超时未支付自动取消是一个常见的需求。
这个功能乍一看很简单，甚至很多初学者会觉得："不就是加个定时器么？" 但真到了实际工作中，细节的复杂程度往往会超乎预期。
这里我们从基础到高级，逐步分析各种实现方案，最后分享一些在生产中常见的优化技巧，希望对你会有所帮助。
苏三最近开源了一个基于 SpringBoot+Vue+uniapp 的商城项目，欢迎访问和star。

1. 使用延时队列（DelayQueue）

适用场景： 订单数量较少，系统并发量不高。

延时队列是Java并发包（java.util.concurrent）中的一个数据结构，专门用于处理延时任务。

订单在创建时，将其放入延时队列，并设置超时时间。

延时时间到了以后，队列会触发消费逻辑，执行取消操作。

示例代码：

import java.util.concurrent.*;



public class OrderCancelService {

    private static final DelayQueue delayQueue = new DelayQueue<>();



    public static void main(String[] args) throws InterruptedException {

        // 启动消费者线程

        new Thread(() -> {

            while (true) {

                try {

                    OrderTask task = delayQueue.take(); // 获取到期任务

                    System.out.println("取消订单：" + task.getOrderId());

                } catch (InterruptedException e) {

                    Thread.currentThread().interrupt();

                }

            }

        }).start();



        // 模拟订单创建

        for (int i = 1; i <= 5; i++) {

            delayQueue.put(new OrderTask(i, System.currentTimeMillis() + 5000)); // 5秒后取消

            System.out.println("订单" + i + "已创建");

        }

    }



    static class OrderTask implements Delayed {

        private final long expireTime;

        private final int orderId;



        public OrderTask(int orderId, long expireTime) {

            this.orderId = orderId;

            this.expireTime = expireTime;

        }



        public int getOrderId() {

            return orderId;

        }



        @Override

        public long getDelay(TimeUnit unit) {

            return unit.convert(expireTime - System.currentTimeMillis(), TimeUnit.MILLISECONDS);

        }



        @Override

        public int compareTo(Delayed o) {

            return Long.compare(this.expireTime, ((OrderTask) o).expireTime);

        }

    }

}

优点：

实现简单，逻辑清晰。

缺点：

依赖内存，系统重启会丢失任务。
随着订单量增加，内存占用会显著上升。

2. 基于数据库轮询

适用场景： 订单数量较多，但系统对实时性要求不高。

轮询是最容易想到的方案：定期扫描数据库，将超时的订单状态更新为“已取消”。

示例代码：

public void cancelExpiredOrders() {

    String sql = "UPDATE orders SET status = 'CANCELLED' WHERE status = 'PENDING' AND create_time < ?";

    try (Connection conn = dataSource.getConnection();

         PreparedStatement ps = conn.prepareStatement(sql)) {

        ps.setTimestamp(1, new Timestamp(System.currentTimeMillis() - 30 * 60 * 1000)); // 30分钟未支付取消

        int affectedRows = ps.executeUpdate();

        System.out.println("取消订单数量：" + affectedRows);

    } catch (SQLException e) {

        e.printStackTrace();

    }

}

优点：

数据可靠性强，不依赖内存。
实现成本低，无需引入第三方组件。

缺点：

频繁扫描数据库，会带来较大的性能开销。
实时性较差（通常定时任务间隔为分钟级别）。

优化建议：

为相关字段加索引，避免全表扫描。
结合分表分库策略，减少单表压力。

3. 基于Redis队列

适用场景： 适合对实时性有要求的中小型项目。

Redis 的 List 或 Sorted Set 数据结构非常适合用作延时任务队列。

我们可以把订单的超时时间作为 Score，订单 ID 作为 Value 存到 Redis 的 ZSet 中，定时去取出到期的订单进行取消。

例子：

public void addOrderToQueue(String orderId, long expireTime) {

    jedis.zadd("order_delay_queue", expireTime, orderId);

}



public void processExpiredOrders() {

    long now = System.currentTimeMillis();

    Set<String> expiredOrders = jedis.zrangeByScore("order_delay_queue", 0, now);

    for (String orderId : expiredOrders) {

        System.out.println("取消订单：" + orderId);

        jedis.zrem("order_delay_queue", orderId); // 删除已处理的订单

    }

}

优点：

实时性高。
Redis 的性能优秀，延迟小。

缺点：

Redis 容量有限，适合中小规模任务。
需要额外处理 Redis 宕机或数据丢失的问题。

4. Redis Key 过期回调

适用场景：对超时事件实时性要求高，并且希望依赖 Redis 本身的特性实现简单的任务调度。

Redis 提供了 Key 的过期功能，结合 keyevent 事件通知机制，可以实现订单的自动取消逻辑。

当订单设置超时时间后，Redis 会在 Key 过期时发送通知，我们只需要订阅这个事件并进行相应的处理。

例子：

设置订单的过期时间：

public void setOrderWithExpiration(String orderId, long expireSeconds) {

    jedis.setex("order:" + orderId, expireSeconds, "PENDING");

}

订阅 Redis 的过期事件：

public void subscribeToExpirationEvents() {

    Jedis jedis = new Jedis("localhost");

    jedis.psubscribe(new JedisPubSub() {

        @Override

        public void onPMessage(String pattern, String channel, String message) {

            if (channel.equals("__keyevent@0__:expired")) {

                System.out.println("接收到过期事件，取消订单：" + message);

                // 执行取消订单的业务逻辑

            }

        }

    }, "__keyevent@0__:expired"); // 订阅过期事件

}

优点：

实现简单，直接利用 Redis 的过期机制。
实时性高，过期事件触发后立即响应。

缺点：

依赖 Redis 的事件通知功能，需要开启 notify-keyspace-events 配置。
如果 Redis 中大量使用过期 Key，可能导致性能问题。

注意事项：要使用 Key 过期事件，需要确保 Redis 配置文件中 notify-keyspace-events 的值包含 Ex。比如：

notify-keyspace-events Ex

最近就业形势比较困难，为了感谢各位小伙伴对苏三一直以来的支持，我特地创建了一些工作内推群，看看能不能帮助到大家。

你可以在群里发布招聘信息，也可以内推工作，也可以在群里投递简历找工作，也可以在群里交流面试或者工作的话题。

添加苏三的私人微信：su_san_java，备注：掘金+所在城市，即可加入。

5. 基于消息队列（如RabbitMQ）

适用场景：高并发系统，实时性要求高。

订单创建时，将订单消息发送到延迟队列（如RabbitMQ 的 x-delayed-message 插件）。

延迟时间到了以后，消息会重新投递到消费者，消费者执行取消操作。

示例代码（以RabbitMQ为例）：

public void sendOrderToDelayQueue(String orderId, long delay) {

    Map<String, Object> args = new HashMap<>();

    args.put("x-delayed-type", "direct");

    ConnectionFactory factory = new ConnectionFactory();

    try (Connection connection = factory.newConnection();

         Channel channel = connection.createChannel()) {

        channel.exchangeDeclare("delayed_exchange", "x-delayed-message", true, false, args);

        channel.queueDeclare("delay_queue", true, false, false, null);

        channel.queueBind("delay_queue", "delayed_exchange", "order.cancel");



        AMQP.BasicProperties props = new AMQP.BasicProperties.Builder()

                .headers(Map.of("x-delay", delay)) // 延迟时间

                .build();

        channel.basicPublish("delayed_exchange", "order.cancel", props, orderId.getBytes());

    } catch (Exception e) {

        e.printStackTrace();

    }

}

优点：

消息队列支持分布式，高并发下表现优秀。
数据可靠性高，不容易丢消息。

缺点：

引入消息队列增加了系统复杂性。
需要处理队列堆积的问题。

6. 使用定时任务框架

适用场景：订单取消操作复杂，需要分布式支持。

定时任务框架，比如：Quartz、Elastic-Job，能够高效地管理任务调度，适合处理批量任务。

比如 Quartz 可以通过配置 Cron 表达式，定时执行订单取消逻辑。

示例代码：

@Scheduled(cron = "0 */5 * * * ?")

public void scanAndCancelOrders() {

    System.out.println("开始扫描并取消过期订单");

    // 这里调用数据库更新逻辑

}

优点：

成熟的调度框架支持复杂任务调度。
灵活性高，支持分布式扩展。

缺点：

对实时性支持有限。
框架本身较复杂。

7. 基于触发式事件流处理

适用场景：需要处理实时性较高的订单取消，同时结合复杂业务逻辑，例如根据用户行为动态调整超时时间。

可以借助事件流处理框架（如 Apache Flink 或 Spark Streaming），实时地处理订单状态，并触发超时事件。

每个订单生成后，可以作为事件流的一部分，订单未支付时通过流计算触发超时取消逻辑。

示例代码（以 Apache Flink 为例）：

DataStream orderStream = env.fromCollection(orderEvents);



orderStream

    .keyBy(OrderEvent::getOrderId)

    .process(new KeyedProcessFunction() {

        @Override

        public void processElement(OrderEvent event, Context ctx, Collector out) throws Exception {

            // 注册一个定时器

            ctx.timerService().registerProcessingTimeTimer(event.getTimestamp() + 30000); // 30秒超时

        }



        @Override

        public void onTimer(long timestamp, OnTimerContext ctx, Collector out) throws Exception {

            // 定时器触发，执行订单取消逻辑

            System.out.println("订单超时取消，订单ID：" + ctx.getCurrentKey());

        }

    });

优点：

实时性高，支持复杂事件处理逻辑。
适合动态调整超时时间，满足灵活的业务需求。

缺点：

引入了流计算框架，系统复杂度增加。
对运维要求较高。

总结

每种方案都有自己的适用场景，大家在选择的时候，记得结合业务需求、订单量、并发量来综合考虑。
如果你的项目规模较小，可以直接用延时队列或 Redis；而在大型高并发系统中，消息队列和事件流处理往往是首选。
当然，代码实现只是第一步，更重要的是在实际部署和运行中进行性能调优，保证系统的稳定性。

作者：苏三说技术
来源：juejin.cn/post/7451018774743269391

收起阅读 »

妙用MyBatisPlus，12个实战技巧解锁新知识

Java

妙用MyBatisPlus，12个实战技巧解锁新知识前言说起数据库ORM，我忽然想起了小时候外婆做的那锅鲜美的羊肉汤。平常人家做的羊肉汤无非是几块肉、几片姜，味道寡淡得很，喝了和喝白开水差不多。但外婆的汤，那是另一回事儿 —— 一锅汤，香气四溢，肉质软烂，...

继续阅读 »

妙用MyBatisPlus，12个实战技巧解锁新知识

前言

说起数据库ORM，我忽然想起了小时候外婆做的那锅鲜美的羊肉汤。平常人家做的羊肉汤无非是几块肉、几片姜，味道寡淡得很，喝了和喝白开水差不多。但外婆的汤，那是另一回事儿 —— 一锅汤，香气四溢，肉质软烂，汤头浓郁得能让人连碗都想舔干净。

写代码何尝不是如此？以前写Mybatis，就像是在煮一锅没有灵魂的羊肉汤：原料都在，但就是不够鲜美。代码繁琐，每写一个查询都像是在不断调味，却怎么也调不出那种令人惊艳的味道。直到遇见MyBatisPlus，一切都变了 —— 这就像是从普通的羊肉汤，突然升级到了外婆秘制的顶级羊肉汤！

MyBatisPlus就像一位精通厨艺的帮厨，它帮你处理了所有繁琐的准备工作。想要一个复杂的查询？不用自己一刀一刀地切肉、一勺一勺地调味，框架已经帮你准备好了。你只需要轻轻地指挥，代码就像汤汁一样顺滑流畅，性能更是鲜美可口。

在接下来的篇幅里，我将与你分享12个MyBatisPlus优化的"秘制配方"。相信看完这些，你写的每一行代码，都会像外婆的羊肉汤一样，让人回味无穷。

耐心看完，你一定有所收获。

避免使用isNull判断

// ❌ 不推荐

LambdaQueryWrapper<User> wrapper1 = new LambdaQueryWrapper<>();

wrapper1.isNull(User::getStatus);



// ✅ 推荐：使用具体的默认值

LambdaQueryWrapper<User> wrapper2 = new LambdaQueryWrapper<>();

wrapper2.eq(User::getStatus, UserStatusEnum.INACTIVE.getCode());

📝 原因:
- 使用具体的默认值可以提高代码的可读性和维护性
- NULL值会使索引失效，导致MySQL无法使用索引进行查询优化
- NULL值的比较需要特殊的处理逻辑，增加了CPU开销
- NULL值会占用额外的存储空间，影响数据压缩效率

明确Select字段

// ❌ 不推荐

// 默认select 所有字段

List<User> users1 = userMapper.selectList(null);  



// ✅ 推荐：指定需要的字段

LambdaQueryWrapper<User> wrapper = new LambdaQueryWrapper<>();

wrapper.select(User::getId, User::getName, User::getAge);

List<User> users2 = userMapper.selectList(wrapper);

📝 原因:
- 避免大量无用字段的网络传输开销
- 可以利用索引覆盖，避免回表查询
- 减少数据库解析和序列化的负担
- 降低内存占用，特别是在大量数据查询时

批量操作方法替代循环

// ❌ 不推荐

for (User user : userList) {

    userMapper.insert(user);

}



// ✅ 推荐

userService.saveBatch(userList, 100);  // 每批次处理100条数据



// ✅ 更优写法：自定义批次大小

userService.saveBatch(userList, BatchConstants.BATCH_SIZE);

📝 原因:
- 减少数据库连接的创建和销毁开销
- 批量操作可以在一个事务中完成，提高数据一致性
- 数据库可以优化批量操作的执行计划
- 显著减少网络往返次数，提升吞吐量

Exists方法子查询

// ❌ 不推荐

wrapper.inSql("user_id", "select user_id from order where amount > 1000");



// ✅ 推荐

wrapper.exists("select 1 from order where order.user_id = user.id and amount > 1000");



// ✅ 更优写法：使用LambdaQueryWrapper

wrapper.exists(orderService.lambdaQuery()

    .gt(Order::getAmount, 1000)

    .apply("order.user_id = user.id"));

📝 原因:
- EXISTS是基于索引的快速查询，可以使用到索引
- EXISTS在找到第一个匹配项就会停止扫描
- IN子查询需要加载所有数据到内存后再比较
- 当外表数据量大时，EXISTS的性能优势更明显

使用orderBy代替last

// ❌ 不推荐：SQL注入风险

wrapper.last("ORDER BY " + sortField + " " + sortOrder);



// ❌ 不推荐：直接字符串拼接

wrapper.last("ORDER BY FIELD(status, 'active', 'pending', 'inactive')");



// ✅ 推荐：使用 Lambda 安全排序

wrapper.orderBy(true, true, User::getStatus);



// ✅ 推荐：多字段排序示例

wrapper.orderByAsc(User::getStatus)

       .orderByDesc(User::getCreateTime);

📝 原因:
- 直接拼接SQL容易导致SQL注入攻击
- 动态SQL可能破坏SQL语义完整性
- 影响SQL语句的可维护性和可读性
- last会绕过MyBatis-Plus的安全检查机制

使用LambdaQuery确保类型安全

// ❌ 不推荐：字段变更后可能遗漏

QueryWrapper<User> wrapper1 = new QueryWrapper<>();

wrapper1.eq("name", "张三").gt("age", 18);



// ✅ 推荐

LambdaQueryWrapper<User> wrapper2 = new LambdaQueryWrapper<>();

wrapper2.eq(User::getName, "张三")

        .gt(User::getAge, 18);



// ✅ 更优写法：使用链式调用

userService.lambdaQuery()

    .eq(User::getName, "张三")

    .gt(User::getAge, 18)

    .list();

📝 原因:
- 编译期类型检查，避免字段名拼写错误
- IDE可以提供更好的代码补全支持
- 重构时能自动更新字段引用
- 提高代码的可维护性和可读性

用between代替ge和le

// ❌ 不推荐

wrapper.ge(User::getAge, 18)

       .le(User::getAge, 30);



// ✅ 推荐

wrapper.between(User::getAge, 18, 30);



// ✅ 更优写法：条件动态判断

wrapper.between(ageStart != null && ageEnd != null,

               User::getAge, ageStart, ageEnd);

📝 原因:
- 生成的SQL更简洁，减少解析开销
- 数据库优化器可以更好地处理范围查询
- 代码更易读，语义更清晰
- 减少重复编写字段名的机会

排序字段注意索引

// ❌ 不推荐

// 假设lastLoginTime无索引

wrapper.orderByDesc(User::getLastLoginTime);  



// ✅ 推荐

// 主键排序

wrapper.orderByDesc(User::getId);  



// ✅ 更优写法：组合索引排序

wrapper.orderByDesc(User::getStatus)  // status建立了索引

       .orderByDesc(User::getId);     // 主键排序

📝 原因:
- 索引天然具有排序特性，可以避免额外的排序操作
- 无索引排序会导致文件排序，极大影响性能
- 当数据量大时，内存排序可能导致溢出
- 利用索引排序可以实现流式读取

分页参数设置

// ❌ 不推荐

wrapper.last("limit 1000");  // 一次查询过多数据



// ✅ 推荐

Page<User> page = new Page<>(1, 10);

userService.page(page, wrapper);



// ✅ 更优写法：带条件的分页查询

Page<User> result = userService.lambdaQuery()

    .eq(User::getStatus, "active")

    .page(new Page<>(1, 10));

📝 原因:
- 控制单次查询的数据量，避免内存溢出
- 提高首屏加载速度，优化用户体验
- 减少网络传输压力
- 数据库资源利用更合理

条件构造处理Null值

// ❌ 不推荐

if (StringUtils.isNotBlank(name)) {

    wrapper.eq("name", name);

}

if (age != null) {

    wrapper.eq("age", age);

}



// ✅ 推荐

wrapper.eq(StringUtils.isNotBlank(name), User::getName, name)

       .eq(Objects.nonNull(age), User::getAge, age);



// ✅ 更优写法：结合业务场景

wrapper.eq(StringUtils.isNotBlank(name), User::getName, name)

       .eq(Objects.nonNull(age), User::getAge, age)

       .eq(User::getDeleted, false)  // 默认查询未删除记录

       .orderByDesc(User::getCreateTime);  // 默认按创建时间倒序

📝 原因:
- 优雅处理空值，避免无效条件
- 减少代码中的if-else判断
- 提高代码可读性
- 防止生成冗余的SQL条件

⚠️ 下面就要来一些高级货了

查询性能追踪

// ❌ 不推荐：简单计时，代码冗余

public List<User> listUsers(QueryWrapper<User> wrapper) {

    long startTime = System.currentTimeMillis();

    List<User> users = userMapper.selectList(wrapper);

    long endTime = System.currentTimeMillis();

    log.info("查询耗时：{}ms", (endTime - startTime));

    return users;

}



// ✅ 推荐：使用 Try-with-resources 自动计时

public List<User> listUsersWithPerfTrack(QueryWrapper<User> wrapper) {

    try (PerfTracker.TimerContext ignored = PerfTracker.start()) {

        return userMapper.selectList(wrapper);

    }

}



// 性能追踪工具类

@Slf4j

public class PerfTracker {

    private final long startTime;

    private final String methodName;



    private PerfTracker(String methodName) {

        this.startTime = System.currentTimeMillis();

        this.methodName = methodName;

    }



    public static TimerContext start() {

        return new TimerContext(Thread.currentThread().getStackTrace()[2].getMethodName());

    }



    public static class TimerContext implements AutoCloseable {

        private final PerfTracker tracker;



        private TimerContext(String methodName) {

            this.tracker = new PerfTracker(methodName);

        }



        @Override

        public void close() {

            long executeTime = System.currentTimeMillis() - tracker.startTime;

            if (executeTime > 500) {

                log.warn("慢查询告警：方法 {} 耗时 {}ms", tracker.methodName, executeTime);

            }

        }

    }

}

📝 原因:
- 业务代码和性能监控代码完全分离
- try-with-resources 即使发生异常，close() 方法也会被调用，确保一定会记录耗时
- 不需要手动管理计时的开始和结束
- 更优雅

枚举类型映射

// 定义枚举

public enum UserStatusEnum {

    NORMAL(1, "正常"),

    DISABLED(0, "禁用");



    @EnumValue  // MyBatis-Plus注解

    private final Integer code;

    private final String desc;

}



// ✅ 推荐：自动映射

public class User {

    private UserStatusEnum status;

}



// 查询示例

userMapper.selectList(

    new LambdaQueryWrapper<User>()

        .eq(User::getStatus, UserStatusEnum.NORMAL)

);

📝 原因:
- 类型安全
- 自动处理数据库和枚举转换
- 避免魔法值
- 代码可读性更强

自动处理逻辑删除

@TableLogic  // 逻辑删除注解

private Integer deleted;



// ✅ 推荐：自动过滤已删除数据

public List<User> getActiveUsers() {

    return userMapper.selectList(null);  // 自动过滤deleted=1的记录

}



// 手动删除

userService.removeById(1L);  // 实际是更新deleted状态

📝 原因:
- 数据不丢失
- 查询自动过滤已删除数据
- 支持数据恢复
- 减少手动编写删除逻辑

📷 注意：
- XML中需要手动拼接 deleted = 1

乐观锁更新保护

public class Product {

    @Version  // 乐观锁版本号

    private Integer version;

}



// ✅ 推荐：更新时自动处理版本

public boolean reduceStock(Long productId, Integer count) {

    LambdaUpdateWrapper<Product> wrapper = new LambdaUpdateWrapper<>();

    wrapper.eq(Product::getId, productId)

           .ge(Product::getStock, count);

    

    Product product = new Product();

    product.setStock(product.getStock() - count);

    

    return productService.update(product, wrapper);

}

📝 原因:
- 防止并发冲突
- 自动处理版本控制
- 简化并发更新逻辑
- 提高数据一致性

递增和递减：setIncrBy 和 setDecrBy

// ❌ 不推荐：使用 setSql

userService.lambdaUpdate()

    .setSql("integral = integral + 10")

    .update();



// ✅ 推荐：使用 setIncrBy

userService.lambdaUpdate()

    .eq(User::getId, 1L)

    .setIncrBy(User::getIntegral, 10)

    .update();



// ✅ 推荐：使用 setDecrBy

userService.lambdaUpdate()

    .eq(User::getId, 1L)

    .setDecrBy(User::getStock, 5)

    .update();

📝 原因:
- 类型安全
- 避免手动拼接sql，防止sql注入
- 代码可维护性更强，更清晰

总结

写代码如烹小鲜，讲究的是精细和用心。就像一碗好汤，不仅仅在于锅和火候，更在于厨师对食材的理解和尊重。MyBatisPlus的这12个优化技巧，何尝不是程序员对代码的一种尊重和雕琢？

还记得文章开头说的外婆的羊肉汤吗？优秀的代码，和一碗好汤，都需要用心。每一个细节，每一个调整，都是为了让最终的成果更加完美。MyBatisPlus就像是厨房里的得力助手，它帮你处理繁琐，让你专注于创造。

当你掌握了这些技巧，你的代码将不再是简单的指令堆砌，而是一首优雅的诗，一曲悦耳的交响乐。它们将像外婆的羊肉汤一样，散发着独特的魅力，让人回味无穷。

愿每一位开发者，都能用MyBatisPlus，煮出属于自己的"秘制汤羹"！

代码，就应该是这个样子 —— 简单而不失优雅，高效而不失温度。

作者：一只叫煤球的猫
来源：juejin.cn/post/7436567167728812044

收起阅读 »

反射为什么慢？

Java

1. 背景今天刷到一篇文章，标题是反射为什么慢，一下子懵逼了，确实没想过这个问题；盲猜了一下是由于反射实际上是做了一个代理的动作，导致执行的效率是小于直接实体类去调用方法的。 2. 文章给出的解释文章中给出的理由是因为以下4点：反射涉及动态解析的内容，...

继续阅读 »

1. 背景

今天刷到一篇文章，标题是反射为什么慢，一下子懵逼了，确实没想过这个问题；盲猜了一下是由于反射实际上是做了一个代理的动作，导致执行的效率是小于直接实体类去调用方法的。

2. 文章给出的解释

文章中给出的理由是因为以下4点：

反射涉及动态解析的内容，不能执行某些虚拟机优化，例如JIT优化技术

在反射时，参数需要包装成object[]类型，但是方法真正执行的时候，又使用拆包成真正的类型，这些动作不仅消耗时间，而且过程中会产生很多的对象，这就会导致gc，gc也会导致延时

反射的方法调用需要从数组中遍历，这个遍历的过程也比较消耗时间

不仅需要对方法的可见性进行检查，参数也需要做额外的检查

3. 结合实际理解

3.1 第一点分析

首先我们需要知道，java中的反射是一种机制，它可以在代码运行过程中，获取类的内部信息（变量、构造方法、成员方法）；操作对象的属性、方法。
然后关于反射的原理，首先我们需要知道一个java项目在启动之后，会将class文件加载到堆中，生成一个class对象，这个class对象中有一个类的所有信息，通过这个class对象获取类相关信息的操作我们称为反射。

其次是JIT优化技术，首先我们需要知道在java虚拟机中有两个角色，解释器和编译器；这两者各有优劣，首先是解释器可以在项目启动的时候直接直接发挥作用，省去编译的时候，立即执行，但是在执行效率上有所欠缺；在项目启动之后，随着时间推移，编译器逐渐将机器码编译成本地代码执行，减少解释器的中间损耗，增加了执行效率。

我们可以知道JIT优化通常依赖于在编译时能够知道的静态信息，而反射的动态性可能会破坏这些假设，使得JIT编译器难以进行有效的优化。

3.2 第二点

关于第二点，我们直接写一段反射调用对象方法的demo：

@Test

public void methodTest() {

    Class clazz = MyClass.class;



    try {

        //获取指定方法

        //这个注释的会报错 java.lang.NoSuchMethodException

        //Method back = clazz.getMethod("back");

        Method back = clazz.getMethod("back", String.class);

        Method say = clazz.getDeclaredMethod("say", String.class);

        //私有方法需要设置

        say.setAccessible(true);

        MyClass myClass = new MyClass("abc", 99);

        //反射调用方法

        System.out.println(back.invoke(myClass, "back"));



        say.invoke(myClass, "hello world");

    } catch (Exception e) {

        e.printStackTrace();

    }

}

在上面这段代码中，我们调用了一个invoke 方法，并且传了class对象和参数，进入到invoke方法中，我们可以看到invoke方法的入参都是Object类型的，args更是一个Object 数组，这就第二点，关于反射调用过程中的拆装箱。

@CallerSensitive

public Object invoke(Object obj, Object... args)

    throws IllegalAccessException, IllegalArgumentException,

        InvocationTargetException

{

    if (!override) {

        if (!Reflection.quickCheckMemberAccess(clazz, modifiers)) {

            Class<?> caller = Reflection.getCallerClass();

            checkAccess(caller, clazz, obj, modifiers);

        }

    }

    MethodAccessor ma = methodAccessor;             // read volatile

    if (ma == null) {

        ma = acquireMethodAccessor();

    }

    return ma.invoke(obj, args);

}

3.3 第三点

关于调用方法需要遍历这点，还是上面那个demo，我们在获取Method 对象的时候是通过调用getMethod、getDeclaredMethod方法，点击进入这个方法的源码，我们可以看到如下代码：

private static Method searchMethods(Method[] methods,

                                    String name,

                                    Class<?>[] parameterTypes)

{

    Method res = null;

    String internedName = name.intern();

    for (int i = 0; i < methods.length; i++) {

        Method m = methods[i];

        if (m.getName() == internedName

            && arrayContentsEq(parameterTypes, m.getParameterTypes())

            && (res == null

                || res.getReturnType().isAssignableFrom(m.getReturnType())))

            res = m;

    }



    return (res == null ? res : getReflectionFactory().copyMethod(res));

}

我们可以看到，底层实际上也是将class对象的所有method遍历了一遍，最终才拿到我们需要的方法的，这也就是第二点，执行具体方法的时候需要遍历class对象的方法。

3.4 第四点

第4点说需要对方法和参数进行检查，也就是我们在执行具体的某一个方法的时候，我们实际上是需要校验这个方法是否可见的，如果不可见，我们还需要将这个方法设置为可见，否则如果我们直接调用这个方法的话，会报错。

同时还有一个点，在我们调用invoke方法的时候，反射类会对方法和参数进行一个校验，让我们来看一下源码：

@CallerSensitive

public Object invoke(Object obj, Object... args)

    throws IllegalAccessException, IllegalArgumentException,

        InvocationTargetException

{

    if (!override) {

        if (!Reflection.quickCheckMemberAccess(clazz, modifiers)) {

            Class<?> caller = Reflection.getCallerClass();

            checkAccess(caller, clazz, obj, modifiers);

        }

    }

    MethodAccessor ma = methodAccessor;             // read volatile

    if (ma == null) {

        ma = acquireMethodAccessor();

    }

    return ma.invoke(obj, args);

}

我们可以看到还有quickCheckMemberAccess、checkAccess 等逻辑

4. 总结

平时在反射这块用的比较少，也没针对性的去学习一下。在工作之余，还是得保持一个学习的习惯，这样子才不会出现今天这种被一个问题难倒的情况，而且才能产出更多、更优秀的方案。

作者：喜欢小钱钱
来源：juejin.cn/post/7330115846140051496

收起阅读 »

从 Java 8 到 Java 17：你真的会用 Stream API 吗

Java

自从 Java 8 引入 Stream API，Java 开发者可以更方便地对集合进行操作，比如过滤、映射、排序等。 Stream API 提供了一种声明式编程风格，让代码更简洁、可读性更高。不过，虽然 Stream API 看起来很优雅，实际使用中可能会遇到...

继续阅读 »

自从 Java 8 引入 Stream API，Java 开发者可以更方便地对集合进行操作，比如过滤、映射、排序等。

Stream API 提供了一种声明式编程风格，让代码更简洁、可读性更高。不过，虽然 Stream API 看起来很优雅，实际使用中可能会遇到一些性能问题和常见陷阱。

今天，我们就聊聊在 Java 8 到 Java 17 之间，Stream API 的性能优化技巧，以及我们可能踩到的那些坑。

1. Stream API 的优势

Stream 是一个抽象化的数据管道，允许我们以声明式的方式处理数据集合。Stream 的两个主要功能是：中间操作 和 终端操作。

中间操作：如 filter(), map()，这些操作是惰性的（lazy），不会立即执行。

终端操作：如 collect(), forEach()，这些操作会触发 Stream 的实际执行。

Java 8 的 Stream 使代码看起来更清晰，但它在使用时也带来了一些需要注意的地方，尤其是在处理大数据集时的性能。

2. Stream API 常见的性能陷阱

2.1 多次创建 Stream 导致浪费

在开发中，如果对同一个集合多次创建 Stream，可能会导致重复计算。例如：

List<String> names = Arrays.asList("Alice", "Bob", "Charlie", "David");



// 多次创建 Stream

long countA = names.stream().filter(name -> name.startsWith("A")).count();

long countB = names.stream().filter(name -> name.startsWith("B")).count();

在上面的代码中，names.stream() 被调用了两次，导致每次都从头开始扫描集合。可以优化为一次操作：

Map<String, Long> result = names.stream()

        .collect(Collectors.groupingBy(name -> name.substring(0, 1), Collectors.counting()));

这样做的好处是只遍历一次集合，减少不必要的开销。

2.2 避免使用 `forEach` 进行数据聚合

forEach 是一个常见的终端操作，但它在很多场景下并不是最优解，尤其是在需要聚合数据时：

List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);

List<Integer> result = new ArrayList<>();

numbers.stream().forEach(result::add);  // 这种方式不推荐

这里直接通过 forEach 操作来修改外部集合，会失去 Stream 的声明式风格，甚至可能出现线程安全问题。更好的做法是使用 collect：

List<Integer> result = numbers.stream().collect(Collectors.toList());

这种方式不仅代码更简洁，还能保证线程安全，特别是在并行流的场景下。

简单说说声明式和命令式

Stream API 提供了一种声明式的编程风格，让你可以专注于“做什么”，而不是“怎么做”。使用 forEach 来修改外部集合是一个命令式的做法，涉及了外部状态的修改，这样就打破了 Stream 的声明式优势。

相比之下在使用 collect 的例子中，代码更简洁且更易读，表达了你的意图是“收集这些元素”，而不是“对每个元素进行操作”。

2.3 滥用并行流

Java 8 引入了并行流（Parallel Stream），它可以通过 stream().parallel() 方法来让 Stream 操作并行化。然而，并行流并不总是能带来性能提升：

// 生成一个 0~999999 的数字列表

List<Integer> numbers = IntStream.range(0, 1000000).boxed().collect(Collectors.toList());



// 直接使用并行流

long start1 = System.currentTimeMillis();

long sum = numbers.parallelStream().mapToInt(Integer::intValue).sum();

long end1 = System.currentTimeMillis();

System.out.println("并行流执行时间：" + (end1 - start1) + "ms");

System.out.println(sum);



// 使用普通流

long start2 = System.currentTimeMillis();

long sum2 = numbers.stream().mapToInt(Integer::intValue).sum();

long end2 = System.currentTimeMillis();

System.out.println("普通流执行时间：" + (end2 - start2) + "ms");

System.out.println(sum2);

> 并行流的适用场景是计算量较大、数据量足够多的情况下。如果数据量较小，或者 Stream 操作较简单，使用并行流反而会带来线程切换的开销，导致性能下降。

2.4 `limit()` 和 `skip()` 的误用

limit() 和 skip() 可以限制 Stream 的数据量，但要注意它们的相对位置。如果在 filter() 之后使用 limit()，可能会带来不必要的性能消耗：

List<Integer> numbers = IntStream.range(0, 1_000_000).boxed().collect(Collectors.toList());



// 过滤偶数，然后取前 10 个

List<Integer> result = numbers.stream()

    .filter(n -> n % 2 == 0)

    .limit(10)

    .collect(Collectors.toList());

这种情况下，filter() 会对 1,000,000 个元素逐个过滤，直到找到前 10 个符合条件的元素。更高效的方式是先 limit()，再进行其他操作：

List<Integer> result = numbers.stream()

    .limit(20)  // 先取出前 20 个

    .filter(n -> n % 2 == 0)  // 再进行过滤

    .collect(Collectors.toList());

这样，Stream 只会处理有限的元素，性能会更好。

3. Stream API 性能优化技巧

3.1 使用 `toArray()` 而不是 `collect(Collectors.toList())`

如果我们只需要将 Stream 转换为数组，使用 toArray() 是更快的选择：

String[] array = names.stream().toArray(String[]::new);

相比 collect(Collectors.toList())，toArray() 在实现上更直接，尤其在处理大量数据时可以减少内存分配的开销。

collect(Collectors.toList()) ：这个方法首先创建一个 ArrayList，然后将所有元素添加到这个列表中。在这个过程中，ArrayList 可能会经历多次扩容，每次扩容都需要新建一个更大的数组，并将现有元素复制到新数组中。这种重复的内存分配和数组复制操作在处理大量数据时会增加开销。

toArray() ：这个方法直接生成一个数组，避免了 ArrayList 的扩容过程。

3.2 避免不必要的装箱与拆箱

在处理基本数据类型时，使用 mapToInt()、mapToDouble() 这样的基本类型专用方法，可以避免不必要的装箱和拆箱操作，提高性能：

List<Integer> numbers = IntStream.range(0, 10000000).boxed().collect(Collectors.toList());

long start1 = System.currentTimeMillis();

// 使用 map 导致装箱和拆箱

int sumWithMap = numbers.stream()

        .map(n -> n)  // 装箱

        .reduce(0, Integer::sum);  // 拆箱

long end1 = System.currentTimeMillis();

System.out.println("sumWithMap: " + sumWithMap + " time: " + (end1 - start1));



long start2 = System.currentTimeMillis();

// 使用 mapToInt 避免装箱和拆箱

int sumWithMapToInt = numbers.stream()

        .mapToInt(n -> n)  // 直接处理基本类型

        .sum();

long end2 = System.currentTimeMillis();

System.out.println("sumWithMapToInt: " + sumWithMapToInt + " time: " + (end2 - start2));

如果直接使用 `map()` 会导致频繁的装箱和拆箱，降低性能。

3.3 尽量使用 `forEachOrdered()`

在并行流中，forEach() 的执行顺序是非确定性的，如果我们希望按原来的顺序处理数据，使用 forEachOrdered() 可以保证顺序，但会稍微影响性能。

numbers.parallelStream().forEachOrdered(System.out::println);

3.4 减少链式调用中的中间操作

每个中间操作都会产生一个新的 Stream 实例，如果链式调用过多，会增加调用栈的深度，影响性能。尽量合并中间操作来减少链条长度：

// 原始链式调用

List<String> result = names.stream()

    .filter(name -> name.length() > 3)

    .map(String::toUpperCase)

    .filter(name -> name.startsWith("A"))

    .collect(Collectors.toList());



// 优化后的调用

List<String> resultOptimized = names.stream()

    .filter(name -> name.length() > 3 && name.startsWith("A"))

    .map(String::toUpperCase)

    .collect(Collectors.toList());

通过合并 filter 的条件，可以减少 Stream 的中间操作，提升性能。

4. 从 Java 8 到 Java 17 的改进

Java 9 到 Java 17 中，Stream API 进行了多次优化和功能增强：

Java 9 引入了 takeWhile() 和 dropWhile() 方法，这些方法允许我们基于条件对 Stream 进行分割，性能上比过滤操作更高效。
```
List<Integer> limitedNumbers = numbers.stream()

    .takeWhile(n -> n < 100)

    .collect(Collectors.toList());
```

Java 10 开始，Collectors.toUnmodifiableList() 提供了一种方法来创建不可修改的集合，适用于需要更严格集合控制的场景。

Java 16 增加了对 Stream.toList() 的支持，方便直接将流转换为不可变的 List：
```
List<String> immutableList = names.stream().filter(n -> n.length() > 3).toList();
```

Java 17 进一步优化了 Stream 的性能，特别是在并行流的实现上，使其在多核环境下能够更高效地利用硬件资源。

5. 总结

Stream API 在 Java 8 引入后，可以说是极大地提高了代码的可读性和简洁性，但也带来了性能优化和陷阱需要注意。从 Java 8 到 Java 17 的不断优化中，我们可以看到 Stream API 逐渐变得更强大和高效。

要想充分利用 Stream API，开发者需要意识到 Stream 的惰性求值特点，避免重复计算和不必要的装箱、拆箱操作。同时，并行流的使用应在充分评估场景后进行，避免反而拖累性能。

希望这篇文章能帮助你更好地掌握 Java Stream API 的优化技巧，在开发中写出更高效、更优雅的代码！

若有勘误，烦请不吝赐教。

作者：奔跑的毛球
来源：juejin.cn/post/7419984211144736808

收起阅读 »

SpringBoot 中实现订单30分钟自动取消

Java

在涉及到支付的业务时，通常需要实现一个功能:如果用户在生成订单的一定时间内未完成支付，系统将自动取消订单。本文将基于Spring Boot框架实现订单30分钟内未支付自动取消的几种方案，并提供实例代码。方案一：定时任务利用@Scheduled注解，我们可以...

继续阅读 »

在涉及到支付的业务时，通常需要实现一个功能:如果用户在生成订单的一定时间内未完成支付，系统将自动取消订单。本文将基于Spring Boot框架实现订单30分钟内未支付自动取消的几种方案，并提供实例代码。

方案一：定时任务

利用@Scheduled注解，我们可以轻松实现定时任务，周期性扫描订单记录，检查未支付的订单，如果有满足三十分钟则进行关闭。

@Component

public class OrderSchedule {

    @Autowired

    private OrderService orderService;



    @Scheduled(cron = "0 0/1 * * * ?")

    public void cancelUnpaidOrders() {

        LocalDateTime now = LocalDateTime.now();

        List<Integer> idList = new ArrayList<Integer>();

        List<OrderEntity> orderList = orderService.getOrderList();

        orderList.forEach(order -> {

            if (order.getWhenCreated().plusMinutes(30).isBefore(now)) {

                idList.add(order.getId());

          }

        });

        orderService.cancelOrderList(idList);

        }

}

方案二：延迟队列

使用消息队列的延迟队列，当订单生成时将订单ID推送到延迟队列，设置30分钟后过期，过期后消费该消息，判断订单状态，如果未支付则取消订单。

@Service

public class OrderService {



    @Autowired

    private RabbitTemplate rabbitTemplate;



    public void createOrder(Order order) {

        // 保存数据库

        saveOrder(order);



        // 将订单ID推送至延迟队列

        rabbitTemplate.convertAndSend("orderDelayExchange", "orderDelayKey", order.getId(), message -> {

            message.getMessageProperties().setDelay(30 * 60 * 1000); // 设置延迟时间

            return message;

        });

    }

}



@Component

public class OrderDelayConsumer {



    @Autowired

    private OrderService orderService;



    @RabbitHandler

    @RabbitListener(queues = "orderDelayQueue")

    public void cancelOrder(String orderId) {

        // 取消订单

        orderService.cancelOrder(orderId);

    }

}

方案三：redis过期事件

使用redis的key过期事件，当订单创建时在Redis中存储一个key，设置30分钟过期，key过期时通过redis的过期事件通知功能触发订单取消。

@Service

public class OrderService {



    @Autowired

    private StringRedisTemplate redisTemplate;



    public void createOrder(Order order) {

        // 保存订单至数据库

        saveOrder(order);



        // 在redis中存储一个key，设置30分钟过期

        redisTemplate.opsForValue().set("order:" + order.getId(), order.getId(), 30, TimeUnit.MINUTES);

    }



    // 当key过期时，redis会自动调用该方法（需要配置redis的过期事件通知）

    public void onOrderKeyExpired(String orderId) {

        cancelOrder(orderId);

    }

}

注：redis的key过期通知是一种典型的发布-订阅模式。在redis中，我们可以订阅到某些特定的事件。key过期事件就是其中之一。但想要使用这个功能，需要redis服务器开启相关配置。具体如何配置会在后期的文章里分享给大家。

最后总结：

三种方案都可以实现订单在30分钟内未支付则自动取消的需求。根据实际业务需求、系统负载和其他因素，可以选择最适合自己系统的实现方案。每种方案都有其优缺点，需要根据具体情况权衡。

作者：程序员小小
来源：juejin.cn/post/7340907184640065536

收起阅读 »

舒服了，学习了，踩到一个 Lombok 的坑！

Java

你好呀，我是歪歪。踩坑了啊，最近踩了一个 lombok 的坑，有点意思，给你分享一波。我之前写过一个公共的服务接口，这个接口已经有好几个系统对接并稳定运行了很长一段时间了，长到这个接口都已经交接给别的同事一年多了。因为是基础服务嘛，相对稳定，所以交出去之...

继续阅读 »

你好呀，我是歪歪。

踩坑了啊，最近踩了一个 lombok 的坑，有点意思，给你分享一波。

我之前写过一个公共的服务接口，这个接口已经有好几个系统对接并稳定运行了很长一段时间了，长到这个接口都已经交接给别的同事一年多了。

因为是基础服务嘛，相对稳定，所以交出去之后他也一直没有动过这部分代码。

但是有一天有新服务要对接这个接口，同事反馈说遇到一个诡异的问题，这个新服务调用的时候，接口里面报了一个空指针异常。

根据日志来看，那一行代码大概是这样的：

//为了脱敏我用field1、2、3来代替了

if(reqDto.getField1() 

    && reqDto.getField2()!=null

    && reqDto.getField3()!=null){

        //满足条件则执行对应业务逻辑

    }

reqDto 是接口入参对象，有好多字段。具体到 field1、2、3 大概是这样的：

@Data

@Builder

@NoArgsConstructor

@AllArgsConstructor

public class ReqDto { 

    private Boolean field1 = true;

    private String field2;

    private String field3;

}

所以看到这一行抛出了空指针异常，我直接就给出了一个结论：首先排除 field1 为 null，因为有默认值。那只可能 reqDto 传进来的就是 null，导致在 get 字段的时候出现了空指针异常。

但是很不幸，这个结论一秒就被推翻了。

因为 reqDto 是请求入参，在方法入口处选了几个关键字段进行打印。

如果 reqDto 是 null 的话，那么日志打印的时候就会先抛出空指针异常了。

然后我又开始怀疑是部署的代码版本和我们看的版本不一致，可能并不是这一行报错。

和测试同学确认之后，也排除了这个方向。

盯着报错的那一行代码又看了几秒，排除所有不可能之后，我又下了一个结论：调用的时候，传递进来的 field1 主动设值为了 null。

也就是说调用方有这样的代码：

ReqDto reqDto = new ReqDto();

reqDto.setField1(null);

我知道，这样的代码看起来很傻，但是确实只剩下这一种可能了。

于是我去看了调用方构建参数的写法，准备吐槽一波为什么要写设置为 null 这样的坑爹代码。

然而，当时我就被打脸了，调用方的代码是这样的：

ReqDto reqDto = ReqDto.builder()

        .field2("why")

        .field3("max")

        .build();

用的是 builder 模式构建的对象，并不是直接 new 出来的对象。

我一眼看着这个代码也没有发现毛病，虽然没有对 Boolean 类型的 field1 进行设值，但是我有默认值啊。

问调用方为什么不设值，对方的回答也是一句话：我看你有默认值，我本来也是想传 true，但是一看你的默认值就是 true，所以就没有给值了。

对啊，这逻辑无懈可击啊，难道......

是 builder 在里面搞事情了？

于是我里面写了一个代码进行了验证：

好你个浓眉大眼的 @Builder，果然是你在搞事情。

问题现象基本上就算是定位到了，用 @Builder 注解的时候，丢失默认值了。

所以拿着 “@Builder 默认值” 这样的关键词一搜：

立马就能找到这样的一个注解：@Builder.Default

对应到我的案例应该是这样的：

@Data

@Builder

@NoArgsConstructor

@AllArgsConstructor

public class ReqDto { 

    @Builder.Default

    private Boolean field1 = true;

    private String field2;

    private String field3;

}

这样，再次运行 Demo 就会发现有默认值了：

同时我们从两个写法生成的 class 文件中也可以看出一些端倪。

没有@Builder.Default 注解的时候，class 文件中 ReqDtoBuilder 类中关于 field1 字段是这样的：

但是有 @Builder.Default 注解的时候，是这样的：

明显是不同的处理方式。

反正，网上一搜索，加上 @Builder.Default 注解，问题就算是解决了。

但是紧接着我想到了另外一个问题：为什么？

为什么我明明给了默认值，@Builder 不使用，非得给再显示的标记一下呢？

于是我带着这个问题在网上冲了一大圈，不说没有找到权威的回答了，甚至没有找到来自“民间”的回答。

所以我也只能个人猜测一下，我觉得可能是 Lombok 觉得这样的赋默认值的写法是 Java 语言的规范：

private Boolean field1 = true;

规范我 Lombok 肯定遵守，但是我怎么知道你这个字段有没有默认值呢？

我肯定是有手段去检查的，但是我必须要每个字段都盲目的去瞅一眼，这个方案对我不友好啊。

这样，我给使用者定一个规范：你给我打个标，主动告诉我那些字段是有默认值的。对于打了标的字段，我才去解析对应的默认值，否则我就不管了。

如果你直接 new 对象，那是 Java 的规范，我管不了。

但是如果你使用 Builder 模式，你就得遵守我的规范。不然出了问题也别赖我，谁叫你不准守我的规范。

打个标，就是 @Builder.Default。

必须要强调的是，这个观点是歪师傅纯粹的个人想法，不保真。如果你有其他的看法也可以提出来一起交流，学习一波。

吃个瓜

虽然我没有找到关于 @Builder.Default 注解存在的意义的官方说明，但是我在 github 上找到了这个一个链接：

github.com/projectlomb…

里面的讨论的问题和我们这个注解有点关系，而且我认为这是一个非常明确的 bug，但是官方却当做 feature 给处理了。

简单的一起吃个瓜。

2017 年 3 月 29 日的时候，一个老哥抛出了一个问题。

首先我们看一下提出问题的老哥给的代码：

就上面这个代码，如果我们这样去创建对象：

MyClass myClass = new MyClass();

按照 Java 规范来说，我们附了默认值的，调用 myClass.getEntitlements() 方法返回的肯定是一个空集合嘛。

但是，这个老哥说当 new MyClass 对象的时候，这个字段变成了 null：

他就觉得很奇怪，于是抛出了这个问题。

然后另外有人立马补充了一下。说不仅是 list/set/map，任何其他 non-primitive 类型都会出现这个问题：

啥意思呢，拿我们前面的案例来说就是，你用 1.16.16 这个版本，不加 @Builder.Default 注解，运行结果是符合预期的：

但是加上 @Builder.Default 注解，运行结果会变成这样：

build 倒是正确了，但是 new 对象的时候，你把默认值直接给干没了。

看到这个运行结果的第一个感觉是很奇怪，第二个感觉是这肯定是 lombok 的 BUG。

问题抛出来之后，紧接着就有老哥来讨论了：

这个哥们直接喊话官方：造孽啊，这么大个 BUG 还有没有人管啦？

同时他还抛出了一个观点：老实说，为字段生成默认值的最直观方法就是从字段初始化中获取值，而不是需要额外的 Builder.Default 注解来标记。

这个观点，和我前面的想法倒是不谋而合。但是还是那句话：一切解释权归官方所有，你要用，就得遵守我制定的规范。

那么到底是改了啥导致产生了这么一个奇怪的 BUG 呢？

注意 omega09 这个老哥的发言的后半句：field it will be initialized twice.

initialized twice，初始化两次，哪来的两次？

我们把目光放到这里来：

@NoArgsConstructor，这是个啥东西？

这不就是让 lombok 给我们搞一个无参构造函数吗？

搞无参构造函数的时候，不是得针对有默认值的字段，进行一波默认值的初始化吗？

这个算一次了。

前面我们分析了 @Builder.Default 也要对有默认值的字段初始化一次。

所以是 twice，而且这两次干得都是同一个活。

开发者一看，这不行啊，得优化啊。

于是把 @NoArgsConstructor 的初始化延迟到了 @Builder.Default 里面去，让两次合并为一次了。

这样一看，用 Builder 模式的时候确实没问题了，但是用 new 的时候，默认值就没了。

这是一种经典的顾头不顾尾的解决问题的方式。

作者可能也没想到，大家在使用的时候会把 @Builder 和 @NoArgsConstructor 两个注解放在一起用。

作者可能还觉得委屈呢：这明明就是两种不同的对象构建方式啊，二选一就行了，你要放在一起？哎哟，你干嘛~

接着一个叫做 davidje13 的老哥接过了话茬，顺着 omega09 老哥的话往下说，他除了解释两个注解放在一起使用的场景外，还提到了一个词：least-surprise。

least-surprise，是一个软件设计方面的词汇，翻译过来就是最小惊吓原则。

简单来说就是我们的程序所表现出的行为，应该尽量满足在其领域内具有一致性、显而易见、可预测、遵循惯例。

比如我们认为的惯例是 new 对象的时候，如果有默认值会附上默认值。

结果你这个就搞没了，就不遵循惯例了。

当然，你还是可以拿出那句万金油的话：一切解释权归官方所有，你要用，就得遵守我制定的规范。我的规范就是不让你们混用。

这就是纯纯的耍无赖了，相当于是做了一个违背祖宗的决定。

然而这个问题似乎并没有官方人员参与讨论，直到这个时候，2018 年 3 月 27 日：

rspiller 就是官方人员，他说：我们正在调查此事。

此时，距离这个问题提出的时间已经过去了一年。

我是比较吃惊的，因为我认为这是一个比较严重的 BUG 了，程序员在使用的时候会遇到一些就类似于我认为这个字段一定是有默认值的，但是实际上却变成了 null 这种莫名其妙的问题。

在官方人员介入之后，这个问题再次活跃起来。

一位 xak2000 老哥也发表了自己的看法，并艾特了官方人员：

他的观点我是非常认同的，给你翻译一波。

他说，导致这个问题的原因是为了消除可能出现的重复初始化。但实际上，与修改 POJO 字段的默认初始化这种完全出乎意料的行为相比，重复初始化的问题要小得多。

当然，解决这个问题的最佳方法是以某种方式摆脱双重初始化，同时又不破坏字段初始化器。

但如果这不可能，或者太难，或者时间太长，那么，就让重复初始化发生吧！

然后把“重复初始化”写到 @Builder.Default javadocs 中，大不了再给这几个字加个粗。

如果有人确实写了一些字段初始化比较复杂的程序，这可能会导致一些问题，但比起该初始化却没有初始化带来的问题要少得多。

在当前的这个情况下，当突然抛出一个空指针异常的时候，我真的很蒙蔽啊。

当然了，也有人提出了不一样的看法：

这个哥们的核心思路刚刚相反，就是呼吁大家不要把 @Builder 和 @NoArgsConstructor 混着用。

从“点赞数”你也能看出来，大家都不喜欢这个方案。

而这个 BUG 是在 2018 年 7 月 26 日，1.18.2 版本中才最终解决的：

projectlombok.org/changelog

此时，距离这个问题提出，已经过去了一年又四个月。

值得注意的是，在官方的描述里面，用的是 FEATURE 而不是 BUGFIX。

个中差异，你可以自己去品一品。

但是现在 Lombok 都已经发展到 1.18.32 版本了，1.16.x 版本应该没有人会去使用了。

所以，大家大概率是不会踩到这个坑的。

我觉得这个事情，了解“坑”具体是啥不重要，而是稍微走进一下开源项目维护者的内心世界。

开源不易，有时候真的就挺崩溃的。

编译时注解

既然聊到 Lombok 了，顺便也简单聊聊它的工作原理。

Lombok 的核心工作原理就是编译时注解，这个你知道吧？

不知道其实也很正常，因为我们写业务代码的时候很少自定义编译时注解，顶天了搞个运行时注解就差不多了。

其实我了解的也不算深入，只是大概知道它的工作原理是什么样的，对于源码没有深入研究。

但是我可以给你分享一下两个需要注意的地方和可以去哪里了解这个玩意。

以 Lombok 的日志相关的注解为例。

首先第一个需要注意的地方是这里：

log 相关注解的源码位于这个部分，可以看到很奇怪啊，这些文件是以 SCL.lombok 结尾的，这是什么玩意？

这是 lombok 的小心思，其实这些都是 class 文件，但是为了避免污染用户项目，它做了特殊处理。

所以你打开这类文件的时候选择以 class 文件的形式打开就行了，就可以看到里面的具体内容。

比如你可以看看这个文件：

lombok.core.handlers.LoggingFramework

你会发现你们就像是枚举似的，写了很多日志的实现：

这个里面把每个注解需要生成的 log 都硬编码好了。正是因为这样，Lombok 才知道你用什么日志注解，应该给你生成什么样的 log。

比如 log4j 是这样的：

private static final org.apache.logging.log4j.Logger log = org.apache.logging.log4j.LogManager.getLogger(TargetType.class);

而 SLF4J 是这样的：

private static final org.slf4j.Logger log = org.slf4j.LoggerFactory.getLogger(TargetType.class);

第二个需要注意的地方是找到入口:

这些 class 文件加载的入口在于这个地方，是基于 Java 的 SPI 机制：

AnnotationProcessorHider 这个类里面有两行静态内部类，我们看其中一个， AnnotationProcessor ，它是继承自 AbstractProcessor 抽象类：

javax.annotation.processing.AbstractProcessor

这个抽象类，就是入口中的入口，核心中的核心。

在这个入口里面，初始化了一个类加载器，叫做 ShadowClassLoader：

它干的事儿就是加载那些被标记为 SCL.lombok 的 class 文件。

然后我是怎么知道 Lombok 是基于编译时注解的呢？

其实这玩意在我看过的两本书里面都有写，有点模糊的印象，写文章的时候我又翻出来读了一遍。

首先是《深入理解 Java 虚拟机(第三版)》的第四部分程序编译与代码优化的第 10 章：前端编译与优化一节。

里面专门有一小节，说插入式注解的：

Lombok 的主要工作地盘，就在 javac 编译的过程中。

在书中的 361 页，提到了编译过程的几个阶段。

从 Java 代码的总体结构来看，编译过程大致可以分为一个准备过程和三个处理过程：

1.准备过程：初始化插入式注解处理器。

2.解析与填充符号表过程，包括：
- 词法、语法分析。将源代码的字符流转变为标记集合，构造出抽象语法树。
- 填充符号表。产生符号地址和符号信息。

3.插入式注解处理器的注解处理过程：插入式注解处理器的执行阶段，本章的实战部分会设计一个插入式注解处理器来影响Javac的编译行为。

4.分析与字节码生成过程，包括：
- 标注检查。对语法的静态信息进行检查。
- 数据流及控制流分析。对程序动态运行过程进行检查。
- 解语法糖。将简化代码编写的语法糖还原为原有的形式。（java中的语法糖包括泛型、变长参数、自动装拆箱、遍历循环foreach等，JVM运行时并不支持这些语法，所以在编译阶段需要还原。）
- 字节码生成。将前面各个步骤所生成的信息转换成字节码。

如果说 javac 编译的过程就是 Lombok 的工作地盘，那么其中的“插入式注解处理器的注解处理过程”就是它的工位了。

书中也提到了 Lombok 的工作原理：

第二本书是《深入理解 JVM 字节码》，在它的第 8 章，也详细的描述了插件化注解的处理原理，其中也提到了 Lombok：

最后画了一个示意图，是这样的：

如果你看懂了书中的前面的十几页的描述，那么看这个图就会比较清晰了。

总之，Lombok 的核心原理就是在编译期对于 class 文件的魔改，帮你生成了很多代码。

如果你有兴趣深入了解它的原理的话，可以去看看我前面提到的这两本书，里面都有手把手的实践开发。

我就不写了，一个原因是因为确实门槛较高，写出来生涩难懂，对我们日常业务开发帮助也不大。

另外一个原因那不是因为我懒嘛。

荒腔走板

周末去了一趟都江堰。

问道青城山，拜水都江堰。读大学的时候就知道这句话了，所以从大学算起，都江堰景区去过的次数，没有十次也有七八次了。

之前每次去就是觉得：哇，好大的山；哇，好急的水；哇，这个一点也不像鱼嘴的地方为什么叫鱼嘴；哇，这个鱼嘴看介绍很牛逼，但是我感觉我上我也行的样子。

这次去的时候，我和 Max 同学算是自己做了一次攻略，看了相关的介绍视频，比较系统的了解了一下鱼嘴、飞沙堰、宝瓶口的作用。

如果你也有兴趣的话，推荐看看 B 站“星球研究所”有一期将都江堰的视频，简短且直观，很不错。

看视频的时候才知道原来这里面有这么多门道，并惊叹于古人的智慧和劳动能力。顺应自然规律，因时制宜，建造了都江堰水利工程，并一直沿用了约 2300 年。

当我们真的走进景区，看到鱼嘴、飞沙堰、宝瓶口就在眼前的时候，才真正明白了视频里面说的“四六分水、二八排沙”是怎么回事，“深淘摊，低作堰”又是怎么回事。

水旱从人，不知饥谨，时无荒年，天下谓之天府也。

成都不能没有都江堰。

李冰父子，配享太庙。

作者：why技术
来源：juejin.cn/post/7349569626341490740

收起阅读 »

为什么很多人不推荐你用JWT?

Java

为什么很多人不推荐你用JWT? 如果你经常看一些网上的带你做项目的教程，你就会发现有很多的项目都用到了JWT。那么他到底安全吗？为什么那么多人不推荐你去使用。这个文章将会从全方面的带你了解JWT 以及他的优缺点。什么是JWT? 这个是他的官网JSON We...

继续阅读 »

为什么很多人不推荐你用JWT?

如果你经常看一些网上的带你做项目的教程，你就会发现有很多的项目都用到了JWT。那么他到底安全吗？为什么那么多人不推荐你去使用。这个文章将会从全方面的带你了解JWT 以及他的优缺点。

什么是JWT?

这个是他的官网JSON Web Tokens - jwt.io

这个就是JWT

JWT 全称JSON Web Token

如果你还不熟悉JWT，不要惊慌！它们并不那么复杂！

你可以把JWT想象成一些JSON数据，你可以验证这些数据是来自你认识的人。

当然如何实现我们在这里不讲，有兴趣的可以去自己了解。

下面我们来说一下他的流程：

当你登录到一个网站，网站会生成一个JWT并将其发送给你。

这个JWT就像是一个包裹，里面装着一些关于你身份的信息，比如你的用户名、角色、权限等。

然后，你在每次与该网站进行通信时都会携带这个JWT。

每当你访问一个需要验证身份的页面时，你都会把这个JWT带给网站。

网站收到JWT后，会验证它的签名以确保它是由网站签发的，并且检查其中的信息来确认你的身份和权限。

如果一切都通过了验证，你就可以继续访问受保护的页面了。

为什么说JWT很烂？

首先我们用JWT应该就是去做这些事情：

用户注册网站

用户登录网站

用户点击并执行操作

本网站使用用户信息进行创建、更新和删除信息

这些事情对于数据库的操作经常是这些方面的

记录用户正在执行的操作

将用户的一些数据添加到数据库中

检查用户的权限，看看他们是否可以执行某些操作

之后我们来逐步说出他的一些缺点

大小

这个方面毋庸置疑。

比如我们需要存储一个用户ID 为xiaou

如果存储到cookie里面，我们的总大小只有5个字节。

如果我们将 ID 存储在一个 JWT 里。他的大小就会增加大概51倍

这无疑就增大了我们的宽带负担。

冗余签名

JWT的主要卖点之一就是其加密签名。因为JWT被加密签名，接收方可以验证JWT是否有效且可信。

但是，在过去20年里几乎每一个网络框架都可以在使用普通的会话cookie时获得加密签名的好处。

事实上，大多数网络框架会自动为你加密签名（甚至加密！）你的cookie。这意味着你可以获得与使用JWT签名相同的好处，而无需使用JWT本身。

实际上，在大多数网络身份验证情况下，JWT数据都是存储在会话cookie中的，这意味着现在有两个级别的签名。一个在cookie本身上，一个在JWT上。

令牌撤销问题

由于令牌在到期之前一直有效，服务器没有简单的方法来撤销它。

以下是一些可能导致这种情况危险的用例。

注销并不能真正使你注销！

想象一下你在推特上发送推文后注销了登录。你可能会认为自己已经从服务器注销了，但事实并非如此。因为JWT是自包含的，将在到期之前一直有效。这可能是5分钟、30分钟或任何作为令牌一部分设置的持续时间。因此，如果有人在此期间获取了该令牌，他们可以继续访问直到它过期。

可能存在陈旧数据

想象一下用户是管理员，被降级为权限较低的普通用户。同样，这不会立即生效，用户将继续保持管理员身份，直到令牌过期。

JWT通常不加密

因此任何能够执行中间人攻击并嗅探JWT的人都拥有你的身份验证凭据。这变得更容易，因为中间人攻击只需要在服务器和客户端之间的连接上完成

安全问题

对于JWT是否安全。我们可以参考这个文章

JWT （JSON Web Token）（in）security - research.securitum.com

同时我们也可以看到是有专门的如何攻击JWT的教程的

高级漏洞篇之JWT攻击专题 - FreeBuf网络安全行业门户

总结

总的来说，JWT适合作为单次授权令牌，用于在两个实体之间传输声明信息。

但是，JWT不适合作为长期持久数据的存储机制，特别是用于管理用户会话。使用JWT作为会话机制可能会引入一系列严重的安全和实现上的问题，相反，对于长期持久数据的存储，更适合使用传统的会话机制，如会话cookie，以及建立在其上的成熟的实现。

但是写了这么多，我还是想说，如果你作为自己开发学习使用，不考虑安全，不考虑性能的情况下，用JWT是完全没有问题的，但是一旦用到生产环境中，我们就需要避免这些可能存在的问题。

作者：小u
来源：juejin.cn/post/7365533351451672612

收起阅读 »

Java中使用for而不是forEach遍历List的10大理由

Java

首发公众号:【赵侠客】引言我相信作为一名java开发者你一定听过或者看过类似《你还在用for循环遍历List吗？》、《JDK8都10岁了，你还在用for循环遍历List吗？》这类鄙视在Java中使用for循环遍历List的水文。这类文章说的其实就是使用J...

继续阅读 »

首发公众号:【赵侠客】

引言

我相信作为一名java开发者你一定听过或者看过类似《你还在用for循环遍历List吗？》、《JDK8都10岁了，你还在用for循环遍历List吗？》这类鄙视在Java中使用for循环遍历List的水文。这类文章说的其实就是使用Java8中的Stream.foreach()来遍历元素，在技术圈感觉使用新的技术就高大上，开发者们也都默许接受新技术的很多缺点，而使用老的技术或者传统的方法就会被人鄙视，被人觉得Low，那么使用forEach()真的很高大上吗？它真的比传统的for循环好用吗？本文就列出10大推荐使用for而不是forEach()的理由。

理由一、for性能更好

在我的固有认知中我是觉得for的循环性能比Stream.forEach()要好的，因为在技术界有一条真理：

越简单越原始的代码往往性能也越好

而且搜索一些文章或者大模型都是这么觉得的，可时我并没有找到专业的基准测试证明此结论。那么实际测试情况是不是这样的呢？虽然这个循环的性能差距对我们的系统性能基本上没有影响，不过为了证明for的循环性能真的比Stream.forEach()好我使用基准测试用专业的实际数据来说话。我的测试代码非常的简单，就对一个List<Integer> ids分别使用for和Stream.forEach()遍历出所有的元素，以下是测试代码：

@State(Scope.Thread)

public class ForBenchmark {

    private List<Integer> ids ;

    @Setup

    public void setup() {

        ids = new ArrayList<>();

        //分别对10、100、1000、1万、10万个元素测试

        IntStream.range(0, 10).forEach(i -> ids.add(i));

    }

    @TearDown

    public void tearDown() {

        ids = new ArrayList<>();

    }

    @Benchmark

    public void testFor() {

        for (int i = 0; i <ids.size() ; i++) {

            Integer id = ids.get(i);

        }

    }



    @Benchmark

    public void testStreamforEach() {

        ids.stream().forEach(x->{

            Integer id=x;

        });

    }



    @Test

    public void testMyBenchmark() throws Exception {

        Options options = new OptionsBuilder()

                .include(ForBenchmark.class.getSimpleName())

                .forks(1)

                .threads(1)

                .warmupIterations(1)

                .measurementIterations(1)

                .mode(Mode.Throughput)

                .build();

        new Runner(options).run();

    }

}

我使用ArrayList分对10、100、1000、1万，10万个元素进行测试，以下是使用JMH基准测试的结果，结果中的数字为吞吐量，单位为ops/s，即每秒钟执行方法的次数：

方法	十	百	千	万	10万
forEach	45194532	17187781	2501802	200292	20309
for	127056654	19310361	2530502	202632	19228
for对比	↑181%	↑12%	↑1%	↓1%	↓5%

从使用Benchmark基准测试结果来看使用for遍历List比Stream.forEach性能在元素越小的情况下优势越明显，在10万元素遍历时性能反而没有Stream.forEach好了，不过在实际项目开发中我们很少有超过10万元素的遍历。

所以可以得出结论：

在小List(万元素以内)遍历中for性能要优于Stream.forEach

理由二、for占用内存更小

Stream.forEach()会占用更多的内存，因为它涉及到创建流、临时对象或者对中间操作进行缓存。for 循环则更直接，操作底层集合，通常不会有额外的临时对象。可以看如下求和代码，运行时增加JVM参数-XX:+PrintGCDetails -Xms4G -Xmx4G输出GC日志：

使用for遍历

List<Integer> ids = IntStream.range(1,10000000).boxed().collect(Collectors.toList());

int sum = 0;

for (int i = 0; i < ids.size(); i++) {

    sum +=ids.get(i);

}

System.gc();

//GC日志

[GC (System.gc()) [PSYoungGen: 392540K->174586K(1223168K)] 392540K->212100K(4019712K), 0.2083486 secs] [Times: user=0.58 sys=0.09, real=0.21 secs]

从GC日志中可以看出，使用for遍历List在GC回收前年轻代使用了392540K，总内存使用了392540K，回收耗时0.20s

使用stream

List<Integer> ids = IntStream.range(1,10000000).boxed().collect(Collectors.toList());

int sum = ids.stream().reduce(0,Integer::sum);

System.gc();

//GC日志

[GC (System.gc()) [PSYoungGen: 539341K->174586K(1223168K)] 539341K->212118K(4019712K), 0.3747694 secs] [Times: user=0.55 sys=0.83, real=0.38 secs]

从GC日志中可以看出，回收前年轻代使用了539341K，总内存使用了539341K，回收耗时0.37s ，从内存占用情况来看使用for会比Stream.forEach()占用内存少37%，而且Stream.foreach() GC耗时比for多了85%。

理由三、for更易控制流程

我们使用for遍历List可以很方便的使用break、continue、return来控制循环，而使用Stream.forEach在循环中是不能使用break、continue，特别指出的使用return是无法中断Stream.forEach循环的，如下代码：

List<Integer> ids = IntStream.range(1,4).boxed().collect(Collectors.toList());

ids.stream().forEach(i->{

    System.out.println(""+i);

    if(i>1){

        return;

    }

});

System.out.println("==");

for (int i = 0; i < ids.size(); i++) {

    System.out.println(""+ids.get(i));

    if(ids.get(i)>1){

        return;

    }

}

输出：

forEach-1

forEach-2

forEach-3

==

for-1

for-2

从输出结果可以看出在Stream.forEach中使用return后循环还会继续执行的，而在for循环中使用return将中断循环。

理由四、for访问变量更灵活

这点我想是很多人在使用Stream.forEach中比较头疼的一点，因为在Stream.forEach中引用的变量必须是final类型，也就是说不能修改forEach循环体之外的变量，但是我们很多业务场景就是修改循环体外的变量，如以下代码:

Integer sum=0;

for (int i = 0; i < ids.size(); i++) {

    sum++;

}



ids.stream().forEach(i -> {

    //报错

    sum++;

});

像上面的这样的代码在实际中是很常见的，sum++在forEach中是不被允许的，有时为了使用类似的方法我们只能把变量变成一个引用类型：

AtomicReference<Integer> sum= new AtomicReference<>(0);

ids.stream().forEach(i -> {

    sum.getAndSet(sum.get() + 1);

});

所以在访问变量方面for会更加灵活。

理由五、for处理异常更方便

这一点也是我使用forEach比较头疼的，在forEach中的Exception必须要捕获处理，如下代码：

public void testException() throws Exception {

  List<Integer> ids = IntStream.range(1, 4).boxed().collect(Collectors.toList());

  for (int i = 0; i < ids.size(); i++) {

      //直接抛出Exception

      System.out.println(div(i, i - 1));

  }



  ids.stream().forEach(x -> {

      try {

          //必须捕获Exception

          System.out.println(div(x, x - 1));

      } catch (Exception e) {

          throw new RuntimeException(e);

      }

  });

}



private Integer div(Integer a, Integer b) throws Exception {

    return a / b;

}

我们在循环中调用了div()方法，该方法抛出了Exception，如果是使用for循环如果不想处理可以直接抛出，但是使用forEach就必须要自己处理异常了，所以for在处理异常方面会更加灵活方便。

理由六、for能对集合添加、删除

在for循环中可以直接修改原始集合（如添加、删除元素），而 Stream 不允许修改基础集合，会抛出 ConcurrentModificationException，如下代码：

List<Integer> ids = IntStream.range(0, 4).boxed().collect(Collectors.toList());

for (int i = 0; i < ids.size(); i++) {

    if(i<1){

        ids.add(i);

    }

}

System.out.println(ids);



List<Integer> ids2 = IntStream.range(0, 4).boxed().collect(Collectors.toList());

ids2.stream().forEach(x -> {

    if(x<1){

        ids2.add(x);

    }

});

System.out.println(ids2);

输出：

[0, 1, 2, 3, 0]

java.util.ConcurrentModificationException

如果你想在循环中添加或者删除元素foreach是无法完成了，所以for处理集合更方便。

理由七、for Debug更友好

Stream.forEach()使用了Lambda表达示，一行代码可以搞定很多功能，但是这也给Debug带来了困难，如下代码：

List<Integer> ids = IntStream.range(0, 4).boxed().collect(Collectors.toList());

for (int i = 0; i < ids.size(); i++) {

    System.out.println(ids.get(i));

}

List<Integer> ids2 = IntStream.range(0, 4).boxed().collect(Collectors.toList());

ids2.stream().forEach(System.out::println);

以下是DeBug截图：

我们可以看出使用for循环Debug可以一步一步的跟踪程序执行步骤，但是使用forEach却做不到，所以for可以更方便的调试你的代码，让你更快捷的找到出现问题的代码。

理由八、for代码可读性更好

Lambda表达示属于面向函数式编程，主打的就是一个抽象，相比于面向对象或者面向过程编程代码可读性是非常的差，有时自己不写的代码过段时间后自己都看不懂。就比如我在文章《解密阿里大神写的天书般的Tree工具类，轻松搞定树结构！》一文中使用函数式编程写了一个Tree工具类，我们可以对比一下面向过程和面向函数式编程代码可读性的差距：

使用for面向过程编程代码：

 public static List<MenuVo> makeTree(List<MenuVo> allDate,Long rootParentId) {

      List<MenuVo> roots = new ArrayList<>();

      for (MenuVo menu : allDate) {

          if (Objects.equals(rootParentId, menu.getPId())) {

              roots.add(menu);

          }

      }

      for (MenuVo root : roots) {

           makeChildren(root, allDate);

      }

      return roots;

  }

  public static MenuVo makeChildren(MenuVo root, List<MenuVo> allDate) {

      for (MenuVo menu : allDate) {

          if (Objects.equals(root.getId(), menu.getPId())) {

              makeChildren(menu, allDate);

              root.getSubMenus().add(menu);

          }

      }

      return root;

  }

使用forEach面向函数式编程代码：

public static <E> List<E> makeTree(List<E> list, Predicate<E> rootCheck, BiFunction<E, E, Boolean> parentCheck, BiConsumer<E, List<E>> setSubChildren) {

      return list.stream().filter(rootCheck).peek(x -> setSubChildren.accept(x, makeChildren(x, list, parentCheck, setSubChildren))).collect(Collectors.toList());

}

private static <E> List<E> makeChildren(E parent, List<E> allData, BiFunction<E, E, Boolean> parentCheck, BiConsumer<E, List<E>> children) {

    return allData.stream().filter(x -> parentCheck.apply(parent, x)).peek(x -> children.accept(x, makeChildren(x, allData, parentCheck, children))).collect(Collectors.toList());

}

对比以上两段代码，可以看出面向过程的代码思路非常的清晰，基本上可以一眼看懂代码要做什么，反观面向函数式编程的代码，我想大都人一眼都不知道代码在干什么的，所以使用for的代码可读性会更好。

理由九、for更好的管理状态

for循环可以轻松地在每次迭代中维护状态，这在Stream.forEach中可能需要额外的逻辑来实现。这一条可理由三有点像，我们经常需要通过状态能控制循环是否执行，如下代码：

boolean  flag = true;

for (int i = 0; i < 10; i++) {

    if(flag){

        System.out.println(i);

        flag=false;

    }

}



AtomicBoolean flag1 = new AtomicBoolean(true);

IntStream.range(0, 10).forEach(x->{

    if (flag1.get()){

        flag1.set(false);

        System.out.println(x);

    }

});

这个例子说明了在使用Stream.forEach时，为了维护状态，我们需要引入额外的逻辑，如使用AtomicBoolean，而在for循环中，这种状态管理是直接和简单的。

理由十、for可以使用索引直接访问元素

在某些情况下，特别是当需要根据元素的索引（位置）来操作集合中的元素时，for就可以直接使用索引访问了。在Stream.forEach中就不能直接通过索引访问，比如我们需要将ids中的数字翻倍：

List<Integer> ids = IntStream.range(0, 4).boxed().collect(Collectors.toList());

for (int i = 0; i < ids.size(); i++) {

   ids.set(i,i*2);

}



List<Integer> ids2 = IntStream.range(0, 4).boxed().collect(Collectors.toList());

ids2=ids2.stream().map(x->x*2).collect(Collectors.toList());

我们使用for循环来遍历这个列表，并在每次迭代中根据索引i来修改列表中的元素。这种操作直接且直观。而使用Stream.foreach()不能直接通过索引下标访问元素的，只能将List转换为流，然后使用map操作将每个元素乘以2，最后，我们使用Collectors.toList()将结果收集回一个新的List。

总结

本文介绍了在实际开发中更推荐使用for循环而不是Stream.foreach()来遍历List的十大理由，并给出了具体的代码和测试结果，当然这并不是说就一定要使用传统的for循环，要根据自己的实际情况来选择合适的方法。通过此案件也想让读者明白在互联网世界中你所看到的东西都是别人想让你看到的，这个世界是没有真相的，别人想让你看到的就是所谓的”真相“，做为吃瓜群众一定不能随波逐流，要有鉴别信息真假的能力和培养独立思考的能力。

作者：赵侠客
来源：juejin.cn/post/7416848881407524902

收起阅读 »

一文讲清DTO、BO、PO、VO，为什么可以不需要VO?

Java

DTO、BO、PO、VO是什么在讨论这些是什么的时候，建议先看看我的这篇文章：写好业务代码的经典案例 - 掘金 (juejin.cn) 在上面我的这篇文章中提到的缺乏模型抽象，无边界控制，就是正好对应的DTO BO PO VO这些模型的概念如何对模型进行抽...

继续阅读 »

DTO、BO、PO、VO是什么

在讨论这些是什么的时候，建议先看看我的这篇文章：写好业务代码的经典案例 - 掘金 (juejin.cn)

在上面我的这篇文章中提到的缺乏模型抽象，无边界控制，就是正好对应的DTO BO PO VO这些模型的概念

如何对模型进行抽象，控制边界，可用看看我的这篇文章：为啥建议用MapperStruct，不建议用BeanUtils.copyProperties拷贝数据？ - 掘金 (juejin.cn)

在后端开发中，比如传统的MVC架构和现在流行的DDD架构，经常会使用到下列几种对象的概念

DTO (Data Transfer Object) 数据传输对象： DTO设计模式用于将数据从服务端传输到客户端，或者在不同的服务之间传递。通常，DTO包含了特定业务场景需要的数据结构，并且不包含任何业务逻辑。它简化了不同服务或模块之间的交互，使得各个层之间的耦合度降低。

BO (Business Object) 业务对象： BO代表了业务逻辑层中的对象，封装了与某个业务相关的数据以及针对这些数据的操作逻辑。一个BO可能由多个实体属性组成，并处理涉及多个实体的复杂业务逻辑。

PO (Persistent Object) 持久化对象： PO主要用来表示数据库表的一条记录，它的属性和数据库表的字段相对应。通常在持久层（如Hibernate、JPA等ORM框架）中使用，主要用于操作数据库，如保存、更新和查询数据。

VO (Value Object) 值对象： VO是视图层的对象，通常用于封装展示给用户的数据，它可以和数据库表对应，也可以根据UI界面需求进行定制。VO的主要目的是在页面展示时只携带必要的数据，从而避免把大量不必要的数据暴露给前端。

举个实际代码的例子，这里暂不给出VO，在最后的总结会讲这个VO

这个就是PO

@Data

public class User implements Serializable{

    private Long id;



    private String username;



    private String password;



    private String identityCard;



    private String gender;



    private String location;



    private String userImage;



    private String phoneNumber;



    private String createTime;



    private String updateTime;



    @TableLogic

    private int isDelete;

}

UserDTO

@Data

public class UserDTO implements Serializable{

    private Long id;



    private String username;



    private String password;



    private String identityCard;



    private String gender;



    private String location;



    private String userImage;



    private String phoneNumber;

}

UserLoginBO、UserUpdateBO ...

@Data

public class UserLoginBO implements Serializable{

    private String username;



    private String password;

}



@Data

public class UserUpdateBO implements Serializable{

    private Long id;



    private String username;



    private String password;



    private String identityCard;



    private String gender;



    private String location;



    private String userImage;



    private String phoneNumber;

}

从上面这个例子大家能看出来区别不

UserDTO是一个大的入口，它可以接收整个模块的参数

BO则是在进入Service层之前对UserDTO的数据进行过滤，并且对边界进行控制

最后在进入infra层之前转为PO

其实BO也可以像UserDTO那样，直接一个UserBO包含UserLoginBO和UserUpdateBO，单纯的做模型转换，不做值过滤也可以

在后端开发中怎么用的

总结

为什么我们通篇没有讲关于VO的事情呢？

我个人的理解是DTO能解决的事情没有必要再加一个VO，我们可以弄一个全局配置，将DTO里面为null值的字段全都过滤掉

这样就没有说将数据传给前端的时候需要加多一个VO

给出代码示例，这样配置就可以把DTO中为null值过滤掉，不会序列化发给前端

@Configuration

public class GlobalConfig extends WebMvcConfigurationSupport {



    @Override

    protected void configureMessageConverters(List<HttpMessageConverter<?>> converters) {

        super.configureMessageConverters(converters);

        converters.add(mappingJackson2HttpMessageConverter());

    }

    /**

     * 自定义mappingJackson2HttpMessageConverter

     * 目前实现：空值忽略，空字段可返回

     */

    private MappingJackson2HttpMessageConverter mappingJackson2HttpMessageConverter() {

        ObjectMapper objectMapper = new ObjectMapper();

        objectMapper.configure(SerializationFeature.FAIL_ON_EMPTY_BEANS, false);

        objectMapper.setSerializationInclusion(JsonInclude.Include.NON_NULL);

        return new MappingJackson2HttpMessageConverter(objectMapper);

    }

}

作者：radient
来源：juejin.cn/post/7334691453833166848

收起阅读 »

为什么Spring官方不推荐使用 @Autowired ?

Java

大家好，我是苏三，又跟大家见面了。前言很多人刚接触 Spring 的时候，对 @Autowired 绝对是爱得深沉。一个注解，轻松搞定依赖注入，连代码量都省了。谁不爱呢？但慢慢地，尤其是跑到稍微复杂点的项目里，@Autowired 就开始给你整点幺蛾...

继续阅读 »

大家好，我是苏三，又跟大家见面了。

前言

很多人刚接触 Spring 的时候，对 @Autowired 绝对是爱得深沉。

一个注解，轻松搞定依赖注入，连代码量都省了。

谁不爱呢？

但慢慢地，尤其是跑到稍微复杂点的项目里，@Autowired 就开始给你整点幺蛾子。

于是，官方Spring 4.0开始：不建议无脑用 @Autowired，而是更推荐构造函数注入。

为什么？

是 @Autowired 不行吗？并不是。

它可以用，但问题是：它不是无敌的，滥用起来容易埋坑。

下面就来聊聊为啥官方建议你慎用 @Autowired，顺便再带点代码例子，希望对你会有所帮助。

苏三最近开源了一个基于 SpringBoot+Vue+uniapp 的商城项目，欢迎访问和star。

1. 容易导致隐式依赖

很多小伙伴在工作中喜欢直接写：

@Service

public class MyService {

    @Autowired

    private MyRepository myRepository;

}

看着挺简单，但问题来了：类的依赖关系藏得太深了。

你看这段代码，MyService 和 MyRepository 的关系其实是个“隐形依赖”，全靠 @Autowired 来注入。

如果有个同事刚接手代码，打开一看，完全不知道 myRepository 是啥玩意儿、怎么来的，只有通过 IDE 或运行时才能猜出来。

隐式依赖的结果就是，代码看起来简单，但维护起来费劲。

后期加个新依赖，或者改依赖顺序，分分钟把人搞糊涂。

怎么破？

用 构造函数注入 替代。

@Service

public class MyService {

    private final MyRepository myRepository;



    // 构造函数注入，依赖一目了然

    public MyService(MyRepository myRepository) {

        this.myRepository = myRepository;

    }

}

这样做的好处是：

依赖清晰： 谁依赖谁，直接写在构造函数里，明明白白。

更易测试： 构造函数注入可以手动传入 mock 对象，方便写单元测试。

2. 会导致强耦合

再举个例子，很多人喜欢直接用 @Autowired 注入具体实现类，比如：

@Service

public class MyService {

    @Autowired

    private SpecificRepository specificRepository;

}

表面上没毛病，但这是硬邦邦地把 MyService 和 SpecificRepository 绑死了。

万一有一天，业务改了，需要切换成另一个实现类，比如 AnotherSpecificRepository，你得改代码、改注解，连带着测试也崩。

怎么破？

用接口和构造函数注入，把依赖解耦。

@Service

public class MyService {

    private final Repository repository;



    public MyService(Repository repository) {

        this.repository = repository;

    }

}

然后通过 Spring 的配置文件或者 @Configuration 类配置具体实现：

@Configuration

public class RepositoryConfig {

    @Bean

    public Repository repository() {

        return new SpecificRepository();

    }

}

这么搞的好处是：

灵活切换： 改实现类时，不用动核心逻辑代码。

符合面向接口编程的思想： 降低耦合，提升可扩展性。

3. 容易导致 NullPointerException

有些小伙伴喜欢这么写：

@Service

public class MyService {

    @Autowired

    private MyRepository myRepository;



    public void doSomething() {

        myRepository.save(); // 啪！NullPointerException

    }

}

问题在哪？如果 Spring 容器还没来得及注入依赖，你的代码就跑了（比如在构造函数或初始化方法中直接调用依赖），结果自然就是 NullPointerException。

怎么破？

用构造函数注入，彻底干掉 null 的可能性。

@Service

public class MyService {

    private final MyRepository myRepository;



    public MyService(MyRepository myRepository) {

        this.myRepository = myRepository; // 确保依赖在对象初始化时就已注入

    }



    public void doSomething() {

        myRepository.save();

    }

}

构造函数注入的另一个优点是：依赖注入是强制的，Spring 容器不给你注入就报错，让问题早暴露。

4.自动装配容易搞出迷惑行为

Spring 的自动装配机制有时候是“黑魔法”，尤其是当你的项目里有多个候选 Bean 时。比如：

@Service

public class MyService {

    @Autowired

    private Repository repository; // 容器里有两个 Repository 实现类，咋办？

}

如果有两个实现类，比如 SpecificRepository 和 AnotherRepository，Spring 容器直接报错。解决方法有两种：

指定 @Primary。

用 @Qualifier 手动指定。

但这些方式都让代码看起来更复杂了，还可能踩坑。

怎么破？

构造函数注入 + 显式配置。

@Configuration

public class RepositoryConfig {

    @Bean

    public Repository repository() {

        return new SpecificRepository();

    }

}

你明确告诉 Spring 该用哪个实现类，别让容器帮你猜，省得以后“配错药”。

最近就业形势比较困难，为了感谢各位小伙伴对苏三一直以来的支持，我特地创建了一些工作内推群，看看能不能帮助到大家。

你可以在群里发布招聘信息，也可以内推工作，也可以在群里投递简历找工作，也可以在群里交流面试或者工作的话题。

添加苏三的私人微信：su_san_java，备注：掘金+所在城市，即可加入。

5. 写单元测试非常痛苦

最后，聊聊测试的事儿。

@Autowired 依赖 Spring 容器才能工作，但写单元测试时，大家都不想起 Spring 容器（麻烦、慢）。结果就是：

字段注入： 没法手动传入 mock 对象。

自动装配： 有时候不清楚用的 Bean 是哪个，测试难搞。

怎么破？

构造函数注入天生就是为单元测试设计的。

public class MyServiceTest {

    @Test

    public void testDoSomething() {

        MyRepository mockRepository = mock(MyRepository.class);

        MyService myService = new MyService(mockRepository);



        // 测试逻辑

    }

}

看见没？

直接传入 mock 对象，测试简单、优雅。

总结

简单总结下问题：

隐式依赖让代码可读性差。

强耦合违背面向接口编程。

字段注入容易 NPE。

自动装配有坑。

单元测试不好写。

那到底咋办？用 构造函数注入，清晰、稳健、测试友好，官方推荐不是没道理的。

但话说回来，@Autowired 也不是不能用，只是你得分场景。

开发中，养成用构造函数注入的习惯，能让你的代码更健壮，少挖坑，多干活！

最后说一句(求关注，别白嫖我)

如果这篇文章对您有所帮助，或者有所启发的话，帮忙关注一下我的同名公众号：苏三说技术，您的支持是我坚持写作最大的动力。

求一键三连：点赞、转发、在看。

关注公众号：【苏三说技术】，在公众号中回复：进大厂，可以免费获取我最近整理的10万字的面试宝典，好多小伙伴靠这个宝典拿到了多家大厂的offer。

作者：苏三说技术
来源：juejin.cn/post/7442346963302203407

收起阅读 »

SpringBoot中使用LocalDateTime踩坑记录

Java

@[toc]前言近日心血来潮想做一个开源项目，目标是做一款可以适配多端、功能完备的模板工程，包含后台管理系统和前台系统，开发者基于此项目进行裁剪和扩展来完成自己的功能开发。本项目基于Java21和SpringBoot3开发，序列化工具使用的是默认的Jackso...

继续阅读 »

@[toc]

前言

近日心血来潮想做一个开源项目，目标是做一款可以适配多端、功能完备的模板工程，包含后台管理系统和前台系统，开发者基于此项目进行裁剪和扩展来完成自己的功能开发。

本项目基于Java21和SpringBoot3开发，序列化工具使用的是默认的Jackson，使用Spring Data Redis操作Redis缓存。

在定义实体类过程中，日期时间类型的属性我使用了java.time包下的LocalDate和LocalDateTime类，而没有使用java.util包下的Date类。

但在使用过程中遇到了一些问题，于是在此记录下来与诸位分享。

一、为什么推荐使用java.time包的LocalDateTime而不是java.util的Date？

LocalDateTime和Date是Java中表示日期和时间的两种不同的类，它们有一些区别和特点。

类型：LocalDateTime是Java 8引入的新类型，属于Java 8日期时间API（java.time包）。而Date是旧版Java日期时间API（java.util包）中的类。
不可变性：LocalDateTime是不可变的类型，一旦创建后，其值是不可变的，对该类对象的加减等计算操作不会修改原对象，而是会返回一个新的LocalDateTime对象。而Date是可变的类型，可以通过方法修改其值。
线程安全性：LocalDateTime是线程安全的，多个线程可以同时访问和操作不同的LocalDateTime实例。而Date是非线程安全的，如果多个线程同时访问和修改同一个Date实例，可能会导致不可预期的结果。
时间精度：LocalDateTime提供了纳秒级别的时间精度，可以表示更加精确的时间。而Date只能表示毫秒级别的时间精度。
时区处理：LocalDateTime默认不包含时区信息，表示的是本地日期和时间。而Date则包含时区信息，它的实际值会受到系统默认时区的影响。

由于LocalDateTime是Java 8及以上版本的新类型，并提供了更多的功能和灵活性，推荐在新的项目中使用LocalDateTime来处理日期和时间。

对于旧版Java项目，仍然需要使用Date类，但在多线程环境下需要注意其线程安全性。

如果需要在LocalDateTime和Date之间进行转换，可以使用相应的方法进行转换，例如通过LocalDateTime的atZone()方法和Date的toInstant()方法进行转换。

二、使用LocalDateTime和LocalDate时遇到了哪些坑？

2.1 Redis序列化报错

2.1.1 问题现象

在使用RedisTemplate向Redis中插入数据时，遇到了如下报错：

2024-01-11T21:33:25.233+08:00 ERROR 13212 --- [nio-8080-exec-1] o.a.c.c.C.[.[.[/].[dispatcherServlet]    : Servlet.service() for servlet [dispatcherServlet] in context with path [] threw exception



org.springframework.data.redis.serializer.SerializationException: Could not write JSON: Java 8 date/time type `java.time.LocalDateTime` not supported by default: add Module "com.fasterxml.jackson.datatype:jackson-datatype-jsr310" to enable handling (through reference chain: java.util.ArrayList[0]->com.fast.alden.data.model.SysApiResource["createdTime"])

	at org.springframework.data.redis.serializer.Jackson2JsonRedisSerializer.serialize(Jackson2JsonRedisSerializer.java:157) ~[spring-data-redis-3.2.0.jar:3.2.0]

	at org.springframework.data.redis.core.AbstractOperations.rawValue(AbstractOperations.java:128) ~[spring-data-redis-3.2.0.jar:3.2.0]

	at org.springframework.data.redis.core.DefaultValueOperations.set(DefaultValueOperations.java:236) ~[spring-data-redis-3.2.0.jar:3.2.0]

2.1.2 问题分析

在使用Redis缓存含有LocalDateTime类型变量的实体类时会产生序列化问题，因为Jackson库在默认情况下不支持Java8的LocalDateTime类型的序列化和反序列化。

错误堆栈中也给出了解决方案，添加 com.fasterxml.jackson.datatype:jackson-datatype-jsr310依赖，但光添加依赖是不够的，还我们需要自定义序列化和反序列化的行为。

2.1.3 解决方案

添加maven依赖

<dependency>

  <groupId>com.fasterxml.jackson.datatypegroupId>

  <artifactId>jackson-datatype-jsr310artifactId>

  <version>2.13.0version>

dependency>

修改RedisSerializer Bean配置

在定义RedisSerializer Bean的代码中自定义ObjectMapper对象处理时间属性时的序列化和反序列化行为，LocalDate、LocalDateTime、LocalTime的序列化和反序列化都要自定义，还要禁用将日期序列化为时间戳。

@Configuration

public class RedisConfig {

    @Bean

    public RedisSerializer

收起阅读 »

stream().toList()的大坑，你真的了解吗

Java

stream().toList() 下面这两行代码相同吗？ List<Integer> list1 = list.stream().toList(); List<Integer> list2 = list.stream().collec...

继续阅读 »

stream().toList()

下面这两行代码相同吗？

List<Integer> list1 = list.stream().toList();

List<Integer> list2 = list.stream().collect(Collectors.toList());

在Idea里，Idea还会提醒你可以替换，难道真的是相同的api吗？

我们直接打印一下它们的Class

List<Integer> list1 = list.stream().toList();

List<Integer> list2 = list.stream().collect(Collectors.toList());

System.out.println(list1.getClass());

System.out.println(list2.getClass());

class java.util.ImmutableCollections$ListN

class java.util.ArrayList

发现一个是ImmutableCollection，一个是ArrayList

从名字中就可以看出来list1是不可变的，remove一下果然抛出了异常

// all mutating methods throw UnsupportedOperationException

@Override public void    add(int index, E element) { throw uoe(); }

@Override public boolean addAll(int index, Collection<? extends E> c) { throw uoe(); }

@Override public E       remove(int index) { throw uoe(); }

@Override public void    replaceAll(UnaryOperator<E> operator) { throw uoe(); }

@Override public E       set(int index, E element) { throw uoe(); }

@Override public void    sort(Comparator<? super E> c) { throw uoe(); }

作者：湫qiu
来源：juejin.cn/post/7436938110023958565

收起阅读 »

面试官问我String能存储多少个字符？

Java

首先String的length方法返回是int。所以理论上长度一定不会超过int的最大值。编译器源码如下，限制了字符串长度大于等于65535就会编译不通过 private void checkStringConstant(DiagnosticPosition...

继续阅读 »

首先String的length方法返回是int。所以理论上长度一定不会超过int的最大值。

编译器源码如下，限制了字符串长度大于等于65535就会编译不通过
```
private void checkStringConstant(DiagnosticPosition var1, Object var2) {

    if (this.nerrs == 0 && var2 != null && var2 instanceof String &&   ((String)var2).length() >= 65535) {

        this.log.error(var1, "limit.string", new Object[0]);

        ++this.nerrs;

    }

}
```
Java中的字符常量都是使用UTF8编码的，UTF8编码使用1~4个字节来表示具体的Unicode字符。所以有的字符占用一个字节，而我们平时所用的大部分中文都需要3个字节来存储。
```
//65534个字母，编译通过

String s1 = "dd..d";



//21845个中文”自“,编译通过

String s2 = "自自...自";



//一个英文字母d加上21845个中文”自“，编译失败

String s3 = "d自自...自";
```
对于s1，一个字母d的UTF8编码占用一个字节，65534字母占用65534个字节，长度是65534，长度和存储都没超过限制，所以可以编译通过。

对于s2，一个中文占用3个字节，21845个正好占用65535个字节，而且字符串长度是21845，长度和存储也都没超过限制，所以可以编译通过。

对于s3，一个英文字母d加上21845个中文”自“占用65536个字节，超过了存储最大限制，编译失败。

JVM规范对常量池有所限制。量池中的每一种数据项都有自己的类型。Java中的UTF-8编码的Unicode字符串在常量池中以CONSTANTUtf8类型表示。CONSTANTUtf8的数据结构如下：
```
CONSTANT_Utf8_info {

    u1 tag;

    u2 length;

    u1 bytes[length];

}
```
我们重点关注下长度为 length 的那个bytes数组，这个数组就是真正存储常量数据的地方，而 length 就是数组可以存储的最大字节数。length 的类型是u2，u2是无符号的16位整数，因此理论上允许的的最大长度是2^16-1=65535。所以上面byte数组的最大长度可以是65535

运行时限制

String 运行时的限制主要体现在 String 的构造函数上。下面是 String 的一个构造函数：
```
public String(char value[], int offset, int count) {

    ...

}
```
上面的count值就是字符串的最大长度。在Java中，int的最大长度是2^31-1。所以在运行时，String 的最大长度是2^31-1。

但是这个也是理论上的长度，实际的长度还要看你JVM的内存。我们来看下，最大的字符串会占用多大的内存。
```
(2^31-1)*16/8/1024/1024/1024 = 2GB
```
所以在最坏的情况下，一个最大的字符串要占用 2GB的内存。如果你的虚拟机不能分配这么多内存的话，会直接报错的。

补充 JDK9以后对String的存储进行了优化。底层不再使用char数组存储字符串，而是使用byte数组。对于LATIN1字符的字符串可以节省一倍的内存空间。

作者：念念清晰
来源：juejin.cn/post/7343883765540831283

收起阅读 »

这年头不会还有谁没碰过minio的吧？这可太...🤡

综合技术讨论

🏆本文收录于「滚雪球学Spring Boot」专栏，专业攻坚指数级提升持续更新中，up！up！up！！ 🥝 前言：文件存储那些“坑”，你踩过几个？想象一下，你正在开发一个新项目，老板突然拍着桌子跟你说：“咱这个项目得支持海量文件存储，用户随时上传随时下...

继续阅读 »

🏆本文收录于「滚雪球学Spring Boot」专栏，专业攻坚指数级提升持续更新中，up！up！up！！

🥝 前言：文件存储那些“坑”，你踩过几个？

想象一下，你正在开发一个新项目，老板突然拍着桌子跟你说：“咱这个项目得支持海量文件存储，用户随时上传随时下载，成本要低，性能要高，安全也不能落下！”你抓了抓头发，盯着屏幕陷入沉思，传统文件系统？太笨重。云存储？预算超标。就在你一筹莫展时，MinIO横空出世，仿佛一道曙光，照亮了你前行的路。

MinIO，这款开源的对象存储系统，以其高性能、易扩展、S3兼容性等优点，迅速成为开发者圈中的“香饽饽”。如果你用Spring Boot开发项目，想要高效管理文件存储，那么接下来的内容会让你大呼过瘾。

🍇 MinIO是什么？

MinIO，是一款以高性能、轻量级著称的对象存储服务。它完全兼容Amazon S3 API，支持大规模非结构化数据的存储，适合图片、视频、日志、备份等海量数据的管理需求。

简单点说，它就是你的“私人云存储”，但没有昂贵的费用和复杂的运维。不论是几百GB还是上百TB的数据，MinIO都能轻松搞定。

🍒 MinIO的“秘密武器”

开源免费：没有隐藏费用，企业也能无压力使用。

S3 API兼容：现有的S3工具可以无缝衔接。

性能炸裂：每秒高达数十GB的吞吐量，轻松应对高并发。

易部署，易维护：几行命令搞定，开发小白也能轻松上手。

🍅 为什么选择MinIO？

有人可能会问：“为啥不用传统的文件系统？” 传统文件系统确实在小规模存储中还算凑合，但当你面对动辄几百GB甚至TB级的数据时，传统方案的缺点就暴露无遗了。管理难、性能低、扩展性差……而MinIO正是为了解决这些痛点而生。

🥝 MinIO能给你什么？

超高性价比：无需支付昂贵的存储服务费用，MinIO让你拥有“云存储”的体验，却不需要“云存储”的钱包。

弹性扩展：无论是初创团队还是大型企业，MinIO都能根据业务规模灵活扩展，绝不让存储成为发展瓶颈。

高可用性：MinIO支持分布式部署，即使某个节点故障，数据依然安全无忧。

选择MinIO，就是选择一种面向未来的存储方式。

🥑 MinIO核心概念

● 对象（Object）：对象是实际的数据单元，例如：上传的图片。

● 存储桶（Bucket）：存储桶是用于组织对象的名称空间，类似于文件夹。每个存储桶可以包含多个对象（文件）。

● 端点（Endpoint）：MinIO服务器的网络地址，用于访问存储桶和对象。例如：http://192.168.10.100:9000 , 注意：9000为 MinIO的API默认端口。

● AccessKey 和Secret Key：

AccessKey：用于标识和验证访问者身份的唯一标识符，相当于用户名。

Secret Key：与AccessKey关联的密码，用于验证访问者的身份。

🌽 MinIO客户端实操

🥬 创建bucket

这里的bucket存储桶是用于组织对象的名称空间，类似于我们所说的文件夹。

🥜 测试文件上传

然后来测试一下，文件上传。

上传文件，点击"upload"，选择上传的文件即可。

🥖 设置匿名用户的访问权限

将匿名用户权限设置为只读。

🧆 创建 Access Key

这里的Access Key用于标识和验证访问者身份的唯一标识符，相当于用户名。

如上操作完后，我们便来进行此期的真正的干货了，直接上手实操。

🌯 Spring Boot集成MinIO的实操指南

🫔 环境准备

首先，确保你的开发环境已经配置好以下工具：

JDK 1.8

Spring Boot 2.6+

MinIO服务（可使用Docker快速部署）

docker run -p 9000:9000 -p 9001:9001 --name minio \  

-e "MINIO_ROOT_USER=admin" \  

-e "MINIO_ROOT_PASSWORD=password123" \  

minio/minio server /data --console-address ":9001"

这段命令会在本地启动MinIO服务，你只需要打开浏览器，输入http://localhost:9001，用设置的账号密码登录，即可看到管理界面。

或者你也可以参考Linux常规搭建，可看这篇《Linux零基础安装Minio，手把手教学，一文搞定它！(超详细)》，妥妥傻瓜式教学。

🫑 引入依赖

接下来，修改pom.xml，引入MinIO的Java SDK依赖：

        <!--minio oss服务-->

        <dependency>

            <groupId>io.minio</groupId>

            <artifactId>minio</artifactId>

            <version>8.5.12</version>

        </dependency>

🍌 定义MinIO连接信息

我们需要先将minio的连接信息配置到我们的配置类中，方便修改及动态配置。

故我们需要先去minio的客户端先创建于一个access key，然后将access-key 与 secret-key 填写到 yml 配置文件中。

具体配置如下，你们直接改成你们的即可。

# minio文件存储

minio:

  access-key: Ro2ypdSShhmqQYgHWyDP

  secret-key: 6XOaQsYXBKflV10KDcjgcwE9lvekcN4KYfE85fBL

  url: http://10.66.66.143:9000

  bucket-name: hpy-files

属性解读：

如上这段代码配置的是MinIO文件存储的连接信息，具体内容如下：

access-key: Ro2ypdSShhmqQYgHWyDP — 这是MinIO的访问密钥（类似于用户名），用于身份验证。

secret-key: 6XOaQsYXBKflV10KDcjgcwE9lvekcN4KYfE85fBL — 这是MinIO的密钥（类似于密码），用于进行身份验证。

url: http://10.66.66.143:9000 — 这是MinIO服务器的地址，表示文件存储服务的主机IP地址和端口。

bucket-name: hpy-files — 这是用于存储文件的桶（bucket）名称。在MinIO中，文件是按桶来存储和组织的。

🍐 配置MinIO客户端

我们需要为Spring Boot项目配置一个MinIO客户端。新建MinioConfig.java：

/**

 * @author: bug菌

 * @date: 2024-10-21 11:59

 */

@Data

@Configuration

@ConfigurationProperties(prefix = "minio")

public class MinioConfig {

    private String accessKey;



    private String secretKey;



    private String url;



    private String bucketName;



    @Bean

    public MinioClient minioClient() {

        return MinioClient.builder()

                .region("cn-north-1")

                .endpoint(url)

                .credentials(accessKey, secretKey)

                .build();

    }

}

配置完成后，MinIO客户端就已经准备好为我们的Spring Boot项目服务了。

🍌 创建文件工具类

接下来，我们需要创建一个MinioUtil类，该类的目的是为了封装和简化与 MinIO 文件存储服务的交互，提供一系列的操作方法，使得我们能够轻松地进行文件上传、下载、删除、获取文件信息等常见的文件存储操作。具体意义如下：

与 MinIO 交互的封装：
类中封装了与 MinIO 存储服务进行交互的代码，包括检查存储桶是否存在、文件上传、下载、删除等常见的操作。这样，业务逻辑代码无需直接操作 MinIO API，提升了代码的复用性和可维护性。

自动化存储桶管理：
在 @PostConstruct 注解的 init() 方法中，会自动检查并创建存储桶（bucket）。确保在程序启动时，指定的存储桶已经存在，避免了在使用过程中因存储桶不存在而导致的错误。

支持文件的 URL 生成：
提供了生成文件访问 URL 的功能，包括带过期时间的预签名 URL。这是为了允许用户在一定时间内访问文件，避免文件暴露或在外部用户访问时需要额外认证。

文件下载支持：
类中提供了文件下载的功能，包括标准下载（通过 HTTP ServletResponse）和流式下载（获取文件流）。它可以处理文件的大小、编码等问题，保证文件的正确下载。

文件操作的错误处理与日志：
通过 Logger 对操作进行记录，且所有可能抛出异常的操作都进行了捕获和处理，避免了程序因为 MinIO 服务故障等原因而直接崩溃。确保系统的稳定性和错误反馈。

文件夹与文件的存在性检查：
该类提供了检查文件或文件夹是否存在的方法，有助于在上传或删除文件前进行状态验证，避免重复操作。

简化 API 调用：
通过抽象出一层高层次的操作接口，开发者不需要直接关注 MinIO 底层的复杂实现，只需调用简洁的方法即可完成文件存储操作。

总结而言，MinioUtil 类通过封装 MinIO 的常见文件操作，提供便捷的接口，降低与 MinIO 交互的复杂性，并通过统一的错误处理和日志记录，增强了系统的健壮性和可维护性。

代码实操：

/**

 * 文件工具类

 *

 * @author: bug菌

 * @date: 2024-10-21 12:02

 * @desc:

 */

@Service

public class MinioUtil {

    private static final Logger log = LoggerFactory.getLogger(MinioUtil.class);



    @Autowired

    private MinioClient minioClient;

    @Autowired

    private MinioConfig minioConfig;



    @PostConstruct

    public void init() {

        existBucket(minioConfig.getBucketName());

    }





    /**

     * 判断bucket是否存在，不存在则创建

     */

    public boolean existBucket(String bucketName) {

        boolean exists;

        try {

            exists = minioClient.bucketExists(BucketExistsArgs.builder().bucket(bucketName).build());

            if (!exists) {

                minioClient.makeBucket(MakeBucketArgs.builder().bucket(bucketName).build());

                exists = true;

            }

        } catch (Exception e) {

            e.printStackTrace();

            exists = false;

        }

        return exists;

    }



    /**

     * 上传文件

     */

    public void upload(MultipartFile file, String fileName) {

        // 使用putObject上传一个文件到存储桶中。

        InputStream inputStream = null;

        try {

            inputStream = file.getInputStream();

            minioClient.putObject(PutObjectArgs.builder()

                    .bucket(minioConfig.getBucketName())

                    .object(fileName)

                    .stream(inputStream, file.getSize(), -1)

                    .contentType(file.getContentType())

                    .build());

            inputStream.close();

        } catch (Exception e) {

            e.printStackTrace();

        }

    }



    /**

     * 获取文件访问地址

     */

    public String getFileUrl(String fileName) {

        try {

            return minioClient.getPresignedObjectUrl(GetPresignedObjectUrlArgs.builder()

                    .method(Method.GET)

                    .bucket(minioConfig.getBucketName())

                    .object(fileName)

                    .build()

            );

        } catch (Exception e) {

            e.printStackTrace();

        }

        return null;

    }



    /**

     * 下载一个文件（返回文件流）

     */

    public InputStream download(String objectName) throws Exception {

        InputStream stream = minioClient.getObject(

                GetObjectArgs.builder().bucket(minioConfig.getBucketName()).object(objectName).build());

        return stream;

    }





    /**

     * 下载文件

     */

    public void download(HttpServletResponse response, String newFileName, String saveFileName) {

        InputStream in = null;

        try {

            // 获取对象信息

            StatObjectResponse stat = minioClient.statObject(StatObjectArgs.builder()

                    .bucket(minioConfig.getBucketName())

                    .object(saveFileName)

                    .build());



            // 设置请求头Content-Type

            response.setContentType(stat.contentType());



            // 确保使用 UTF-8 编码

//            String encodedFileName = encodeFilename(newFileName);

            String encodedFileName = URLEncoder.encode(newFileName, "UTF-8").replaceAll("\\+", "%20");

            response.setHeader("Content-Disposition", "attachment; filename=\"" + encodedFileName + "\"");



            // 设置禁用缓存

            response.setHeader("Cache-Control", "no-cache, no-store, must-revalidate");

            response.setHeader("Pragma", "no-cache");

            response.setHeader("Expires", "0");



            // 设置文件大小

            long fileSize = stat.size();

            response.setContentLengthLong(fileSize);



            // 获取文件输入流

            in = minioClient.getObject(GetObjectArgs.builder()

                    .bucket(minioConfig.getBucketName())

                    .object(saveFileName)

                    .build());



            // 文件下载

            IOUtils.copy(in, response.getOutputStream());



        } catch (Exception e) {

            e.printStackTrace();

            try {

                response.sendError(HttpServletResponse.SC_INTERNAL_SERVER_ERROR, "File download failed: " + e.getMessage());

            } catch (IOException ioException) {

                ioException.printStackTrace();

            }

        } finally {

            if (in != null) {

                try {

                    in.close();

                } catch (IOException e) {

                    e.printStackTrace();

                }

            }

        }

    }

    



    /**

     * 删除文件

     */

    public void delete(String fileName) {

        try {

            minioClient.removeObject(RemoveObjectArgs.builder().bucket(minioConfig.getBucketName()).object(fileName).build());

        } catch (Exception e) {

            e.printStackTrace();

        }

    }



 

    /**

     * 判断文件是否存在

     *

     * @param objectName

     */

    public boolean isFileExist(String objectName) {

        boolean exist = true;

        try {

            minioClient.statObject(StatObjectArgs.builder().bucket(minioConfig.getBucketName()).object(objectName).build());

        } catch (Exception e) {

            log.error("[Minio工具类]>>>> 判断文件是否存在, 异常：", e);

            exist = false;

        }

        return exist;

    }

}

📝 文件上传/下载/预览/删除实战

🧁 1.文件上传

🍆 示例代码

/**

 * @author: bug菌

 * @date: 2024-10-21 12:07

 */

@Api(tags = "Minio文件管理")

@RestController

@RequestMapping("/file")

public class UploadFileController extends BaseController {



    @Autowired

    private MinioUtil minioUtil;



    /**

     * 上传文件

     */

    @GetMapping(value = "/upload")

    @ApiOperation("上传文件")

    public R upload(MultipartFile file) {

        // 获取到上传文件的完整名称，包括文件后缀

        String fileName = file.getOriginalFilename();

        // 获取不带后缀的文件名

        String baseName = FilenameUtils.getBaseName(fileName);

        // 获取文件后缀

        String extension = FilenameUtils.getExtension(fileName);

        //创建一个独一的文件名(存于服务器名),格式为 name_时间戳.后缀

        String saveFileName = baseName + "_" + System.currentTimeMillis() + "." + extension;

        minioUtil.upload(file, saveFileName);

        return R.ok("上传成功！存放文件名为：" + saveFileName);

    }

}

🥔 示例测试

Postman接口测试上传接口如下：

校验文件是否真正上传到minio中，我们可以上客户端查验下。根据登录查看确实是我们测试时所上传的文件。

🍓 示例代码解析

在本次的代码演示中，我将会深入剖析每句代码，详细阐述其背后的设计思想和实现逻辑。通过这样的讲解方式，我希望能够引导同学们逐步构建起对代码的深刻理解。我会先从代码的结构开始，逐步拆解每个模块的功能和作用，并指出关键的代码段，并解释它们是如何协同运行的。通过这样的讲解和实践相结合的方式，我相信每位同学都能够对代码有更深入的理解，并能够早日将其掌握，应用到自己的学习和工作中。

如上提供的这段代码是一个用于文件上传的控制器，使用 Spring Boot 构建，负责处理文件的上传操作。以下是代码的详细解析：

类注解：
- @Api(tags = "Minio文件管理")：使用 Swagger API 文档工具生成接口文档，并为该类提供了一个标签“Minio文件管理”，用于描述文件管理相关的接口。
- @RestController：该注解表示这是一个控制器类，并且返回的内容会被自动序列化为 JSON 格式。它是 @Controller 和 @ResponseBody 的组合。
- @RequestMapping("/file")：设置该类的基础请求路径为 /file，所有该类中的请求都会以 /file 开头。

依赖注入：
- @Autowired：自动注入 MinioUtil 类的实例，MinioUtil 是一个封装了 MinIO 操作的工具类，用于处理与 MinIO 存储服务的交互。

方法注解：
- @GetMapping(value = "/upload")：处理 HTTP GET 请求，路径为 /file/upload。尽管通常文件上传使用 POST 请求，但这里使用 GET 请求可能是简化了请求示例，实际应用中可能使用 POST。
- @ApiOperation("上传文件")：Swagger 文档生成的描述，表示该接口用于上传文件。

上传文件操作：
- MultipartFile file：表示前端传递的文件。Spring 会自动将请求中的文件映射到该参数。
- String fileName = file.getOriginalFilename();：获取上传文件的原始文件名，包括文件扩展名。
- String baseName = FilenameUtils.getBaseName(fileName);：使用 Apache Commons IO 库的 FilenameUtils 类，获取文件的基本名称（不包含扩展名）。
- String extension = FilenameUtils.getExtension(fileName);：获取文件的扩展名。
- String saveFileName = baseName + "_" + System.currentTimeMillis() + "." + extension;：生成一个新的唯一文件名。通过文件的基本名称加上当前的时间戳（毫秒级），确保文件名不重复。
- minioUtil.upload(file, saveFileName);：调用 MinioUtil 类中的 upload 方法，将文件上传到 MinIO 存储服务，保存为 saveFileName。

返回结果：
- return R.ok("上传成功！存放文件名为：" + saveFileName);：返回上传成功的响应，R.ok() 是一个自定义的响应方法，表示操作成功并返回相应的信息，saveFileName 作为返回信息的一部分，告知客户端上传文件后的存储文件名。

小结：

该控制器类用于处理文件上传请求，接收文件并生成一个唯一的文件名，通过 MinioUtil 工具类将文件上传至 MinIO 存储。它结合了文件名生成、上传及响应返回等功能，实现了简单的文件上传管理。

🍬 2.文件下载

🍆 示例代码

    /**

     * 根据文件ID下载文件

     */

    @GetMapping("/download")

    @ApiOperation("根据文件ID下载文件")

    public void downloadById(@RequestParam("fileName") String fileName, @RequestParam("saveFileName") String saveFileName, HttpServletResponse response) {

        // 下载文件，传递存储文件名和显示文件名

        minioUtil.download(response, fileName, saveFileName);

        return;

    }

🥔 示例测试

Postman接口测试上传接口如下：

🍓 示例代码解析

如上提供的这段代码是用于根据文件ID下载文件的控制器方法。以下是对代码的详细解析：

方法注解：
- @GetMapping("/download")：该方法处理 HTTP GET 请求，路径为 /download。该请求用于根据文件ID下载文件。
- @ApiOperation("根据文件ID下载文件")：Swagger 文档生成的描述，表明该接口用于根据文件ID下载文件。

方法参数：
- @RequestParam("fileName") String fileName：从请求中获取名为 fileName 的请求参数，并将其绑定到 fileName 变量。这个参数通常表示文件在存储中的实际名称。
- @RequestParam("fileName") String saveFileName：这个参数也是从请求中获取名为 fileName 的请求参数。由于参数名称重复，可能会导致问题。正确的做法是使用不同的名字，例如 fileName 和 saveFileName，用来分别传递存储文件名和显示文件名。
- HttpServletResponse response：Spring MVC 自动注入的 HttpServletResponse 对象，用于设置响应信息，发送文件内容到客户端。

下载文件操作：
- minioUtil.download(response, fileName, saveFileName);：调用 MinioUtil 类中的 download 方法。该方法接收 HttpServletResponse 对象、存储文件名（fileName）和显示文件名（saveFileName）作为参数。download 方法将从 MinIO 存储中获取指定的文件并通过 HTTP 响应将其返回给客户端。

方法结束：
- return;：该方法没有返回任何内容，因为文件内容通过 HttpServletResponse 被直接流式传输到客户端。

小结：

该方法用于处理根据文件ID下载文件的请求。它通过传递文件名参数，调用 MinioUtil 的下载方法，将文件从 MinIO 存储下载并返回给客户端。

🍩 3.文件预览

🍓 示例代码

    @GetMapping("/preview")

    @ApiOperation("根据文件ID预览文件")

    public String previewFileById(@RequestParam("fileName") String fileName) {

        return minioUtil.getFileUrl(fileName);

    }

🥔 示例测试

Postman接口测试上传接口如下：

通过接口可直接给你返回该文件的预览地址，我们只需要在浏览器输入该地址便可预览。

🍆 示例代码解析

如上提供的这段代码是用于根据文件ID预览文件的控制器方法。以下是详细解析：

方法注解：
- @GetMapping("/preview")：该方法处理 HTTP GET 请求，路径为 /preview，用于根据文件ID预览文件。
- @ApiOperation("根据文件ID预览文件")：Swagger 文档生成的描述，表明该接口用于根据文件ID预览文件。

方法参数：
- @RequestParam("fileName") String fileName：从请求中获取名为 fileName 的请求参数，并将其绑定到 fileName 变量。这个参数通常表示要预览的文件在存储中的文件名。

文件预览操作：
- minioUtil.getFileUrl(fileName)：调用 MinioUtil 类中的 getFileUrl 方法，该方法使用文件名从 MinIO 存储生成文件的预览 URL。返回的 URL 通常是一个可以直接访问该文件的链接，可以在客户端浏览器中打开进行预览。

返回值：
- 方法返回 String 类型的文件预览 URL，这个 URL 可以直接访问文件并在浏览器中预览。

小结：

该方法用于处理根据文件ID预览文件的请求。它通过文件名生成一个文件的预览 URL，并将该 URL 返回给客户端，客户端可以使用该 URL 访问文件进行预览。

🍭 4.文件删除

🍓 示例代码

    /**

     * 根据文件ID删除文件

     */

    @GetMapping("/delete")

    @ApiOperation("根据文件ID删除文件")

    public R deleteById(@RequestParam("fileName") String fileName) {

        minioUtil.delete(fileName);

        return R.ok();

    }

🥔 示例测试

Postman接口测试上传接口如下：

接着我们上客户端查验下，该文件是否真被删除了。

根据时间倒序排序，确实该文件被删除了。

🍆 示例代码解析

如上提供的这段代码是用于根据文件ID删除文件的控制器方法。以下是详细解析：

方法注解：
- @GetMapping("/delete")：该方法处理 HTTP GET 请求，路径为 /delete，用于根据文件ID删除文件。
- @ApiOperation("根据文件ID删除文件")：Swagger 文档生成的描述，表明该接口用于根据文件ID删除文件。

方法参数：
- @RequestParam("fileName") String fileName：从请求中获取名为 fileName 的请求参数，并将其绑定到 fileName 变量。这个参数通常表示要删除的文件在存储中的文件名。

删除文件操作：
- minioUtil.delete(fileName)：调用 MinioUtil 类中的 delete 方法，该方法会根据提供的 fileName 删除 MinIO 存储中的对应文件。

返回值：
- 方法返回 R.ok()：表示操作成功，返回一个响应对象，R.ok() 是一种常见的封装返回成功的方式，可能会带有自定义的状态码或消息。

小结：
该方法处理根据文件ID删除文件的请求。它通过文件名调用 MinioUtil 删除对应的文件，并返回一个成功的响应。

🫐 MinIO与云原生架构的完美契合

MinIO不仅是一个存储工具，它更是云原生架构中不可或缺的一部分。与Kubernetes无缝整合，让微服务架构下的数据管理变得轻松自如。不论是CI/CD流水线还是大数据分析，MinIO都能应对自如。

🍐 总结与思考

通过这篇文章，你应该对Spring Boot与MinIO的结合有了一个全面的了解。这种现代化的文件存储方案不仅让开发更高效，也为未来业务的扩展奠定了坚实基础。既然已经Get到这么棒的技能，何不立即尝试一下，让你的项目也能“飞”起来？

🥕 附录相关报错及方案解决

🫛1、okhttp3包冲突

如果你遇到你的项目集成 minio 8.5.4 遇到 okhttp3包冲突，比如报错如下所示，可见我这篇《SpringBoot项目集成 minio 8.5.4 遇到 okhttp3包冲突，如何解决？》带你解决此问题：

🍏2、启动报错

如果你启动后遇到如下问题，比如报错如下所示，可见我这篇《集成minio启动报错：Caused by:java.lang.IllegalArgumentException:invalid hostname 10.66.66.143:9000...| 亲测有效》带你解决此问题：

ok，本期内容我就暂聊到这里，哇，一口气给大家输出完，我我我我...头发又脱落了一撮。

📣 关于我

我是bug菌，CSDN | 掘金 | InfoQ | 51CTO | 华为云 | 阿里云 | 腾讯云等社区博客专家，C站博客之星Top30，华为云2023年度十佳博主，掘金多年度人气作者Top40，掘金等各大社区平台签约作者，51CTO年度博主Top12，掘金/InfoQ/51CTO等社区优质创作者；全网粉丝合计 30w+；硬核微信公众号「猿圈奇妙屋」，欢迎你的加入！免费白嫖最新BAT互联网公司面试真题、4000G PDF电子书籍、简历模板等海量资料，你想要的我都有，关键是你不来拿哇。

-End-

作者：bug菌
来源：juejin.cn/post/7443658338867134518

收起阅读 »

一个 Bug JDK 居然改了十年？

Java

问题现象今天偶然看到了一个 JDK 的 Bug，给大家分享一下。假设现在有如下的代码： List<String> list = new ArrayList<>(); list.add("1"); Object[] array = l...

继续阅读 »

问题现象

今天偶然看到了一个 JDK 的 Bug，给大家分享一下。

假设现在有如下的代码：

List<String> list = new ArrayList<>();

list.add("1");

Object[] array = list.toArray();

array[0] = 1;

System.out.println(Arrays.toString(array));

上面的代码是可以正常支执行的，如下图所示：

修改代码为如下代码：

List<String> list = Arrays.asList("1");

Object[] array = list.toArray();

array[0] = 1;

System.out.println(Arrays.toString(array));

再次执行代码，结果就会抛出 ArrayStoreException 异常，这个异常表明这里并不能把一个 Integer 类型的对象存放到这个数组里面。如下图所示：

查看 Arrays 的静态内部类 ArrayList 的 toArray() 方法的返回值就是 Object[] 类型的，如下图所示：

这里就会引发一个疑问：为啥使用 java.lang.util.ArrayList 代码就可以正常运行？但是使用 Arrays 的静态内部类 ArrayList 就会报错了？

原因分析

首先看下 java.lang.util.ArrayList 类的 toArray() 方法的实现逻辑：

从上面可以看出 toArray() 方法是拷贝了一个 ArrayList 内部的数组对象，然后返回的。而 elementData 这个数组在实际初始化的时候，就是 new 了 Object 类型的数组。如下图所示：

那么经过拷贝之后返回的还是一个实际类型为Object 类型的数组。既然这里是一个 Object 类型的数组，那么往里面放一个 Integer 类型的数据是合法的，因为 Object 是 Integer 类型的父类。

然后再看下 Arrays 的静态内部类 ArrayList 的 toArray() 方法的实现逻辑。这里返回的是 a 这个数组的一个克隆。如下图所示：

而这个 a 数组声明的类型是 E[]，根据泛型擦除后的原则，这里实际上声明的类型也变成了 Object[]。如下图所示：

那接下来再看看 a 实际的类型是什么？由于 Arrays 的静态内部类 ArrayList 的构造函数是包级访问的，因此只能通过 Arrays.asList() 静态方法来构造一个这个对象。如下图所示：

而 Arrays.asList() 方法的签名是变长参数类型，这个是 Java 的一个语法糖，实际对应的是一个数组，泛型擦除后就变成了 Object[] 类型。如下图所示：

而在代码实际调用处，实际上会 new 一个 String 类型的数组，也就是说「a 的实际类型是一个 String 类型的数组」。那么 a 调用了 clone() 方法之后返回的类型也是一个 String 类型的数组，克隆嘛，类型一样才叫克隆。如下图所示：

经过上面的分析，答案就呼之欲出了。a 的实际类型是一个 String 类型的数组，那么往这个数组里面放一个 Integer 类型的对象那肯定是要报错的。等效代码如下图所示：

为什么是个Bug ？

查看 Collection 接口的方法签名，方法声明明确是要返回的是一个 Object[] 类型的数组，因为方法明确声明了返回的是一个 Object[] 类型的数组，但是实际上在获取到了这个返回值后把它当作一个 Object[] 类型的数组使用某些情况下是不满足语义的。

同时这里要注意一下，返回的这个数组要是一个「安全」的数组，安全的意思就是「集合本身不能持有对返回的数组的引用」，即使集合的内部是用数组实现的，也不能直接把这个内部的数组直接返回。这就是为什么上面两个 toArray() 方法的实现要么是把原有的数组复制了一份，要么是克隆了一份，本质上都是新建了一个数组。如下图所示：

在 OpenJDK 的 BugList 官网上很早就有人提出这个问题了，从时间上看至少在 2005 年就已经发现这个 Bug 了，这个 Bug 真正被解决是在 2015 年的时候，整整隔了 10 年时间。花了 10 年时间修这个 Bug，真是十年磨一剑啊！

如何修正的这个 Bug ？

JDK 9 中的实现修改为了新建一个 Object 类型的数组，然后把原有数组中的元素拷贝到这个数组里面，然后返回这个 Object 类型的数组，这样的话就和 java.util.ArrayList 类中的实现方法一样了。

在 java.util.ArrayList 类的入参为 Collection\<? exends E> 类型的构造函数中就涉及到可能调用 Arrays 的静态内部类 ArrayList 的 toArray() 方法，JDK 在实现的时候针对这个 Bug 还做了特殊的处理，不同厂商发行的 JDK 处理方式还有细微的不同。

Oracel JDK 8 版本的实现方式：

Eclipse Temurin Open JDK 8 版本的实现方式：

之所以在 java.util.ArrayList 对这个 Bug 做特殊的处理是因为 Sun 公司在当时选择不修复改这个Bug，因为怕修复了之后已有的代码就不能运行了。如下图所示：

比如在修复前有如下的代码，这个代码在 JDK 8 版本是可以正常运行的，如下图所示：

String[] strings = (String[]) Arrays.asList("foo", "bar").toArray();  

for (String string : strings) {  

    System.out.println(string);  

}

但是如果升级到 JDK 9 版本，就会报 ClassCastException 异常了，如下图所示：

因为修复了这个 Bug 之后，编译器并不能告诉你原来的代码存在问题，甚至连新的警告都没有。假设你从 JDK 8 升级到 JDK 9 了，代码也没有改，但是突然功能就用不了，这个时候你想不想骂人，哈哈哈哈。这也许就是 Sun 公司当年不愿意修复这个 Bug 的原因之一了。当然，如果你要问我为什么要升级的话，我会说：你发任你发，我用 Java 8 ！

题外话

阿里巴巴的 Java开发手册对 toArray(T[] array) 方法的调用有如下的建议：

这里以 java.util.ArrayList 类的源码作为参考，源码实现如下：

// ArrayList 的 toArray() 方法实现：

public <T> T[] toArray(T[] a) {  

    if (a.length < size)  // 如果传入的数组的长度小于 size 

        // Make a new array of a's runtime type, but my contents:  

        return (T[]) Arrays.copyOf(elementData, size, a.getClass());  

    System.arraycopy(elementData, 0, a, 0, size);  

    if (a.length > size)  

        a[size] = null;  

    return a;  

}

// Arrays 的 coypyOf 方法实现：

public static <T,U> T[] copyOf(U[] original, int newLength, Class<? extends T[]> newType) {  

    @SuppressWarnings("unchecked")  

    T[] copy = ((Object)newType == (Object)Object[].class)  

        ? (T[]) new Object[newLength]  

        : (T[]) Array.newInstance(newType.getComponentType(), newLength);  

    System.arraycopy(original, 0, copy, 0,  

                     Math.min(original.length, newLength));  

    return copy;  

}

当调用 toArray() 方法时传入的数组长度为 0 时，方法内部会根据传入的数组类型动态创建一个和当前集合 size 相同的数组，然后把集合的元素复制到这个数组里面，然后返回。

当调用 toArray() 方法时传入的数组长度大于 0，小于 ArrayList 的 size 时，走的逻辑和上面是一样的，也会进入到 Arays 的 copyOf 方法的调用中，但是调用方法传入的新建的数组相当于新建之后没有被使用，白白浪费了，需要等待 GC 回收。

当调用 toArray() 方法时传入的数组长度大于等于 ArrayList 的 size 时，则会直接把集合的元素拷贝到这个数组中。如果是大于的情况，还会把数组中下标为 size 的元素设置为 null，但是 size 下标后面的元素保持不变。如下所示：

List<String> list = new ArrayList<>();  

list.add("1");  

String[] array = new String[3];  

array[1] = "2";  

array[2] = "3";  

String[] toArray = list.toArray(array);  

System.out.println(array == toArray);  

System.out.println(Arrays.toString(toArray));

手册中提到的在高并发的情况下，传入的数组长度等于 ArrayList 的 size 时，如果 ArrayList 的 size 在数组创建完成后变大了，还是会走到重新新建数组的逻辑里面，仍然会导致调用方法传入的新建的数组没有被使用，而且这里因为调用方法时新建的数组和 ArrayList 之前的 size 相同，会造成比传入长度为 0 的数组浪费多得多的空间。但是我个人觉得，因为 ArrayList 不是线程安全的，如果存在数据竞争的情况就不应该使用。

参考

Arrays.asList(x).toArray().getClass() should be Object[].class

array cast Java 8 vs Java 9

toArray方法的小陷阱，写开发手册的大佬也未能幸免

 .toArray(new MyClass[0]) or .toArray(new MyClass[myList.size()])?

Arrays of Wisdom of the Ancients

Java开发手册(黄山版).pdf

作者：javadaydayup
来源：juejin.cn/post/7443746761846374439

收起阅读 »

业务场景

核心思路

相关实现

枚举定义

注册发现

请求与响应

Mybatis Plus 枚举中的使用

【谈一谈】Redis是AP还是CP?

一、总纲图:

二、什么是CAP?

CAP理论

三、为啥说Redis是AP?不是CP?

REDIS是AP的理由

为什么Redis无法保持强一致性??

完结!~

士不可以不弘毅,任重而道远,诸君共勉!~

防重复提交

1、自定义防重复提交注解

2、防止重复提交的抽象类

2.1、preHandle 方法

2.2、isRepeatSubmit 方法

2.2.1、compareParams 方法

2.2.2、compareTime 方法

备注：

RepeatedlyRequestWrapper

getBodyString 方法

接口基本信息

接口实现

接口优化

优化方案1

优化方案2

优化方案3

优化方案4

其他问题

问题1

问题2

问题3

各种O都是干什么的？

为什么要划分各种O？

OO不分的惨痛经历

前端中O的使用

介绍

接口限流

防重复提交

接口防抖

关于作者

来自一线程序员Seven的探索与实践，持续学习迭代中~本文已收录于我的个人博客：http://www.seven97.top公众号：seven97，欢迎关注~作者：Seven97来源：juejin.cn/post/7408859165433364490

一、背景

二、解决方案

1. 通用操作

1.1 确认binlog开启

1.1.1 查询开启状态

1.1.2 开启binlog

1.2 binlog模式

1.2.1 查询binlog模式

1.2.2 配置binlog模式

1.3 binlog信息查询

1.3.1 查询当前使用的binlog文件

1.3.2 找到所有binlog文件名

1.3.3 查询binlog保存位置

2. 方案一：找到insert语句，重新插入

2.1 找到binlog文件

2.2 根据时间点解析binlog文件

2.2.1 statement模式确认binlog位置

2.2.2 row模式确认binlog位置

2.3 根据binlog位置解析binlog文件

2.4 重放数据

3. 方案二：找到delete语句，生成逆向操作，重新insert

3.1 找到binlog文件

3.2 根据时间点解析binlog文件

3.2.1 statement模式

3.2.2 row模式

3.3 生成逆向操作

3.4 重放数据

三、常见工具

1. binlog2mysql

四、总结

1. Native Image

1.1 GraalVM

1.2 Native Image

`CAP`理论

`REDIS`是`AP`的理由

为什么`Redis`无法保持强一致性??

来自一线程序员Seven的探索与实践，持续学习迭代中~
本文已收录于我的个人博客：http://www.seven97.top
公众号：seven97，欢迎关注~

作者：Seven97
来源：juejin.cn/post/7408859165433364490