目录

一、分布式锁介绍

二、原理

Zookeeper节点的概念:

Znode分为四种类型:

Zookeeper分布式锁的原理

获取锁

释放锁

三、zookeeper分布式锁实现

1.定义分布式锁接口

2.定义一个简单的互斥锁

3. 分布式锁的实现细节

4. 获取锁调用demo


一、分布式锁介绍

分布式锁主要用于在分布式环境中保护跨进程、跨主机、跨网络的共享资源实现互斥访问,以达到保证数据的一致性。

二、原理

Zookeeper节点的概念:

Zookeeper的数据存储结构就像一棵树,这棵树由节点组成,这种节点叫做Znode。

Znode分为四种类型:

1.持久节点 (PERSISTENT)

默认的节点类型。创建节点的客户端与zookeeper断开连接后,该节点依旧存在 。

2.持久节点顺序节点(PERSISTENT_SEQUENTIAL)

所谓顺序节点,就是在创建节点时,Zookeeper根据创建的时间顺序给该节点名称进行编号:

3.临时节点(EPHEMERAL)

和持久节点相反,当创建节点的客户端与zookeeper断开连接后,临时节点会被删除:

4.临时顺序节点(EPHEMERAL_SEQUENTIAL)

顾名思义,临时顺序节点结合和临时节点和顺序节点的特点:在创建节点时,Zookeeper根据创建的时间顺序给该节点名称进行编号;当创建节点的客户端与zookeeper断开连接后,临时节点会被删除。

Zookeeper分布式锁的原理

Zookeeper分布式锁恰恰应用了临时顺序节点。具体如何实现呢?让我们来看一看详细步骤:

获取锁

首先,在Zookeeper当中创建一个持久节点ParentLock。当第一个客户端想要获得锁时,需要在ParentLock这个节点下面创建一个临时顺序节点 Lock1。

之后,Client1查找ParentLock下面所有的临时顺序节点并排序,判断自己所创建的节点Lock1是不是顺序最靠前的一个。如果是第一个节点,则成功获得锁。

这时候,如果再有一个客户端 Client2 前来获取锁,则在ParentLock下载再创建一个临时顺序节点Lock2。

Client2查找ParentLock下面所有的临时顺序节点并排序,判断自己所创建的节点Lock2是不是顺序最靠前的一个,结果发现节点Lock2并不是最小的。

于是,Client2向排序仅比它靠前的节点Lock1注册Watcher,用于监听Lock1节点是否存在。这意味着Client2抢锁失败,进入了等待状态。  

这时候,如果又有一个客户端Client3前来获取锁,则在ParentLock下载再创建一个临时顺序节点Lock3。

Client3查找ParentLock下面所有的临时顺序节点并排序,判断自己所创建的节点Lock3是不是顺序最靠前的一个,结果同样发现节点Lock3并不是最小的。

于是,Client3向排序仅比它靠前的节点Lock2注册Watcher,用于监听Lock2节点是否存在。这意味着Client3同样抢锁失败,进入了等待状态。  

这样一来,Client1得到了锁,Client2监听了Lock1,Client3监听了Lock2。这恰恰形成了一个等待队列,很像是Java当中ReentrantLock所依赖的

释放锁

释放锁分为两种情况:

1.任务完成,客户端显示释放

当任务完成时,Client1会显示调用删除节点Lock1的指令。

2.任务执行过程中,客户端崩溃

获得锁的Client1在任务执行过程中,如果Duang的一声崩溃,则会断开与Zookeeper服务端的链接。根据临时节点的特性,相关联的节点Lock1会随之自动删除。

由于Client2一直监听着Lock1的存在状态,当Lock1节点被删除,Client2会立刻收到通知。这时候Client2会再次查询ParentLock下面的所有节点,确认自己创建的节点Lock2是不是目前最小的节点。如果是最小,则Client2顺理成章获得了锁。

同理,如果Client2也因为任务完成或者节点崩溃而删除了节点Lock2,那么Client3就会接到通知。

最终,Client3成功得到了锁。

 

三、zookeeper分布式锁实现

在介绍使用Zookeeper实现分布式锁之前,首先看当前的系统架构图

java使用zookeeper分布式锁 zookeeper实现分布式锁的原理_分布式锁

Service表示需要互斥访问的共享资源。

1.定义分布式锁接口

package com.ljq.lock;

import java.util.concurrent.TimeUnit;

public interface DistributedLock {
    /**
     * 获取锁,如果没有得到锁就一直等待
     * 
     * @throws Exception
     */
    public void acquire() throws Exception;

    /**
     * 获取锁,如果没有得到锁就一直等待直到超时
     * 
     * @param time 超时时间
     * @param unit time参数时间单位
     * 
     * @return 是否获取到锁
     * @throws Exception
     */
    public boolean acquire(long time, TimeUnit unit) throws Exception;

    /**
     * 释放锁
     * 
     * @throws Exception
     */
    public void release() throws Exception;
}

2.定义一个简单的互斥锁

定义一个互斥锁类,实现以上定义的锁接口,同时继承一个基类BaseDistributedLock,该基类主要用于与Zookeeper交互,包含一个尝试获取锁的方法和一个释放锁。

package com.ljq.lock;

import java.io.IOException;
import java.util.concurrent.TimeUnit;

import org.I0Itec.zkclient.ZkClient;

public class SimpleDistributedLock extends BaseDistributedLock implements DistributedLock {

    /*
     * 用于保存Zookeeper中实现分布式锁的节点,如名称为locker:/locker,
     * 该节点应该是持久节点,在该节点下面创建临时顺序节点来实现分布式锁
     */
    private final String basePath;

    /*
     * 锁名称前缀,locker下创建的顺序节点例如都以lock-开头,这样便于过滤无关节点
     * 这样创建后的节点类似:lock-00000001,lock-000000002
     */
    private static final String LOCK_NAME = "lock-";

    /* 用于保存某个客户端在locker下面创建成功的顺序节点,用于后续相关操作使用(如判断) */
    private String ourLockPath;

    /**
     * 传入Zookeeper客户端连接对象,和basePath
     * 
     * @param client
     *            Zookeeper客户端连接对象
     * @param basePath
     *            basePath是一个持久节点
     */
    public SimpleDistributedLock(ZkClient client, String basePath) {
        /*
         * 调用父类的构造方法在Zookeeper中创建basePath节点,并且为basePath节点子节点设置前缀
         * 同时保存basePath的引用给当前类属性
         */
        super(client, basePath, LOCK_NAME);
        this.basePath = basePath;
    }
    
    /**
     * 用于获取锁资源,通过父类的获取锁方法来获取锁
     * 
     * @param time 获取锁的超时时间
     * @param unit 超时时间单位
     * 
     * @return 是否获取到锁
     * @throws Exception
     */
    private boolean internalLock(long time, TimeUnit unit) throws Exception {
        // 如果ourLockPath不为空则认为获取到了锁,具体实现细节见attemptLock的实现
        ourLockPath = attemptLock(time, unit);
        return ourLockPath != null;
    }


    /**
     * 获取锁,如果没有得到锁就一直等待
     * 
     * @throws Exception
     */
    public void acquire() throws Exception {
        // -1表示不设置超时时间,超时由Zookeeper决定
        if (!internalLock(-1, null)) {
            throw new IOException("连接丢失!在路径:'" + basePath + "'下不能获取锁!");
        }
    }

    /**
     * 获取锁,如果没有得到锁就一直等待直到超时
     * 
     * @param time 超时时间
     * @param unit time参数时间单位
     * 
     * @return 是否获取到锁
     * @throws Exception
     */
    public boolean acquire(long time, TimeUnit unit) throws Exception {
        return internalLock(time, unit);
    }

    
    /**
     * 释放锁
     */
    public void release() throws Exception {
        releaseLock(ourLockPath);
        System.out.println(ourLockPath + "锁已释放...");
    }
}

3. 分布式锁的实现细节

获取分布式锁的重点逻辑在于BaseDistributedLock,实现了基于Zookeeper实现分布式锁的细节。

package com.ljq.lock;

import java.util.Collections;
import java.util.Comparator;
import java.util.List;
import java.util.concurrent.CountDownLatch;
import java.util.concurrent.TimeUnit;

import org.I0Itec.zkclient.IZkDataListener;
import org.I0Itec.zkclient.ZkClient;
import org.I0Itec.zkclient.exception.ZkNoNodeException;

public class BaseDistributedLock {
    private final ZkClient client; //Zookeeper客户端
    private final String basePath; //用于保存Zookeeper中实现分布式锁的节点,例如/locker节点,该节点是个持久节点,在该节点下面创建临时顺序节点来实现分布式锁
    private final String path; //同basePath变量一样
    private final String lockName; //锁名称前缀,/locker下创建的顺序节点,例如以lock-开头,这样便于过滤无关节点
    private static final Integer MAX_RETRY_COUNT = 10; //最大重试次数

    public BaseDistributedLock(ZkClient client, String path, String lockName) {
        this.client = client;
        this.basePath = path;
        this.path = path.concat("/").concat(lockName);
        this.lockName = lockName;
    }

    /**
     * 删除节点
     * 
     * @param path 
     * @throws Exception
     */
    private void deletePath(String path) throws Exception {
        client.delete(path);
    }

    /**
     * 创建临时顺序节点
     * 
     * @param client Zookeeper客户端
     * @param path 节点路径
     * @return
     * @throws Exception
     */
    private String createEphemeralSequential(ZkClient client, String path) throws Exception {
        return client.createEphemeralSequential(path, null);
    }

    /**
     * 获取锁的核心方法
     * 
     * @param startMillis 当前系统时间
     * @param millisToWait 超时时间
     * @param path 
     * @return
     * @throws Exception
     */
    private boolean waitToLock(long startMillis, Long millisToWait, String path) throws Exception {
        boolean haveTheLock = false; //获取锁标志
        boolean doDelete = false; //删除锁标志

        try {
            while (!haveTheLock) {
                // 获取/locker节点下的所有顺序节点,并且从小到大排序
                List<String> children = getSortedChildren();
                // 获取子节点,如:/locker/node_0000000003返回node_0000000003
                String sequenceNodeName = path.substring(basePath.length() + 1);

                // 计算刚才客户端创建的顺序节点在locker的所有子节点中排序位置,如果是排序为0,则表示获取到了锁
                int ourIndex = children.indexOf(sequenceNodeName);

                /*
                 * 如果在getSortedChildren中没有找到之前创建的[临时]顺序节点,这表示可能由于网络闪断而导致
                 * Zookeeper认为连接断开而删除了我们创建的节点,此时需要抛出异常,让上一级去处理
                 * 上一级的做法是捕获该异常,并且执行重试指定的次数,见后面的 attemptLock方法
                 */
                if (ourIndex < 0) {
                    throw new ZkNoNodeException("节点没有找到: " + sequenceNodeName);
                }

                // 如果当前客户端创建的节点在locker子节点列表中位置大于0,表示其它客户端已经获取了锁
                // 此时当前客户端需要等待其它客户端释放锁
                boolean isGetTheLock = ourIndex == 0; //是否得到锁

                // 如何判断其它客户端是否已经释放了锁?从子节点列表中获取到比自己次小的那个节点,并对其建立监听
                String pathToWatch = isGetTheLock ? null : children.get(ourIndex - 1); //获取比自己次小的那个节点,如:node_0000000002

                if (isGetTheLock) {
                    haveTheLock = true;
                } else {
                    // 如果次小的节点被删除了,则表示当前客户端的节点应该是最小的了,所以使用CountDownLatch来实现等待
                    String previousSequencePath = basePath.concat("/").concat(pathToWatch);
                    final CountDownLatch latch = new CountDownLatch(1);
                    final IZkDataListener previousListener = new IZkDataListener() {
                        /**
                         * 监听指定节点删除时触发该方法
                         */
                        public void handleDataDeleted(String dataPath)
                                throws Exception {
                            // 次小节点删除事件发生时,让countDownLatch结束等待
                            // 此时还需要重新让程序回到while,重新判断一次!
                            latch.countDown();
                        }

                        /**
                         * 监听指定节点的数据发生变化触发该方法
                         * 
                         */
                        public void handleDataChange(String dataPath,
                                Object data) throws Exception {

                        }

                    };

                    try {
                        // 如果节点不存在会出现异常
                        client.subscribeDataChanges(previousSequencePath, previousListener); //监听比自己次小的那个节点

                        //发生超时需要删除节点
                        if (millisToWait != null) {
                            millisToWait -= (System.currentTimeMillis() - startMillis);
                            startMillis = System.currentTimeMillis();
                            if (millisToWait <= 0) {
                                doDelete = true; // timed out - delete our node
                                break;
                            }

                            latch.await(millisToWait, TimeUnit.MICROSECONDS);
                        } else {
                            latch.await();
                        }

                    } catch (ZkNoNodeException e) {
                        // ignore
                    } finally {
                        client.unsubscribeDataChanges(previousSequencePath, previousListener);
                    }
                }
            }
        } catch (Exception e) {
            // 发生异常需要删除节点
            doDelete = true;
            throw e;

        } finally {
            // 如果需要删除节点
            if (doDelete) {
                deletePath(path);
            }
        }
        return haveTheLock;
    }

    private String getLockNodeNumber(String str, String lockName) {
        int index = str.lastIndexOf(lockName);
        if (index >= 0) {
            index += lockName.length();
            return index <= str.length() ? str.substring(index) : "";
        }
        return str;
    }

    /**
     * 获取parentPath节点下的所有顺序节点,并且从小到大排序
     * 
     * @return
     * @throws Exception
     */
    private List<String> getSortedChildren() throws Exception {
        try {
            List<String> children = client.getChildren(basePath);
            Collections.sort(children, new Comparator<String>() {
                public int compare(String lhs, String rhs) {
                    return getLockNodeNumber(lhs, lockName).compareTo(
                            getLockNodeNumber(rhs, lockName));
                }
            });
            return children;

        } catch (ZkNoNodeException e) {
            client.createPersistent(basePath, true); //创建锁持久节点
            return getSortedChildren();
        }
    }

    /**
     * 释放锁
     * 
     * @param lockPath
     * @throws Exception
     */
    protected void releaseLock(String lockPath) throws Exception {
        deletePath(lockPath);
    }

    /**
     * 尝试获取锁
     * 
     * @param time
     * @param unit
     * @return
     * @throws Exception
     */
    protected String attemptLock(long time, TimeUnit unit) throws Exception {
        final long startMillis = System.currentTimeMillis();
        final Long millisToWait = (unit != null) ? unit.toMillis(time) : null;

        String ourPath = null;
        boolean hasTheLock = false; //获取锁标志
        boolean isDone = false; //是否完成得到锁
        int retryCount = 0; //重试次数

        // 网络闪断需要重试一试
        while (!isDone) {
            isDone = true;

            try {
                // createLockNode用于在locker(basePath持久节点)下创建客户端要获取锁的[临时]顺序节点
                ourPath = createEphemeralSequential(client, path);
                /**
                 * 该方法用于判断自己是否获取到了锁,即自己创建的顺序节点在locker的所有子节点中是否最小
                 * 如果没有获取到锁,则等待其它客户端锁的释放,并且稍后重试直到获取到锁或者超时
                 */
                hasTheLock = waitToLock(startMillis, millisToWait, ourPath);
                
            } catch (ZkNoNodeException e) {
                if (retryCount++ < MAX_RETRY_COUNT) {
                    isDone = false;
                } else {
                    throw e;
                }
            }
        }

        System.out.println(ourPath + "锁获取" + (hasTheLock ? "成功" : "失败"));
        if (hasTheLock) {
            return ourPath;
        }

        return null;
    }
}

4. 获取锁调用demo

package com.ljq.lock;

import org.I0Itec.zkclient.ZkClient;

public class LockTest {
    public static void main(String[] args) throws Exception {
        ZkClient zkClient = new ZkClient("192.168.2.249:2181", 3000);
        SimpleDistributedLock simple = new SimpleDistributedLock(zkClient, "/locker");
        
        for (int i = 0; i < 10; i++) {
            try {
                simple.acquire();
                System.out.println("正在进行运算操作:" + System.currentTimeMillis());
            } catch (Exception e) {
                e.printStackTrace();
            } finally {
                simple.release();
                System.out.println("=================\r\n");
            }
        }
    }
}