一、哈希码的官方文档解释

   hashcode方法返回该对象的哈希码值。支持该方法是为哈希表提供一些优点,例如,java.util.Hashtable 提供的哈希表。


二、hashCode 的常规协定  

    在 Java 应用程序执行期间,在同一对象上多次调用 hashCode 方法时,必须一致地返回相同的整数,前提是对象上 equals 比较中所用的信息没有被修改。从某一应用程序的一次执行到同一应用程序的另一次执行,该整数无需保持一致。如果根据 equals(Object) 方法,两个对象是相等的,那么在两个对象中的每个对象上调用 hashCode 方法都必须生成相同的整数结果。以下情况不是必需的:如果根据 equals(java.lang.Object) 方法,两个对象不相等,那么在两个对象中的任一对象上调用 hashCode 方法必定会生成不同的整数结果。但是,程序员应该知道,为不相等的对象生成不同整数结果可以提高哈希表的性能。


    实际上,由 Object 类定义的 hashCode() 方法确实会针对不同的对象返回不同的整数。(这一般是通过将该对象的内部地址转换成一个整数来实现的,但是 Java编程语言不需要这种实现技巧。)


    当equals方法被重写时,通常有必要重写 hashCode()方法,以维护 hashCode()方法的常规协定,该协定声明相等对象必须具有相等的哈希码。


    哈希码产生的依据:哈希码并不是完全唯一的,它是一种算法,让同一个类的对象按照自己不同的特征尽量的有不同的哈希码,但不表示不同的对象哈希码完全不同。也有相同的情况,看程序员如何写哈希码的算法。


    在Java中,哈希码代表对象的特征。


    例如对象

String str1 = “aa”, str1.hashCode= 3104 

         String str2 = “bb”, str2.hashCode= 3106 

         String str3 = “aa”, str3.hashCode= 3104


    根据HashCode由此可得出str1!=str2,str1==str3

三、常用的哈希码的算法

        1、Object类的hashCode.返回对象的内存地址经过处理后的结构,由于每个对象的内存地址都不一样,所以哈希码也不一样。


        2、String类的hashCode.根据String类包含的字符串的内容,根据一种特殊算法返回哈希码,只要字符串所在的堆空间相同,返回的哈希码也相同。


        3、Integer类,返回的哈希码就是Integer对象里所包含的那个整数的数值,例如Integer i1=new Integer(100),i1.hashCode的值就是100 。由此可见,2个一样大小的Integer对象,返回的哈希码也一样。


        equals()方法是默认的判断2个对象是否相等的方法,在Object类里有实现,判断的是2个对象的hashCode。但是在实际需求中,比如两个人,由同一个JavaBean创建的对象,如果人的属性完全相同,我们可以默认为是同一个人,但是在程序中,两者并不是同一个对象,所以hashCode并不相同,在Object类中的方法中,我们默认比较的是两者的hashCode,所以不能满足我们的需求,所以我们需要重写equals()方法,

User u1 = new User(“张三”); 

 User u2 = new User(“李四”); 

 User u3 = new User(“张三”);


        按照项目需求,用户只要名字相同,就表示同一个用户,所以我们认为,u1和u3是同一个人,同一个对象。但是因为u1,u2,u3三者的内存地址都各不相同,所以hibernate会认为这是3个不同的对象。这与我们假设的出了矛盾。 因此,在自定义JavaBean时,如果有需要,我们将重写Object类中的equals方法。


        equals和HashCode的关系


        由于我们重写了User的equals方法,所以 u1.equals(u2);返回true 但是,User并没有重写hashCode方法,它用的是Object类的hashCode方法,所以 u1和u2的HashCode并不相同。

四、HashSet中的HashCode

        Java中的集合(Collection)有两类,一类是List,再有一类是Set。 


        前者集合内的元素是有序的,元素可以重复;后者元素无序,但元素不可重复。


        在hashset中不允许出现重复对象,元素的位置也是不确定的。在hashset中又是怎样判定元素是否重复的呢?判断两个对象是否相等的规则是: 


                (1)判断两个对象的hashCode是否相等 


        如果不相等,认为两个对象也不相等,完毕,如果相等,转入2


                (2)判断两个对象用equals运算是否相等 


        如果不相等,认为两个对象也不相等 


        如果相等,认为两个对象相等(equals()是判断两个对象是否相等的关键) 


        通常想查找一个集合中是否包含某个对象,就是逐一取出每个元素与要查找的元素进行比较,当发现某个元素与要查找的对象进行equals方法比较的结果相等时,则停止继续查找并返回肯定的信息,否则返回否定的信息,如果一个集合中有很多元素譬如成千上万的元素,并且没有包含要查找的对象时,则意味着你的程序需要从该集合中取出成千上万个元素进行逐一比较才能得到结论,于是,有人就发明了一种哈希算法来提高从集合中查找元素的效率,这种方式将集合分成若干个存储区域,每个对象可以计算出一个哈希码,可以将哈希码分组,每组分别对应某个存储区域,根据一个对象的哈希码就可以确定该对象应该存储的那个区域。


        hashCode方法可以这样理解:它返回的就是根据对象的内存地址换算出的一个值。这样一来,当集合要添加新的元素时,先调用这个元素的hashCode方法,就一下子能定位到它应该放置的物理位置上。如果这个位置上没有元素,它就可以直接存储在这个位置上,不用再进行任何比较了;如果这个位置上已经有元素了,就调用它的equals方法与新元素进行比较,相同的话就不存了,不相同就散列其它的地址。这样一来实际调用equals方法的次数就大大降低了,几乎只需要一两次。