java集合类详解(五)：Set

终身学习的程序猿

2010-12-01

1.1、概述 Java 中的Set和正好和数学上直观的集（set）的概念是相同的。Set最大的特性就是不允许在其中存放的元素是重复的。根据这个特点，我们就可以使用Set 这个接口来实现前面提到的关于商品种类的存储需求。Set 可以被用来过滤在其他集合中存放的元素，从而得到一个没有包含重复新的集合。

1.2、常用方法

按照定义，Set接口继承Collection接口，而且它不允许集合中存在重复项。所有原始方法都是现成的，没有引入新方法。具体的Set实现类依赖添加的对象的equals()方法来检查等同性。

我们简单的描述一下各个方法的作用：

publicintsize()：返回set中元素的数目，如果set包含的元素数大于Integer.MAX_VALUE，返回Integer.MAX_VALUE

publicbooleanisEmpty()：如果set中不含元素，返回true

publicbooleancontains(Objecto)：如果set包含指定元素，返回true

publicIteratoriterator()：返回set中元素的迭代器,元素返回没有特定的顺序

publicObject[]toArray()：返回包含set中所有元素的数组

publicObject[]toArray(Object[]a)：返回包含set中所有元素数组，返回数组运行时类型是指定数组运行时类型

publicbooleanadd(Objecto)：如果set中不存在指定元素，则向set加入

publicbooleanremove(Objecto)：如果set中存在指定元素，则从set中删除

publicbooleanremoveAll(Collectionc)：如果set包含指定集合，则从set中删除指定集合的所有元素

publicbooleancontainsAll(Collectionc)：如果set包含指定集合的所有元素，返回true。如果指定集合也是一个set，只有是当前set的子集时，方法返回true

publicbooleanaddAll(Collectionc)：如果set中中不存在指定集合的元素，则向set中加入所有元素

publicbooleanretainAll(Collectionc)：只保留set中所含的指定集合的元素（可选操作）。换言之，从set中删除所有指定集合不包含的元素。如果指定集合也是一个set，那么该操作修改set的效果是使它的值为两个set的交集

publicbooleanremoveAll(Collectionc)：如果set包含指定集合，则从set中删除指定集合的所有元素

publicvoidclear()：从set中删除所有元素

“集合框架” 支持 Set 接口两种普通的实现：HashSet 和 TreeSet以及LinkedHashSet。下表中是Set的常用实现类的描述：

Set，成员不能重复

HashSet，外部无序地遍历成员。成员可为任意Object子类的对象，但如果覆盖了equals方法，同时注意修改hashCode方法。

TreeSet，外部有序地遍历成员；附加实现了SortedSet,支持子集等要求顺序的操作，成员要求实现Comparable接口，或者使用Comparator构造TreeSet。成员一般为同一类型。

LinkedHashSet ，外部按成员的插入顺序遍历成员，成员与HashSet成员类似，成员可为任意Object子类的对象，但如果覆盖了equals方法，同时注意修改hashCode方法。附加实现了SortedSet, 支持子集等要求顺序的操作成员要求实现Comparable接口，或者使用Comparator构造TreeSet。成员一般为同一类型。外部按成员的插入顺序遍历成员成员与HashSet成员类似

在更多情况下，您会使用 HashSet 存储重复自由的集合。同时HashSet中也是采用了Hash算法的方式进行存取对象元素的。所以添加到 HashSet 的对象对应的类也需要采用恰当方式来实现 hashCode() 方法。虽然大多数系统类覆盖了 Object 中缺省的 hashCode() 实现，但创建您自己的要添加到 HashSet 的类时，别忘了覆盖 hashCode()。

对于Set的使用，我们先以一个简单的例子来说明：

import java.util.*;

public class HashSetDemo {

public static void main(String[] args) {

Set set1 = new HashSet();

if (set1.add("a")) {// 添加成功

System.out.println("1 add true");

}

if (set1.add("a")) {// 添加失败

System.out.println("2 add true");

}

set1.add("000");// 添加对象到Set集合中

set1.add("111");

set1.add("222");

System.out.println("集合set1的大小：" + set1.size());

System.out.println("集合set1的内容：" + set1);

set1.remove("000");// 从集合set1中移除掉 "000" 这个对象

System.out.println("集合set1移除 000 后的内容：" + set1);

System.out.println("集合set1中是否包含000 ：" + set1.contains("000"));

System.out.println("集合set1中是否包含111 ：" + set1.contains("111"));

Set set2 = new HashSet();

set2.add("111");

set2.addAll(set1);// 将set1 集合中的元素全部都加到set2中

System.out.println("集合set2的内容：" + set2);

set2.clear();// 清空集合 set1 中的元素

System.out.println("集合set2是否为空：" + set2.isEmpty());

Iterator iterator = set1.iterator();// 得到一个迭代器

while (iterator.hasNext()) { // 遍历

Object element = iterator.next();

System.out.println("iterator = " + element);

}

// 将集合set1转化为数组

Object s[] = set1.toArray();

for (int i = 0; i < s.length; i++) {

System.out.println(s[i]);

}

程序执行的结果为：

1addtrue

集合set1的大小：4

集合set1的内容：[222,a,000,111]

集合set1移除000后的内容：[222,a,111]

集合set1中是否包含000：false

集合set1中是否包含111：true

集合set2的内容：[222,a,111]

集合set2是否为空：true

iterator=222

iterator=a

iterator=111

222

111

从上面的这个简单的例子中，我们可以发现，Set中的方法与直接使用Collection中的方法一样。唯一需要注意的就是Set中存放的元素不能重复。

我们再看一个例子，来了解一下其它的Set的实现类的特性：

packagec08;

importjava.util.*;

publicclassSetSortExample{

publicstaticvoidmain(Stringargs[]){

Setset1=newHashSet();

Setset2=newLinkedHashSet();

for(inti=0;i<5;i++){

//产生一个随机数，并将其放入Set中

ints=(int)(Math.random()*100);

set1.add(newInteger(s));

set2.add(newInteger(s));

System.out.println("第"+i+"次随机数产生为："+s);

}

System.out.println("未排序前HashSet："+set1);

System.out.println("未排序前LinkedHashSet："+set2);

//使用TreeSet来对另外的Set进行重构和排序

SetsortedSet=newTreeSet(set1);

System.out.println("排序后TreeSet："+sortedSet);

}

该程序的一次执行结果为：

第0次随机数产生为：96

第1次随机数产生为：64

第2次随机数产生为：14

第3次随机数产生为：95

第4次随机数产生为：57

未排序前HashSet：[64,96,95,57,14]

未排序前LinkedHashSet：[96,64,14,95,57]

排序后TreeSet：[14,57,64,95,96]

从这个例子中，我们可以知道HashSet的元素存放顺序和我们添加进去时候的顺序没有任何关系，而LinkedHashSet则保持元素的添加顺序。TreeSet则是对我们的Set中的元素进行排序存放。

一般来说，当您要从集合中以有序的方式抽取元素时，TreeSet实现就会有用处。为了能顺利进行，添加到TreeSet的元素必须是可排序的。而您同样需要对添加到TreeSet中的类对象实现Comparable接口的支持。对于Comparable接口的实现，在前一小节的Map中已经简单的介绍了一下。我们暂且假定一棵树知道如何保持java.lang包装程序器类元素的有序状态。一般说来，先把元素添加到HashSet，再把集合转换为TreeSet来进行有序遍历会更快。这点和HashMap的使用非常的类似。

其实Set的实现原理是基于Map上面的。通过下面我们对Set的进一步分析大家就能更加清楚的了解这点了。

1.3、实现原理

Java中Set的概念和数学中的集合(set)一致，都表示一个集内可以存放的元素是不能重复的。

前面我们会发现，Set中很多实现类和Map中的一些实现类的使用上非常的相似。而且前面再讲解Map的时候，我们也提到：Map中的“键值对”，其中的“键”是不能重复的。这个和Set中的元素不能重复一致。我们以HashSet为例来分析一下，会发现其实Set利用的就是Map中“键”不能重复的特性来实现的。

先看看HashSet中的有哪些属性：

再结合构造函数来看看：

通过这些方法，我们可以发现，其实HashSet的实现，全部的操作都是基于HashMap来进行的。我们看看是如何通过HashMap来保证我们的HashSet的元素不重复性的：

看到这个操作我们可以发现HashSet的巧妙实现：就是建立一个“键值对”，“键”就是我们要存入的对象，“值”则是一个常量。这样可以确保，我们所需要的存储的信息之是“键”。而“键”在Map中是不能重复的，这就保证了我们存入Set中的所有的元素都不重复。而判断是否添加元素成功，则是通过判断我们向Map中存入的“键值对”是否已经存在，如果存在的话，那么返回值肯定是常量：PRESENT，表示添加失败。如果不存在，返回值就为null表示添加成功。

我们再看看其他的方法实现：

了解了这些后，我们就不难理解，为什么HashMap中需要注意的地方，在HashSet中也同样的需要注意。其他的Set的实现类也是差不多的原理。

至此对于Set我们就应该能够比较好的理解了。

数学集合 hashcode

安科网

java集合类详解(五)：Set

终身学习的程序猿

终身学习的程序猿

相关推荐

P2057 [SHOI2007]善意的投票 / [JLOI2010]冠军调查

Java Review (二十三、集合-----概述）

jav的流行型

数据结构与算法分析 - 9 - 并查集（不相交集）

【Python】组合数据类型

[考试反思]0515省选模拟97：构造

07. 集合

Python 内置数据结构之 set

Python的set集合详解

模拟111 题解

怎样量化评价搜索引擎的结果质量

java 集合（set，map，list）

每周一练之数据结构与算法（Set）

一起来用js实现一个Set 类

JavaScript数据结构与算法——集合

JS数据结构与算法_集合&字典

集合框架知识系列01 总体框架

Java集合Set List Map

JavaScript ES6 (五) - 集合

python奇遇记：数据结构窥探3

终身学习的程序猿