解析、查找数组中重复出现的元素,Java实现。
《数据结构与算法分析:解析、查找数组中重复出现的元素》
问题描述:一个结构化数据,假设事先按照某种顺序排好序(比如升序)的一个数组中,无规则、重复出现若干次某个相同元素,形如有序数组data:
data = { "A", "A", "B", "C", "C", "D", "D" , "D" }
data数组中,事先已经按照 A -> Z 升序排好,但是数组内部的数据元素无规则重复出现:
’A’在数组位置0,1(注:0,1指下标,下同)重复出现两次;
’B’没有重复;
’C’在数组位置3,4重复出现两次;
’D’在5,6,7位置重复出现三次。
针对这样的数据结构,设计算法并代码实现查找、分析数组中重复出现的元素。
算法的应用场景:这种算法的应用场景之一就是在通讯录联系人的操作中将被涉及。比如在我之前写的一篇文章:《Android基于PinnedSectionListView实现联系人通讯录》(链接地址: ,此文涉及到通讯录分类整理,需要按照联系人姓氏的首字符排序分组)。通常,一个手机的通讯录中存有若干个联系人,每个联系人都有姓,如果按照姓氏的首字符(比如,中文姓’张’,Zhang,首字符为’Z’)排成升序,将构成形如上述data数组的数据结构,进而对联系人进行分组。比如,都是张姓联系人,则都归入到’Z’组下,从而便于用户快速定位查找通讯录中个某一张姓联系人。因此,将此现实中的应用场景建立数据模型,就是本文算法所要解决的计算问题。
现给出一个代码实现(Java)的算法:
import java.util.ArrayList;
public class Test {
// 原始数据data。假设data数组中的数据元素已经按照某种顺序排好。
// 但是,该数组中的数据元素重复出现。
// 我们的目的是查找、解析data数组中重复出现的某元素。
// 比如,在这个data数组中,元素'C'在数组位置2,3重复出现两次。
// 注意!有些元素没有重复出现,比如元素'B'。
private String[] data = { "A", "A", "B", "C", "C", "D", "D", "D" };
// 存储分类好的数据元素。
private ArrayList groups = new ArrayList();
// 核心的算法实现。
public void find() {
// 游标index
int index = 0, j = 0;
while (index < data.length) {
Group group = new Group();
group.title = data[index];
String t = group.title;
ArrayList children = new ArrayList();
for (j = index; j < data.length; j++) {
String child = data[j];
if (t.equals(child)) {
// 同时记录该重复出现的元素在原数组中的下标j,便于查验、评估结果。
children.add(child + "@" + j);
} else {
break;
}
}
// 往后推进游标index
index = j;
group.children = children;
groups.add(group);
}
}
// 输出结果。
private void print() {
for (int i = 0; i < groups.size(); i++) {
Group g = groups.get(i);
System.out.println(g);
}
}
// 自己构造一个类,作为一组数据的容器。
// 该类用一个title表明这一group数据是归属于那个重复元素的组。
// 该title下重复的元素装入到ArrayList children中,供遍历查询。
private class Group {
public String title;
public ArrayList children;
// 结果。
@Override
public String toString() {
String str = "组" + title + ": ";
for (int i = 0; i < children.size(); i++) {
str += children.get(i) + " ";
}
return str;
}
}
public static void main(String args[]) {
Test t = new Test();
t.find();
t.print();
}
}
结果输出:
组A: A@0 A@1
组B: B@2
组C: C@3 C@4
组D: D@5 D@6 D@7