数据结构与算法(Java实现)之【哈希表】

数据结构与算法(Java实现)之【哈希表】,第1张

数据结构与算法(Java实现)之【哈希表】 1、介绍

2、散列表 (-1)相关术语

1、散列方法(杂凑法)
选取某个函数,依该函数按关键字计算元素的存储位置,并按此存放。
查找时,由同一个函数对给定值k计算地址,将k与地址单元中元素关键值进行比较,确定查找是否成功。

2、散列函数:散列方法中使用的转换函数。

3、散列表:按上述思想构造的表

4、冲突:不同的关键值映射到同一个散列地址,key1≠key2,但是H(key1)=H(key2)

(0)按散列函数 H(k)=k 存放

(1)思考存储过程

选取某个函数,依该函数按关键字计算元素的存储位置 Loc(i)=H(key)冲突
不同的关键字映射到同一个散列地址 key1≠key2,但是H(key1)=H(key2)
在散列查找方法中,冲突是不可避免的,只能尽可能减少 (2)有存储冲突时的查找过程

3、使用散列表要解决好两个问题

(1)构造好的散列函数
所选函数尽可能简单,以便提高转换速度
所选函数对关键值计算出的地址,应在散列表中均匀分布,以减少空间浪费。(2)制定一个好的解决冲突的方案
查找时,如果从散列函数计算出的地址中查不到关键字,则应依据解决冲突的规则,有规律地查询其它相关单元。 4、常见的散列函数的构造方法

(1)直接地址法

(2)除留余数法

5、常见的解决冲突的方法

(1)开放地址法(开地址法) 【1】基本思想:

有冲突就去找下一个空的散列地址, 只要散列表足够大,空的散列地址总能找到,并将数据元素存入。
例如:除留余数法 Hi=(Hash(key)+di)mod m 这里di为增量序列。

【2】确定di的常用方法

【2.1】线性探测法

Hi=(Hash(key)+di)mod m (1= 其中:m<=散列表长度的质数
di为增量序列1,2,3,…,m-1,且di=i
技巧:一旦冲突就依照增量序列找下一个地址。

【2.2.2】案例

(2)链地址法(拉链法) 【1】基本思想:

相同散列地址的记录链成一单链表
m个散列地址就设m个单链表,然后用一个数组将m个单链表的表头指针存储起来,形成一个动态结构。

【2】栗子

6、比较和总结

散列表的查找效率分析

结论:除留余数法+链地址法 -->哈希表现状

结论验证:

已知一组关键字(19,14,23,1,68,20,84,27,55,11,10,79)散列函数为:H(key)=key MOD 13,散列表长为m=16,设每个记录的查找概率相等

(1) 用开放地址法+线性探测散列处理冲突,即Hi=(H(key)+di) MOD m
(2) 用链地址法处理冲突
7、Java代码手撸哈希表(乞丐版) (1)google 公司的一个上机题:

有一个公司,当有新的员工来报道时,要求将该员工的信息加入(id,性别,年龄,名字,住址…),当输入该员工的 id 时, 要求查找到该员工的 所有信息.

(2)要求

1)不使用数据库,速度越快越好=>哈希表(散列)2)添加时,保证按照 id 从低到高插入 [课后思考:如果 id 不是从低到高插入,但要求各条链表仍是从低到高,怎么解决?]3)使用链表来实现哈希表, 该链表不带表头[即: 链表的第一个结点就存放雇员信息] (3)示意图

(4)代码实现

雇员类(顾源-小时代)

//表示一个雇员
class Emp {
	public int id;
	public String name;
	public Emp next; //next 默认为 null
	public Emp(int id, String name) {
		super();
		this.id = id;
		this.name = name;
	}
}

雇员链表
添加
查找
显示所有雇员

//创建 EmplinkedList ,表示链表
class EmplinkedList {
	//头指针,执行第一个Emp,因此我们这个链表的head 是直接指向第一个Emp
	private Emp head; //默认null
	
	//添加雇员到链表
	//说明
	//1. 假定,当添加雇员时,id 是自增长,即id的分配总是从小到大
	//   因此我们将该雇员直接加入到本链表的最后即可
	public void add(Emp emp) {
		//如果是添加第一个雇员
		if(head == null) {
			head = emp;
			return;
		}
		//如果不是第一个雇员,则使用一个辅助的指针,帮助定位到最后
		Emp curEmp = head;
		while(true) {
			if(curEmp.next == null) {//说明到链表最后
				break;
			}
			curEmp = curEmp.next; //后移
		}
		//退出时直接将emp 加入链表
		curEmp.next = emp;
	}
	
	//遍历链表的雇员信息
	public void list(int no) {
		if(head == null) { //说明链表为空
			System.out.println("第 "+(no+1)+" 链表为空");
			return;
		}
		System.out.print("第 "+(no+1)+" 链表的信息为");
		Emp curEmp = head; //辅助指针
		while(true) {
			System.out.printf(" => id=%d name=%st", curEmp.id, curEmp.name);
			if(curEmp.next == null) {//说明curEmp已经是最后结点
				break;
			}
			curEmp = curEmp.next; //后移,遍历
		}
		System.out.println();
	}
	
	//根据id查找雇员
	//如果查找到,就返回Emp, 如果没有找到,就返回null
	public Emp findEmpById(int id) {
		//判断链表是否为空
		if(head == null) {
			System.out.println("链表为空");
			return null;
		}
		//辅助指针
		Emp curEmp = head;
		while(true) {
			if(curEmp.id == id) {//找到
				break;//这时curEmp就指向要查找的雇员
			}
			//退出
			if(curEmp.next == null) {//说明遍历当前链表没有找到该雇员
				curEmp = null;
				break;
			}
			curEmp = curEmp.next;//以后
		}
		
		return curEmp;
	}
	
}

以雇员链表为元素的哈希数组
添加雇员(包含MOD散列函数)
计算属于哪一条链表并查找id
展示所有雇员

//创建 HashTab 管理多条链表
class HashTab {
	private EmplinkedList[] emplinkedListArray;
	private int size; //表示有多少条链表
	
	//构造器
	public HashTab(int size) {
		this.size = size;
		//初始化emplinkedListArray
		emplinkedListArray = new EmplinkedList[size];
		//?留一个坑, 这时不要分别初始化每个链表
		for(int i = 0; i < size; i++) {
			emplinkedListArray[i] = new EmplinkedList();
		}
	}
	
	//添加雇员
	public void add(Emp emp) {
		//根据员工的id ,得到该员工应当添加到哪条链表
		int emplinkedListNO = hashFun(emp.id);
		//将emp 添加到对应的链表中
		emplinkedListArray[emplinkedListNO].add(emp);
		
	}
	//遍历所有的链表,遍历hashtab
	public void list() {
		for(int i = 0; i < size; i++) {
			emplinkedListArray[i].list(i);
		}
	}
	
	//根据输入的id,查找雇员
	public void findEmpById(int id) {
		//使用散列函数确定到哪条链表查找
		int emplinkedListNO = hashFun(id);
		Emp emp = emplinkedListArray[emplinkedListNO].findEmpById(id);
		if(emp != null) {//找到
			System.out.printf("在第%d条链表中找到 雇员 id = %dn", (emplinkedListNO + 1), id);
		}else{
			System.out.println("在哈希表中,没有找到该雇员~");
		}
	}
	
	//编写散列函数, 使用一个简单取模法
	public int hashFun(int id) {
		return id % size;
	}
	
	
}
(5)效果



(6)完整代码
public class HashTabDemo {

	public static void main(String[] args) {
		
		//创建哈希表
		HashTab hashTab = new HashTab(7);
		
		//写一个简单的菜单
		String key = "";
		Scanner scanner = new Scanner(System.in);
		while(true) {
			System.out.println("add:  添加雇员");
			System.out.println("list: 显示雇员");
			System.out.println("find: 查找雇员");
			System.out.println("exit: 退出系统");
			
			key = scanner.next();
			switch (key) {
			case "add":
				System.out.println("输入id");
				int id = scanner.nextInt();
				System.out.println("输入名字");
				String name = scanner.next();
				//创建 雇员
				Emp emp = new Emp(id, name);
				hashTab.add(emp);
				break;
			case "list":
				hashTab.list();
				break;
			case "find":
				System.out.println("请输入要查找的id");
				id = scanner.nextInt();
				hashTab.findEmpById(id);
				break;
			case "exit":
				scanner.close();
				System.exit(0);
			default:
				break;
			}
		}
		
	}

}

//创建 HashTab 管理多条链表
class HashTab {
	private EmplinkedList[] emplinkedListArray;
	private int size; //表示有多少条链表
	
	//构造器
	public HashTab(int size) {
		this.size = size;
		//初始化emplinkedListArray
		emplinkedListArray = new EmplinkedList[size];
		//?留一个坑, 这时不要分别初始化每个链表
		for(int i = 0; i < size; i++) {
			emplinkedListArray[i] = new EmplinkedList();
		}
	}
	
	//添加雇员
	public void add(Emp emp) {
		//根据员工的id ,得到该员工应当添加到哪条链表
		int emplinkedListNO = hashFun(emp.id);
		//将emp 添加到对应的链表中
		emplinkedListArray[emplinkedListNO].add(emp);
		
	}
	//遍历所有的链表,遍历hashtab
	public void list() {
		for(int i = 0; i < size; i++) {
			emplinkedListArray[i].list(i);
		}
	}
	
	//根据输入的id,查找雇员
	public void findEmpById(int id) {
		//使用散列函数确定到哪条链表查找
		int emplinkedListNO = hashFun(id);
		Emp emp = emplinkedListArray[emplinkedListNO].findEmpById(id);
		if(emp != null) {//找到
			System.out.printf("在第%d条链表中找到 雇员 id = %dn", (emplinkedListNO + 1), id);
		}else{
			System.out.println("在哈希表中,没有找到该雇员~");
		}
	}
	
	//编写散列函数, 使用一个简单取模法
	public int hashFun(int id) {
		return id % size;
	}
	
	
}

//表示一个雇员
class Emp {
	public int id;
	public String name;
	public Emp next; //next 默认为 null
	public Emp(int id, String name) {
		super();
		this.id = id;
		this.name = name;
	}
}

//创建 EmplinkedList ,表示链表
class EmplinkedList {
	//头指针,执行第一个Emp,因此我们这个链表的head 是直接指向第一个Emp
	private Emp head; //默认null
	
	//添加雇员到链表
	//说明
	//1. 假定,当添加雇员时,id 是自增长,即id的分配总是从小到大
	//   因此我们将该雇员直接加入到本链表的最后即可
	public void add(Emp emp) {
		//如果是添加第一个雇员
		if(head == null) {
			head = emp;
			return;
		}
		//如果不是第一个雇员,则使用一个辅助的指针,帮助定位到最后
		Emp curEmp = head;
		while(true) {
			if(curEmp.next == null) {//说明到链表最后
				break;
			}
			curEmp = curEmp.next; //后移
		}
		//退出时直接将emp 加入链表
		curEmp.next = emp;
	}
	
	//遍历链表的雇员信息
	public void list(int no) {
		if(head == null) { //说明链表为空
			System.out.println("第 "+(no+1)+" 链表为空");
			return;
		}
		System.out.print("第 "+(no+1)+" 链表的信息为");
		Emp curEmp = head; //辅助指针
		while(true) {
			System.out.printf(" => id=%d name=%st", curEmp.id, curEmp.name);
			if(curEmp.next == null) {//说明curEmp已经是最后结点
				break;
			}
			curEmp = curEmp.next; //后移,遍历
		}
		System.out.println();
	}
	
	//根据id查找雇员
	//如果查找到,就返回Emp, 如果没有找到,就返回null
	public Emp findEmpById(int id) {
		//判断链表是否为空
		if(head == null) {
			System.out.println("链表为空");
			return null;
		}
		//辅助指针
		Emp curEmp = head;
		while(true) {
			if(curEmp.id == id) {//找到
				break;//这时curEmp就指向要查找的雇员
			}
			//退出
			if(curEmp.next == null) {//说明遍历当前链表没有找到该雇员
				curEmp = null;
				break;
			}
			curEmp = curEmp.next;//以后
		}
		
		return curEmp;
	}
	
}


欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/zaji/5719300.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-12-18
下一篇 2022-12-17

发表评论

登录后才能评论

评论列表(0条)

保存