[자료구조] Hash Table -3

본문과 관련하여 실습한 전체코드는 리파지토리에 별도 작성하였습니다.: https://github.com/ejImDev/data_structure_study.git

동적 해싱

## 해시방법의 성능 비교 및 응용

해시방법의 성능은 탐색이나 삽입 연산을 수행할 때 성공과 실패한 경우를 각각 분석하여 측정
선형조사는 적재율 ∝가 너무 작으면 해시 테이블에 empty 원소가 너무 많고, ∝ 값이 1.0에 근접할수록 군집화가 심화됨
개방주소방식의 해싱은 ∝∽0.5, 즉, M∼2N일때 상수시간 성능 보임
체이닝은 ∝가 너무 작으면 대부붑ㄴ의 연결리스트들이 empty가 되고, ∝가 너무 크면 연결리스트들의 길이가 너무 길어져 해시성능이 매우 저하됨
일반적으로 M이 소수이다
이러한 해시함수들의 공통점
- 키의 모든 자리의 숫자들이 함수 계산에 참여함으로써 계산 결과에서는 원래의 키에 부여된 의미나 특성을 찾아볼 수 없게 된다는 점
- 계산 결과에서 해시테이블의 크기에 따라 특정부분만 해시값으로 활용한다는 점
가장 널리 사용되는 해시함수 : 나눗셈 함수
- 나눗셈 함수는 키를 소수 M으로 나눈 뒤, 그 나머지를 해시값으로 사용
- h(key) = key % M이고, 따라서 해시테이블의 인덱스는 0에서 M-1이 됨
- 여기서 제수로 소수를 사용하는 이유는 나눗셈 연산을 했을 때, 소수가 키들을 균등하게 인덱스로 변환시키는 성질을 갖기 때문

참고 자료 : ‘경기대학교 소프트웨어중심대학사업단 - JAVA 자료구조’ https://youtu.be/6YTPEDcAKaU