WIKIOI
wiki(I:)
比赛相关
工具软件
语言基础
算法基础
搜索
动态规划
字符串
数学
数据结构
图论
计算几何
杂项
专题
语言基础简介
Hello, World!
C++ 语法基础
变量
运算
分支
循环
数组
结构体
指针
函数
文件操作
C++ 标准库简介
STL 容器简介
迭代器
序列式容器
关联式容器
无序关联式容器
容器适配器
STL 算法
bitset
string
类
命名空间
重载运算符
引用
常值
新版 C++ 特性
pb_ds 简介
堆
平衡树
C 与 C++ 区别
Pascal 转 C++ 急救
Python 速成
Java 速成
35 objects
本站非官方,所收集资源均来源于网络。
无序关联式容器 - 语言基础
## 概述 自 C++11 标准起,四种基于哈希实现的无序关联式容器正式纳入了 C++ 的标准模板库中,分别是: `unordered_set` , `unordered_multiset` , `unordered_map` , `unordered_multimap` 。 ### "编译器不支持 C++11 的使用方法" > 在 C++11 之前,无序关联式容器属于 C++ 的 TR1 扩展。所以,如果编译器不支持 C++11,在使用时需要在头文件的名称中加入 `tr1/` 前缀,并且使用 `std::tr1` 命名空间。如 `#include
` 需要改成 `#include
` ; `std::unordered_map` 需要改为 `std::tr1::unordered_map` (如果使用 `using namespace std;` ,则为 `tr1::unordered_map` )。 它们与相应的关联式容器在功能,函数等方面有诸多共同点,而最大的不同点则体现在普通的关联式容器一般采用红黑树实现,内部元素按特定顺序进行排序;而这几种无序关联式容器则采用哈希方式存储元素,内部元素不以任何特定顺序进行排序,所以访问无序关联式容器中的元素时,访问顺序也没有任何保证。 采用哈希存储的特点使得无序关联式容器 **在平均情况下** 大多数操作(包括查找,插入,删除)都能在常数时间复杂度内完成,相较于关联式容器与容器大小成对数的时间复杂度更加优秀。 !!! warning > 在最坏情况下,对无序关联式容器进行插入、删除、查找等操作的时间复杂度会 **与容器大小成线性关系** !这一情况往往在容器内出现大量哈希冲突时产生。 > 同时,由于无序关联式容器的操作时通常存在较大的常数,其效率有时并不比普通的关联式容器好太多。 > 因此应谨慎使用无序关联式容器,尽量避免滥用(例如懒得离散化,直接将 `unordered_map
` 当作空间无限的普通数组使用)。 由于无序关联式容器与相应的关联式容器在用途和操作中有很多共同点,这里不再介绍无序关联式容器的各种操作,这些内容读者可以参考 [关联式容器](#) 。 ## 制造哈希冲突 上文中提到了,在最坏情况下,对无序关联式容器进行一些操作的时间复杂度会与容器大小成线性关系。 在哈希函数确定的情况下,可以构造出数据使得容器内产生大量哈希冲突,导致复杂度达到上界。 在标准库实现里,每个元素的散列值是将值对一个质数取模得到的,更具体地说,是 [这个列表](https://github.com/gcc-mirror/gcc/blob/gcc-8_1_0-release/libstdc++-v3/src/shared/hashtable-aux.cc) 中的质数(g++ 6 及以前版本的编译器,这个质数一般是 $126271$ ,g++ 7 及之后版本的编译器,这个质数一般是 $107897$ )。 因此可以通过向容器中插入这些模数的倍数来达到制造大量哈希冲突的目的。 ## 自定义哈希函数 使用自定义哈希函数可以有效避免构造数据产生的大量哈希冲突。 要想使用自定义哈希函数,需要定义一个结构体,并在结构体中重载 `()` 运算符,像这样: ```cpp struct my_hash { size_t operator()(int x) const { return x; } }; ``` 当然,为了确保哈希函数不会被迅速破解(例如 Codeforces 中对使用无序关联式容器的提交进行 hack),可以试着在哈希函数中加入一些随机化函数(如时间)来增加破解的难度。 例如,在 [这篇博客](https://codeforces.com/blog/entry/62393) 中给出了如下哈希函数: ```cpp struct my_hash { static uint64_t splitmix64(uint64_t x) { x += 0x9e3779b97f4a7c15; x = (x ^ (x >> 30)) * 0xbf58476d1ce4e5b9; x = (x ^ (x >> 27)) * 0x94d049bb133111eb; return x ^ (x >> 31); } size_t operator()(uint64_t x) const { static const uint64_t FIXED_RANDOM = chrono::steady_clock::now().time_since_epoch().count(); return splitmix64(x + FIXED_RANDOM); } // 针对 std::pair
作为主键类型的哈希函数 size_t operator()(pair
x) const { static const uint64_t FIXED_RANDOM = chrono::steady_clock::now().time_since_epoch().count(); return splitmix64(x.first + FIXED_RANDOM) ^ (splitmix64(x.second + FIXED_RANDOM) >> 1); } }; ``` 写完自定义的哈希函数后,就可以通过 `unordered_map
my_map;` 或者 `unordered_map
, int, my_hash> my_pair_map;` 的定义方式将自定义的哈希函数传入容器了。