前言

哈希表是一种巧妙并且实用的数据结构。它是一个无序的 key/value对 的集合,其中所有的 key 都是不同的,然后通过给定的 key 可以在常数时间复杂度内检索、更新或删除对应的 value。

在 Go 语言中,一个 map 就是一个哈希表的引用,map 类型可以写为 map[K]V,其中 K 和 V 分别对应 key 和 value。map 中所有的 key 都有相同的类型,所有的 value 也有着相同的类型,但是 key 和 value 之间可以是不同的数据类型。其中 K 对应的 key 必须是支持 == 比较运算符的数据类型(切片、函数等不支持),所以 map 可以通过测试 key 是否相等来判断是否已经存在。虽然浮点数类型也是支持相等运算符比较的,但是将浮点数用做 key 类型则是一个坏的想法。对于 V 对应的 value 数据类型则没有任何的限制。

  • map 是无序的
  • 在 Go 语言中的 map 是引用类型,必须初始化才能使用

Map 是一种集合,所以我们可以像迭代数组和切片那样迭代它。由于 map 是无序的,我们无法决定它的返回顺序。

map 的定义

可以使用内建函数 make 也可以使用 map 关键字来定义 map:

// 使用 make 函数
m := make(map[keyType]valueType)
// 长度为 0 的 map
m := make(map[keyType]valueType, 0)

// 声明变量,默认 map 是 nil
var m map[keyType]valueType
// 长度为 0 的 map
var m map[keyType]valueType{}

其中:

  • m 为 map 的变量名。
  • keyType 为键类型。
  • valueType 是键对应的值类型。

在声明的时候不需要知道 map 的长度,因为 map 是可以动态增长的。但是如果我们提前知道 map 需要的长度,最好指定一下。

len(m)cap(m)
invalid argument m (type map[string]int) for cap

如果不初始化 map,那么就会创建一个 nil map。nil map 不能用来存放键值对。如果向一个 nil 值的 map 存入元素将导致一个 panic 异常:

下面我们用 make 函数创建一个 map:

ages := make(map[string]int)

当然,我们也可以直接创建一个 map 并且指定一些最初的值:

ages := map[string]int{
    "Conan": 18,
    "Kidd": 23,
}

这种就相当于:

ages := make(map[string]int)
ages["Conan"] = 18
ages["Kidd"] = 23

所以,另一种创建空(不是 nil)的 map 方法是:

ages := map[string]int{}

map 在定义时,key 是唯一的,不允许重复(value 可以重复)。下面的程序会报错

ages := map[string]int{
    "Conan": 18,
    "Conan": 23,
}

但是之后在对 map 赋值时,则会覆盖原来的 value

ages["Conan"] = 18
ages["Conan"] = 23
fmt.Println(ages["Conan"])  // 23

map 类型的零值是 nil,也就是没有引用任何哈希表,其长度也为 0.

var ages map[string]int
fmt.Println(ages == nil)  // true
fmt.Println(len(ages))  // 0

map 的基本使用

m[key] = value
ages := make(map[string]int)
ages["Conan"] = 18
ages["Kidd"] = 23

使用内置的 delete 函数可以删除元素,参数为 map 和其对应的 key,没有返回值:

delete(ages, "Conan")

注意:即使这些 key 不在 map 中也不会报错。

修改 map 的内容和 增 的写法类似,只不过 key 是已存在的,如果不存在,则为增加,例如:

ages := map[string]int{
    "Conan": 18,
    "Kidd": 23,
}
ages["Conan"] = 21

map 中的元素通过 key 对应的下标语法访问:

ages["Conan"] = 18
fmt.Println(ages["Conan"])  // 18

要想遍历 map 中全部的键值对的话,可以使用 range 风格的 for 循环实现,和之前的 slice 遍历语法类似。例如:

for key, value := range ages {
    fmt.Println(key, value)
}
_
for key := range ages {
    fmt.Println(key)
}

如果查找失败也没有关系,程序也不会报错,而是返回 value 类型对应的零值。例如:

ages := map[string]int{
    "Conan": 18,
    "Kidd": 23,
}
fmt.Println(ages["Lan"])  // 0

通过 key 作为索引下标来访问 map 将产生一个 value。如果 key 在 map 中是存在的,那么将得到与 key 对应的 value;如果 key 不存在,那么将得到 value 对应类型的零值。

但是有时候我们需要知道对应的元素是否真的是在 map 之中。比如,如果元素类型是一个数字,你需要区分一个已经存在的 0,和不存在而返回零值的 0。例如:

ages := map[string]int{
    "Conan": 18,
    "Kidd": 23,
}
// 如果 key 存在,则 ok = true;不存在,ok = false
if value, ok := ages["Conan"]; ok {
    fmt.Println(value)
} else {
    fmt.Println("key 不存在")
}

在这种场景下,map 的下标语法将产生两个值;第二个是一个布尔值,用于报告元素是否真的存在。布尔变量一般命名为 ok,特别适合马上用于 if 条件判断部分。

map 的迭代顺序是不确定的。有没有什么办法可以顺序的打印出 map 呢?我们可以借助切片来完成。先将 key(或者 value)添加到一个切片中,再对切片排序,然后使用 for-range 方法打印出所有的 key 和 value。如下所示:

package main

import (
	"fmt"
	"sort"
)

func main() {
	// 创建一个 ages map,并给三个值
	ages := make(map[string]int)
	ages["Conan"] = 18
	ages["Kidd"] = 23
	ages["Lan"] = 19

	// 创建一个切片用于给 key 进行排序
	var names []string
	for name := range ages {
		names = append(names, name)
	}
	sort.Strings(names)

	// 循环打印出 map 中的值
	for _, name := range names {
		fmt.Printf("%s	%d
", name, ages[name])
	}
}

因为我们一开始就知道 names 的最终大小,因此给切片分配一个合适的容量大小将会更有效。下面的代码创建了一个空的切片,但是切片的容量刚好可以放下 map 中全部的 key:

names := make([]string, 0, len(ages))

当然,如果使用结构体切片,这样就会更有效:

type name struct {
    key string
    value int
}

map 之间不能进行相等比较;唯一的例外是和 nil 进行比较。要判断两个 map 是否包含相同的 key 和 value,我们必须通过一个循环实现:

func equalMap(x, y map[string]int) bool {
    // 长度不一样,肯定不相等
    if len(x) != len(y) {
        return false
    }
    for k, xv := range x {
        if yv, ok := y[k]; !ok || xv != yv {
            return false
        }
    }
    return true
}

map 作为函数参数

map 作为函数参数是地址传递(引用传递),作返回值时也一样。

在函数内部对 map 进行操作,会影响主调函数中实参的值。例如:

func foo(m map[string]int) {
    m["Conan"] = 22
    m["Lan"] = 21
}

func main() {
    m := make(map[string]int, 2)
    m["Conan"] = 18
	fmt.Println(m)  // map[Conan:18]
	foo(m)
	fmt.Println(m)  // map[Conan:22 Lan:21]
}

并发环境中使用的 map:sync.Map

Go 语言中的 map 在并发情况下,只读是线程安全的,同时读写是线程不安全的

下面我们来看一下在并发情况下读写 map 时会出现的问题,代码如下:

// 创建一个 map
m := make(map[int]int)

// 开启一个 go 程
go func () {
    // 不停地对 map 进行写入
    for true {
        m[1] = 1
    }
}()

// 开启一个 go 程
go func() {
    // 不停的对 map 进行读取
    for true {
        _ = m[1]
    }
}()

// 运行 10 秒停止
time.Sleep(time.Second * 10)

运行代码会报错,错误如下:

fatal error: concurrent map read and map write

当两个并发函数不断地对 map 进行读和写时,map 内部会对这种并发操作进行检查并提前发现。

当我们需要并发读写时,一般的做法是加锁,但是这样性能不高。

Go 语言在 1.9 版本中提供了一种效率较高的并发安全的 sync.Map。

sync.Map 有以下特性:

  • 无须初始化,直接声明即可
  • sync.Map 不能使用 map 的方式进行取值和设置等操作,而是使用 sync.Map 的方法进行调用:Store 表示存储,Load 表示获取,Delete 表示删除。
  • 使用 Range 配合一个回调函数进行遍历操作,通过回调函数返回内部遍历出来的值,Range 参数中回调函数的返回值在需要继续迭代遍历时返回 true,终止迭代遍历时,返回 false。

并发安全的 sync.Map 示例代码如下:

package main

import (
	"fmt"
	"sync"
)

func main() {
	var ages sync.Map

	// 将键值对保存到 sync.Map
	ages.Store("Conan", 18)
	ages.Store("Kidd", 23)
	ages.Store("Lan", 18)

	// 从 sync.Map 中根据键取值
	age, ok := ages.Load("Conan")
	fmt.Println(age, ok)

	// 根据键删除对应的键值对
	ages.Delete("Kidd")
	fmt.Println("删除后的 sync.Map: ", ages)

	// 遍历所有 sync.Map 中的键值对
	ages.Range(func(key, value interface{}) bool {
		fmt.Println(key, value)
		return true
	})
}

sync.Map 没有提供获取 map 数量的方法,替代方法是在获取 sync.Map 时遍历自行计算数量,sync.Map 为了保证并发安全有一些性能损失,因此在非并发情况下,使用 map 相比使用 sync.Map 会有更好的性能。

所以,我们用 sync.Map 时进行同时读写是没问题的,示例代码如下:

package main

import (
	"fmt"
	"sync"
	"time"
)

func main() {
	var m sync.Map

	// 开启一个 go 程
	go func() {
		// 不停地对 map 进行写入
		for true {
			m.Store(1, 1)
		}
	}()

	// 开启一个 go 程
	go func() {
		// 不停的对 map 进行读取并打印读取结果
		for true {
			value, _ := m.Load(1)
			fmt.Println(value)
		}
	}()
	time.Sleep(time.Second * 10)
}

这时的结果就会一直输出 1。

练习

1、封装 wordCountFunc() 函数。接收一段英文字符串 str。返回一个 map,记录 str 中每个“单词”出现的次数。

示例:

输入:"I love my work and I love my family too"
输出:
    family:1
    too:1
    I:2
    love:2
    my:2
    work:1
    and:1

提示:使用 strings.Fields() 函数可提高效率

实现:

package main

import (
	"fmt"
	"strings"
)

func wordCountFunc(str string) map[string]int {
	// 使用 strings.Fields 进行拆分, 自动按照空格对字符串进行拆分成切片
	wordSlice := strings.Fields(str)
	// 创建一个用于存储 word 次数的 map
	m := make(map[string]int)

	// 遍历拆分后的字符串切片
	for _, value := range wordSlice {
		if _, ok := m[value]; !ok {
			// key 不存在
			m[value] = 1
		} else {
			// key 值已存在
			m[value]++
		}
	}
	return m
}

func main() {
	str := "I love my work and I love my family too"
	res := wordCountFunc(str)

	// 遍历 map, 展示每个 word 出现的次数
	for key, value := range res {
		fmt.Println(key, ": ", value)
	}
}

如需更深入的了解 map 的原理,推荐阅读这篇文章:深度解密Go语言之map

李培冠博客

欢迎访问我的个人网站:

李培冠博客:lpgit.com