「图解算法数据结构」——数据结构简介

2023-05-26 0 809

序言

排序机系统程序是为同时实现对排序机系统统计数据有效率采用的各式各样统计数据组织方式,服务于各种类别办公自动化。相同的排序机系统程序具备各别相关联的适用于情景,意在减少各式各样演算法排序的天数与内部空间维数,更佳的各项任务继续执行工作效率。

如下表所示图右图,常用的排序机系统程序可分成「非线性排序机系统程序」与「非线性排序机系统程序」,具体内容为:「字符串」、「二叉树」、「栈」、「堆栈」、「树」、「图」、「散条目」、「堆」。

「图解算法数据结构」——数据结构简介

从头开始自学演算法的老师对排序机系统程序的采用方式可能将尚不熟识,此栏将初步如是说各排序机系统程序的基本上特征,与 Python3 词汇中排序机系统程序的调用与构筑方式。

字符串

字符串是将完全相同类别的原素储存于已连续物理地址的排序机系统程序,其宽度不气门。

「气门字符串」是时常采用的排序机系统程序,其如前所述字符串和扩容监督机制同时实现,较之一般字符串更为灵巧。常用操作方式有:出访原素、加进原素、删掉原素。

# 调用气门字符串 array = [] # 向前部加进原素 array.append(2) array.append(3) array.append(1) array.append(0) array.append(2)

二叉树

二叉树以结点为基层单位,每一原素都是两个分立第一类,在物理地址的储存亦然已连续的。二叉树的结点第一类具备三个核心成员变量:「值 val」,「后继者结点提及 next」 。

class ListNode: def __init__(self, x): self.val = x # 结点值 self.next = None # 后继者结点提及

如下表所示图右图,建立此二叉树需要实例化每一结点,并构筑各结点的提及指向。

# 实例化结点 n1 = ListNode(4) # 结点 head n2 = ListNode(5) n3 = ListNode(1) # 构筑提及指向 n1.next = n2 n2.next = n3
「图解算法数据结构」——数据结构简介

栈是一种具备 「先入后出」 特征的抽象排序机系统程序,可采用字符串或二叉树同时实现。

stack = [] # Python 可将条目作为栈采用

如下表所示图右图,通过常用操作方式「入栈 push()」,「出栈 pop()」,展示了栈的先入后出特性。

stack.append(1) # 原素 1 入栈 stack.append(2) # 原素 2 入栈 stack.pop() # 出栈 -> 原素 2stack.pop()# 出栈 -> 原素 1

注意:通常情况下,不推荐采用 Java 的 Vector 以及其子类 Stack ,而一般将 LinkedList 作为栈来采用。详细说明请见:Stack,ArrayDeque,LinkedList 的区别 。

// Java LinkedList<Integer> stack = new LinkedList<>(); stack.addLast(1); // 原素 1 入栈 stack.addLast(2); // 原素 2 入栈 stack.removeLast(); // 出栈 -> 原素 2 stack.removeLast(); // 出栈 -> 原素 1

堆栈

堆栈是一种具备 「先入先出」 特征的抽象排序机系统程序,可采用二叉树同时实现。

# Python 通常采用双端堆栈 collections.deque from collections import deque queue = deque()

如下表所示图右图,通过常用操作方式「入队 push()」,「出队 pop()」,展示了堆栈的先入先出特性。

queue.append(1) # 原素 1 入队 queue.append(2) # 原素 2 入队queue.popleft()# 出队 -> 原素 1 queue.popleft() # 出队 -> 原素 2

树是一种非线性排序机系统程序,根据子结点数量可分成 「二叉树」 和 「多叉树」,最顶层的结点称为「根结点 root」。以二叉树为例,每一结点包含三个核心成员变量:「值 val」、「左子结点 left」、「右子结点 right」 。

class TreeNode: def __init__(self, x): self.val = x # 结点值 self.left = None # 左子结点 self.right = None # 右子结点

如下表所示图右图,建立此二叉树需要实例化每一结点,并构筑各结点的提及指向。

# 调用结点 n1 = TreeNode(3) # 根结点 root n2 = TreeNode(4) n3 = TreeNode(5) n4 = TreeNode(1) n5 = TreeNode(2) # 构筑提及指向 n1.left = n2 n1.right = n3 n2.left = n4 n2.right = n5
「图解算法数据结构」——数据结构简介

图是一种非线性排序机系统程序,由「结点(顶点)vertex」和「边 edge」组成,每条边连接一对顶点。根据边的方向有无,图可分成「有向图」和「无向图」。本文 以无向图为例 开展如是说。

如下表所示图右图,此无向图的 顶点 和 边 集合分别为:

顶点集合: vertices = {1, 2, 3, 4, 5}边集合: edges = {(1, 2), (1, 3), (1, 4), (1, 5), (2, 4), (3, 5), (4, 5)}
「图解算法数据结构」——数据结构简介

表示图的方式通常有两种:

1.邻接矩阵:采用字符串 vertices储存顶点,邻接矩阵 edges 储存边; edges[i][j] 代表结点 i + 1 和结点 j + 1之间是否有边。

「图解算法数据结构」——数据结构简介

邻接矩阵

vertices = [1, 2, 3, 4, 5] edges = [[0, 1, 1, 1, 1], [1, 0, 0, 1, 0], [1, 0, 0, 0, 1], [1, 1, 0, 0, 1], [1, 0, 1, 1, 0]]

2.邻接表: 采用字符串 vertices 储存顶点,邻接表 edges 储存边。 edges 为两个二维容器,第一维 i代表顶点索引,第二维 edges[i] 储存此顶点相关联的边集和;例如 edges[0] = [1, 2, 3, 4]代表 vertices[0] 的边集合为 [1, 2, 3, 4]。

「图解算法数据结构」——数据结构简介
vertices = [1, 2, 3, 4, 5] edges = [[1, 2, 3, 4], [0, 3], [0, 4], [0, 1, 4], [0, 2, 3]]

邻接矩阵 VS 邻接表 :

邻接矩阵的大小只与结点数量有关,即 N^2 ,其中 N 为节点数量。因此,当边数量明显少于结点数量时,采用邻接矩阵储存图会造成较大的内存浪费。

因此,邻接表 适合储存稀疏图(顶点较多、边较少); 邻接矩阵 适合储存稠密图(顶点较少、边较多)。

散条目

散条目是一种非非线性排序机系统程序,通过利用 Hash 函数将指定的「键 key」映射至相关联的「值 value」,以同时实现高效的原素查找。

设想两个简单情景:小力、小特、小扣的学号分别为 10001, 10002, 10003 。

现需求从「姓名」查找「学号」。

则可通过建立姓名为 key ,学号为 value 的散条目同时实现此需求,代码如下表所示:

JavaPythonC++

# 调用散条目 dic = {} # 加进 key -> value 键值对 dic[“小力”] = 10001 dic[“小特”] = 10002 dic[“小扣”] = 10003 # 从姓名查找学号 dic[“小力”] # -> 10001dic[“小特”] # -> 10002 dic[“小扣”] # -> 10003
「图解算法数据结构」——数据结构简介

Hash 函数设计 Demo :

假设需求:从「学号」查找「姓名」。

将三人的姓名储存至以下字符串中,则各姓名在字符串中的索引分别为 0, 1, 2 。

JavaPythonC++

names = [ “小力”, “小特”, “小扣” ]

此时,我们构造两个简单的 Hash 函数( % 为取余符号 ),公式和封装函数如下表所示右图:

def hash(id):index = (id –1) % 10000 return index

则我们构筑了以学号为 key 、姓名相关联的字符串索引为 value 的散条目。利用此 Hash 函数,则可在 O(1)天数维数下通过学号查找到相关联姓名,即:

names[hash(10001)] // 小力 names[hash(10002)] // 小特 names[hash(10003)] // 小扣
「图解算法数据结构」——数据结构简介

以上设计只适用于于此示例,实际的 Hash 函数需保证低碰撞率、 高鲁棒性等,以适用于于各种类别统计数据和情景。

堆:

堆是一种如前所述「完全二叉树」的排序机系统程序,可采用字符串同时实现。以堆为原理的排序演算法称为「堆排序」,如前所述堆同时实现的排序机系统程序为「优先堆栈」。堆分成「大顶堆」和「小顶堆」,大(小)顶堆:任意结点的值不大于(小于)其父结点的值。

完全二叉树定义: 设二叉树深度为 kk ,若二叉树除第 kk 层外的其它各层(第 11 至 k-1k−1 层)的结点达到最大个数,且处于第 kk 层的结点都已连续集中在最左边,则称此二叉树为完全二叉树。

如下表所示图右图,为包含 1, 4, 2, 6, 8 原素的小顶堆。将堆(完全二叉树)中的结点按层编号,即可映射到右边的字符串储存方式。

通过采用「优先堆栈」的「压入 push()」和「弹出 pop()」操作方式,即可完成堆排序,同时实现代码如下表所示:

from heapq import heappush, heappop # 调用小顶堆 heap = [] # 原素入堆 heappush(heap, 1) heappush(heap, 4) heappush(heap, 2) heappush(heap, 6) heappush(heap, 8) # 原素出堆(从小到大) heappop(heap) # -> 1 heappop(heap) # -> 2 heappop(heap) # -> 4 heappop(heap) # -> 6 heappop(heap) # -> 8

作者:Krahets

链接:

https://leetcode-cn.com/leetbook/read/illustration-of-algorithm/50e446/

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务