【C++上岸】C++常见面试题目--数据结构篇（第十二期）

蒹葭玉树

767人浏览 · 2025-08-06 10:32:59

蒹葭玉树 · 2025-08-06 10:32:59 发布

欢迎来到C++面试题系列的第12期！😊 数据结构是面试中的高频考点，掌握它们能帮你轻松上岸。今天，我们聚焦数据结构篇，详细解答10个常见问题。我会用简单易懂的语言和代码示例（C++实现）帮你理解核心概念🚀。

文章目录

1. 😊 什么是关键路径？

关键路径是项目管理中的核心概念，常用于AOE网（Activity On Edge Network），表示项目中耗时最长的路径。它决定了整个项目的最短完成时间，因为路径上的任何延迟都会直接影响总工期。简单来说，关键路径是那些“不能延误”的活动序列。

原理：在AOE网中，每个边代表一个活动（带权值表示时间），节点表示事件。关键路径通过计算最早开始时间（Earliest Start Time, EST）和最晚开始时间（Latest Start Time, LST）来识别。如果某个活动的EST等于LST，它就是关键活动；所有关键活动连成的路径就是关键路径。
公式：设活动时间为 $t$ ，则EST和LST的计算涉及动态规划。例如，最早开始时间：
$EST_j = \max_{i \in \text{前驱}} (EST_i + t_{i \to j})$
其中 $i$ 是 $j$ 的前驱节点。
应用：在C++中，可以用图算法（如拓扑排序）实现。例如，项目调度工具的核心逻辑就基于此。

2. 💡 字典树

字典树（Trie）是一种高效存储和检索字符串的数据结构，特别适合前缀匹配场景（如自动补全）。它的核心是树形结构，每个节点代表一个字符，从根到叶子的路径形成一个单词。

原理：节点包含一个子节点数组（通常大小为26，对应英文字母），插入时遍历字符串字符，创建或跳转到对应节点；搜索时类似遍历，判断是否完整单词。
优点：查找时间复杂度为 $O (m)$ （ $m$ 为字符串长度），比哈希表更省空间。

C++实现示例：

#include <vector>
#include <string>
using namespace std;

class TrieNode {
public:
    vector<TrieNode*> children;
    bool isEnd;
    TrieNode() : children(26, nullptr), isEnd(false) {}
};

class Trie {
private:
    TrieNode* root;
public:
    Trie() : root(new TrieNode()) {}
    
    void insert(string word) {
        TrieNode* node = root;
        for (char c : word) {
            int index = c - 'a';
            if (!node->children[index]) {
                node->children[index] = new TrieNode();
            }
            node = node->children[index];
        }
        node->isEnd = true;
    }
    
    bool search(string word) {
        TrieNode* node = root;
        for (char c : word) {
            int index = c - 'a';
            if (!node->children[index]) return false;
            node = node->children[index];
        }
        return node->isEnd;
    }
};

使用示例：插入"apple"，搜索"app"返回false（因为不是完整单词），但前缀匹配可扩展。

3. 📚 简述二叉树的前中后序遍历算法

二叉树遍历是基础算法，分为前序、中序和后序，区别在于访问根节点的顺序。所有遍历都可用递归或迭代实现（C++中常用栈）。

前序遍历：根节点 -> 左子树 -> 右子树（口诀：根左右）。常用于复制树结构。
中序遍历：左子树 -> 根节点 -> 右子树（口诀：左根右）。二叉搜索树的中序输出有序序列。
后序遍历：左子树 -> 右子树 -> 根节点（口诀：左右根）。常用于释放树内存。

递归C++代码：

#include <iostream>
using namespace std;

struct TreeNode {
    int val;
    TreeNode* left;
    TreeNode* right;
    TreeNode(int x) : val(x), left(nullptr), right(nullptr) {}
};

void preorder(TreeNode* root) {  // 前序
    if (!root) return;
    cout << root->val << " ";  // 访问根
    preorder(root->left);
    preorder(root->right);
}

void inorder(TreeNode* root) {  // 中序
    if (!root) return;
    inorder(root->left);
    cout << root->val << " ";  // 访问根
    inorder(root->right);
}

void postorder(TreeNode* root) {  // 后序
    if (!root) return;
    postorder(root->left);
    postorder(root->right);
    cout << root->val << " ";  // 访问根
}

时间复杂度均为

O (n)

（

n

为节点数），空间复杂度递归为

O (h)

（

h

为树高）。迭代版本用栈模拟，避免递归开销。

4. 🔍 了解哈希表吗？简述其原理

哈希表（Hash Table）是一种高效的数据结构，通过哈希函数将键（key）映射到数组索引，实现 $O (1)$ 平均时间复杂度的查找、插入和删除。

原理：核心是哈希函数 $h (k ey)$ ，它将任意键转换为固定范围的索引。值存储在数组（桶）中，索引对应位置。
工作流程：插入时，计算 $h (k ey)$ ，存储值到该索引；查找时，同样计算索引直接访问。
优点：速度快，适合高频查询场景，如C++中的unordered_map。
公式示例：简单哈希函数，如字符串哈希：
$\sum_{i=0}^{n-1} s[i] \times 31^i \mod m$
其中 $s$ 是字符串， $m$ 是表大小。
缺点：哈希冲突可能发生（见下一个问题）。

5. ⚙️ 如何解决Hash冲突？

Hash冲突指多个键映射到同一索引位置，常见解决方法有链地址法（Chaining）和开放地址法（Open Addressing）。

链地址法：每个桶（数组元素）存储一个链表（或其他结构）。冲突时，将新元素添加到链表末尾。查找时，遍历链表匹配键。
- 优点：简单高效，平均时间复杂度 $\alpha)$ （ $\alpha$ 为负载因子）。
- C++示例：std::unordered_map默认使用此方法。
开放地址法：所有元素都存储在数组中，冲突时通过探测序列（如线性探测、二次探测）找空位。
- 线性探测：冲突后，检查下一个索引$ (h(key) + i) % m $（$ i$从1递增）。
- 二次探测：使用$ (h(key) + i^2) % m $减少聚集。
- 公式：探测序列一般定义为：
  $h_i(key) = (h(key) + f(i)) \% m$ 其中 $f (i)$ 是探测函数。
其他方法：再哈希（使用第二个哈希函数）、双哈希等。选择方法需权衡空间和性能。

6. 🛣️ 简述最短路径算法

最短路径算法用于图中找两点间最小权值路径，常见有Dijkstra算法（单源最短路径）和Floyd-Warshall算法（所有对最短路径）。

Dijkstra算法：适用于非负权图。从源点开始，贪心选择当前最短路径节点，更新邻居距离。
- 原理：使用优先队列（最小堆）存储节点和距离。时间复杂度 $O((V+E)\log V)$ （ $V$ 顶点数， $E$ 边数）。
- 公式：距离更新：
  $\min(d[v], d[u] + w(u,v))$ 其中 $u$ 是当前节点， $v$ 是邻居， $w$ 是边权。
Floyd-Warshall算法：动态规划解决所有对最短路径，支持负权（无负环）。
- 原理：三重循环更新距离矩阵：
  $\min(d[i][j], d[i][k] + d[k][j])$ 时间复杂度 $O(V^3)$ 。
应用：C++中可用priority_queue实现Dijkstra，用于路由规划。

7. 🧵 听过KMP算法吗，知道其中的原理吗？

KMP算法（Knuth-Morris-Pratt）是高效字符串匹配算法，时间复杂度 $O (n + m)$ （ $n$ 文本长度， $m$ 模式长度），比暴力匹配 $O (nm)$ 快得多。核心是部分匹配表（next数组），避免不必要的回溯。

原理：预处理模式串，构建next数组，存储最长前后缀长度。匹配时，当字符不匹配，根据next值跳过部分字符。
- next数组：定义 $n e x t [i]$ 为模式串 $P [0.. i - 1]$ 的最长公共前后缀长度。
- 公式：构建next：
  $\begin{cases} 0 & \text{if } i=0 \\ \max_{k} \{k \mid P[0..k-1] = P[i-k..i-1]\} & \text{otherwise} \end{cases}$
- 匹配过程：文本指针不回溯，模式指针根据next跳转。

C++代码片段：

vector<int> computeNext(string pattern) {
    int n = pattern.size();
    vector<int> next(n, 0);
    for (int i = 1, len = 0; i < n; ) {
        if (pattern[i] == pattern[len]) {
            len++;
            next[i] = len;
            i++;
        } else {
            if (len != 0) len = next[len-1];
            else { next[i] = 0; i++; }
        }
    }
    return next;
}

应用场景：文本编辑器中的查找功能。

8. 🌳 简述二叉树的层序遍历

层序遍历（Level Order Traversal）按树的层级从上到下、从左到右访问节点，使用广度优先搜索（BFS）实现，通常借助队列。

原理：从根节点开始，入队；循环中出队访问，并将子节点入队。确保每层节点顺序处理。
时间复杂度： $O (n)$ ，空间复杂度 $O (w)$ （ $w$ 为树的最大宽度）。

C++实现：

#include <queue>
#include <vector>
using namespace std;

vector<vector<int>> levelOrder(TreeNode* root) {
    vector<vector<int>> result;
    if (!root) return result;
    queue<TreeNode*> q;
    q.push(root);
    while (!q.empty()) {
        int size = q.size();
        vector<int> level;
        for (int i = 0; i < size; i++) {
            TreeNode* node = q.front();
            q.pop();
            level.push_back(node->val);
            if (node->left) q.push(node->left);
            if (node->right) q.push(node->right);
        }
        result.push_back(level);
    }
    return result;
}

输出二维数组，每层一个子数组。适用于二叉树序列化或打印树结构。

9. 🔎 说说常见的查找方式

查找算法在数据结构中至关重要，常见方式包括：

顺序查找（Sequential Search）：遍历数组或链表，逐个比较。时间复杂度 $O (n)$ ，简单但低效，适合小数据。😅
二分查找（Binary Search）：要求有序数组。每次比较中点，缩小搜索范围。时间复杂度 $O(\log n)$ 。公式：
$\text{mid} = \left\lfloor \frac{\text{low} + \text{high}}{2} \right\rfloor$
哈希查找（Hash Search）：基于哈希表，平均 $O (1)$ 时间，但需处理冲突（见问题5）。
树查找（Tree Search）：如二叉搜索树（BST），左子树小于根，右子树大于根。查找 $O (h)$ （ $h$ 树高），平衡树如AVL优化到 $O(\log n)$ 。
其他：B树（数据库索引）、跳表（概率性高效）等。C++中，std::set用BST，std::unordered_set用哈希。

10. 🧼 简述冒泡排序的原理

冒泡排序是一种简单排序算法，通过重复遍历数组，比较相邻元素并交换，使较大元素“冒泡”到末尾。

原理：每轮遍历，从第一个元素开始，比较 $a rr [j]$ 和 $a rr [j + 1]$ ，如果逆序则交换。每轮后，最大元素就位。重复 $n - 1$ 轮（ $n$ 为数组长度）。
时间复杂度：平均和最坏 $O(n^2)$ ，最好 $O (n)$ （已排序时）。空间复杂度 $O (1)$ （原地排序）。
公式描述：交换条件：
$\text{if } arr[j] > arr[j+1] \text{ then swap}(arr[j], arr[j+1])$

C++代码：

void bubbleSort(vector<int>& arr) {
    int n = arr.size();
    for (int i = 0; i < n-1; i++) {
        bool swapped = false;  // 优化：如果无交换，提前结束
        for (int j = 0; j < n-i-1; j++) {
            if (arr[j] > arr[j+1]) {
                swap(arr[j], arr[j+1]);
                swapped = true;
            }
        }
        if (!swapped) break;  // 已排序，提前退出
    }
}

适用于教学或小数据集，但实际中效率低，常用快速排序替代。

🎉 恭喜你完成本期的学习！数据结构是C++面试的基石，多加练习这些题目，上岸指日可待。如果有疑问，欢迎留言讨论～💪

🌟如果觉得有用，点个赞吧！👍 收藏本文，面试前翻一翻，上岸更轻松！ 如果觉得有用，点赞支持一下，你的鼓励是我持续更新的动力！😊 也欢迎关注我，获取更多“C++上岸”系列干货。下期见！🚀

DAMO开发者矩阵

DAMO开发者矩阵，由阿里巴巴达摩院和中国互联网协会联合发起，致力于探讨最前沿的技术趋势与应用成果，搭建高质量的交流与分享平台，推动技术创新与产业应用链接，围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐

使用概率图路径规划的机器人路径规划研究Octave（Matlab代码实现）

针对复杂未知环境下传统机器人路径规划算法适应性差、避障稳定性弱、全局搜索效率低的问题，本文开展基于概率图的机器人路径规划方法研究。概率图路径规划依托概率路线图建模思想，通过环境随机采样、节点连通性构建、最优路径检索的核心逻辑，摆脱了传统算法对环境精准建模的依赖，具备强环境适配性与高运算效率。本文系统阐述概率图路径规划的核心理论、运行机制与技术优势，基于Octave仿真平台搭建多场景机器人运动规划仿