Google Interview University - 一套完整的学习手册帮助自己准备 Google 的面试 Back

原文地址：Google Interview University

原文作者：John Washam

译文出自：掘金翻译计划

译者：aleen42，Newton，bobmayuze，Jaeger，sqrthree

这是？

这是我为了从 web 开发者（自学、非计算机科学学位）蜕变至 Google 软件工程师所制定的计划，其内容历时数月。

这一长列表是从 Google 的指导笔记 中萃取出来并进行扩展。因此，有些事情你必须去了解一下。我在列表的底部添加了一些额外项，用于解决面试中可能会出现的问题。这些额外项大部分是来自于 Steve Yegge 的“得到在 Google 工作的机会”。而在 Google 指导笔记的逐字间，它们有时也会被反映出来。

为何要用到它？

我一直都是遵循该计划去准备 Google 的面试。自 1997 年以来，我一直从事于 web 程序的构建、服务器的构建及创业型公司的创办。对于只有着一个经济学学位，而不是计算机科学学位（CS degree）的我来说，在职业生涯中所取得的都非常成功。然而，我想在 Google 工作，并进入大型系统中，真正地去理解计算机系统、算法效率、数据结构性能、低级别编程语言及其工作原理。可一项都不了解的我，怎么会被 Google 所应聘呢？

当我创建该项目时，我从一个堆栈到一个堆都不了解。那时的我，完全不了解 Big-O 、树，或如何去遍历一个图。如果非要我去编写一个排序算法的话，我只能说我所写的肯定是很糟糕。一直以来，我所用的任何数据结构都是内建于编程语言当中。至于它们在背后是如何运作，对此我一概不清楚。此外，以前的我并不需要对内存进行管理，最多就只是在一个正在执行的进程抛出了“内存不足”的错误后，采取一些权变措施。而在我的编程生活中，也甚少使用到多维数组，可关联数组却成千上万。而且，从一开始到现在，我都还未曾自己实现过数据结构。

就是这样的我，在经过该学习计划后，已然对被 Google 所雇佣充满信心。这是一个漫长的计划，以至于花费了我数月的时间。若您早已熟悉大部分的知识，那么也许能节省大量的时间。

如何使用它

下面所有的东西都只是一个概述。因此，你需要由上而下逐一地去处理它。

在学习过程中，我是使用 GitHub 特殊的语法特性 markdown flavor 去检查计划的进展，包括使用任务列表。

[x] 创建一个新的分支，以使得你可以像这样去检查计划的进展。直接往方括号中填写一个字符 x 即可：[x]

更多关于 Github-flavored markdown 的详情

拥有一名 Googler 的心态

把一个（或两个）印有“future Googler”的图案打印出来，并用你誓要成功的眼神盯着它。

我得到了工作吗？

我还没去应聘。

因为我离完成学习（完成该疯狂的计划列表）还需要数天的时间，并打算在下周开始用一整天的时间，以编程的方式去解决问题。当然，这将会持续数周的时间。然后，我才通过使用在二月份所得到的一个介绍资格，去正式应聘 Google（没错，是二月份时就得到的）。

感谢 JP 的这次介绍。

跟着我的脚步

目前我仍在该计划的执行过程中，如果你想跟随我脚步去学习的话，可以登进我在 GoogleyAsHeck.com 上所写的博客。

下面是我的联系方式：

Twitter: @googleyasheck
Twitter: @StartupNextDoor
Google+: +Googleyasheck
LinkedIn: johnawasham

不要妄自菲薄

Google 的工程师都是才智过人的。但是，就算是工作在 Google 的他们，仍然会因为觉得自己不够聪明而感到一种不安。
天才程序员的神话

关于 Google

面试过程 & 通用的面试准备

视频：
文章：
- 三步成为 Googler
- 得到在 Google 的工作机会
  - 所有他所提及的事情都列在了下面
- （早已过期） 如何得到 Google 的一份工作，面试题，应聘过程
- 手机设备屏幕的问题
附加的（虽然 Google 不建议，但我还是添加在此）：
- ABC：永远都要去编程（Always Be Coding）
- 四步成为 Google 里一名没有学位的员工
- 共享白板（Whiteboarding）
- Google 是如何看待应聘、管理和公司文化
- 程序开发面试中有效的白板（Whiteboarding）
- 震撼开发类面试第一集：
  - Gayle L McDowell —— 震撼开发类面试（视频）
  - 震撼开发类面试 —— 作者 Gayle Laakmann McDowell（视频）
- 如何在世界四强企业中获得一份工作：
  - “如何在世界四强企业中获得一份工作 —— Amazon、Facebook、Google 和 Microsoft”（视频）
- 面试 Google 失败

为你的面试选择一种语言

在这，我就以下话题写一篇短文 —— 重点：为在 Google 的面试选择一种语言

在大多数公司的面试当中，你可以在编程这一环节，使用一种自己用起来较为舒适的语言去完成编程。但在 Google，你只有三种固定的选择：

C++
Java
Python

有时你也可以使用下面两种，但需要事先查阅说明。因为，说明中会有警告：

JavaScript
Ruby

你需要对你所选择的语言感到非常舒适且足够了解。

更多关于语言选择的阅读：

在此查看相关语言的资源

由于，我正在学习C、C++ 和 Python。因此，在下面你会看到部分关于它们的学习资料。相关书籍请看文章的底部。

在你开始之前

该列表已经持续更新了很长的一段时间，所以，我们的确很容易会对其失去控制。

这里列出了一些我所犯过的错误，希望您不要重滔覆辙。

1. 你不可能把所有的东西都记住

就算我查看了数小时的视频，并记录了大量的笔记。几个月后的我，仍然会忘却其中大部分的东西。所以，我翻阅了我的笔记，并将可回顾的东西制作成抽认卡（flashcard）（请往下看）

2. 使用抽认卡

为了解决善忘的问题，我制作了一些关于抽认卡的页面，用于添加两种抽认卡：正常的及带有代码的。每种卡都会有不同的格式设计。

而且，我还以移动设备为先去设计这些网页，以使得在任何地方的我，都能通过我的手机及平板去回顾知识。

你也可以免费制作属于你自己的抽认卡网站：

抽认卡页面的代码仓库
我的抽认卡数据库：有一点需要记住的是，我做事有点过头，以至于把卡片都覆盖到所有的东西上。从汇编语言和 Python 的细枝末节，乃至到机器学习和统计都被覆盖到卡片上。而这种做法，对于 Google 的要求来说，却是多余。

在抽认卡上做笔记： 若你第一次发现你知道问题的答案时，先不要急着把其标注成“已懂”。你需要做的，是去查看一下是否有同样的抽认卡，并在你真正懂得如何解决问题之前，多问自己几次。重复地问答可帮助您深刻记住该知识点。

3. 回顾，回顾，回顾

我留有一组 ASCII 码表、OSI 堆栈、Big-O 记号及更多的小抄纸，以便在空余的时候可以学习。

每编程半个小时就要休息一下，并去回顾你的抽认卡。

4. 专注

在学习的过程中，往往会有许多令人分心的事占据着我们宝贵的时间。因此，专注和集中注意力是非常困难的。

你所看不到的

由于，这个巨大的列表一开始是作为我个人从 Google 面试指导笔记所形成的一个事件处理列表。因此，有一些我熟悉且普遍的技术在此都未被谈及到：

SQL
Javascript
HTML、CSS 和其他前端技术

日常计划

部分问题可能会花费一天的时间去学习，而部分则会花费多天。当然，有些学习并不需要我们懂得如何实现。

因此，每一天我都会在下面所列出的列表中选择一项，并查看相关的视频。然后，使用以下的一种语言去实现：

C —— 使用结构体和函数，该函数会接受一个结构体指针 * 及其他数据作为参数。
C++ —— 不使用内建的数据类型。
C++ —— 使用内建的数据类型，如使用 STL 的 std::list 来作为链表。
Python —— 使用内建的数据类型（为了持续练习 Python），并编写一些测试去保证自己代码的正确性。有时，只需要使用断言函数 assert() 即可。

此外，你也可以使用 Java 或其他语言。以上只是我的个人偏好而已。

为何要在这些语言上分别实现一次？

因为可以练习，练习，练习，直至我厌倦它，并完美地实现出来。（若有部分边缘条件没想到时，我会用书写的形式记录下来并去记忆）

因为可以在纯原生的条件下工作（不需垃圾回收机制的帮助下，分配/释放内存（除了 Python））

因为可以利用上内建的数据类型，以使得我拥有在现实中使用内建工具的经验（在生产环境中，我不会去实现自己的链表）

就算我没有时间去每一项都这么做，但我也会尽我所能的。

在这里，你可以查看到我的代码：

你不需要记住每一个算法的内部原理。

在一个白板上写代码，而不要直接在计算机上编写。在测试完部分简单的输入后，到计算机上再测试一遍。

必备知识

计算机是如何处理一段程序：
- CPU 是如何执行代码（视频）
- 机器码指令（视频）
编译器
浮点数是如何存储的：
- 简单的 8-bit：浮点数的表达形式　—— 1（视频 —— 在计算上有一个错误 —— 详情请查看视频的介绍）
- 32 bit：IEEE754 32-bit 浮点二进制（视频）

算法复杂度 / Big-O / 渐进分析法

并不需要实现
Harvard CS50 —— 渐进表示（视频）
Big O 记号（通用快速教程）（视频）
Big O 记号（以及 Omega 和 Theta）—— 最佳数学解释（视频）
Skiena 算法：
- 视频
- 幻灯片
对于算法复杂度分析的一次详细介绍
增长阶数（Orders of Growth）（视频）
渐进性（Asymptotics）（视频）
UC Berkeley Big O（视频）
UC Berkeley Big Omega（视频）
平摊分析法（Amortized Analysis）（视频）
举证“Big O”（视频）
高级编程（包括递归关系和主定理）：
- 计算性复杂度：第一部
- 计算性复杂度：第二部
速查表（Cheat sheet）

如果部分课程过于学术性，你可直接跳到文章底部，去查看离散数学的视频以获取相关背景知识。

数据结构

数组（Arrays）

实现一个可自动调整大小的动态数组。
介绍：
实现一个动态数组（可自动调整大小的可变数组）：
- 练习使用数组和指针去编码，并且指针是通过计算去跳转而不是使用索引
- 通过分配内存来新建一个原生数据型数组
  - 可以使用 int 类型的数组，但不能使用其语法特性
  - 从大小为16或更大的数（使用2的倍数 —— 16、32、64、128）开始编写
- size() —— 数组元素的个数
- capacity() —— 可容纳元素的个数
- is_empty()
- at(index) —— 返回对应索引的元素，且若索引越界则愤然报错
- push(item)
- insert(index, item) —— 在指定索引中插入元素，并把后面的元素依次后移
- prepend(item) —— 可以使用上面的 insert 函数，传参 index 为 0
- pop() —— 删除在数组末端的元素，并返回其值
- delete(index) —— 删除指定索引的元素，并把后面的元素依次前移
- remove(item) —— 删除指定值的元素，并返回其索引（即使有多个元素）
- find(item) —— 寻找指定值的元素并返回其中第一个出现的元素其索引，若未找到则返回 -1
- resize(new_capacity) // 私有函数
  - 若数组的大小到达其容积，则变大一倍
  - 获取元素后，若数组大小为其容积的1/4，则缩小一半
时间复杂度
- 在数组末端增加/删除、定位、更新元素，只允许占 O(1) 的时间复杂度（平摊（amortized）去分配内存以获取更多空间）
- 在数组任何地方插入/移除元素，只允许 O(n) 的时间复杂度
空间复杂度
- 因为在内存中分配的空间邻近，所以有助于提高性能
- 空间需求 = （大于或等于 n 的数组容积）* 元素的大小。即便空间需求为 2n，其空间复杂度仍然是 O(n)

链表（Linked Lists）

介绍：
- 单向链表（视频）
- CS 61B —— 链表（视频）
C 代码（视频）
- 并非看完整个视频，只需要看关于节点结果和内存分配那一部分即可
链表 vs 数组：
- 基本链表 Vs 数组（视频）
- 在现实中，链表 Vs 数组（视频）
为什么你需要避免使用链表（视频）
的确：你需要关于“指向指针的指针”的相关知识：（因为当你传递一个指针到一个函数时，该函数可能会改变指针所指向的地址）该页只是为了让你了解“指向指针的指针”这一概念。但我并不推荐这种链式遍历的风格。因为，这种风格的代码，其可读性和可维护性太低。
- 指向指针的指针
实现（我实现了使用尾指针以及没有使用尾指针这两种情况）：
- size() —— 返回链表中数据元素的个数
- empty() —— 若链表为空则返回一个布尔值 true
- value_at(index) —— 返回第 n 个元素的值（从0开始计算）
- push_front(value) —— 添加元素到链表的首部
- pop_front() —— 删除首部元素并返回其值
- push_back(value) —— 添加元素到链表的尾部
- pop_back() —— 删除尾部元素并返回其值
- front() —— 返回首部元素的值
- back() —— 返回尾部元素的值
- insert(index, value) —— 插入值到指定的索引，并把当前索引的元素指向到新的元素
- erase(index) —— 删除指定索引的节点
- value_n_from_end(n) —— 返回倒数第 n 个节点的值
- reverse() —— 逆序链表
- remove_value(value) —— 删除链表中指定值的第一个元素
双向链表
- 介绍（视频）
- 并不需要实现

堆栈（Stack）

堆栈（视频）
使用堆栈 —— 后进先出（视频）
可以不实现，因为使用数组来实现并不重要

队列（Queue）

使用队列 —— 先进先出（视频）
队列（视频）
原型队列/先进先出（FIFO）
优先级队列（视频）
使用含有尾部指针的链表来实现:
- enqueue(value) —— 在尾部添加值
- dequeue() —— 删除最早添加的元素并返回其值（首部元素）
- empty()
使用固定大小的数组实现：
- enqueue(value) —— 在可容的情况下添加元素到尾部
- dequeue() —— 删除最早添加的元素并返回其值
- empty()
- full()
花销：
- 在糟糕的实现情况下，使用链表所实现的队列，其入列和出列的时间复杂度将会是 O(n)。因为，你需要找到下一个元素，以致循环整个队列
- enqueue：O(1)（平摊（amortized）、链表和数组 [探测（probing）]）
- dequeue：O(1)（链表和数组）
- empty：O(1)（链表和数组）

哈希表（Hash table）

视频：
在线课程：
使用线性探测的数组去实现
- hash(k, m) —— m 是哈希表的大小
- add(key, value) —— 如果 key 已存在则更新值
- exists(key)
- get(key)
- remove(key)

树（Trees）

树 —— 笔记 & 背景

系列：基本树（视频）
系列：树（视频）
基本的树形结构
遍历
操作算法
BFS（广度优先检索，breadth-first search）
- MIT（视频）
- 层序遍历（使用队列的 BFS 算法）
  - 时间复杂度： O(n)
  - 空间复杂度：
    - 最好情况： O(1)
    - 最坏情况：O(n/2)=O(n)
DFS（深度优先检索，depth-first search）
- MIT（视频）
- 笔记：
  - 时间复杂度：O(n)
  - 空间复杂度：
    - 最好情况：O(log n) - 树的平均高度
    - 最坏情况：O(n)
- 中序遍历（DFS：左、节点本身、右）
- 后序遍历（DFS：左、右、节点本身）
- 先序遍历（DFS：节点本身、左、右）

二叉查找树（Binary search trees）：BSTs

二叉查找树概览（视频）
系列（视频）
- 从符号表开始到 BST 程序
介绍（视频）
MIT（视频）
C/C++:
实现：
- insert // 往树上插值
- get_node_count // 查找树上的节点数
- print_values // 从小到大打印树中节点的值
- delete_tree
- is_in_tree // 如果值存在于树中则返回 true
- get_height // 返回节点所在的高度（如果只有一个节点，那么高度则为1）
- get_min // 返回树上的最小值
- get_max // 返回树上的最大值
- is_binary_search_tree
- delete_value
- get_successor // 返回给定值的后继者，若没有则返回-1

堆（Heap） / 优先级队列（Priority Queue） / 二叉堆（Binary Heap）

可视化是一棵树，但通常是以线性的形式存储（数组、链表）
堆)
介绍（视频）
无知的实现（视频）
二叉树（视频）
关于树高的讨论（视频）
基本操作（视频）
完全二叉树（视频）
伪代码（视频）
堆排序 —— 跳到起点（视频）
堆排序（视频）
构建一个堆（视频）
MIT：堆与堆排序（视频）
CS 61B Lecture 24：优先级队列（视频）
构建线性时间复杂度的堆（大顶堆）
实现一个大顶堆：
- insert
- sift_up —— 用于插入元素
- get_max —— 返回最大值但不移除元素
- get_size() —— 返回存储的元素数量
- is_empty() —— 若堆为空则返回 true
- extract_max —— 返回最大值并移除
- sift_down —— 用于获取最大值元素
- remove(i) —— 删除指定索引的元素
- heapify —— 构建堆，用于堆排序
- heap_sort() —— 拿到一个未排序的数组，然后使用大顶堆进行就地排序
  - 注意：若用小顶堆可节省操作，但导致空间复杂度加倍。（无法做到就地）

字典树（Tries）

需要注意的是，字典树各式各样。有些有前缀，而有些则没有。有些使用字符串而不使用比特位来追踪路径。
阅读代码，但不实现。
数据结构笔记及编程技术
短课程视频：
字典树：一个被忽略的数据结构
高级编程 —— 使用字典树
标准教程（现实中的用例）（视频）
MIT，高阶数据结构，使用字符串追踪路径（可事半功倍）

平衡查找树（Balanced search trees）

掌握至少一种平衡查找树（并懂得如何实现）：
“在各种平衡查找树当中，AVL 树和2-3树已经成为了过去，而红黑树（red-black trees）看似变得越来越受人青睐。这种令人特别感兴趣的数据结构，亦称伸展树（splay tree）。它可以自我管理，且会使用轮换来移除任何访问过根节点的 key。” —— Skiena
因此，在各种各样的平衡查找树当中，我选择了伸展树来实现。虽然，通过我的阅读，我发现在 Google 的面试中并不会被要求实现一棵平衡查找树。但是，为了胜人一筹，我们还是应该看看如何去实现。在阅读了大量关于红黑树的代码后，我才发现伸展树的实现确实会使得各方面更为高效。
- 伸展树：插入、查找、删除函数的实现，而如果你最终实现了红黑树，那么请尝试一下：
- 跳过删除函数，直接实现搜索和插入功能
我希望能阅读到更多关于 B 树的资料，因为它也被广泛地应用到大型的数据库当中。
自平衡二叉查找树
AVL 树
- 实际中：我能告诉你的是，该种树并无太多的用途，但我能看到有用的地方在哪里：AVL 树是另一种平衡查找树结构。其可支持时间复杂度为 O(log n) 的查询、插入及删除。它比红黑树严格意义上更为平衡，从而导致插入和删除更慢，但遍历却更快。正因如此，才彰显其结构的魅力。只需要构建一次，就可以在不重新构造的情况下读取，适合于实现诸如语言字典（或程序字典，如一个汇编程序或解释程序的操作码）。
- MIT AVL 树 / AVL 树的排序（视频）
- AVL 树（视频）
- AVL 树的实现（视频）
- 分离与合并
伸展树
- 实际中：伸展树一般用于缓存、内存分配者、路由器、垃圾回收者、数据压缩、ropes（字符串的一种替代品，用于存储长串的文本字符）、Windows NT（虚拟内存、网络及文件系统）等的实现。
- CS 61B：伸展树（Splay trees）（视频）
- MIT 教程：伸展树（Splay trees）：
  - 该教程会过于学术，但请观看到最后的10分钟以确保掌握。
  - 视频
2-3查找树
- 实际中：2-3树的元素插入非常快速，但却有着查询慢的代价（因为相比较 AVL 树来说，其高度更高）。
- 你会很少用到2-3树。这是因为，其实现过程中涉及到不同类型的节点。因此，人们更多地会选择红黑树。
- 2-3树的直感与定义（视频）
- 2-3树的二元观点
- 2-3树（学生叙述）（视频）
2-3-4树 (亦称2-4树)
- 实际中：对于每一棵2-4树，都有着对应的红黑树来存储同样顺序的数据元素。在2-4树上进行插入及删除操作等同于在红黑树上进行颜色翻转及轮换。这使得2-4树成为一种用于掌握红黑树背后逻辑的重要工具。这就是为什么许多算法引导文章都会在介绍红黑树之前，先介绍2-4树，尽管2-4树在实际中并不经常使用。
- CS 61B Lecture 26：平衡查找树（视频）
- 自底向上的2-4树（视频）
- 自顶向下的2-4树（视频）
B 树
- 有趣的是：为啥叫 B 仍然是一个神秘。因为 B 可代表波音（Boeing）、平衡（Balanced）或 Bayer（联合创造者）
- 实际中：B 树会被广泛适用于数据库中，而现代大多数的文件系统都会使用到这种树（或变种)。除了运用在数据库中，B 树也会被用于文件系统以快速访问一个文件的任意块。但存在着一个基本的问题，那就是如何将文件块 i 转换成一个硬盘块（或一个柱面-磁头-扇区）上的地址。
- B 树
- B 树的介绍（视频）
- B 树的定义及其插入操作（视频）
- B 树的删除操作（视频）
- MIT 6.851 —— 内存层次模块（Memory Hierarchy Models）（视频）
  - 覆盖有高速缓存参数无关型（cache-oblivious）B 树和非常有趣的数据结构
  - 头37分钟讲述的很专业，或许可以跳过（B 指块的大小、即缓存行的大小）
红黑树
- 实际中：红黑树提供了在最坏情况下插入操作、删除操作和查找操作的时间保证。这些时间值的保障不仅对时间敏感型应用有用，例如实时应用，还对在其他数据结构中块的构建非常有用，而这些数据结构都提供了最坏情况下的保障；例如，许多用于计算几何学的数据结构都可以基于红黑树，而目前 Linux 系统所采用的完全公平调度器（the Completely Fair Scheduler）也使用到了该种树。在 Java 8中，红黑树也被用于存储哈希列表集合中相同的数据，而不是使用链表及哈希码。
- Aduni —— 算法 —— 课程4（该链接直接跳到开始部分）（视频）
- Aduni —— 算法 —— 课程5（视频）
- 黑树（Black Tree）
- 二分查找及红黑树的介绍

N 叉树（K 叉树、M 叉树）

注意：N 或 K 指的是分支系数（即树的最大分支数）：
- 二叉树是一种分支系数为2的树
- 2-3树是一种分支系数为3的树
K 叉树

排序（Sorting）

笔记:
- 实现各种排序 & 知道每种排序的最坏、最好和平均的复杂度分别是什么场景:
  - 不要用冒泡排序 - 大多数情况下效率感人 - 时间复杂度 O(n^2), 除非 n <= 16
- 排序算法的稳定性 ("快排是稳定的么?")
- 哪种排序算法可以用链表？哪种用数组？哪种两者都可？
  - 并不推荐对一个链表排序，但归并排序是可行的.
  - 链表的归并排序
关于堆排序，请查看前文堆的数据结构部分。堆排序很强大，不过是非稳定排序。
冒泡排序 (video)
冒泡排序分析 (video)
插入排序 & 归并排序 (video)
插入排序 (video)
归并排序 (video)
快排 (video)
选择排序 (video)
斯坦福大学关于排序算法的视频:
- 课程 15 | 编程抽象 (video)
- 课程 16 | 编程抽象 (video)
Shai Simonson 视频, Aduni.org:
- 算法 - 排序 - 第二讲 (video)
- 算法 - 排序2 - 第三讲 (video)
Steven Skiena 关于排序的视频:
加州大学伯克利分校（UC Berkeley）大学课程:
- 归并排序:
  - 使用外部数组
  - 对原数组直接排序
- 快速排序:
  - 实现
  - 实现
实现:
- 归并：平均和最差情况的时间复杂度为 O(n log n)。
- 快排：平均时间复杂度为 O(n log n)。
- 选择排序和插入排序的最坏、平均时间复杂度都是 O(n^2)。
- 关于堆排序，请查看前文堆的数据结构部分。
有兴趣的话，还有一些补充 - 但并不是必须的:

图（Graphs）

图论能解决计算机科学里的很多问题，所以这一节会比较长，像树和排序的部分一样。

Yegge 的笔记:
- 有 3 种基本方式在内存里表示一个图:
  - 对象和指针
  - 矩阵
  - 邻接表
- 熟悉以上每一种图的表示法，并了解各自的优缺点
- 宽度优先搜索和深度优先搜索 - 知道它们的计算复杂度和设计上的权衡以及如何用代码实现它们
- 遇到一个问题时，首先尝试基于图的解决方案，如果没有再去尝试其他的。
Skiena 教授的课程 - 很不错的介绍:
图 (复习和其他):
完整的 Coursera 课程:
- 图的算法 (video)
Yegge: 如果有机会，可以试试研究更酷炫的算法:
- Dijkstra 算法 - 上文 - 6.006
- A* 算法
我会实现:
- DFS 邻接表 (递归)
- DFS 邻接表 (栈迭代)
- DFS 邻接矩阵 (递归)
- DFS 邻接矩阵 (栈迭代)
- BFS 邻接表
- BFS 邻接矩阵
- 单源最短路径问题 (Dijkstra)
- 最小生成树
- 基于 DFS 的算法 (根据上文 Aduni 的视频):
  - 检查环 (我们会先检查是否有环存在以便做拓扑排序)
  - 拓扑排序
  - 计算图中的连通分支
  - 列出强连通分量
  - 检查双向图

可以从 Skiena 的书（参考下面的书推荐小节）和面试书籍中学习更多关于图的实践。

终面

这一部分有一些短视频，你可以快速的观看和复习大多数重要概念。

这对经常性的巩固很有帮助。

综述:

2-3 分钟的短视频系列 (23 个)
- Videos
2-5 分钟的短视频系列 - Michael Sambol (18 个):
- Videos

排序:

归并排序: https://www.youtube.com/watch?v=GCae1WNvnZM

书籍

Google Coaching 里提到的

阅读并做练习:

算法设计手册 (Skiena)
- 书 (Kindle 上可以租到):
  - Algorithm Design Manual
- Half.com 是一个资源丰富且性价比很高的在线书店.
- 答案:
  - 解答)
  - 解答
- 勘误表

一旦你理解了每日计划里的所有内容，就去读上面所列的书并完成练习，然后开始读下面所列的书并做练习，之后就可以开始实战写代码了（本文再往后的部分）

首先阅读:

Programming Interviews Exposed: Secrets to Landing Your Next Job, 2nd Edition

然后阅读 (这本获得了很多推荐，但是不在 Google coaching 的文档里):

Cracking the Coding Interview, 6th Edition
- 如果你看到有人在看 "The Google Resume", 实际上它和 "Cracking the Coding Interview" 是同一个作者写的，而且后者是升级版。

附加书单

这些没有被 Google 推荐阅读，不过我因为需要这些背景知识所以也把它们列在了这里。

C Programming Language, Vol 2
- 练习的答案
C++ Primer Plus, 6th Edition
《Unxi 环境高级编程》 The Unix Programming Environment
《编程珠玑》 Programming Pearls
Algorithms and Programming: Problems and Solutions

如果你有时间

Introduction to Algorithms
Elements of Programming Interviews
- 如果你希望在面试里用 C++ 写代码，这本书的代码全都是 C++ 写的
- 通常情况下能找到解决方案的好书.

编码练习和挑战

一旦你学会了理论基础，就应该把它们拿出来练练。尽量坚持每天做编码练习，越多越好。

编程问题预备:

编码练习平台:

当你临近面试时

搞定代码面试 (videos):

你的简历

10 条小贴士让你写出一份还算不错的简历
这是搞定面试的第一个关键步骤

当面试来临的时候

随着下面列举的问题思考下你可能会遇到的 20 个面试问题

每个问题准备 2-3 种回答

准备点故事，不要只是摆一些你完成的事情的数据，相信我，人人都喜欢听故事

你为什么想得到这份工作？
你解决过的最有难度的问题是什么？
面对过的最大挑战是什么?
见过的最好或者最坏的设计是怎么样的?
对某项 Google 产品提出改进建议。
你作为一个个体同时也是团队的一员，如何达到最好的工作状态?
你的什么技能或者经验是你的角色中不可或缺的?为什么？
你在某份工作或某个项目中最享受的是什么?
你在某份工作或某个项目中面临过的最大挑战是什么?
你在某份工作或某个项目中遇到过的最蛋疼的 Bug 是什么样的？
你在某份工作或某个项目中学到了什么？
你在某份工作或某个项目中哪些地方还可以做的更好？

问面试官的问题

我会问的一些：(可能我已经知道了答案但我想听听面试官的看法或者了解团队的前景):

团队多大规模?
开发周期是怎样的? 会使用瀑布流/极限编程/敏捷开发么?
经常会为 deadline 加班么? 或者是有弹性的?
团队里怎么做技术选型?
每周平均开多少次会?
你觉得工作环境有助于员工集中精力吗?
目前正在做什么工作?
喜欢这些事情吗?
工作期限是怎么样的?

当你获得了梦想的职位

我还能说些什么呢，恭喜你！

我希望在 Google 的第一天就知道的 10 件事

坚持继续学习。

得到这份工作只是一个开始。

下面的内容都是可选的。这些是我的推荐，不是 Google 的。

通过学习这些内容，你将会得到更多的有关 CS 的概念，并将为所有的软件工程工作做更好的准备。

附加的学习

Unicode

字节顺序

大、小端字节序
大端字节 Vs 小端字节(视频)
大、小端字节序的里里外外(Big And Little Endian Inside/Out) (视频)
- 内核开发者的讨论非常技术性，如果大多数都超出了你的理解范围，不要太担心。
- 前半段已经足够了。

Emacs and vi(m)

Yegge 的建议，从一个很早以前的亚马逊招聘信息中而来：熟悉基于 unix 的代码编辑器
vi(m):
emacs:

Unix 命令行工具

下列内容中的优秀工具由的 Yegge 推荐，Yegge 目前致力于 Amazon 人事招聘处。
bash
cat
grep
sed
awk
curl or wget
sort
tr
uniq
strace
tcpdump

信息资源 (视频)

奇偶校验位 & 汉明码 (视频)

系统熵值（系统复杂度）

请参考下方视频
观看之前，请先确定观看了信息论的视频
信息理论, 克劳德·香农, 熵值, 系统冗余, 数据比特压缩 (视频)

密码学

请参考下方视频
观看之前，请先确定观看了信息论的视频
可汗学院
密码学: 哈希函数
密码学: 加密

压缩

网络 (视频)

计算机安全

释放缓存

并行/并发编程

设计模式

UML统一建模语言概览 (视频)
主要有如下的设计模式:
- s(strategy)
- singleton
- adapter
- prototype
- decorator
- visitor
- factory, abstract factory
- facade
- observer
- proxy
- delegate
- command
- state
- memento
- iterator
- composite
- flyweight
第六章 (第 1 部分 ) - 设计模式 (视频)
第六章 (第 2 部分 ) - Abstraction-Occurrence, General Hierarchy, Player-Role, Singleton, Observer, Delegation (视频)
第六章 (第 3 部分 ) - Adapter, Facade, Immutable, Read-Only Interface, Proxy (video)
视频
Head Fisrt 设计模型
- 尽管这本书叫做设计模式：重复使用模块，但是我还是认为Head First是对于新手来说很不错的书。
基于实际操作对于入门开发者的建议

信息传输, 序列化,和队列化的系统

快速傅里叶变换

布隆过滤器

给一个布隆过滤器m比特和k个哈希函数，所有的注入和相关测试都会是通过。
布隆过滤器
布隆过滤器 | 数据挖掘 | Stanford University
教程
如何写一个布隆过滤器应用

van Emde Boas 树

更深入的数据结构

CS 61B 第 39 课: 更深入的数据结构

跳表

"有一种非常迷幻的数据类型" - Skiena
随机化: 跳表 (视频)
更生动详细的解释

网络流

不相交集 & 联合查找

不相交集
UCB 61B - 不相交集; 排序 & 选择(视频)
Coursera (not needed since the above video explains it great):

快速处理数学

树堆（Treap）

线性规划（Linear Programming）（视频）

几何：凸包（Geometry, Convex hull）（视频）

离散数学

查看下面的视频：(这里没看到视频= =）

机器学习（Machine Learning）

为什么学习机器学习？
谷歌云机器学习工具（视频）
谷歌开发者机器学习清单 (Scikit Learn 和 Tensorflow) (视频)
Tensorflow (视频)
Tensorflow 教程
Python 实现神经网络实例教程（使用 Theano）
课程:
- 很棒的初级课程：机器学习
```
- [视频教程](https://www.youtube.com/playlist?list=PLZ9qNFMHZ-A4rycgrgOYma6zxF4BZGGPW)
- 看第 12-18 集复习线性代数（第 14 集和第 15 集是重复的）
```
- 机器学习中的神经网络
- Google 深度学习微学位
- Google/Kaggle 机器学习工程师微学位
- 无人驾驶工程师微学位
- Metis 在线课程 (两个月 99 美元)
资源:
- 书籍: Data Science from Scratch: First Principles with Python: https://www.amazon.com/Data-Science-Scratch-Principles-Python/dp/149190142X
- 网站: Data School: http://www.dataschool.io/

Go 语言

一些主题的额外内容

我为前面提到的某些主题增加了一些额外的内容，之所以没有直接添加到前面，是因为这样很容易导致某个主题内容过多。毕竟你想在本世纪找到一份工作，对吧？

动态规划的更多内容 (视频)
图形处理进阶 (视频)
- 异步分布式算法: 对称性破缺，最小生成树
- 异步分布式算法: 最小生成树
MIT 概率论 (mathy, and go slowly, which is good for mathy things) (视频):
Simonson: 近似算法 (视频)