深度学习阅读01
第二章 线性代数
标量、向量、矩阵与张量
- 标量(scalar)是一个单独的数字
- 向量(vector)是一组数字
- 矩阵(matrix)为二维的向量
- 张量(tensor)为多维矩阵
矩阵乘法
- 定义略
- 性质如下
单位矩阵和逆矩阵
- 单位矩阵的定义类似于群论中的幺元,任何矩阵与单位矩阵相乘后仍为自身。即单位矩阵的主对角线应该全为1,其他为0。
- 矩阵A 的逆矩阵记为A−1 ,满足AA−1=A−1A=In,n为矩阵维度
线性相关和生成子空间
对于线性方程组Ax=b,如果逆矩阵A−1存在,那么必然存在一个唯一的解x=A−1b。
为了分析该方程组有多少解,我们将矩阵A看作是列向量的组合,即A=A!.A2,A3,…,An,那么方程可写为ΣxiAi=b。
我们将这些向量放在Rn的空间中,那么我们需要去选择如何组合这些向量,来使得可以从原点出发,在这些向量的方向上运动后达到b。这种操作称为线性组合。我们称一组向量的生成子空间为原始向量经过线性组合后能达到的所有点的集合。
同时,和矩阵的秩联系在一起,如果某个维度上,这些向量的值全为0,那么不可能通过线性组合组合出目标向量b。这也恰好说明了此时矩阵不满秩。
范数
我们需要衡量向量的大小,一般地,我们使用称为范数(norm)的函数来衡量向量大小,形式上,Lp范数定义如下 ||x||p=(Σ|xi|p)1p 从直观上来讲,向量x的范数衡量远点到点x的距离。
更严谨地,范数是满足以下性质的任意向量函数
- f(x)=0=>x=0
- f(x+y)≤f(x)+f(y)
p=2时,L2称为欧几里得范数。
有时候我们会希望衡量矩阵的大小,此时我们会使用Frobenius 范数 ||A||F=√ΣA2i,j
特殊类型的矩阵和向量
- 对角矩阵:对角线上非零,其他为0,可表示为diag(v),意为由向量v组成的对角矩阵,换而言之,diag(v)x=v⨀x
- 对称,转置后与自身相等
- 正交矩阵:ATA=AAT=I