🌈有限元分析学习笔记（二）：最速下降法与共轭梯度法

最速下降法

定理 1

考虑线性方程组：

\bold A \bold x = \bold b,\;A \in \bold R^{n\times n},\;A对称正定

和二次泛函

\varphi(\bold x) = \bold x^T\bold A \bold x-2\bold b^T\bold x

有定理 1：设 $\bold A$ 对称正定，求方程组 $\bold A \bold x = \bold b$ 的解等价与求二次泛函 $\varphi (x)$ 的极小值点。

即求 $\bold x^* \in \bold R^n$ 使得 $\varphi(\bold x^*) = \mathop{\min}\limits_{x \in R} \varphi(\bold x)$

证明：

必要性

设 $\bold x^*$ 是 $\varphi(\bold x^*)$ 在 $R^n$ 上的极小值点，则 $grad(\varphi (\bold x^*)) = \nabla \varphi (\bold x)=0$

grad(\varphi(\bold x^*)) = \begin{pmatrix} \frac{\partial \varphi}{\partial x_1}\\ \frac{\partial \varphi}{\partial x_2}\\ \vdots\\ \frac{\partial \varphi}{\partial x_n}\\ \end{pmatrix}

下面开始求 $\varphi(x)$ :

\begin{aligned} \varphi(\bold x) & = \bold x^T\bold A \bold x -2\bold b^T \bold x \\&= \begin{bmatrix} x_1,\;x_2,\;\cdots,\;x_n \end{bmatrix} \begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{bmatrix} -2 \begin{bmatrix} b_1,\;b_2,\;\cdots,\;b_n \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{bmatrix}\\ & = \begin{bmatrix} \sum\limits_{i=1}^na_{i1}x_i,\;\sum\limits_{i=2}^na_{i2}x_i,\;\cdots,\;\sum\limits_{i=n}^na_{in}x_i \end{bmatrix} \begin{bmatrix} x_1\\ x_2\\ \vdots\\ x_n \end{bmatrix} -2\sum\limits_{i=1}^nb_ix_i\\ & = \sum\limits_{i=1}^na_{i1}x_ix_1+\sum\limits_{i=1}^na_{i2}x_ix_2+\;\cdots+\sum\limits_{i=1}^na_{in}x_ix_n-2\sum\limits_{i=1}^nb_ix_i\\ & = \sum\limits_{j=1}^n\sum\limits_{i=1}^na_{ij}x_ix_j-2\sum\limits_{i=1}^nb_ix_i\\ \end{aligned}

求偏导：

\frac{\partial \varphi(\bold x)}{\partial x_k}=a_{k1}x_1 + a_{k2}x_2 + a_{k,k-1}x_{k-1} + \frac{\partial \varphi(x_k)}{x_k} +a_{k,k+1}x_{k+1} + \cdots + a_{k,n}x_n - 2b_k

上式中，把 $\frac{\partial \varphi(x_k)}{x_k}$ 单独拎出来计算：

\frac{\partial \varphi(x_k)}{x_k} = \frac{\partial\left(\sum\limits_{i=1}^na_{ik}x_ix_k\right)}{x_k}= \sum\limits_{i=1,i\neq k}^na_{ik}x_i + 2a_{kk}x_k

又由于 $\bold A$ 矩阵是对称的，即 $\bold A = \bold A^T ,\; a_{ki} = a_{ik}$
整理一下，得到：

\frac{\partial \varphi(\bold x)}{\partial x_K}=2\sum\limits_{i=1}^na_{ki}x_i - 2b_k

那么，

grad(\varphi(\bold x^*)) = \begin{pmatrix} \frac{\partial \varphi}{\partial x_1}\\ \frac{\partial \varphi}{\partial x_2}\\ \vdots\\ \frac{\partial \varphi}{\partial x_n}\\ \end{pmatrix} = 2\begin{pmatrix} \sum\limits_{i=1}^na_{1i}x_i\\ \sum\limits_{i=1}^na_{2i}x_i\\ \vdots\\ \sum\limits_{i=1}^na_{ni}x_i\\ \end{pmatrix} -2 \begin{pmatrix} b_1\\ b_2\\ \vdots\\ b_n\\ \end{pmatrix} =2(\bold A\bold x - \bold b) = -2\bold r\;, \; (r = \bold b - \bold A\bold x)

所以，如果 $\bold A\bold x^* = \bold b$ ，那么， $\bold x^*$ 就是 $\bold A \bold x = \bold b$ 的解

充分性

若 $\bold A\bold x^* = \bold b$ ，则 $\forall \bold y\in \bold R^n$ ，有

\begin{aligned} \varphi(\bold x^*+\bold y) &=(\bold x^*+\bold y)^T\bold A (\bold x^*+\bold y)-2\bold b^T(\bold x^*+\bold y)\\ & = \bold {x^*}^T\bold A \bold x^* + \bold {x^*}^T\bold A\bold y + \bold y^T\bold A \bold x^*+\bold y^T\bold A\bold y-2\bold b^T\bold x^* - 2\bold b^T\bold y\\ & = \bold {x^*}^T\bold A \bold x^* + \bold b^T\bold y + \bold y^T\bold b+\bold y^T\bold A\bold y-2\bold b^T\bold x^* - 2\bold b^T\bold y\;\; \\&\;\;\;\;(\bold A^T = \bold A, \; \bold A\bold x^* = \bold b，所以\bold {x^*}^T\bold A\bold y = \bold {x^*}^T\bold A^T\bold y = {\bold A\bold x^*}^T\bold =\bold b^T\bold y)\\ & = \bold {x^*}^T\bold A \bold x^* + \bold y^T\bold A\bold y-2\bold b^T\bold x^*\;\; \\&\;\;\;\;(\bold b^T\bold y和\bold y^T\bold b是相等的，都是数字，所以可以跟后面的- 2\bold b^T\bold y \;消掉)\\ & = \varphi(\bold x^*) \underbrace{ + \bold y^T\bold A\bold y }_{一定为非负数} \geq \varphi(\bold x^*) \end{aligned}

$\therefore x^*$ 使得 $\varphi(\bold x)$ 达到最小

证毕

计算思路

通过前面的定理，那么用最速下降法求方程组就相当于求二次泛函的极小值点，求这个极小值点的方式类似于盲人下山

（1）对给定的初始向量 $\bold x_0$ ，确定一个下山方向 $\bold P_0$ ，沿着直线 $\bold x = \bold x_0 + \alpha \bold P_0$ 寻找点 $\bold x_1 = \bold x_0 + \alpha_0 \bold P_0$ 使得 $\varphi(\bold x_0+\alpha_0\bold P_0) \leq \varphi(\bold x_0+\alpha \bold P_0),\;\alpha \in \bold R$
（2）类似地，找点 $\bold x_2 = \bold x_1+\alpha_1 \bold P_1$ ，使得 $\varphi(\bold x_2)=\varphi(\bold x_1+\alpha_1\bold P_1) \leq \varphi(\bold x_1+\alpha \bold P_1),\;\alpha \in \bold R$
…
（k）找点 $\bold x_k = \bold x_{k-1} + \alpha_{k-1}\bold P_{k-1}$ ，使得 $\varphi(\bold x_k)=\varphi(\bold x_{k-1}+\alpha_{k-1}\bold P_{k-1}) \leq \varphi(\bold x_{k-1}+\alpha \bold P_{k-1}),\;\alpha \in \bold R$
…
直到 $||\bold r_k|| = ||\bold b - \bold A \bold x_k || \leq tol$ ， $tol$ 是能够容许的误差，通常为一个极小的值

在计算过程中，需要确定步长 $\alpha_k$ 和搜索方向 $\bold P_k$
首先确定搜索方向，应该是 $\varphi(\bold x)$ 减少速度最快的方向，也就是负梯度方向： $\bold P_k = \bold r_k = \bold b - \bold A \bold x_k$
然后确定步长 $\alpha_k$ ，使得 $f(\alpha_k) = \mathop{\min}\limits_{\alpha}f(\alpha)=\mathop{\min}\limits_{\alpha}\varphi(x_k+\alpha P_k)=\varphi(\bold x_k+\alpha_k \bold P_k)$
所以 $\alpha_k$ 应为满足 $f'(\alpha) = 0$ 的解
下面确定 $\alpha_k,\;\bold P_k$

\begin{aligned} f(\alpha) & = \varphi(\bold x_k + \alpha \bold P_k) = (\bold x_k + \alpha\bold P_k)^T\bold A (\bold x_k+\alpha \bold P_k)-2\bold b^T(\bold x_k+\alpha \bold P_k)\\ & = \bold x_k^T \bold A \bold x_k \underbrace{ +\alpha \bold x_k^T\bold A \bold P_k + \alpha \bold P_k^T\bold A \bold x_k }_{这两项其实是一样的，可以用转置的定义推导得到} +\alpha^2\bold P_k^T\bold A \bold P_k -2\bold b^T\bold x_k - 2\alpha\bold b^T\bold P_k\\ & = \bold x_k^T\bold A\bold x_k \underline{+ 2\alpha \bold x_k^T\bold A \bold P_k} + \alpha^2\bold P_k^T\bold A \bold P_k -2\bold b^T\bold x_k\underline{- 2\alpha\bold b^T\bold P_k}\\ & = \bold x_k^T\bold A\bold x_k -2\alpha\bold x_k^T\bold A\bold P_k+\alpha^2\bold P_k^T\bold A \bold P_k-2\bold b^T\bold x_k\\ &\;\;\;\;\;(\bold r_k = \bold b - \bold A \bold x_k ,\; 2\alpha \bold x_k^T\bold A \bold P_k-2\alpha\bold b^T\bold P_k = 2\alpha((\bold A\bold x_k)^T-\bold b^T)\bold P_k=-2\alpha \bold r_k^T\bold p_k\;)\\ & =\alpha^2\bold P_k^T\bold A \bold P_k-2\alpha \bold r_k^T\bold p_k+\varphi(\bold x_k) \end{aligned}

\begin{aligned} 解方程& : \;\;f'(\alpha) = 2\alpha \bold P_k^T\bold A \bold P_k - 2\bold r_k^T\bold P_k= 0\\ 得& : \;\;\alpha_k=\frac{\bold r_k^T\bold P_k}{\bold P_k^T\bold A\bold P_k}\\ 又由于&: \;\bold P_k = \bold r_k = \bold b-\bold A\bold x_k\\ \therefore&\;\;\alpha_k = \frac{\bold r_k^T\bold r_k}{\bold P_k^T\bold A\bold P_k} \end{aligned}

验证不等式 $\varphi(\bold x_{k+1}) = \varphi(\bold x_k+\alpha_k\bold P_k) < \varphi(\bold x_k)$ 是否满足

\begin{aligned} \varphi(\bold x_{k+1}-\varphi(\bold x_k)) & = \varphi(\bold x_k+\alpha_k\bold P_k) - \varphi(\bold x_k)\\ & = (\bold x_k+\alpha_k\bold P_k)^T\bold A(\bold x_k+\alpha_k\bold P_k)-2\bold b^T(\bold x_k+\alpha_k\bold P_k) - (\bold x_k^T\bold A\bold x_k-2\bold b^T\bold x_k)\\ & = \bold x_k^T \bold A \bold x_k +\alpha_k \bold x_k^T\bold A \bold P_k + \alpha_k \bold P_k^T\bold A \bold x_k +\alpha_k^2\bold P_k^T\bold A \bold P_k -2\bold b^T\bold x_k - 2\alpha_k\bold b^T\bold P_k - \bold x_k^T\bold A\bold x_k + 2\bold b^T\bold x_k\\ & = \alpha_k \bold x_k^T\bold A \bold P_k + \alpha_k \bold P_k^T\bold A \bold x_k +\alpha_k^2\bold P_k^T\bold A \bold P_k - 2\alpha_k\bold b^T\bold P_k\\ & = 2\alpha_k \bold x_k^T\bold A \bold P_k+\alpha_k^2\bold P_k^T\bold A \bold P_k - 2\alpha_k\bold b^T\bold P_k\\ & = \alpha_k^2\bold P_k^T\bold A \bold P_k - 2\alpha_k\bold r_k^T\bold P_k\\ & = \frac{(\bold r_k^T\bold r_k)^2}{(\bold P_k^T\bold A \bold P_k)^2}\bold P_k^T\bold A\bold P_k - 2\frac{\bold r_k^T\bold r_k}{\bold P_k^T\bold A \bold P_k}\bold r_k^T\bold P_k\\ & = \frac{(\bold r_k^T\bold r_k)^2}{\bold P_k^T\bold A \bold P_k} - 2\frac{(\bold r_k^T\bold r_k)^2}{\bold P_k^T\bold A \bold P_k}\\ & =- \frac{(\bold r_k^T\bold r_k)^2}{\bold P_k^T\bold A \bold P_k} < 0\;\;(只要\;\bold r_k^T\bold P_k \neq 0) \end{aligned}

若 $\bold r_k = 0 , 则:\varphi(\bold x_{k+1} = \varphi{\bold x_k})，即解为\;\bold x_k$

一些向量的性质

\bold P_k^T \bold P_{k+1} = 0

$其中，\;\bold P_{k+1} = \bold b-\bold A\bold x_{k+1}=\bold b-\bold A(\bold x_k+\alpha_k\bold P_k) = \bold b-\bold A\bold x_k-\alpha_k\bold A\bold P_k = \bold r_k-\alpha_k\bold A\bold P_k$
$那么:\bold P_k^T \bold P_{k+1} = \bold P_k^T\bold r_k - \bold P_k^T\bold A\bold P_k\frac{\bold r_k^T\bold r_k}{\bold r_k^T\bold A \bold r_k}=\bold r_k^T\bold r_k-\bold r_k^Tr_k = 0$
这一性质的几何含义：如果在二维上，表现为两次下降的方向是垂直的（正交的）

具体计算步骤

步0：任选初始点 $\bold x_0$ ，置 $k = 0$
步1：计算 $\bold r_k = \bold b-\bold A \bold x_k$ （下降方向为负梯度方向）
步2：若 $\bold r_k = 0$ ，则停止
步3：计算 $\alpha_k = \frac{\bold r_k^T \bold r_k}{\bold r_k^T \bold A \bold r_k} %$ （步长因子）
步4：计算 $\bold x_{k+1} = \bold x_k + \alpha_k \bold P_k$ （新的迭代点）
步5： $k = k+1$ ，转步1

补充

定理2：设 $\bold A \in \bold R^{n\times n}$ 对称正定， $\bold A$ 的特征值为：

\lambda_n\geq\lambda_{n-1}\geq\cdots \geq \lambda_1 > 0

设 $\{x_k\}$ 为由求解对称正定方程组 $\bold A \bold x = \bold b$ 的最速下降法得到的向量序列，则有：

||\bold x_k-\bold x^*||_A\leq\left( \frac{\lambda_n-\lambda_1}{\lambda_n+\lambda_1} \right)^k||\bold x_0-\bold x^*||_A

其中： $\bold A\bold x^* = \bold b$
定义：设 $\bold A \in \bold R^{n\times n}$ 对称正定，则称 $||\bold x||_A = (\bold x^T \bold A \bold x)^{\frac{1}{2}}$ 为 $\bold R^n$ 上的 $\bold A- 范数$
注：可以用范数定义证明 $||*||_A$ 是范数
从定理的结论上看，当 $\frac{\lambda_n}{\lambda_1} \gg 1$ 时，迭代序列收敛速度很慢
缺点：从局部上看，最速下降法的每一步迭代都是最优的，但是从整体上看却未必，为获得全局最优的迭代方法，需要采用共轭梯度法

共轭梯度法

推导

（1） $\forall\;\bold x_0\in\bold R^n,\;\bold r_0=\bold b-\bold A\bold x_0$ ，仍取 $\bold P_0 = \bold r_0$ 。 $\bold x_0$ 沿 $\bold P_0$ 方向作直线搜索
使得 $\varphi(\bold x_0+\alpha_0\bold P_0) = \mathop{\min}\limits_{\alpha}\varphi(\bold x_0+\alpha \bold P_0),\;\alpha \in \bold R$ 证明方法与最速下降法类似
解之，得 $\alpha_0 = \frac{\bold r_0^T\bold r_0}{\bold r_0^T\bold A \bold r_0} > 0$ 【通过求 $f'(\alpha) = 0$ 中的 $\alpha$ 得到】
$\therefore \bold x_1=\bold x_0 + \alpha_0\bold P_0,\;\bold r_1=\bold b - \bold A\bold x_1$
注： $\bold P_0^T \bold r_1 = \bold P_0^T(\bold b - \bold A\bold x_0 - \alpha_0\bold A\bold P_0) = \bold P_0^T\bold r_0 - \alpha_0\bold P_0^T\bold A\bold P_0 \xlongequal{\bold r_0 = \bold P_0} \bold 0$
$\bold r_0^T\bold r_1 = \bold P_0^T\bold r_1 = 0 \;(*)$

（2）从第二步起，下山方向就不再选取负梯度方向，而是在二维平面 $\pi_2 = \{\bold x=\bold x_1+\xi\bold r_1 + \eta\bold P_0\;|\;\xi,\eta\in \bold R\}$ 内找出使函数下降最快的方向作为新的下山方向 $\bold P_1$ 和新的步长 $\alpha_1$ 。

先求 $\bold P_1$ ：

\begin{aligned} \varphi(\xi,\eta) & = \varphi(\bold x_1+\bold \xi\bold r_1+\eta\bold P_0) \\ & = (\bold x_1 + \xi\bold r_1 + \eta\bold P_0)^T\bold A(\bold x_1 + \xi\bold r_1 + \eta\bold P_0) - 2\bold b^T(\bold x_1 + \xi\bold r_1 + \eta\bold P_0)\\ & = \bold x_1^T \bold A \xi\bold r_1+\xi\bold r_1^T\bold A\bold x_1+\xi^2\bold r_1^T\bold A \bold r_1 + \xi\bold r_1^T\bold A \eta\bold P_0+ \eta P_0^T\bold A\xi\bold r_1-2\bold b^T\xi\bold r_1 \end{aligned}

对其求偏导，得到

\begin{aligned} \frac{\varphi(\xi,\eta)}{\xi} \frac{\partial\varphi(\xi,\eta)}{\partial\xi} & = 2(\xi\bold r_1^T\bold A\bold r_1+\eta\bold r_1^T\bold A \bold P_0-\bold r_1^T\bold r_1)\\ \frac{\partial\varphi(\xi,\eta)}{\partial\xi} & = 2(\xi\bold r_1^T\bold A\bold P_0+\eta\bold P_0^T\bold A \bold P_0) \end{aligned}

令（19）（20）为 0 ，即得 $\varphi$ 在 $\pi_2$ 内的唯一极小值解

\widetilde{\bold x} = \bold x_1 + \xi_0\bold r_1 + \eta_0\bold P_0

其中： $\xi_0,\;\eta_0\;$ 满足（19）=（20）= 0
即求方程组： $\begin{cases} \;\xi\bold r_1^T\bold A\bold r_1+\eta\bold r_1^T\bold A \bold P_0=\bold r_1^T\bold r_1\\ \;\xi\bold r_1^T\bold A\bold P_0+\eta\bold P_0^T\bold A \bold P_0 \end{cases}$ 【如果这里直接求解 $\xi_0,\;\eta_0$ 比较困难，可以先求出 $\beta_0=\frac{\eta_0}{\xi_0} = -\frac{\bold r_1^T\bold A \bold P_0}{\bold P_0^T \bold A \bold P_0}$ ，得出方向，再求方向的系数】

（21）中，若 $r_1 \neq 0 \;则\;\xi_0\neq 0$ ，故可取 $\bold x_2 = \bold x_1 + \alpha_1 \bold P_1$ 【 $\bold P_1 = \bold r_1 + \beta_0\bold P_0$ 作为新的方向】

再求 $\alpha_1$

因 $\alpha_1$ 也满足 $\varphi(\bold x_1+\alpha_1\bold P_1) = \mathop{\min}\limits_{\alpha}\varphi(\bold x_1+\alpha \bold P_1),\;\alpha \in \bold R$
故，得到： $\alpha_1 = \frac{\bold r_1^T\bold P_1}{\bold P_1^T\bold A \bold P_1}$
由 $\bold P_1 = \bold r_1 + \beta_0 \bold P_0$ ，得 $\alpha_1 = \frac{\bold r_1^T+\beta_0\bold P_0}{\bold P_1^T\bold A \bold P_1} = \frac{\bold r_1^T\bold r_1}{\bold P_1^T \bold A \bold P_1}$ 【由 $(*)$ ， $\bold r_1$ 和 $\bold P_0$ 垂直，即 $\bold r_1^T \bold P_0 = (\bold P_0^T\bold r_1)^T = 0$ 】

综上： $\bold x_2 = \bold x_1 +\alpha_1\bold P_1,\;\bold P_1 = \bold r_1+\beta_0\bold P_0,\;\bold r_2 = \bold b - \bold A\bold x_2$

一些向量的性质

$\bold P_1^T\bold A \bold P_0 = (\bold r_1 + \beta_0 \bold P_0)^T \bold A \bold P_0 = \bold r_1^T\bold A \bold P_0 + \beta_0\bold P_0^T\bold A \bold P_0 = \bold r_1^T\bold A \bold P_0 - \frac{\bold r_1^T\bold A \bold P_0}{\bold P_0^T\bold A \bold P_0}\bold P_0^T\bold A\bold P_0 = 0$

$\bold P_0^T \bold r_2 = \bold P_0^T(\underbrace{\bold b -\bold A \bold x_1}_{\bold r_1} - \alpha_1 \bold A \bold P_1) = \bold P_0^T \bold r_1 - \alpha_1\bold P_0^T\bold A \bold P_1 = 0$

$\begin{aligned} \bold P_1^T \bold r_2 = \bold P_1^T(\bold b-\bold A\bold x_1-\alpha_1\bold A\bold P_1) & = \bold P_1^T \bold r_1 - \alpha_1 \bold P_1^T\bold A\bold P_1\\& = \bold P_1^T\bold r_1 - \frac{\bold r_1^T\bold r_1}{\bold P_1^T\bold A\bold P_1}\bold P_1^T\bold A \bold P_1 \\& =\bold P_1^T\bold r_1 - \bold r_1^T\bold r_1 \\ & =(\bold r_1+\beta_0\bold P_0)^T\bold r_1 - \bold r_1^T \bold r_1\\& =\beta_0\bold P_0^T \bold r_1 = \beta_0\cdot 0 = 0\end{aligned}$

$\bold r_0^T \bold r_2 = \bold P_0^T\bold r_2 = 0$

$\begin{aligned} \bold r_1^T\bold r_2 = \bold r_1^T(\bold b - \bold A \bold x_1 - \alpha_1\bold A \bold P_1) & = \bold r_1^T(r_1-\alpha_1\bold A \bold P_1) \\&= \bold r_1^T \bold r_1-\bold r_1^T\bold \alpha_1\bold A\bold P_1 \\ &= \bold r_1^T \bold r_1 - \alpha_1\bold r_1^T\bold A \bold P_1\\& =\bold r_1^T \bold r_1-\frac{\bold r_1^T\bold P_1}{\bold P_1^T\bold A\bold P_1}\bold r_1^T\bold A\bold P_1\\&= \bold r_1^T \bold r_1-\frac{\bold r_1^T\bold P_1}{(\bold r_1+\beta_0\bold P_0)^T\bold A\bold P_1}\bold r_1^T\bold A\bold P_1\\&= \bold r_1^T \bold r_1-\frac{\bold r_1^T\bold P_1}{\bold r_1^T\bold A\bold P_1 + \beta_0\bold P_0^T\bold A\bold P_1}\bold r_1^T\bold A\bold P_1 \\&= \bold r_1^T \bold r_1-\frac{\bold r_1^T\bold r_1}{\bold r_1^T\bold A\bold P_1}\bold r_1^T\bold A\bold P_1 \\& = 0 \end{aligned}$

（3）若 $\bold r_2 \neq 0$ ，则重复第二步，总结为：

\begin{aligned} \bold x_{k+1} & = \bold x_k+\alpha_k \bold P_k\\ \bold P_k & = \bold r_k + \beta_{k-1}\bold P_{k-1}\\ \beta_{k-1} & = -\frac{\bold r_k^T\bold A\bold P_{k-1}}{\bold P_{k-1}^T\bold A\bold P_{k-1}} = \frac{\bold r_k^T\bold r_{k-1}}{\bold r_{k-1}^T\bold r_{k-1}}\\ \bold \alpha_k & = \frac{\bold r_k^T\bold r_k}{\bold P_{k}^T\bold A\bold P_k} \\ \bold r_{k+1} & = \bold b - \bold A\bold x_{k+1} = \bold r_k - \alpha_k\bold A \bold P_k \end{aligned}

如此，便得到共轭梯度法的计算步骤

计算步骤

推导出来的计算步骤如下：

$\bold x_0 = 初值$
$\bold r_0 = \bold b - \bold A\bold x_0 ;\;k = 0$
$while \;\;\bold r_k \neq 0 【实际上，应该用范数是否小于设定值来判断$
$k = k + 1$
$if \; k = 1 \;\; \bold P_0 = \bold r_0$
$else$
$\beta_{k-2} = \frac{\bold r_{k-1}^T\bold r_{k-1}}{\bold r_{k-2}^T\bold r_{k-2}}$
$\bold P_{k-1} = \bold r_{k-1}+\beta_{k-2}\bold P_{k-2}$
$end$
$\alpha_{k-1} = \frac{\bold r_{k-1}^T\bold r_{k-1}}{\bold P_{k-1}^T\bold A \bold P_{k-1}}$
$\bold x_k = \bold x_{k-1}+\alpha_{k-1}\bold P_{k-1}$
$\bold r_k = \bold r_{k-1} - \alpha_{k-1}\bold A\bold P_{k-1}$
$end$
$\bold x = \bold x_k$

但是在编写程序过程中，应当按照如下方式编写：

$\bold x_0 = 初值$
$\bold r_0 = \bold b - \bold A\bold x_0 ;\;k = 0$
$while \;\;||\bold r_k||\geq tol \;\;(tol为一设定的很小的值)$
$k = k + 1$
$if \; k = 1 \;\; \bold P_0 = \bold r_0$
$else$
$\beta_{k-2} = \frac{\bold r_{k-1}^T\bold r_{k-1}}{\bold r_{k-2}^T\bold r_{k-2}}$
$\bold P_{k-1} = \bold r_{k-1}+\beta_{k-2}\bold P_{k-2}$
$end$
$temp = \bold A \bold P_{k-1}$
$\alpha_{k-1} = \frac{\bold r_{k-1}^T\bold r_{k-1}}{\bold P_{k-1}^T\cdot temp}$
$\bold x_k = \bold x_{k-1}+\alpha_{k-1}\bold P_{k-1}$
$\bold r_k = \bold r_{k-1} - \alpha_{k-1}\cdot temp$
$end$
$\bold x = \bold x_k$

补充

定理3：由共轭梯度法得到的向量组 $\{\bold r_i\}$ 和 $\{\bold P_i\}$ 具有下面的性质：

（1） $\bold P_I^T\bold r_j = 0,\;0\leq i < j \leq k$
（2） $\bold r_i^T\bold r_j = 0,\;i \neq j,\; 0 \leq i,j\leq k$
（3） $\bold P_i^T\bold A \bold P_j = 0,\;i \neq j,\;0\leq i,j\leq k$
（4） $span\{\bold r_0,\;\bold r_1,\;\cdots,\;\bold r_k\} = span\{\bold P_0,\;\bold P_1,\;\cdots,\;\bold P_k\} = \widetilde{K}(\bold A,\;\bold r_0,\;k+1)$
$\widetilde{K}(\bold A,\;\bold r_0,\;k+1) = span\{\bold r_0,\;\bold A\bold r_0,\;\cdots,\;\bold A^k\bold r_0\} 通常称为krylov子空间$

$\bold A-共轭$ ：设矩阵 $\bold A \in R^{n\times n}$ 对称正定，若非零向量 $\bold P_0,\;\bold P_1,\;\cdots,\;\bold P_{k-1}$ 满足 $\bold P_i^T\bold A \bold P_j = 0 ,\; i\neq j ,\;i,j = 0,\;\cdots,\;k-1$ ，则称向量 $\bold P_0,\;\bold P_1,\;\cdots ,\;\bold P_{k-1}$ 是 $A-共轭$ 的，或称 $\bold P_0,\;\bold P_1,\;\cdots,\;\bold P_{k-1}$ 是 $A-共轭$ 方向

目录CONTENT

🌈有限元分析学习笔记（二）：最速下降法与共轭梯度法

最速下降法

定理 1

证明：

必要性

充分性

计算思路

一些向量的性质

具体计算步骤

补充

共轭梯度法

推导

一些向量的性质

计算步骤

补充

评论区