计算方法(数值分析)

约 17063 字大约 57 分钟

2024-06-30

误差和有效数字基本概念
避免危害

数值分析: 将复杂的计算式转换为指令集中定义过的+、- (×、÷)输入到计算机中, 得到近似解

1.2 误差的背景介绍

1.2.1 来源与分类

来源	分类
从实际问题中抽象出数学模型	模型误差
通过测量得到模型中参数的值	观测误差
求近似解	方法误差(截断误差)
机器字长有限	舍入误差

1.2.2 误差与有效数字

绝对误差

绝对误差: $e^* = x^* - x, 其中x为精确值, x^*为x的近似值$

精确值 $x^*$ 通常不可求得, 我们只能求出近似值

绝对误差限: $|e^*|的上限即为\varepsilon^*, 称为\textcolor{#66ccff}{绝对误差限}$

工程上常记为 $x = x^* \pm e^*$ , 如 $\int_0^1e^{-x^2}dx=0.743\pm0.006$
注意:
- e* 理论上讲是唯一确定的，可能取正，也可能取负。
- e*> 0 不唯一，当然 e* 越小越具有参考价值。

相对误差

相对误差: $e_r^* = \frac{e^*}x ≈ \frac{e^*}{x^*}\\$

相对误差限: $\varepsilon_r^* (= \frac{\varepsilon^*}{x}) = \frac{\varepsilon^*}{|x^*|}\\$

有效数字

~~看不懂的~~有效数字定义: 用科学记数法, 记 $近似值x^*=a_1.a_2a_3...a_n*10^m(其中a_1\neq 0)$ , 若 $(|e^*|=)\ |x^*-x|\leq \textcolor{red}{0.5}*10^{m-n+1}$ (即 $a_n$ 的截取按照四舍五入规则), 则称 $x^*$ 为n位有效数字, 精确到 $10^{m-n+1}$

$m+1$ : $x^*$ 小数点前的位数 $n$ : 有效位数 $m-n+1$ : 小数点后位数 (经过四舍五入的结果)
有效数字即为绝对误差限

有效数字与相对误差的关系

有效数字→相对误差限

已知 $x^*$ 有n位有效数字, 其相对误差限为 $\begin{aligned}\varepsilon_r^*&=\left|\frac{\varepsilon^*}{x^*}\right|=\frac{0.5\times10^{-(n-1)}\times10^m}{a_1.a_2\cdots a_n\times10^m}=\frac{10^{-(n-1)}}{2\times a_1.a_2\cdots}\leq\frac1{2a_1}\times10^{-(n-1)}\end{aligned}$

相对误差限→有效数字

已知 x* 的相对误差限可写为 $\varepsilon_r*=\frac1{2(a_1+1)}\times10^{-(n-1)}\\$
则: $\begin{aligned}\mid x-x^*\mid&\leq\varepsilon_r^*\cdot\mid x^*\mid=\frac{10^{-(n-1)}}{2(a_1+1)}\times a_1.a_2\cdots\times10^m\\&<\frac{10^{-(n-1)}}{2(a_1+1)}\cdot(a_1+1)\times10^m=0.5\times10^{m-n+1}\end{aligned}$
$(a_1+1)$ 是为了通过不等式消除 $0.a_2a_3...$

例: 为使 $\pi^*$ 的相对误差小于0.001%,至少应取几位有效数字？

需求: 从有效数字确定相对误差限
设 $\pi^*$ 取n位有效数字, 则其相对误差限为 $\varepsilon_r^*\leq\frac1{2a_1}\times10^{-n+1}$
要保证相对误差小于0.001%, 只要保证 $\varepsilon_r^*\leq\frac1{2a_1}\times10^{-n+1}<0.001\%$
已知 $\pi的a_1 = 3$ ，则从以上不等式可解得 $n > 6 - log6$ ，即 $n \geq 6$ ，应取 $\pi^* = 3.14159$

数值运算中的误差限

误差传递公式

误差: $\varepsilon = x^*-x$ , 相对误差 $\varepsilon_r=\frac \varepsilon{x^*}\\$ , 函数值相对误差 $\frac{f(x^*)-f(x)}{f(x^*)}\\$

相对误差限比值(条件数): $C_p=|\frac{f(x^*)-f(x)}{f(x^*)}|/|\varepsilon_r|\approx|\frac{xf'(x^*)}{f(x^*)}| \\$

误差限公式

经过 $f(x)$ 计算, 相对误差会被放大

加法: $y^*=x_1^*+x_2^*$

$\varepsilon(y^*)\leq\varepsilon(x_1^*)+\varepsilon(x_2^*)$ 误差限直接相加

乘法: $y^*=x_1^*\cdot x_2^*$

$\varepsilon(y^*)\leq|x_2^*|\varepsilon(x_1^*)+|x_1^*|\varepsilon(x_2^*)$
会受 $|x_1^*|, |x_2^*|$ 影响

除法: $y^*=\frac{x_1^*}{x_2^*}\\$

$\varepsilon(y^*)\leq\frac{|x_2^*|\varepsilon(x_1^*)+|x_1^*|\varepsilon(x_2^*)}{\left|x_2^*\right|^2}\\$
$|x_2^*|\downarrow\ \Rightarrow\ \varepsilon(y^*)↑↑$
要尽量避免除法的出现, 防止误差暴涨

其他注意事项

避免小分母: 分母过小会造成浮点溢出
避免相近二数相减
- 会导致有效数字减少
- 几种经验性避免方法：
  - $\sqrt{x+\varepsilon}-\sqrt{x}=\frac\varepsilon{\sqrt{x+\varepsilon}+\sqrt{x}};\quad\ln(x+\varepsilon)-\ln x=\ln(1+\frac\varepsilon x);\\$
  - 当 | x | << 1 时： $\begin{aligned}&1-\cos x=2\sin^2\frac x2;\\&e^x-1=x\left(1+\frac12x+\frac16x^2+...\right)\end{aligned}$
避免大数吃小数
- 计算机浮点运算, 指数对齐导致的基数部分丢失
尽量减少运算次数
- 使用秦九昭算法

第2章插值法

插值多项式的唯一性
拉格朗日插值公式, 误差, 余项
差商, 均差, 均差的性质
牛顿插值多项式的形式, 误差
2.3.4 不用
埃尔米特插值
例题, 三个点值+一个点的导数的计算
均差表绘制方式
分段低次插值: 知道概念即可
?
三次样条插值不用

什么是插值法

当精确函数 y = f(x) 非常复杂或未知时，在一系列节点 $x_0 … x_n$ 处测得函数值 $y_0 = f(x_0), … yn _= f(x_n)$ ，由此构造一个简单易算的近似函数 $P(x) ≈ f(x)$ ，满足条件 $P(x_i) = f(x_i) (i = 0, … n)$ 。这里的 P(x) 称为f(x) 的插值函数。

最常用的插值函数是多项式

插值多项式

为了使插值函数更方便在计算机上运算,一般插值函数都使用代数多项式和有理函数

代数插值多项式的存在唯一性

设函数 $y=f(x)$ 在区间[a,b]上的代数插值多项式为 $P(x)=a_0+a_1x+a_2x^2+...+a_nx^n, P_n(x_i)=y_i, i=0, 1,2,...,n$

即多项式 $P_n(x)$ 的系数 $a_0, a_1, ...,a_n$ 满足线性方程组

$\begin{cases}a_0+a_1x_0+a_2x_0^2+...+a_nx_0^n=y_0 \\ a_0+a_1x_1+a_2x_1^2+...+a_nx_1^n=y_1\\......\\ a_0+a_1x_n+a_2x_n^2+...+a_nx_n^n=y_n\end{cases}$

上述方程组的系数行列式为n+1阶的Vandermond行列式 ( $x_0, x_1...$ 是已知量)

$V=\left | \begin{matrix} 1 & x_0 & ... & x_0^n \\ 1 & x_1 & ... & x_1^n \\ ... & ... & ... & ... \\ 1 & x_n & ... & x_n^n \\ \end{matrix} \right | =\prod_{i=0}^{n-1}\prod_{j=i+1}^n(x_j-x_i) \neq 0 (x_i\neq x_j)$

定理: 满足 $P(x_i)=y_i, i=0,1,...,n$ , 次数不超过n的插值多项式一定唯一存在

若多项式次数≠n, 则插值多项式不唯一例如 $P(x)=L_n(x)+p(x)\prod_{i=0}^n(x-x_i)$ 也是一个插值多项式，其中p(x)可以是任意多项式。

2.2 拉格朗日插值

2.2.1 线性插值&抛物线插值

插值的目的是求出n次多项式 $P(x)=a_0+a_1x+a_2x^2+...+a_nx^n\ 使得\ P_n(x_i)=y_i, i=0,1,...,n$

线性插值

即n=1, 已知 $y_0=f(x_0), y_1=f(x_1)$ 求 $P_1(x)=a_0+a_1x$ 满足 $P_1(x_0)=y_0, P_2(x_1)=y_1$

由几何意义易得

$\begin{aligned} \boldsymbol{P_{1}}(\boldsymbol{x})& =y_0+\frac{y_1-y_0}{x_1-x_0}(x-x_0) \\ &={\left[\frac{x-x_1}{x_0-x_1}\right]}y_0+{\left[\frac{x-x_0}{x_1-x_0}\right]}y_1=\sum_{i=0}^{1}\textcolor{red}{l_i(x)}y_i \end{aligned}$ $\begin{aligned} l_0(x)=\frac{x-x_1}{x_0-x_1}\\l_1(x)=\frac{x-x_0}{x_1-x_0}\end{aligned}$

抛物线插值

即n=2, … 略!

2.2.2 拉格朗日插值多项式

定义—n次插值基函数

若n次多项式 $l_j(x)(j=0,1,...,n)$ 在 $n+1$ 个节点 $x_0<x_1<...<x_n$ 上

满足条件 $l_j(x_k)=\delta_{jk}=\begin{cases}1,&k=j\\0,&k\neq j\end{cases}\quad j,k=0,1,...,n$ ,

则称这n+1个n次多项式 $l_0(x), l_1(x),...,l_n(x)$ 为插值节点 $x_0,x_1,...,x_n$ 上的n次插值基函数

与上面的例子类似, 可以推导得出n次插值基函数为 $\begin{aligned} l_k(x)& =\frac{(x-x_0)(x-x_1)\cdots(x-x_{k-1})(x-x_{k+1})\cdots(x-x_n)}{(x_k-x_0)(x_k-x_1)\cdots(x_k-x_{k-1})(x_k-x_{k+1})\cdots(x_k-x_n)} \\ &=\prod_{i=0}^n\frac{\left(x-x_i\right)}{\left(x_k-x_i\right)}\quad\quad k=0,1,2,\cdots,n \\ \end{aligned}$

(分子只少了一项 $x-x_k$ , 分母对应的少一项 $x_k-x_k$ )

所以 $\color{blue}L_n(x)=\sum_{k=0\\}^ny_kl_k(x)$ , 由 $l_k(x)$ 的定义可知 $L_n(x_j)=\sum_{k=0\\}^n y_kl_k(x_j)=y_j,j=0,1,...,n$ 满足插值多项式的定义

将形如上述 $L_n(x)$ 的插值多项式称为拉格朗日(Lagrange)插值多项式

拉格朗日插值多项式基函数的简化写法

记 $\omega_{n+1}(x)=(x-x_0)(x-x_1)...(x-x_n)$ , 可得 $\omega_{n+1}^{\prime}(x_k)=(x_k-x_0)(x_k-x_1)\cdot \cdot\cdot (x_k-x_{k-1})(x_k-x_{k+1})\cdot \cdot \cdot (x_k-x_n)$ (导数乘法公式)

得 $\begin{aligned} l_k(x)& \begin{aligned}&=\frac{(x-x_0)(x-x_1)\cdots(x-x_{k-1})(x-x_{k+1})\cdots(x-x_n)}{(x_k-x_0)(x_k-x_1)\cdots(x_k-x_{k-1})(x_k-x_{k+1})\cdots(x_k-x_n)}\end{aligned}=\textcolor{blue}{\frac{\omega_{n+1}(x)}{\omega_{n+1}^{\prime}(x_k)(x-x_k)}}\quad\quad\quad k=0,1,2,\cdots,n \end{aligned}$

公式总结:

\textcolor{blue}{L_n(x)}=\sum_{k=0\\}^ny_kl_k(x): Lagrange插值多项式\\ \textcolor{blue}{l_k(x)}=\frac{\omega_{n+1}(x)}{\omega_{n+1}^{\prime}(x_k)(x-x_k)}: Lagrange插值基函数

2.2.3 插值余项&误差估计

设区间[a, b]上f(x)的差值多项式为n阶的 $L_n(x)$ , 令余项 $R_n(x) = f(x) - L_n(x)$

显然, 在插值节点 $x_i$ 上有 $R_n(x_i) = f(x_i) - L_n(x_i) = 0$

因此, $R_n(x)$ 在[a, b]上有n+1个零点

设 $R_n(x) = K(x)\omega_{n+1}(x);\quad \omega_{n+1}(x) = (x-x_0)(x-x_1)...(x-x_n)$

此时有 $R_n(x) = K(x)\omega_{n+1}(x) = f(x) - L_n(x)$

….

得

拉格朗日型余项定理:

R_n(x) = K(x)\omega_{n+1}(x) =\frac{f^{(n+1)}(\xi)}{(n+1)!}\omega_{n+1}(x), 其中\omega_{n+1}(x)=\prod_{i=0}^{n}(x-x_i), \xi\in(a,b)

2.3 均差与牛顿插值多项式

2.3.1 插值多项式的逐次生成

Lagrange插值多项式的基函数为

当需要增加节点时, 所有基函数 $l_i(x)$ 都需要重新计算

考虑使用一种逐次生成插值多项式的方法, 记为 $P_n(x)$

$对0次插值,P_0(x)=f(x_0)$

对1次插值, $\begin{cases}P_1(x_0)=f(x_0)\\P_1(x_1)=f(x_1)\end{cases}$

$P_1(x)=f(x_0)+\frac{f(x_1)-f(x_0)}{x_1-x_0}(x_1-x_0)(点斜式)=P_0(x)+a_1(x-x_0)$

对2次插值, $\begin{cases}P_2(x_0)=f(x_0)\\P_2(x_1)=f(x_1)\\P_2(x_1)=f(x_2)\end{cases}$

$P_2(x)=P_1(x)+a_2(x-x_0)(x-x_1)$

可得, $P_n(x)=a_0+a_1(x-x_0)+a_2(x-x_0)(x-x_1)+...+a_n(x-x_0)(x-x_1)...(x-x_n)$

其中 $a_0, a_1, ...,a_n可由P_n(x_i)=f(x_i)$ 计算得到

\begin{aligned} &P(x_0)=f_0=a_0 &a_0=f_0 \\ &P(x_1)=f_1=a_0+a_1(x_1-x_0)&a_1=\frac{f_1-f_0}{x_1-x_0} \\ &P(x_2)=f_2=a_0+a_1(x_2-x_0)+a_2(x_2-x_0)(x_2-x_1)& a_{2}=\frac{\frac{f_2-f_0}{x_2-x_0}-\frac{f_1-f_0}{x_1-x_0}}{x_{2}-x_{1}} \end{aligned}

这样计算下去会变得很麻烦, 定义均差来表示他们

2.3.2 均差及其性质

差商(均差, devided difference)的定义:

\begin{aligned} &一阶差商: f[x_0,x_i]=\frac{f(x_1)-f(x_0)}{x_1-x_0}\\ &二阶差商: f[x_0, x_1,x_2] =\frac{f[x_1,x_2]-f[x_0,x_1]}{x_2-x_0}\\&...\\ &k+1阶差商: f[x_0,...,x_{k+1}]=\frac{f[x_0,x_1,...,x_k]-f[x_1,...,x_k,x_{k+1}]}{x_0-x_{k+1}} \\ &\qquad\qquad\qquad\qquad\qquad\qquad\ =\frac{f[x_0,...,x_{k-1},x_k]-f[x_0,...,x_{k-1},x_{k+1}]}{x_k-x_{k+1}} \end{aligned}

是递归定义的
k+1阶差商只需要任选两个k阶差商相减, 并没有固定选择的要求
- 所以在上面选择了 $f[x_0,...,x_{k-1},x_{k+1}]$ 作为减数

均差的性质 ※

①k阶均差-f(x)的线性表示

\begin{aligned} f[x_0,x_1,\cdots,x_{k-1},x_k]&=\sum_{i=0}^k\frac{f(x_i)}{(x_i-x_0)\cdots(x_i-x_{i-1})(x_i-x_{i+1})\cdots(x_i-x_k)} \\ &=\sum_{i=0}^k\frac{f(x_i)}{\omega_{k+1}^{\prime}(x_i)} \\ &\textbf{其中}\quad\omega_{k+1}(x)=\prod_{i=0}^k\left(x-x_i\right),\quad\omega_{k+1}^{\prime}(x_i)=\prod_{j=0}^k\left(x_i-x_j\right) \end{aligned}

②差商与x的顺序无关

如 $f[x_0,x_1,x_2]=f[x_0,x_2,x_1]=f[x_2,x_1,x_0]$

③k阶差商与k阶导

当 $f^{(k)}(x)$ 在包含节点 $x_0,x_1,\cdots,x_k$ 的区间存在时，在 $x_0,x_1,\cdots,x_k$ 之间必存在一点 $\xi$ ,使得 $f[x_0,x_1,\cdots,x_k]=\frac{f^{(k)}(\xi)}{k!}\\$

2.3.3 牛顿插值多项式

$N_n(x)=\alpha_0+\alpha_1(x-x_0)+\alpha_2(x-x_0)(x-x_1)+....+\alpha_n(x-x_0)...(x-x_{n-1})$

$\left.\left\{\begin{array}{cccc|c}f(x)=f(x_0)+f[x,x_0](x-x_0) & \\ f[x,x_0]=f[x_0,x_1]+f[x,x_0,x_1](x-x_1) \\ ....................\\ f[x,x_0,...,x_{n-1}]=f[x_0,...,x_{n}]+f[x,x_0,...,x_{n}](x-x_{n})\quad& \end{array}\right.\right.$

把后一式带入前一式得

\begin{aligned} f(x)=&f(x_0)+f[x_0,x_1](x-x_0)+f[x_0,x_1,x_2](x-x_0)(x-x_1)+...\\&+f[x_0,...,x_n](x-x_0)...(x-x_{n-1}) &牛顿插值多项式N_n(x)\\ &+f[x,x_0,...,x_n](x-x_0)...(x-x_{n-1})(x-x_n)&牛顿插值多项式余项R_n(x) \end{aligned}

由上面的式子可以得出, n阶插值多项式 $P_n(x)=f[x_0,...,x_n]x^n+?x^{n-1}+...+?x+?1$ , 最高项系数一定为n阶差商

↑可以用来证明性质1(结合拉格朗日插值公式)

具体计算方式: 画出差商表

2.4 埃尔米特插值

埃米特插值: 不仅要求函数值相等, 还要求若干阶导数相等

埃尔米特插值: 要求插值函数 P (x) 满足 $P(x_i) = f (x_i), P’ (x_i) = f ’ (x_i),…, P^{(m)} (x_i) = f^{ (m)} (x_i)$

注意:

N个条件可以确定N-1阶多项式
要求在1个节点 $x_0$ $x_{0}$ 处直到m阶导数都重合的插值多项式即为Taylor多项式
- $\begin{gathered} \begin{aligned}P(x)=f(x_0)+f'(x_0)(x-x_0)+...+\frac{f^{(m)}(x_0)}{m!}(x-x_0)^m\end{aligned} \\ \textbf{其余项为}\quad R(x)=f(x)-P(x)=\frac{f^{(m+1)}(\xi)}{(m+1)!}(x-x_0)^{(m+1)} \end{gathered}$
一般只考虑 $f$ 与 $f ’$ 的值。

Hermite插值计算出的多项式次数

给定n+1个点前面的插值函数最高只有n阶 (列出n+1个方程, 解得n个待定系数)

两点三次Hermite插值

考虑只有两个节点的插值问题

设 $f(x)$ 在节点 $x_0,x_1$ 处的函数值为 $y_0,y_1$ 在节点 $x_0,x_1$ 处的的一阶导数值为 $y_0^{\prime},y_1^{\prime}$

两个节点最高可以用 $2\times1+1=3$ 次 $Hermite$ 多项式 $H_{3}(x)$

$H_3(x)$ 应满足插值条件

H_3(x_0)=y_0\quad H_3(x_1)=y_1\\ H_3^{\prime}(x_0)=y_0^{\prime}\quad H_3'(x_1)=y_1'

用四个基函数表示 $\color{blue}H_3(x) = y_0α_0(x) + y_1\alpha_1(x)+y_0'\beta_0(x)+y'\beta_1(x)$

可得

\begin{aligned}&\color{red}{{\alpha_0(x_0)=1}}\quad\color{red}{{\alpha_0(x_1)=0}}\quad\color{red}{{\alpha_0^{\prime}(x_0)=0}}\quad\color{red}{{\alpha_0^{\prime}(x_1)=0}}\\ &\alpha_1(x_0)=0\quad\alpha_1(x_1)=1\quad\alpha_1^{\prime}(x_0)=0\quad\alpha_1^{\prime}(x_1)=0\\ &\beta_0(x_0)=0\quad\beta_0(x_1)=0\quad\beta_0^{\prime}(x_0)=1\quad\beta_0^{\prime}(x_1)=0\\ &\beta_0(x_0)=0 \quad\beta_1(x_0)=0\quad\beta_1^{\prime}(x_1)=0\quad\beta_1^{\prime}(x_1)=1 \ \end{aligned} \Longrightarrow \begin{cases}对\alpha(x): 只有\textcolor{blue}{{a_i(x_i)=1}} ,其余为0\\ 对\beta(x): 只有\textcolor{blue}{\beta_i'(x_i)=1},其余为0\end{cases}

因为 $H_3(x)$ 是3次多项式, 所以 $\alpha_0(x)$ 最高也为3次, $\color{orange}\begin{cases}\alpha_0(x_0)=1&\alpha_0'(x_0)=0&①\\\alpha_0(x_1)=0 &\alpha_0'(x_1)=0&②\end{cases}$

在 $x_1$ 处, $\color{orange}②\quad \alpha_0(x_1)=\alpha_0'(x_1)=0$ , 即 $x_1$ 为 $\alpha_0$ 的二重零点, 函数值为0, 导数也为0 可设 $\color{blue}\alpha_0(x)=(x-x_1)^2(\alpha x+b)$
在 $x_0$ 处, $\color{orange}①\quad \alpha_0(x_0)=1\ \ \alpha_0'(x_0)=0$ , 代入得 $a=-\frac2{\left(x_0-x_1\right)^3}\quad b=\frac1{\left(x_0-x_1\right)^2}+\frac{2x_0}{\left(x_0-x_1\right)^3}$

代入得

\begin{aligned} \alpha_0(x)& =\textcolor{blue}{(x-x_1)^2(ax+b)} \\ &=(x-x_1)^2\left(-\frac{2x}{\left(x_0-x_1\right)^3}+\frac1{\left(x_0-x_1\right)^2}+\frac{2x_0}{\left(x_0-x_1\right)^3}\right) \\ &=\frac{(x-x_1)^2}{\left(x_0-x_1\right)^2}\quad\left(1+\frac{2x_0}{x_0-x_1}-\frac{2x}{x_0-x_1}\right) \\ &=\left(1+2\frac{x-x_0}{x_1-x_0}\right)\left(\frac{x-x_1}{x_0-x_1}\right)^2=\color{blue} (1+2l_1(x))\cdot l_0^2(x)\\ \text{即}&\quad\alpha_0(x)=(1+2l_1(x))\cdot l_0^2(x)~=\left(1+2\frac{x-x_0}{x_1-x_0}\right)\!\left(\frac{x-x_1}{x_0-x_1}\right)^2 \end{aligned}

类似可得

\begin{aligned}\\\alpha_1(x)&=(1+2l_0(x))\cdot l_1^2(x)=\left(1+2\frac{x-x_1}{x_0-x_1}\right)\left(\frac{x-x_0}{x_1-x_0}\right)^2\\\beta_0(x)&=(x-x_0)\cdot l_0^2(x)~=\left(x-x_0\right)\left(\frac{x-x_1}{x_0-x_1}\right)^2\\\beta_1(x)&=(x-x_1)\cdot l_1^2(x)~=\left(x-x_1\right)\left(\frac{x-x_0}{x_1-x_0}\right)^2\end{aligned}

代入 $\color{blue}H_3(x) = y_0α_0(x) + y_1\alpha_1(x)+y_0'\beta_0(x)+y'\beta_1(x)$ 得

\begin{aligned} \textcolor{blue}{H_{3}}(& x)=y_{0}\alpha_{0}(x)+y_{1}\alpha_{1}(x)+y_{0}^{\prime}\beta_{0}(x)+y_{1}^{\prime}\beta_{1}(x) \\ &=y_0(1+2l_1(x))\cdot l_0^2(x)+y_1(1+2l_0(x))\cdot l_1^2(x) \\ &\qquad+y_0^{\prime}(x-x_0)\cdot l_0^2(x)^2+y_1^{\prime}(x-x_1)\cdot l_1^2(x) \\ &=y_0\Bigg(1+2\frac{x-x_0}{x_1-x_0}\Bigg)\Bigg(\frac{x-x_1}{x_0-x_1}\Bigg)^2+y_1\Bigg(1+2\frac{x-x_1}{x_0-x_1}\Bigg)\Bigg(\frac{x-x_0}{x_1-x_0}\Bigg)^2 \\ &\qquad+y_0^{\prime}(x-x_0)\left(\frac{x-x_1}{x_0-x_1}\right)^2+y_1^{\prime}(x-x_1){\left(\frac{x-x_0}{x_1-x_0}\right)}^2 \end{aligned}

两点三次Hermite插值的余项

两点三次Hermite插值的误差为 $R_3(x) = f(x)-H_3(x)$

有$$\begin{cases} R_3(X_i) =f(x_i)-H_3(x_i)=0 \ R_3^{\prime}(X_i) =f^{{\prime}(x_i)-H}{\prime}_3(x_i)=0 \end{cases} \qquad i=0,1$$

所以 $x_0, x_1$ 均为 $R_3(x)$ 的二重零点, 可设 $R_3(x) = K(x)(x-x_0)^2(x-x_1)^2, K(x)待定$

设辅助函数 $\varphi(t)=f(t)-H_3(t)-K(x)(t-x_0)^2(t-x_1)^2$

则有

\begin{cases} \varphi(x_i) \begin{aligned}&=f(x_i)-H_3(x_i)-K(x)(x_i-x_0)^2(x_i-x_1)^2=0\end{aligned} &i=0,1\\ \varphi(x) =f(x)-H_3(x)-K(x)(x-x_0)^2(x-x_1)^2=0 \end{cases}

至少有5个零点 ( $\varphi(x_0), \varphi(x_1)四个, \varphi(x)至少一个$ )

用4次Rolle定理, 即可得, $至少存在一点\xi \in[x_0, x_1], 使得\varphi^{(4)}(x)=0$ , 即 $\varphi^{(4)}(\xi) = f^{(4)}(\xi)-4!K(x) = 0 \quad(H_3(x)三次,导没了)$

所以,两点三次Hermite插值的余项为

R_3(x) = \frac{f^{(4)}(\xi)}{4!}(x-x_0)^2(x-x_1)^2 \quad其中\xi \in[x_0, x_1]

高次Hermite插值

作为多项式插值,三次已是较高的次数，次数再高就有可能发生Runge现象

因此，对有n+1节点的插值问题，我们可以使用分段两点三次Hermite插值

三点+一导数插值

将导数的值算作两个点相近的一阶差商, 使用牛顿插值计算

例：求一个次数不高于3的多项式 $P_3(x)$ ，使其满足 $P_3(0)=0,P_3(1)=1,P'_3(1)=3,P_3(2)=1$ 。

P_3(x)=f(0)+f[0,1](x-0)+f[0,1,1](x-0)(x-1)+f[0,1,1,2](x-0)(x-1)(x-1)\\ P_3(x)=0+(x-0)+2(x-0)(x-1)-\frac52(x-0)(x-1)(x-1)=-\frac52x^3+7x^2-\frac72x

这里相当于设置了四个点0, 1, 1, 2, 其中一阶差商f[0,1], f[1,2]正常计算

对f[1, 1]

观察差商定义 $f[x_0,x_i]=\frac{f(x_1)-f(x_0)}{x_1-x_0}$ 和导数定义 $f'(x_0)=lim_{h→0}\frac {f(x_0+h)−f(x_0)}{h}$
可以发现 $f[x_0, x_0]=f'(x_0)$

2.5 分段低次插值

Runge现象

$\textbf{在}[-5,5]\textbf{上考察}f(x)=\frac1{1+x^2}\textbf{ 的}L_n(x)\text{。取 }x_i=-5+\frac{10}ni\quad(i=0,...,n)$

n越大，端点附近抖动越大，称为Runge现象 ( $L_n(x) \not\rightarrow f (x)$ )

分段线性插值

在每个区间 $[x_i, x_{i+1}]$ 上，用1阶多项式 (直线) 逼近 f (x):

f(x)\approx P_1(x)=\frac{x-x_{i+1}}{x_i-x_{i+1}}y_i+\frac{x-x_i}{x_{i+1}-x_i}y_{i+1} \quad (for\ each x\in [x_i, x_{x+1}])

当取区间( $max|x_{i+1}-x_i|$ )小时, 逼近f(x)
但是失去了光滑性

分段Hermite插值

$给定x_0, . . . , x_n; y_0, . . . , y_n; y_0^{\prime }, . . . , y_n^{\prime }$ 在 $[ x_i, x_{i+ 1}] { 上利用两点的 }y{及 }y$ ’构造3次Hermite函数

导数一般不易得到。

第三章不需要了

第4章数值积分

概论
求积节点求积系数概念
待定系数的确定
求积公式余项证明p102公式梯形公式余项
Newton-Cotes公式
一阶二阶
稳定性为什么不用这个公式
偶阶xxx
复合求积公式
复合梯形, 辛普森及其余项
p108 例题
龙贝格求积公式
龙贝格算法 (注意什么时候停止计算
p113 例6
4.5
自适应skip
高斯: 知道概念
高斯 lelangde公式

4.1 数值积分概论

4.1.1 数值积分基本思想

对于积分 $I(f)=\int_a^bf(x)dx$

如果知道 $f(x)$ 的原函数 $F(x)$ , 则由牛顿-莱布尼茨公式有

\int_a^bf(x)dx = F(x)|_a^b = F(b)-F(a)

但是在工程和科研中, 常出现以下问题

$f(x)$ 的解析式不存在, 只给出了 $f(x)$ 的数值
$f(x)$ 的原函数 $F(x)$ 求不出来, 如 $F(x)$ 不是初等函数
$f(x)$ 表达式复杂, $F(x)$ 很难求出

简单的积分近似计算方式:

梯形公式: T=\frac{b-a}2[f(b)+f(a)]\\ 中矩形公式: R=(b-a)f(\frac{b+a}2)\\ 机械求积: \textcolor{blue}{\int_a^bf(x)dx\approx \sum_{k=0}^nA_kf(x_k)}, 其中x_k称为求积节点, A_k称为求积系数

求积节点一般是给定的, 我们的目标就是确定求积系数 $A_k$

4.1.2 插值多项式计算积分

积分的近似计算方法很多,但为方便起见,最常用的一种方法是利用插值多项式来构造数值求积公式,具体步骤如下:

在积分区间 $[a, b]$ 上取n+1个插值节点 $a\leq x_0< x_1...< x_n\leq b$

$f(x)$ 的n次插值多项式: $L_n(x) = \sum_{k=0}^nf(x_k)l_k(x), l_k(x)为插值基函数$

用 $L_n(x)$ 作为 $f(x)$ 的近似, 此时积分的计算为

\begin{gathered} \int_a^bf(x)dx \approx\int_a^bL_n(x)dx=\int_a^b\sum_{k=0}^nf(x_k)l_k(x)dx \\ =\sum_{k=0}^nf(x_k)\int_a^bl_k(x)dx \end{gathered}

设求积系数 $A_k=\int_a^bl_k(x)dx$ 则 $f(x)$ 的积分 $I(f)=\int_a^bf(x)dx\approx\sum_{k=0}^nA_kf(x_k)=I_n(f)$

4.1.3 代数精度

定义若求积公式 $\int_a^bf(x)dx\approx\sum_{k=0}^nA_kf(x_k)$

对任意次数不超过 $m$ 次的代数多项式 $P_i( x) ( i\leq m)$ 都准确成立，即 $\int_a^bP_i(x)dx=\sum_{k=0}^nA_kP_i(x_k)\quad i=0,1,\cdots,m$
但对 $m+1$ 次多项式却不能准确成立，即只要 $\int_a^bx^{m+1}dx\neq\sum_{k=0}^nA_kx_k^{m+1}$
则称该求积公式具有m次的代数精度

例: 求梯形公式的代数精度

例：对于 $[a,b]$ 上1次插值，有 $L_1(x)=\frac{x-b}{a-b}f(a)+\frac{x-a}{b-a}f(b)$ $\Longrightarrow A_1=A_2=\frac{b-a}2\quad\Longrightarrow\int_a^bf(x)dx\approx\frac{b-a}2[f(a)+f(b)]$ 考察其代数精度。

解：逐次检查公式是否精确成立

代入0次的代数多项式 $P_0=1:\int_a^b1dx=b-a=\frac{b-a}2[1+1]$

代入1次 $P_1=x:\int_a^bxdx=\frac{b^2-a^2}2=\frac{b-a}2[a+b]$

代入2次 $P_{2}= x^{2}: \int _{a}^{b}x^{2}dx= \frac {b^{3}- a^{3}}3\neq \frac {b- a}2[ a^{2}+ b^{2}]$

4.2 Newton-Cotes数值求积分

4.2.1 NewTon-Cotes公式

牛顿–柯特斯公式

Newton-Cotes公式是指等距节点下使用Lagrange插值多项式建立的数值求积公式

设函数 $f(x)\in C[a,b]$ , ( $C[a,b]: 在[a,b]上连续的函数集合$ )

将积分区间 $[a,b]$ 分割成n等分, 各个节点为 $x_k = a + kh, h = \frac{b-a}{n}$

使用Lagrange插值得: $L_n(x)=\sum_{k=0}^nf(x_k)l_k(x)\quad R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}\omega_{n+1}(x)\\$

其中 $l_k(x)=\prod_{\substack{0\leq j\leq n\\j\neq k}}\frac{x-x_j}{x_k-x_j}\quad\xi\in[a,b]\quad\omega_{n+1}(x)=\prod_{i=0}^n(x-x_i)$

此时积分准确值 $I = \int_a^bf(x)dx = \int_a^b[L(x)+R(x)]dx = \int_a^bf(x_k)l(x_k)dx + \int_a^bR(x)dx = \sum_{k=0}^n A_kf(x_k)+\int_a^bR(x)dx\\$

其中 $A_k=\int_a^bl_k(x)dx=\int_a^b\prod_{0\leq j\leq n \and j\neq k}\frac{x-x_j}{x_k-x_j}dx\\$

令 $I_n(f)=\sum_{k=0}^nA_kf(x_k)\\R(I_n)=\int_a^bR_n(x)dx$ 得, $I(f) = I_n(f)+R(I_n), I(f)\approx I_n(f)$

n阶Newton-Cotes求积公式: $I_n(f)=\sum_{k=0}^nA_kf(x_k)$
Newton-Cotes公式的余项: $R(I_n)=\int_a^bR_n(x)dx \quad 其中, R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}\omega_{n+1}(x)\\$

A_k的计算与Cotes系数

$A_k=\int_a^bl_k(x)dx=\int_a^b\prod_{0\leq j\leq n \and j\neq k}\frac{x-x_j}{x_k-x_j}dx\\$

\begin{aligned} &设x=a+th, 由x\in[a, b], 得t\in[0, n]\\ A_{k} &=\int_a^b\prod_{\substack{0\leq j\leq n\\j\neq k}}\frac{x-x_j}{x_k-x_j}dx=\int_0^n\Bigg(\prod_{\substack{0\leq j\leq n\\j\neq k}}\frac{(t-j)h}{(k-j)h}\Bigg)\cdot h\cdot dt\\ & =\frac{h\cdot(-1)^{n-k}}{k!\cdot(n-k)!}\int_0^n\prod_{\begin{matrix}0\leq j\leq n\\j\neq k\end{matrix}}(t-j)dt\\ & =(b-a)\cdot\frac{(-1)^{n-k}}{n\cdot k!\cdot(n-k)!}\int_0^n\prod_{0\leq j\leq n}(t-j)dt\\ \end{aligned}

$A_k=\begin{pmatrix}b-a\end{pmatrix}\cdot C_k^{(n)}$

$\therefore I_n(f)=\sum_{k=0}^nA_kf(x_k)=\begin{pmatrix}b-a\end{pmatrix}\cdot \sum_{k=0}^nC_k^{(n)}f(x_k)\\$

$C_k^{(n)}$ 称为Cotes系数
Cotes 系数仅取决于 n和k，可查表得到。与 f (x) 及区间[a, b]均无关。

4.2.2 低阶Newton-Cotes公式及其余项

在Newton-Cotes公式中,n=1,2,4时的公式是最常用也最重要三个公式,称为低阶公式

梯形公式

梯形求积公式

\begin{aligned} &n=1,x_0=a,x_1=b,h=b-a\\ &\text{Cotes系数为} \begin{cases}C_0^{(1)}=-\int_0^1(t-1)dt=\frac12\\ C_1^{(1)}=\int_0^1tdt=\frac12\end{cases} \\&I_1(f)=(b-a)\sum_{k=0}^1C_k^{(1)}f(x_k)=\frac{b-a}2[f(x_0)+f(x_1)] \\ &\text{即 }I_1(f)=\frac{b-a}2[f(a)+f(b)]\end{aligned}

梯形求积公式(两点公式): $T=I_1(f)=\frac{(b-a)}2[f(a)+f(b)]\\$

梯形公式余项

$R_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}\omega_{n+1}(x)$

$R(T)=R(I_1)=\int_a^bR_1(x)dx$

$\begin{aligned} R(T)& =\int_a^b\frac{f''(\xi_x)}{2}(x-a)(x-b)dx \\ &=\frac{f^{\prime\prime}(\eta)}2\int_a^b(x-a)(x-b)dx \\ &=-\frac{f^{\prime\prime}(\eta)}2\frac{(b-a)^3}6 \\ &=-\frac{(b-a)^3}{12}f^{\prime\prime}(\eta) \end{aligned}$

$\therefore\ \mid R(T)\mid\leq\frac{(b-a)^3}{12}M_2\quad M_2=\max_{x\in[a,b]}\mid f^{\prime\prime}(x)\mid$

梯形(trapezia)公式具有1次代数精度

Simpson公式

\begin{aligned} &\text{取}n=2,\text{则}x_0=a,x_1=\frac{b+a}2,x_2=b,h=\frac{b-a}2& \\ &\text{Cotes系数为}\quad \begin{cases}C_0^{(2)}=\frac{1}{4}\int_0^2(t-1)(t-2)dt=\frac{1}{6}\\ C_1^{(2)}=\frac{-1}{2}\int_0^2t(t-2)dt=\frac{4}{6} \\ C_2^{(2)}=\frac{1}{4}\int_0^2(t-1)tdt=\frac{1}{6} \end{cases}\\ &\text{求积公式为} \quad I_2=(b-a)\sum_{k=0}^2C_k^{(2)}f(x_k)\\ \end{aligned}

Simpson求积公式(三点公式, 抛物线公式): $\begin{aligned}S=I_2(f)&=[b-a](\frac16f(x_0)+\frac46f(x_1)+\frac16f(x_2))\\&=\frac{b-a}6[f(a)+4f(\frac{a+b}2)+f(b)]\end{aligned}$

Simpson公式的余项: $R(S)=R(I_2)=\int_a^bR_2(x)dx =-\frac{b-a}{180}\Big(\frac{b-a}{2}\Big)^4f^{(4)}(\eta)\\$

Simpson公式具有3次代数精度

	公式	余项 $R[f]$	步长h	余项 $R[f]$ (用h表示)	代数精度
n=1(梯形公式)	$\frac{(b-a)}2[f(a)+f(b)]\\$	$-\frac{(b-a)^3}{12}f^{\prime\prime}(\xi)\\$	$b-a$	$-\frac{(b-a)^3}{12}f^{\prime\prime}(\xi), \xi\in[a,b]\\$	1
n=2(Simpson公式)	$\frac{b-a}6[f(a)+4f(\frac{a+b}2)+f(b)]\\$	$-\frac{b-a}{180}(\frac{b-a}2)^4f^{(4)}(\xi)\\$	$\frac{b-a}2\\$	$-\frac1{90}h^5f^{(4)}(\xi), \xi\in[a,b]\\$	3
n = 3: Simpson’s 3/8-Rule			$\frac{b-a}3\\$	$-\frac3{80}h^5f^{(5)}(\xi)\\$	3
n = 4: Cotes Rule		$-\frac{2(b-a)}{945}(\frac{b-a}4)^6f^{(6)}(\eta)\\$	$\frac{b-a}4\\$	$-\frac8{945}h^7f^{(6)}(\xi)\\$	5

定理：当n为偶数时，Newton-Cotes公式至少具有n+1次代数精度

证明：当n为偶数时， Newton-Cotes公式对 $x^{n+1}$ 的余项为0

\begin{aligned} &\begin{cases} R_n(x)=f(x)-P_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)\cdots(x-x_n)=\prod_{j=0}^n(x-x_j) \\\\ R(I_n)=\int_a^bR_n(x)dx=\int_a^b\prod_{j=0}^n(x-x_j)dx\\ \end{cases} \\ &令x=a+th\quad \int_a^bR_n(x)dx=\int_0^nh\prod_{j=0}^n(a+th-a-jh)dt=h^{n+2}\int_0^n\prod_{j=0}^n(t-j)dt \\ &\text{令}t=\mu+\frac n2 \quad\int_0^n\prod_{j=0}^n(t-j)dt=\int_{-\frac n2}^{\frac n2}\prod_{j=0}^n(\mu+\frac n2-j)d\mu=\int_{-\frac n2}^{\frac n2}\prod_{j=-\frac n2}^{\frac n2}(\mu-j)d\mu \\ &被积函数\prod_{j=-\frac n2}^{\frac n2}(\mu-j)是奇函数 \\ &令g(\mu)= \prod_{-\frac n2}^{\frac n2}(\mu-j)=(\mu+\frac n2)(\mu+\frac n2-1)\cdots\mu\cdots(\mu-\frac n2+1)(\mu-\frac n2) \\ &g(-\mu)= (-\mu+\frac{n}{2})(-\mu+\frac{n}{2}-1)\cdots(-\mu)\cdots(-\mu-\frac{n}{2}+1)(-\mu-\frac{n}{2}) \\ &g(-\mu)= \begin{pmatrix}-1\end{pmatrix}^{n+1}g(\mu)=-g(\mu) \\ &\therefore \int_{-\frac n2}^{\frac n2}\prod_{j=-\frac n2}^{\frac n2}(\mu-j)d\mu = 0\\ &\therefore R(I_n)=\int_a^bR_n(x)dx=\int_0^n\prod_{j=0}^n(t-j)dt = \int_{-\frac n2}^{\frac n2}\prod_{j=-\frac n2}^{\frac n2}(\mu-j)d\mu = 0 \end{aligned}

4.2.3 Newton-Cotes公式的稳定性

对Cotes系数: $C_k^{(n)}=\frac{(-1)^{n-k}}{n\cdot k!\cdot(n-k)!}\int_0^n\prod_{0\leq j\leq n}(t-j)dt\\$

值只和积分区间 $[a,b]$ 的阶段 $x_j$ 划分有关, 与函数无关

因此用Newton-Cotes公式计算积分的舍入误差主要由函数值 $f(x_k)$ 的计算引起

考虑 $f(x_k)$ 的舍入误差对公式的影响

记精确值为 $f(x_k)$ ,近似值为 $\tilde{f}(x_k)$ , 误差 $\varepsilon_k=f(x_k)-\tilde{f}(x_k)$

则积分精确值和近似值误差为: $I_n-\tilde{I}_n=(b-a)\sum_{k=0}^nC_k^{(n)}[f(x_k)-\tilde{f}(x_k)]\\$

\begin{aligned}&I_n-\bar{I}_n&&=(b-a)\sum_{k=0}^nC_k^{(n)}\varepsilon_k\\ &\left|I_n-\bar{I}_n\right|&&\leq(b-a)\sum_{k=0}^n\left|C_k^{(n)}\right| |\varepsilon_k|\\&&&\leq(b-a)\varepsilon\sum_{k=0}^n\left|C_k^{(n)}\right|\end{aligned}

$\text{性质}:\sum_{k=0}^nC_k^{(n)}=1$
$\varepsilon=\max\{|\varepsilon_k|\}$

$\text{若 }\forall k\leq n\text{,}C_k^{(n)}>0\text{,有}\left|I_n-\vec{I}_n\right|\leq(b-a)\varepsilon$

结论

Newton-Cotes公式的舍入误差只是函数值误差的**(b-a)倍**

即 $\forall k\leq n\text{ ,C}_k^{(n)}>0$ 时, Newton-Cotes公式是稳定的

稳定: 指误差是否会在计算过程中显著增长
实际上, 当n<8时, 公式都是稳定的

若 $C_k^{(n)}$ 有正有负，有 $(b-a)\varepsilon\sum_{k=0}^n\left|C_k^{(n)}\right|\geq(b-a)\varepsilon\sum_{k=0}^nC_k^{(n)}=(b-a)\varepsilon$

此时,公式的稳定性将无法保证

因此,在实际应用中一般不使用高阶Newton-Cotes公式, 而是采用低阶复合求积法

4.3 复合求积公式

当积分区间 $[a,b]$ 长度较大, 节点数n+1固定时, 使用Newton-Cotes的误差较大

考虑提高n, 过高次数的插值, 公式的舍入误差很难控制
Newton-Cotes公式在 $n\geq 8$ 时不稳定

为了提高公式的精度,又使算法简单易行,往往使用复合方法

将 $[a,b]$ 分为若干小区间, 在小区间内使用低阶Newton-Cotes, 最后累加

高次插值有Runge 现象，故采用分段低次插值 → 分段低次合成的 Newton-Cotes 复合求积公式。

4.3.1 复合梯形公式

分割: $h = \frac{b-a}{n}, x_k=a+hk(k=0,1,\cdots,n)$

在第k个区间( $[x_k,x_{k+1}]$ )上用梯形公式, 然后累加:

\int_{x_k}^{x_{k+1}}f(x)dx\approx\frac{x_{k+1}-x_k}2[f(x_k)+f(x_{k+1})],\quad k=0,...,n-1\quad \Longrightarrow \\\int_a^bf(x)dx\approx\sum_{k=0}^{n-1}\frac h2[f(x_k)+f(x_{k+1})]=\frac h2{\left[f(a)+2\sum_{k=1}^{n-1}f(x_k)+f(b)\right]}=\color{blue}{T_n}

\textcolor{blue}{T_n}=\frac h2[f(a)+2\sum_{k=1}^{n-1}f(x_k)+f(b)]

头, 末尾( $a = x_0, b = x_n$ )加1次, 其他节点被加两次

4.3.2 复合Simpson公式

复合Simpson公式: $h=\frac{b-a}n,x_k=a+kh\quad(k=0,...,n) \\ \int_{x_k}^{x_{k+1}}f(x)dx\approx\frac h6[f(x_k)+4f(x_{k+\frac12})+f(x_{k+1})]$

因为simpson最少需要三个插值点, 在 $x_k和x_{k+1}$ $x_{k} 和 x_{k + 1}$ 之间插入一个点 $x_{k+\frac12}$ $x_{k + \frac{1}{2}}$
- n=2→n=3, 并不会增加过多的误差~~神奇的分数下标~~
$x_k$被加两次→$2f(x_k)$, $x_{k+\frac{1}{2}}$不会重复加→$4f(x_{k+\frac12})$

得 $\int_a^bf(x)dx\approx\frac h6[f(a)+4\sum_{k=0}^{n-1}f(x_{k+\frac12})+2\sum_{k=1}^{n-1}f(x_k)+f(b)]=\color{blue}{S_n}\\$

例: 使用各种复合求积公式计算定积分 $I=\int_0^1\frac{\sin x}xdx\\$

为简单起见,依次使用8阶复合梯形公式、4阶复合Simpson公式和2阶复合Cotes公式

可得各节点的值如表

Trapz	Simpson	Cotes	$x_i$	$f(x_i)$
$x_0$	$x_0$	$x_0$	0	1
$x_1$	$x_{0+\frac{1}{2}}$	$x_{0+\frac{1}{4}}$	0.125	0.99739787
$x_2$	$x_1$	$x_{0+\frac{1}{2}}$	0.25	0.98961584
$x_3$	$x_{1+\frac{1}{2}}$	$x_{0+\frac{3}{4}}$	0.375	0.97672674
$x_4$	$x_2$	$x_1$	0.5	0.95885108
$x_5$	$x_{2+\frac{1}{2}}$	$x_{1+\frac{1}{4}}$	0.625	0.93615564
$x_6$	$x_3$	$x_{1+\frac{1}{2}}$	0.75	0.90885168
$x_7$	$x_{3+\frac{1}{2}}$	$x_{1+\frac{3}{4}}$	0.875	0.87719257
$x_8$	$x_4$	$x_2$	1	0.841470981

$\begin{aligned} &T_8=\frac{1}{16}[f(0)+2\sum_{k=1}^7f(x_k)+f(1)]=0.94569086 \\ &S_4=\frac{1}{24}[f(0)+4\sum_{k=0}^3f(x_{k+\frac12})+2\sum_{k=1}^3f(x_k)+f(1)]=0.94608331 \\ &C_{2}=\frac1{180}[7f(0)+\sum_{k=0}^1[32f(x_{k+\frac14})+12f(x_{k+\frac24})+32f(x_{k+\frac34})]+14\sum_{k=1}^1f(x_k)+7f(1)]=0.94608307 \end{aligned}$

$\begin{aligned} &T_8 = 0.94569086 \quad 精度最低\\&S_4=0.94608331 \quad 精度次高\\&C_2=0.94608307\quad 精度最高\\ &精确值I =0.946083070367183\end{aligned}$

但是误差和收敛速度还需要考虑

4.3.3 复合求积公式的余项和收敛的阶

余项

	求积公式	单纯求积公式的余项	复合求积公式的余项
$T_n$	$\frac h2[f(a)+2\sum_{k=1}^{n-1}f(x_k)+f(b)]\\$	$-\frac{(b-a)}{12}(b-a)^2f''(\eta)\\$	$-\frac{(b-a)}{12}(h)^2f''(\eta)\\$
$S_n$	$\frac h6[f(a)+4\sum_{k=0}^{n-1}f(x_{k+\frac12})+2\sum_{k=1}^{n-1}f(x_k)+f(b)]\\$	$-\frac{b-a}{180}(\frac{b-a}2)^4f^{(4)}(\eta)\\$	$-\frac{b-a}{180}(\frac{h}2)^4f^{(4)}(\eta)\\$
$C_2$		$-\frac{2(b-a)}{945}(\frac{b-a}4)^6f^{(6)}(\eta)\\$	$-\frac{2(b-a)}{945}(\frac{h}4)^6f^{(6)}(\eta)\\$

复合求积公式的误差就是将小区间(长度为步长h)的误差逐个累加

收敛阶

定义: 若一个积分公式的误差满足 $\lim_{h\to0}\frac{R[f]}{h^p}=C<\infty, 且C\neq 0\\$ 则称该公式是 $p$ 阶收敛的。

$T_n\thicksim O\left(h^2\right),S_n\thicksim O\left(h^4\right),C_n\thicksim O\left(h^6\right)$

例: 计算 $π = \int_0^1\frac{4}{1+x^2}dx\\$

例2: 给定精度 $\varepsilon$ , 如何取n ( 要求 $|I-T_n|< \varepsilon$ , 如何判断n=?)

$|R[f]| = |-\frac{h^2}{12}(b-a)f''(\xi)|\leq |-\frac{h^2}{12}(b-a)|M_2$

上例中若要求 $|I-T_n|<4\times10^{-6},\text{则}|R_n[f]|\leq\left|-\frac{h^2}{12}(b-a)\right|M_2=\frac{2h^2}3<4\times10^{-6}$

$\Longrightarrow h< 0. 00244949$ 即：取 $n=409$ 通常采取将区间不断对分的方法，即取 $n=2^k$

上例中 $2^k\geq 409\Rightarrow k= 9\textbf{ 时 , }T_{512}= 3. 14159202$

4.4 龙贝格求积公式

复合梯形公式: $\textcolor{blue}{T_n}=\frac {b-a}{2n}[f(a)+2\sum_{k=1}^{n-1}f(x_k)+f(b)]\\$

在复合梯形公式的基础上, 将[a, b]分隔成2n等份, 且 $h = \frac{(b-a)}{n}$ 不变

即多出来下标为 $k+\frac12, k=0,1,...,n-1$ 的点

\begin{aligned} T_{2n} &= \frac{(b-a)}{4n}[f(a)+2\sum_{k=1}^{n-1}f(x_k)+2\sum_{k=0}^{n-1}f(x_{k+\frac12})+f(b)]\\ &= \frac{h}{4}[f(a)+2\sum_{k=1}^{n-1}f(x_k)+f(b)]+\frac{h}{2}\sum_{k=0}^{n-1}f(x_{k+\frac12})\\ &= \textcolor{blue}{\frac{1}{2}T_n + \frac{h}{2}\sum_{k=0}^{n-1}f(x_{k+\frac12})}\\ &= \frac{1}{2}T_n + \frac{b-a}{2n}\sum_{k=0}^{n-1}f(a+(k+\frac12)h) \end{aligned}

在已经计算出 $T_n$ 基础上, 如果精度不够, 就可以加n个点递归计算, 提高精度

新步长 $h_k$

\begin{aligned} &记h_k = \frac{(b-a)}{2^k}, n=2^{k-1}\\ & 当节点数n=1时, h_0=b-a, n=2时, h_1=\frac{b-a}2\\ & T_1 = \frac{b-a}2[f(a)+f(b)] \quad(基本的梯形公式)\\ & T_2=\frac{1}{2}T_1+\frac{b-a}{2}f(a+\frac{1}{2}h)=T_0(1)=\frac{1}{2}T_0(0)+h_1f(a+h_1)\\ & 当n=2^k时, 记T_n=T_{2^k}=T_0(k) \quad {k=0,1,2,\dots} \end{aligned}

递推公式

\begin{aligned}T_0(0)&=\frac{b-a}2[f(a)+f(b)]\\T_0(k)&=\frac12T_0(k-1)+h_k\sum_{j=0}^{2^{k-1}-1}f(a+(2j+1)h_k)\quad k=1,2,\cdots\end{aligned}

上式称为递推的梯形公式

外推加速公式

复合梯形公式余项: $R_T=-\frac{(b-a)}{12}(h)^2f''(\eta)\\$

\begin{aligned} &由余项得\frac{R_{T2n}}{R_{Tn}} =\frac{I-T_{2n}}{I-T_n}\approx \frac14, 展开得I\approx \frac43T_{2n}-\frac13T_n\\\\ I&\approx \frac43T_{2n}-\frac13T_n\\ &=\frac46T_n+\frac23\sum f(x_{k+\frac12})-\frac13T_n\\ &=\frac13T_n + \frac23h\sum f(x_{k+\frac12})\\ &=\frac13 \frac{h}2[f(a)+2\sum f(x_k)+f(b)] + \frac23h\sum f(x_{k+\frac12})\\ &=\textcolor{red}{\frac h6[f(x_k)+4f(x_{k+\frac12})+f(x_{k+1})]=S_n} 即复合Simpson公式\\ \end{aligned}

可知, $S_n$ 的精度>

龙贝格公式(算法)

用上前面的新步长: $n=2^{k-1}, T_n=T_0(k-1), T_{2n}=T_0(k), I\approx \frac43T_0(k)-\frac13T_0(k-1)=S_{n}$

既然有 $T_0(k)$ , 那么肯定有 $T_1(k)$

$T_1(k-1)=\frac43T_0(k)-\frac13T_0(k-1)=S_n=S_{2^{k-1}}\\$

同理, 对Simpson公式 $S_n=S_{2^{k-1}}=T_1(k-1);\\S_{2n}=S_{2^{k}}=T_1(k)$

…

加速公式总结为: $T_m(k-1)=\frac1{4^m-1}[4^mT_{m-1}(k)-T_{m-1}(k-1)]\\$

Romberg算法的代数精度为m的两倍
Romberg算法的收敛阶高达m+1的两倍

4.5 高斯求积

只讲概念: 什么是高斯求积公式, 什么是高斯求积公式的的节点

构造具有2 $n+1$ 次代数精度的求积公式

\int_a^b\rho(x)f(x)dx\approx\sum_{k=0}^nA_kf(x_k)

将节点 $x_0 … x_n$ 以及系数 $A_0 … A_n$ 都作为待定系数。令 $f (x) = 1, x, x^2, …, x^{2n+1}$ 代入可求解，得到的公式具有2n+1 次代数精度。这样的节点称为Gauss点，公式称为Gauss 型求积公式。

高斯-勒让德求积公式

Legendre 多项式族 : 定义在 [ - 1, 1] 上 , $\rho ( x) \equiv 1$ $P_k(x)=\frac1{2^kk!}\frac{d^k}{dx^k}(x^2-1)^k\\$ 满足： $(P_k,P_l)=\begin{cases}0&k\neq l\\\frac2{2k+1}&k=l&\end{cases}$

由 $P_0= 1, P_1= x$ 有递推 $( k+ 1) P_{k+ 1}= ( 2k+ 1) xP_k- kP_{k- 1}$

以 $P_n+ 1$ 的根为节点的求积公式称为高斯-勒让德公式

第5章解线性方程组的直接方法

5.1
5.1.2 skip
5.2
note: 5.2是分解法的推导过程, 5.3是公式(但是公式背不了一点)
高斯消去法
矩阵三角分解(LU分解) (推导过程)
列主元消去
5.3
矩阵三角分解的公式
做题用算法/公式无所谓
p153/3.2 3.3 公式不一定要背会做就行
skip: 选主元三角分解法; 平方根分解法; 追赶法;
5.4
矩阵范数–各种算子范数计算
定理19 核半径
5.5
什么是病态良态, 计算
条件数, 计算
end

5.2 高斯消去法

5.2.1 消元与回代计算

对于线性方程组 $\begin{cases}a_{11}x_1+a_{12}x_2+...+a_{1m}x_m = b_1\\...\\a_{n1}x_1+a_{n2}x_2+...+a_{nm}x_m = b_n \end{cases}$ 表示为 $Ax=b, A=\matrix{a_{11} &a_{12}&...&a_{1m}\\a_{21}&a_{22}&...&a_{2m}\\...\\a_{n1}&a_{n_2}&...&a_{nm}}$

若 $detA \neq 0$ (行列式)对其增广矩阵施行行初等变换

\overline{A}=(A,b)\stackrel{\text{记}}{=}(A^{(1)},b^{(1)})=\begin{pmatrix}a_{11}^{(1)}&a_{12}^{(1)}&\cdots&a_{1n}^{(1)}&b_1^{(1)}\\a_{21}^{(1)}&a_{22}^{(1)}&\cdots&a_{2n}^{(1)}&b_2^{(1)}\\\vdots&\vdots&&\vdots&\vdots\\a_{n1}^{(1)}&a_{n2}^{(1)}&\cdots&a_{nn}^{(1)}&b_n^{(1)}\end{pmatrix}

经过n-1步消除列元素得

(A^{(1)},b^{(1)})\longrightarrow(A^{(n)},b^{(n)})=\begin{pmatrix}a_{11}^{(1)}&a_{12}^{(1)}&\cdots&a_{1n}^{(1)}&b_{1}^{(1)}\\&a_{22}^{(2)}&\cdots&a_{2n}^{(2)}&b_{2}^{(2)}\\&&\ddots&\vdots&\vdots\\&&&a_{nn}^{(n)}&b_{n}^{(n)}\end{pmatrix}

可知 $a_{ii}^{( i) }\neq 0$ $i= 1, 2, \cdots , n$

因此，上三角形方程组 $A^{(n)}x=b^{(n)}$ 有唯一解

因此可得线性方程组 $Ax=b$ 的解：

\begin{cases}x_n=\frac{b_n}{a_{nn}^{(n)}}\\x_i=\frac{b_i^{(i)}-\sum_{j=i+1}^na_{ij}^{(i)}x_j}{a_{ii}^{(i)}},i=n-1,n-2,\cdots,2,1 \end{cases}

定理: 若A的所有顺序主子式均不为0，则高斯消元无需换行即可进行到底，得到唯一解。

增广矩阵通常用于判断矩阵的有解的情况，比如说秩（A)<秩（A|B) 方程无解；秩（A)=秩（A|B) =n方程有唯一解；秩（A)=秩（A|B) <n方程有无穷多解；秩（A)>秩（A|B)不可能。

5.2.2 矩阵的三角分解

Doolittle分解法和Crout分解法

LU分解法 : 用矩阵描述高斯消去法的过程

矩阵A的LU分解法定义: 不带行交换的Gauss 消去法的消元过程,产生一个单位下三角矩阵L和一个上三角矩阵U,即

A = LU\\ \begin{gathered}L=\begin{pmatrix}1\\m_{21}&1\\m_{31}&m_{32}&1\\\vdots&\vdots&\vdots&\ddots\\m_{n-1,1}&m_{n-1,2}&m_{n-1,2}&\cdots&1\\m_{n,1}&m_{n,2}&m_{n,3}&\cdots&m_{n,n-1}&1\end{pmatrix}\\U=A^{(n)}=\begin{pmatrix}a_{11}^{(1)}&a_{12}^{(1)}&\cdots&a_{1n}^{(1)}\\&a_{22}^{(2)}&\cdots&a_{2n}^{(2)}\\&&\ddots&\vdots\\&&&a_{nn}^{(n)}\end{pmatrix}\end{gathered}

其中U的第一行 $a_{1i}^{(1)}$ 等于矩阵A的第一行
L的第一列 $m_{i1}=\frac{a_{i1}}{a^{(1)}_{11}}\\$
其他元素通过矩阵乘法 (解方程)计算出来

定理: 若A的所有顺序主子式均不为0，则 A 的 LU 分解唯一（其中 L 为单位下三角阵）。

对于杜立特分解: 固定i: $j = i, i+1, ...,n$ 有 $a_{ij}=\sum_{k=1}^{i-1}l_{ik}u_{kj}+u_{ij}, (l_{ij}=1)$

得 $u_{ij} =a_{ij}- \sum_{k=1}^{i-1}l_{ik}u_{kj}$

5.2.3 列主元消去法

在使用高斯消去法时, 每次确定行时, 加上交换行的操作

换行: 选择绝对值最大的列元素,换到上面

5.3 矩阵三角分解法

5.3.1 直接分解法

直接法是将原方程组化为一个或若干个三角形方程组的方法，共有若干种

\begin{aligned} A=&\begin{pmatrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&\vdots&\vdots\\a_{n1}&a_{n2}&\cdots&a_{nn}\end{pmatrix} & x=\begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix}\quad & b=\begin{pmatrix}b_1\\b_2\\\vdots\\b_n\end{pmatrix}\\ &\quad\quad\quad\text{系数矩阵}&\ \ \text{未知量向量}\quad&\text{常数项} \end{aligned}

直接三角分解法

$A=LU \Rightarrow LUx=b \Rightarrow \begin{cases}Ly=b\\Ux=y\end{cases}$

杜立特分解法

A = LU\\ \begin{gathered}L=\begin{pmatrix}1\\m_{21}&1\\m_{31}&m_{32}&1\\\vdots&\vdots&\vdots&\ddots\\m_{n-1,1}&m_{n-1,2}&m_{n-1,2}&\cdots&1\\m_{n,1}&m_{n,2}&m_{n,3}&\cdots&m_{n,n-1}&1\end{pmatrix}\\U=A^{(n)}=\begin{pmatrix}a_{11}^{(1)}&a_{12}^{(1)}&\cdots&a_{1n}^{(1)}\\&a_{22}^{(2)}&\cdots&a_{2n}^{(2)}\\&&\ddots&\vdots\\&&&a_{nn}^{(n)}\end{pmatrix}\end{gathered}

其中U的第一行 $a_{1i}^{(1)}$ 等于矩阵A的第一行
L的第一列 $m_{i1}=\frac{a_{i1}}{a^{(1)}_{11}}\\$
其他元素通过矩阵乘法 (解方程)计算出来

5.4 向量和矩阵范数

5.4.1 向量和矩阵的范数

向量范数

定义1 对于 $n$ 维向量空间 $R^n$ 中任意一个向量 $x$ , 若存在唯一一个实数 $\|x\|\in R$ 与 $x$ 对应，且满足

(正定性) $\|x\|\geq0$ ,且 $\forall x\in R^n,\|x\|=0\Leftrightarrow x=0;$
(齐次性) $\|\alpha x\| = | \alpha | \cdot \| x\|$ , $\forall x\in R^n, \alpha \in R;$
(三角不等式) $\|x+y\|\leq\|x\|+\|y\|,\forall x,y\in R^n.$
则称 $\|x\|$ 为向量 $x$ 的范数

在向量空间 $R^n(C^n)$ 中, $x = (x_1, x_2, ..., x_n)^T$ , 常用的向量x的范数

x的2-范数或欧氏范数: $\left\|x\right\|_2 =(\begin{array}{c}\left|x_1\right|^2+\left|x_2\right|^2+\cdots+\left|x_n\right|^2\end{array})^{1/2}$
x的1-范数: $\left\|x\right\|_{1}=\left|x_1\right|+\left|x_2\right|+\cdots+\left|x_n\right|$
x的∞范数(最大范数): $\left\|x\right\|_\infty =\max_{1\leq i\leq n}\left|x_i\right|\\$
x的p-范数: $||x||_p = (|x_1|^p+|x_2|^p+...|x_n|^p)^{1/p}$
- $\begin{gathered} \max_{1\leq i\leq n}\left|x_i\right| \leq\left(\left|x_1\right|^p+\left|x_2\right|^p+\cdots+\left|x_n\right|^p\right)^{1/p}\leq\left(n\max_{1\leq i\leq n}\left|x_i\right|^p\right)^{1/p} =n^{1/p}\max_{1\leq i\leq n}\left|x_i\right|\to\max_{1\leq i\leq n}\left|x_i\right|\left(p\to\infty\right) \end{gathered}$

定义向量序列 $\{\vec{x}^{(k)}\}$ 收敛于向量 $\vec{x}^*$ 是指对每一个 $1\leq i\leq n$ , 都有 $\lim_k\to\infty x_i^{(k)}=x_i^*$ 。

可以理解为 $\|\vec{x}^{(k)}-\vec{x}^*\|_\infty\to0$

矩阵范数

定义: $R^{m\times m}$ 空间的矩阵范数 $||\cdot||$ 对任意 $A, B\in R^{m\times m}$ 满足以下条件

正定性: $\|A\|\geq0;\quad\|A\|=0\Leftrightarrow A=0$
齐次性: $||alpha A||=|\alpha|\cdot||A||$
三角不等式 : $||A+B||\leq ||A||+||B||$
相容当 m = n 时, $|| AB || < || A || · || B ||$

算子范数:

\begin{aligned} &\textbf{由向量范数}\parallel\cdot\parallel_p\textbf{导出关于矩阵 }A\in R^{n\times n}\text{ 的 }p\text{ 范数:}\\&\parallel A\parallel_p=\max_{{\vec{x}}\neq0}\frac{\parallel A\vec{x}\parallel_p}{\parallel\vec{x}\parallel_p}=\max_{\parallel\tilde{x}\parallel_p=1}\parallel A\vec{x}\parallel_p\quad\text{则} \begin{cases} \parallel AB\parallel_p\leq\parallel A\parallel_p\parallel B\parallel_p\\ \parallel A\vec{x}\parallel_p\leq\parallel A\parallel_p\parallel\vec{x}\parallel_p \end{cases} \end{aligned}

特别有:

行和范数: $\parallel A\parallel_\infty=\max_{1\leq i\leq n}\sum_{j=1}^n\mid a_{ij}\mid\\$ (最大的行之和)
列和范数: $\parallel A\parallel_1=\max_{1\leq j\leq n}\sum_{i=1}^n\mid a_{ij}\mid\\$ (最大的列之和)
2-范数: $\parallel A\parallel_2=\sqrt{\lambda_{\max}(A^TA)}$ ( $A^TA$ 矩阵的最大特征值)

谱半径

定义矩阵A的谱半径记为 $\rho(A)=\max_{1\leq i\leq n}|\lambda_i|$ ,其中 $\lambda_i$ 为A的特征根

5.5 线性方程组的误差分析

$||A||\cdot ||A^{-1}||$ 是关键的误差放大因子, 称为A的条件数, 即为 $cond(A)$

越大, A越病态, 难以求得准确解

根据算子范数的不同, 条件数也不同

\begin{aligned} &cond(A)_1 =\left\|A\right\|_1\cdot\left\|A^{-1}\right\|_1 \\ &cond\left(A\right)_\infty =\left\|A\right\|_\infty\cdot\left\|A^{-1}\right\|_\infty \\ &cond\left(A\right)_2 =\left\|A\right\|_2\cdot\left\|A^{-1}\right\|_2=\sqrt{\lambda_{\max}\left(A^TA\right)}\sqrt{\frac{1}{\lambda_{\min}\left(A^TA\right)}} =\sqrt{\frac{\lambda_{\max}(A^TA)}{\lambda_{\min}(A^TA)}} \end{aligned}

条件数的性质

A可逆, 则 $cond(A)_p \geq 1$
A可逆, $a\in R$ ,则 $cond(\alpha A)=cond(A)$
A正交, 则 $cond(A)_2=1$
A可逆, R正交, 则 $cond(RA)_2=cond(AR)_2=cond(A)_2$

注：一般判断矩阵是否病态，并不计算 $A^{-1}$ ，而由经验得出。

行列式很大或很小（如某些行、列近似相关）；
元素间相差大数量级，且无规则；
主元消去过程中出现小主元；
特征值相差大数量级。

第6章解线性方程组的迭代法

6.1
什么是迭代发散
序列极限
一些定理结论不证明
6.2
雅可比高斯-塞德尔迭代
定理9(1) ; (2), 定理10不用
超松弛skip
end

6.1 引言

在用直接法解线性方程组时要对系数矩阵不断变换
如果方程组的阶数很高，则运算量将会很大, 并且大量占用计算机资源

因此对线性方程组 $Ax=b$ , 要求找寻更经济、适用的数值解法

设 $A\in R^{n\times n},b\in\mathbb{R}^n,x\in\mathbb{R}^n$

可以将线性方程组变换为 $x=Bx+f$ , 其中 $B\in R^n\times n,f\in R^n,x\in R^n$

B称为迭代矩阵, f为常数项
显然上面两式同解，我们称两个方程组等价

对第二个线性方程组，采用以下步骤：

取初始向量 $\vec x^{(0)}$ ,代入，可得 $x^{(1)}=B\vec x^{(0)}+f$

依此类推

\begin{gathered} \vec x^{(2)}=B\vec x^{(1)}+f \\ \begin{array}{c}\bullet\\\bullet\end{array} \\ \vec x^{(k+1)}=B\vec x^{(k)}+f \\ \begin{pmatrix}k=0,1,2,\cdots\end{pmatrix} \end{gathered}

这种方式就称为迭代法 ,以上过程称为迭代过程

迭代法产生一个序列 $\{\vec x^{(k)}\}_0^\infty$

如果其极限存在，即 $\lim_{k\to\infty}\vec x^{(k)}=\vec x^*$ , 则称迭代法收敛，否则称为发散

迭代法收敛的充分条件

设有线性方程组 $x=Bx+f$ 以及一阶定常迭代法 $x^{(k+1)}=Bx^{(k)}+f$

如果有迭代矩阵B的某种算子范数 $||B||=q<1$ , 则

迭代法收敛,即对任取 $x^{(0)}$ 均有 $\lim_{k\to\infty}\vec x^{(k)}=\vec x^*$ , 且 $x^{*}=B\vec x^{*}+f$
$||x^*-x^{(k)}||\leq q^k||x^*-x^{(0)}||$
$||x^*-x^{(k)}||\leq \frac{q}{1-q}||x^*-x^{(0)}||$
$||x^*-x^{(k)}||\leq \frac{q^k}{1-q}||x^{(1)}-x^{(0)}||$

6.2 雅可比迭代法与高斯-塞德尔迭代法

雅可比迭代法

设线性方程组的一般形式为

\begin{cases}a_{11}x_1+a_{12}x_2+\cdots+a_{1n}x_n=b_1\\a_{21}x_1+a_{22}x_2+\cdots+a_{2n}x_n=b_2\\\cdots\cdots\cdots\cdots\\a_{n1}x_1+a_{n2}x_2+\cdots+a_{nn}x_n=b_n\end{cases}

设 $a_{ii}\neq0\quad(i=1,2,\cdots,n),$ 则可从上式解出 $x_i$

如从第一行得: x_1=\frac1{a_{11}}[b_1-(a_{12}x_2+\cdots+a_{1n}x_n)]\\ x_2 = \frac1{a_{22}}[b_2-(a_{21}x_1+\cdots+a_{2n}x_n)]\\... \\ 此时原线性方程组化为: \\ \begin{cases}&x_1=\frac1{a_{11}}(b_1-\sum_{j=1}^na_{1j}x_j)=x_1+\frac1{a_{11}}(b_1-\sum_{j=1}^na_{1j}x_j)\\&x_2=\frac1{a_{22}}(b_2-\sum_{j=1}^na_{2j}x_j)=x_2+\frac1{a_{22}}(b_2-\sum_{j=1}^na_{2j}x_j)\\&\cdots\cdots\cdots\cdots\\&x_i=\frac1{a_{ii}}(b_i-\sum_{j=1}^na_{ij}x_j)=x_i+\frac1{a_{ii}}(b_i-\sum_{j=1}^na_{ij}x_j)\\&\cdots\cdots\cdots\cdots\\&x_n=\frac1{a_{nn}}(b_n-\sum_{j=1}^na_{nj}x_j)=x_n+\frac1{a_{nn}}(b_n-\sum_{j=1}^na_{nj}x_j)\end{cases}

令 $D = diag(a_{11}, a_{22}, ...,a_{nn})$ , 为方程组系数矩阵A的对角线

\begin{aligned}L=&\begin{pmatrix}0&0&\cdots&0\\-a_{21}&0&\cdots&0\\\vdots&\ddots&\ddots&\vdots\\-a_{n1}&-a_{n2}&\cdots&0\end{pmatrix}&A\text{的下三角部分的负矩阵} \\\\ U=&\begin{pmatrix}0&-a_{12}&\cdots&-a_{14}\\0&0&\cdots&-a_{24}\\\vdots&\ddots&\ddots&\vdots\\0&0&\cdots&0\end{pmatrix}&A\text{的上三角部分的负矩阵} \\\end{aligned}

A=D-L-U\\\begin{aligned} Ax=b&\Leftrightarrow(D-L-U)x = b \\ &\Leftrightarrow Dx=(L+U)x+b\\&\Leftrightarrow{x}=\underbrace{D^{-1}(L+U)}_{\boldsymbol{B_J}}{x}+\underbrace{D^{-1}\vec{b}}_{\vec{\boldsymbol{f}}}\end{aligned}

故迭代过程化为 $x^{(k+1)}=D^{-1}(L+U)x^{(k)}+D^{-1}b$ ,

令 $B_J=D^{-1}(L+U),f=D^{-1}b$ ,于是 $x^{(k+1)}=B_Jx^{(k)}+f\ (k=0,1,2,\cdots)$

等价线性方程组为 $x=B_Jx+f\longleftrightarrow Ax=b$ , 即

\vec{x}^{(k+1)}=B_J\vec{x}^{(k)}+D^{-1}\vec{b}, B_J = D^{-1}(L+U)

称上式为解线性方程组的Jacobi迭代法(J法), 矩阵 $B_J$ 为迭代法的迭代矩阵

Gauss-Seidel迭代法

雅可比迭代法中描述的 $\vec x^{(k)}, \vec x^{(k+1)}$ 都是向量, 每轮迭代时还要从 $\vec x^{(k)}=(x^{(k)}_1, x^{(k)}_2, ..., x^{(k)}_n)^T$ 的 $x^{(k)}_i$ 中逐个计算 $x^{(k+1)}_i$

我们知道 $x^{(k+1)}_i$ 的误差会比 $x^{(k)}_i$ 更小
在每轮迭代时, 对 $x^{(k+1)}_i$ , 它前面的 $x^{(k+1)}_j(j=1, 2, ...,i-1)$ 都计算出来了, 可以将它用上

\begin{aligned} &x_1^{(k+1)} =\frac1{a_{11}}(-a_{12}x_2^{(k)}-a_{13}x_3^{(k)}-a_{14}x_4^{(k)}-\cdots-a_{1n}x_n^{(k)}+b_1) \\ &x_2^{(k+1)}= \frac1{a_{22}}(\textcolor{red}{-a_{21}x_1^{(k+1)}}-a_{23}x_3^{(k)}-a_{24}x_4^{(k)}-\cdots-a_{2n}x_n^{(k)}+b_2) \\ &x_3^{(k+1)}=\frac1{a_{33}}(\textcolor{red}{-a_{31}x_1^{(k+1)}-a_{32}x_2^{(k+1)}}-a_{34}x_4^{(k)}-\cdots-a_{3n}x_n^{(k)}+b_3) \\ &\cdots\\ &x_n^{(k+1)} =\frac1{a_{nn}}(\textcolor{red}{-a_{n1}x_1^{(k+1)}-a_{n2}x_2^{(k+1)}-a_{n3}x_3^{(k+1)}-\cdots-a_{nn-1}x_{n-1}^{(k+1)}}+b_n) \end{aligned}

红色部分用了 $x^{(k+1)}_i$ 来更精确的进行计算

转换为矩阵形式

\begin{aligned} &\vec{x}^{(k+1)}=D^{-1}(L\vec{x}^{(k+1)}+U\vec{x}^{(k)})+D^{-1}\vec{b} \\ &\Leftrightarrow\quad(D-L)\vec{x}^{(k+1)}=U\vec{x}^{(k)}+\vec{b} \\ &\Leftrightarrow\vec{x}^{(k+1)}= \underbrace{{(D-L)^{-1}U}}_{B}\ \vec{x}^{(k)} +(\underbrace{D-L)^{-1}}_{\boldsymbol{\overline{f}}}\vec{b} \end{aligned}

B: Gauss-Seidel 迭代阵

Jacobi迭代法和Gauss-Seidel迭代法统称为简单迭代法

例题:

用Jacobi迭代法求解方程组,误差不超过1e-4

取初值 $x^{(0)} = [ 0 0 0] ^T$ ,使用Jacobi迭代法 $x^{(k+1)}=B_Jx^{(k)}+f\quad(k=0,1,2,\cdots n,\cdots)$

用Guass-Seidel迭代法, 选择相同初值 $x^{(0)} = [ 0 0 0] ^T$

通过迭代,至第7步得到满足精度的解x7

可以看出,Gauss-Seidel迭代法的收敛速度比Jacobi迭代法要高

迭代法的收敛性

设解线性方程组的迭代格式: $\vec{x}^{(k+1)}=B\vec{x}^{(k)}+f$ (第k次迭代)

而方程组精确解 $x^*$ , 有 $x^* = Bx^*+f$

两式相减得: $x^{(k+1)}-x^*=Bx^{(k)}-Bx^*=B\left(x^{(k)}-x^*\right)$

令 $\varepsilon = x^{(k)}-x^*, k=0,1,\cdots$ , 则 $\varepsilon^{(k+1)}=B\varepsilon^{(k)}=B^2\varepsilon^{(k-1)}=\cdots=B^{k+1}\varepsilon^{(0)}$

$\varepsilon^{(0)}=x^{(0)}-x^*$ $ε^{(0)} = x^{(0)} - x^{*}$ , 是一个非零常数向量, ( $x^{(0)}$ $x^{(0)}$ 是选取的初值)
- 当然, 如果 $\varepsilon^{(0)}=0$ , 说明恰好选到了精确值, 是特殊情况

因此迭代法收敛的充要条件为

\lim_{k\to\infty}\varepsilon^{(k+1)}=\lim_{k\to\infty}\left(x^{(k+1)}-x^{\star}\right)=0\\\text{可转变为}\lim_{k\to\infty}B^{k+1}=0

定理1: 迭代格式收敛的充要条件为 $\lim_{k\to\infty}B^{k}=0\\$

定理2: 迭代格式收敛的充要条件为谱半径 $\rho(B)<1$

根据矩阵与其Jordan标准形及特征值的关系,可知 $\lim_{k\to\infty}B^{k+1} \Leftrightarrow B的所有特征值的绝对值小于1$

又因为矩阵的谱半径不超过其任一种算子范数,即 $\rho(B)<||B||_v$ , 可得

定理 (充分条件) 若存在一个矩阵范数使得 $\parallel B\parallel=q<1$ , 则迭代收敛，且有下列误差估计：

①\varepsilon^{(k)} = \parallel\vec{x}^*-\vec{x}^{(k)}\parallel\leq\frac q{1-q}\parallel\vec{x}^{(k)}-\vec{x}^{(k-1)}\parallel\\ ②\parallel\vec{x}-\vec{x}^{(k)}\parallel\leq\frac{q^k}{1-q}\parallel\vec{x}^{(1)}-\vec{x}^{(0)}\parallel

证明:

$&\begin{aligned}①\vec{x}^*-\vec{x}^{(k)}&=B(\vec{x}^*-\vec{x}^{(k-1)})\\&=B(\vec{x}^*-\overline{x}^{(k)}+\vec{x}^{(k)}-\vec{x}^{(k-1)})\\\Rightarrow\parallel\vec{x}^*-\vec{x}^{(k)}\parallel&\leq q(\parallel\vec{x}^*-\vec{x}^{(k)}\parallel+\parallel\vec{x}^{(k)}-\vec{x}^{(k-1)}\parallel)\quad\checkmark\end{aligned}$
$\begin{aligned}& ②\vec{x}^{(k)}-\vec{x}^{(k-1)}=B(\vec{x}^{(k-1)}-\vec{x}^{(k-2)})=...=B^{k-1}(\vec{x}^{(1)}-\vec{x}^{(0)})\\ &\Rightarrow\parallel\vec{x}^{(k)}-\vec{x}^{(k-1)}\parallel\leq q^{k-1}\parallel\vec{x}^{(1)}-\vec{x}^{(0)}\parallel\end{aligned}$

例:

(1) 求Jacobi法的迭代矩阵
- $\begin{aligned}B_J=D^{-1}\big(L+U\big)&=\begin{pmatrix}1&0&0\\0&1&0\\0&0&1\end{pmatrix}\cdot\begin{pmatrix}0&-2&2\\-1&0&-1\\-2&-2&0\end{pmatrix}=\begin{pmatrix}0&-2&2\\-1&0&-1\\-2&-2&0\end{pmatrix}\end{aligned}$
- 显然, $B_J$ 的常用算子范数 $||B_J||>1$ , 不能用范数, 只能用特征值来判断
- $\begin{aligned}\det(\begin{array}{c}\lambda I-B_{J}\end{array})&=\det\begin{pmatrix}\lambda&2&-2\\1&\lambda&1\\2&2&\lambda\end{pmatrix}=\lambda^{3}=0\end{aligned}$
- 所以 $\quad\lambda=0\quad\rho(B_{J})=\max(\mid\lambda\mid)=0<1$ , Jacobi迭代法收敛
(2) 求Gauss-Seidel法的迭代矩阵
- $B_G=(D-L)^{-1}U=\begin{pmatrix}1&0&0\\1&1&0\\2&2&1\end{pmatrix}^{-1}\cdot\begin{pmatrix}0&-2&2\\0&0&-1\\0&0&0\end{pmatrix}=\begin{pmatrix}0&-2&2\\0&2&-3\\0&0&2\end{pmatrix}$
- $\begin{aligned}&\lambda=0, \lambda=2\\&\rho(B_{G})=\max(|\lambda|)=2>1\end{aligned}$ , 所以Gauss-Seidel迭代法发散
Gauss-Seidel迭代法收敛速度快, 但是有可能发散, 并不一定优于Jacobi迭代法

另外,给出系数矩阵对角占优线性方程组的一个结论

定理: 若线性方程组 $Ax=b$ 的系数矩阵 $A$ 为严格对角占优矩阵，则Jacobi法和 $G-S$ 法均收敛

矩阵严格对角占优: $\mid a_{ii}\mid>\sum_{j\neq i}\mid a_{ij}\mid\quad i=1,2,3,\cdots,n\\$ 对角线上的值比行上的其他值加起来都大
- 可得 $\frac1{\mid a_{ii}\mid}\sum_{j\neq i}\mid a_{ij}\mid<1\quad i=1,2,3,\cdots,n\\$
对于Jacobi迭代法,其迭代矩阵为 $B_J = D^{-1}(L+U)B_J=-\begin{pmatrix}0&\frac{a_{12}}{a_{11}}&\cdots&\frac{a_{1n}}{a_{11}}\\\frac{a_{21}}{a_{22}}&0&\cdots&\frac{a_{2n}}{a_{22}}\\\vdots&\vdots&\ddots&\vdots\\\frac{a_{n1}}{a_{nn}}&\frac{a_{n2}}{a_{nn}}&\cdots&0\end{pmatrix}$
- $\left\|B_J\right\|_\infty=\max_i\frac1{\mid a_{ii}\mid}\sum_{j\neq i}\mid a_{ij}\mid<1\\$ , 所以Jacobi迭代法收敛
对于G—S迭代法,其迭代矩阵为 $B_G=(D-L)^{-1}U$ , $B_G$ 的形式不像 $B_J$ 那样好确定, 不用范数, 使用特征值判断
- $\begin{aligned} B_G\text{的特征值}\lambda\text{满足 }\det(\lambda I-B_G)&=0 \\ \text{即}\det[\lambda I-(D-L)^{-1}U]& =0 \\ \text{从而 }\det(D-L)^{-1}\cdot\det[\lambda(D-L)-U]& =0 \\ \text{因此 }\det[\lambda(D-L)-U]& =0 \\ 由|a_{ii}|>\sum_{j\neq i}|a_{ij}| 得 |\lambda|\cdot|a_{ii}|>|\lambda|\cdot\sum_{j=1}^{i-1}|a_{ij}|+|\lambda|\cdot\sum_{j=i+1}^n|a_{ij}| \\ \qquad=\mid\lambda\mid\cdot\sum_{j=1}^{i-1}\mid a_{ij}\mid+\sum_{j=i+1}^n\mid a_{ij}\mid+(\mid\lambda\mid-1)\cdot\sum_{j=i+1}^n\mid a_{ij}\mid \end{aligned}$

第7章非线性方程与方程组的数值解法

7,1
二分法和误差
7.2
不动点概念和公式
不动点收敛性
局部收敛
收敛的阶
7.3 skip
7.4 牛顿
简化牛顿牛顿下山skip
重根情形

7.1 方程求根与二分法

7.1.1 多项式基础

略, 高数

7.1.2 二分法

零点定理: 若 $f \in C[a, b]$ ，且 f (a) · f (b) < 0，则 f 在 (a, b) 上必有一根。

算法描述

设[a,b]为单根区间

取中点 $x_0=\frac12(a+b)$

若 $f(x_0)=0$ , $x_0$ 记为 $[a,b]$ 中的根
若 $f(a)\cdot f(x_0)<0$ , 则 $[a, x_0]$ 为有根区间, 令 $a_1=a, b_1=x_0$
若 $f(x_0)\cdot f(b)<0$ , 则 $[x_0, b]$ 为有根区间, 令 $a_1=x_0, b_1=b$

一轮操作后, 有根区间 $[a,b]$ 缩小为一半 $[a_1, b_1]$

循环, 继续取 $[a_1, b_1]$ 的中点 $x_1=\frac12(a_1+b_1)$ , 得到新区间 $[a_2, b_2]$

以此类推, 有 $x_n = \frac12(a_n+b_n)$

对于每个小区间都有 $(b_n-a_n)=\frac1{2^{n+1}}(b-a)\\|x_n-x_{n-1}|=\frac{1}{2^{n+1}}(b-a)$

确定适当的n, 可以得到任意要求的精度 ( $|x_{k+1}-x_k|<\varepsilon_1$ )

误差分析

对于第0步的 $x_0=\frac12(a+b)$ 有误差 $|x_0-x^*|\leq\frac{b-a}2$

第k步的 $x_k$ 误差: $|x_k-x^*|\leq \frac{b-a}{2^{k+1}}$

对于给定的精度ε,可估计二分法所需的步数 k ： $\frac{b-a}{2^{k+1}}<\varepsilon\quad\Rightarrow\quad k>\frac{\left[\ln\left(b-a\right)-\ln\varepsilon\right]}{\ln2}-1\\$

特点

优点

简单;
对f (x) 要求不高(只要连续即可)

缺点

无法求复根及偶重根
收敛慢

注：用二分法求根，最好先给出 $f(x)$ 草图以确定根的大概位置。或用搜索程序，将[a, b]分为若干小区间，对每一个满足 $f (a_k)·f (b_k) < 0$ 的区间调用二分法程序，可找出区间[a, b]内的多个根，且不必要求 $f (a)·f (b) < 0$ 。

例

例证明1-x-sin $x=0$ 在[0,1]内仅有一个根，使用二分法求误差不大于 $\frac12\times10^{-4}$ 的根需要对分多少次？

解:

设 $f(x)=1-x-\sin x$ ,则 $f(0)=1>0$ ,f $(1)=-\sin(1)<0$ ,且 $f(x)$ 在上[0,1]上连续，故方程 $f(x)=0$ 在[0,1]内至少有一根
又因为 $f^\prime(x)=-1-\cos x<0,x\in[0,1]$ ,故 $f(x)$ 在[0,1]上单调递减，因此 $f(x)$ 在[0,1]上有且仅有一个根
使用二分法，使误差限 $\left|x_k-x^*\right|\leq\frac1{2^{k+1}}(b-a)=\frac1{2^{k+1}}\leq\frac12\times10^{-4}$ ,解得 $2^{k}\geq10^{4},k\geq\frac{4\ln10}{\ln2}=13.2877$

所以对分14次即可

7.2 迭代法及其收敛性

不动点迭代法

将非线性方程 $f(x)=0$ 化为一个同解方程 $x=\varphi(x)$ , 且设 $\varphi(x)$ 连续

任取初值 $x_0$ 代入, 得 $x_1=\varphi(x_0), x_2=\varphi(x_1)\cdots, x_k=\varphi(x_{k-1})$

称上式为求解非线性方程 $x=\varphi(x)$ 的不动点迭代法

称 $\varphi(x)$ 为迭代函数, $x_k$ 为第k步迭代值
若存在 $x^*,使得lim_{k→∞}x_k=x^*\\$ , 则 $x^*$ 为 $\varphi$ 的不动点, 也就是方程f=0的根

发散与收敛

若存在一点 $x^*$ , 使得迭代序列 $\{x_k\}_0^\infin$ 满足 $lim_{k→\infin}x_k=x^*\\$ 则称迭代法收敛,否则称为发散

如果将原方程表示为 $\{\begin{array}{l}y=x\\y=\varphi(x)\end{array}$ 与原方程同解

例题: 用迭代法求解方程 $2x^3-x-1=0$

将原方程化为等价方程 $x=2x^3-1$
- 取 $x_0=0$ , 得 $\begin{aligned} &x_{0}=0 \\ &x_1=2x_0^3-1=-1 \\ &x_2=2x_1^3-1=-3 \\ &x_3=2x_2^3-1=-55 \end{aligned}$ , 显然发散
如果将原方程化为等价方程 $x=\sqrt[3]{\frac{x+1}2}$
- $\begin{aligned}&x_0=0\\&x_1=\sqrt[3]{\frac{x_0+1}2}=\sqrt[3]{\frac12}\approx0.7937\\&x_2=\sqrt[3]{\frac{x_1+1}2}=\sqrt[3]{\frac{1.7937}2}\approx0.9644\end{aligned}$
- 得 $x2 = 0.9644; x3 = 0.9940;x4 = 0.9990;x5 = 0.9998;x6 = 1.0000;x7 = 1.0000$
- 收敛, 原方程的解为 $x=1.0000$

迭代法收敛定理

定理: 设迭代函数 $\varphi(x)$ 在[a,b]上连续, 且满足

当 $x\in[a,b]$ 时, $\ a\leq\varphi(x)\leq b$
存在一个整数L, 满足 $0<L<1$ 且 $\forall x\in [a,b]$ , 有 $|\varphi'(x)|\leq L$ (上确界为L)

则有以下结论

方程 $x=\varphi(x)$ 在 $[a,b]$ 内有唯一解 $x^*$
对于任意初值 $x_0\in[a,b]$ , 迭代法 $x_{k+1}=\varphi(x_k)$ 均收敛于 $x^*$
$\left|x_k-x^*\right|\leq\frac L{1-L}\left|x_k-x_{k-1}\right|\\$
$\left|x_k-x^*\right|\leq\frac{L^k}{1-L}\left|x_1-x_0\right|\\$ $∣ x_{k} - x^{*} ∣ \leq \frac{L ^{k}}{1 - L} ∣ x_{1} - x_{0} ∣$
- $\left|x_k-x^*\right|\leq\frac L{1-L}\left|x_k-x_{k-1}\right|\leq\frac{L^k}{1-L}\left|x_1-x_0\right|\\$

定理证明:

结论1: 方程 $x=\varphi(x)$ 在 $[a,b]$ 内有唯一解 $x^*$

①构造了一个 $(a,a)→(b,b)$ 的正方形空间, 对角线 $y=x$ ; $f(b)=\varphi(a)-a \geq0; f(b)=\varphi(b)-b\leq0$
②对于两个函数交点: $f(x)=\varphi(x)-x= 0$ , $f'(x)=\varphi'(x)-1<0$ , 单调递减
零点定理得 $\varphi(x)-x$ 在 $(a,b)$ 有唯一零点 $x^*$

结论2: 对于任意初值 $x_0\in[a,b]$ , 迭代法 $x_{k+1}=\varphi(x_k)$ 均收敛于 $x^*$

对 $x_{k+1}=\varphi(x_k)$ , 由微分中值定理和 $|\varphi'(x)|<L$ 得
$\begin{aligned}\left|x_{k}-x^{*}\right|& =\left|\varphi(x_{k-1})-\varphi(x_{k})\right| \\&\leq L|x_{k-1}-x^*|\leq\cdots\leq L^k|x_0-x^*| \end{aligned}$

结论3&4: $\left|x_k-x^*\right|\leq\frac L{1-L}\left|x_k-x_{k-1}\right|\\$ 和 $\left|x_k-x^*\right|\leq\frac{L^k}{1-L}\left|x_1-x_0\right|\\$

$\begin{aligned}\left|\begin{array}{c}x_{k+p}-x_k\end{array}\right|& \leq\left|\begin{array}{c}x_{k+p}-x_{k+p-1}\end{array}\right|+\left|\begin{array}{c}x_{k+p-1}-x_{k+p-2}\end{array}\right| +\cdots+\left|\begin{array}{c}x_{k+1}-x_k\end{array}\right| \\ &\leq\left(L^p+L^{p-1}+\cdots+L\right)|\left.x_k-x_{k-1}\right| \\&\leq\frac L{1-L}\Big|x_k-x_{k-1}\Big| (等比数列\frac{L-L^{p+1}}{1-L})\end{aligned}$
$\begin{aligned}\left|x_k-x^*\right|&\leq\frac L{1-L}\Big|x_k-x_{k-1}\Big|\\&\leq\frac{L^2}{1-L}\Big|x_{k-1}-x_{k-2}\Big|\\&\cdots\cdots\cdots\\&\leq\frac{L^k}{1-L}\Big|x_1-x_0\Big|\end{aligned}$
另一种方式证明收敛: 由于L<1, $\lim_{k\to\infty}(|x_k-x^*|)=0$

由定理可知, 只要迭代函数满足 $|\varphi'(x)|\leq L<1$ , 迭代法收敛

注: 虽然收敛, 但不一定是唯一根

对于实际要求中的误差限 $\varepsilon$ , 只要 $\frac L{1-L}|x_k-x_{k-1}|<\varepsilon\\$

所以当 $\left|x_k-x_{k-1}\right|<\frac{1-L}L\varepsilon\approx\varepsilon\\$ 时, 即可停止迭代, 将 $x_k$ 作为近似解

收敛的阶

由定理1的结论可以看出,L或 $|\varphi'(x)|$ 在[a, b]上越小, 迭代法收敛越快

设 $e_k=|x_k-x^*|$

定义: 若存在实数 $p\geq1$ 和 $c>0$ 满足 $\lim_{k\to\infty}\frac{e_{k+1}}{e_k^p}=c\\$ ( $e_{k+1}和e_k^p$ 同阶无穷小), 则称迭代法p阶收敛

当p=1称为线性收敛, p>1时称为超线性收敛, p=2时称为平方收敛

收敛阶的计算

若 $\varphi(x)$ 在精确解 $x^*$ 处处可导, 泰勒展开得: $\varphi(x)=\varphi(x^*)+\varphi'(x^*)(x-x^*)+\frac{\varphi''(x^*)}{2!}(x-x^*)^2+...\\+\frac{\varphi^{(p-1)}(x^*)}{(p-1)!}(x-x^*)^{p-1}+\frac{\varphi^{(p)}(\xi)}{p!}(x-x^*)^p\\$

$\text{如果 }\varphi^{\prime}(x^*)=\varphi^{\prime\prime}(x^*)=\cdots=\varphi^{(p-1)}(x^*)=0\quad\text{ 而 }\varphi^{(p)}(x^*)\neq0\\\varphi(x)=\varphi(x^*)+\frac{\varphi^{(p)}(\xi)}{p!}(x-x^*)^p$

$x_{k+1}=\varphi(x_k)=\varphi(x^*)+\frac{\varphi^{(p)}(\xi)}{p!}(x_k-x^*)^p\\$
$x_{k+1}-x^*=\frac{\varphi^{(p)}(\xi)}{p!}(x_k-x^*)^p\\$
$\frac{e_{k+1}}{e_k^p}=\frac{\left|x_{k+1}-x^*\right|}{\left|x_k-x^*\right|^p}\quad\to\left|\frac{\varphi^{(p)}(x^*)}{p!}\right|,(k\to\infty)\\$ , 即迭代法 $x_{k+1}=\varphi(x_k)$ 的收敛阶是p

定理: 如果迭代法迭代函数 $\varphi(x)$ 在根 $x^*$ 附近满足：

$(1)\varphi(x)$ 存在 $p$ 阶导数处连续；
$(2)\varphi^{\prime}(x^*)=\varphi^{\prime\prime}(x^*)=\cdots=\varphi^{(p-1)}(x^*)=0$ ,而 $\varphi^{(p)}{(x^*)}\neq0$

则迭代法 $x_k+1=\varphi(x_k)$ 的收敛阶是 $p$

7.4 牛顿法

原理：将非线性方程线性化 —— Taylor 展开 /Taylor’s expansion/

取 $x_0=x^*$ , 将f(x)在x0处做一阶泰勒展开,得

$f(x)=f(x_0)+f^{\prime}(x_0)(x-x_0)+\frac{f^{\prime\prime}(\xi)}{2!}(x-x_0)^2,\xi\text{ 在 }x_0\text{ 和 }x\text{ 之间。}$

将将 $(x* - x_0)^2$ 看成高阶小量，则有：

$0=f(x^*)\approx f(x_0)+f^{\prime}(x_0)(x^*-x_0)\quad\Rightarrow\quad x^*\approx(x_0-\frac{f(x_0)}{f^{\prime}(x_0)})\\$ (去掉了f''项, 所以约等于)

$x_{k+1}=x_k-\frac{f(x_k)}{f^{\prime}(x_k)}\\$ :

推导过程

如果将非线性方程 $f(x)=0$ 化为等价方程 $x=x-k(x)f(x)$ , 且 $k(x)\neq0$

求k(x)

令 $\begin{aligned}\varphi(x)&=x-k(x)f(x)\\\varphi'(x)&=1-k'(x)f(x)-k(x)f'(x)\end{aligned}$

设 $x^*$ 为f(x)=0的根, $|\varphi^{\prime}(x)|$ 在 $x^*$ 附近越小,则收敛速度越快 (f(x)对x的影响大)
如果 $f'(x^*)\neq 0$ , 令 $\varphi'(x^*)=0$ (收敛速度最大), 即 $1-k'(x^*)f(x^*)-k(x^*)f'(x^*)=0$ , $k(x^*)=\frac1{f'(x^*)}$

取 $k(x)=\frac1{f'(x)}$ , 则 $\varphi(x)=x-\frac{f(x)}{f^{\prime}(x)}\quad x=x-\frac{f(x)}{f^{\prime}(x)}$

取初值 $x_0$ , 由上面k(x)构造迭代函数得

牛顿迭代法: $x_{k+1}=x_k-\frac{f(x_k)}{f'(x_k)}\quad(k=0,1,2,\cdots)\\$

具有局部收敛性, 只要 $f'(x^*)\neq 0$ , 牛顿迭代法至少平方收敛

例1: 用Newton迭代法求方程的根:

例: $\text{设}x^*\text{是方程}f(x)=0\text{的}m(\geq2)\text{重根},\text{证明牛顿法}x_{k+1}=x_k-\frac{f(x_k)}{f'(x_k)}\\$ 为线性收敛

因为 $x^*$ 是方程 $f(x)=0$ 的m重根, $\therefore f(x)=(x-x^*)^mg(x)$ 且 $g(x^*)\neq 0, m\geq2$
得 $f^{\prime}(x)=m(x-x^*)^{m-1}g(x)+(x-x^*)^mg^{\prime}(x)$
$\begin{gathered} x_{k+1}=x_k-\frac{f(x_k)}{f^{\prime}(x_k)} =x_k-\frac{(x_k-x^*)^mg(x_k)}{m(x_k-x^*)^{m-1}g(x_k)+(x_k-x^*)^mg^{\prime}(x_k)} \\ =x_k-\frac{(x_k-x^*)g(x_k)}{mg(x_k)+(x_k-x^*)g^{\prime}(x_k)} \end{gathered}$
$x_{k+1}-x^*=(x_k-x^*)(1-\frac{g(x_k)}{mg(x_k)+(x_k-x^*)g^\prime(x_k)})\\$
$\lim_{k\to\infty}\frac{x_{k+1}-x^*}{x_k-x^*}=\lim_{k\to\infty}(1-\frac{g(x_k)}{mg(x_k)+(x_k-x^*)g^{\prime}(x_k)})=1-\frac1m\\$
$m\geq2\text{时,1}-\frac1m>0$ 由定义可知, 该迭代法对m(>=2)重根是线性收敛的

例: 设 $f(a)=0$ , 且 $f'(a)\neq0$ 证明 $x_{k+1}=x_k-\frac{f(x_k)}{f^{\prime}(x_k)}\\$ , 至少是平方收敛

令 $\varphi(x)=x-\frac{f(x)}{f'(x)}$
则 $\varphi'(x)=1-\frac{[f'(x)]^2-f(x)f''(x)}{[f'(x)]^2}=\frac{f(x)f''(x)}{[f'(x)]^2}\\$
所以 $\varphi^{\prime}(a)=0$ ,该迭代法至少平方收敛

收敛的充分条件

设 $f\in C^2[a, b]$ 若

$f(a)f(b)<0$ (区间端点异号, 有根)
在整个 $[a,b]$ 区间上, $f''$ 不变号, 且 $f'(x)\neq 0$ (根唯一)
选取 $x_0\in[a,b]$ 使得 $f(x_0)f''(x_0)>0$ (产生的序列单调有界, 保证收敛)

则牛顿迭代法产生的序列 $\{x_k\}$ 收敛到 $f(x)$ 在 $[a,b]$ 区间内的唯一根

局部收敛性

设 $f \in C^2[a, b]$ ，若 x* 为 f (x) 在[a, b]上的单根，且 $f ’(x^*) \neq 0$ ，则存在 x* 的邻域 $B_\delta (x^*)$ 使得任取初值 $x_0\in B_\delta (x^*)$ ，Newton’s Method产生的序列 $\{ x_k \}$ 收敛到x*，且满足 $\lim_{k\to\infty}\frac{x^*-x_{k+1}}{\left(x^*-x_k\right)^2}=-\frac{f^{\prime\prime}(x^*)}{2f^{\prime}(x^*)}\\$

例: 证明牛顿迭代法实际上是一种特殊的不动点迭代其中 $g(x)=x-\frac{f(x)}{f'(x)}$ 则 $\left|g^{\prime}(x^*)\right|=\left|\frac{f^{\prime\prime}(x^*)f(x^*)}{f^{\prime2}(x^*)}\right|=0<1\quad\Rightarrow\quad\text{收敛}$