Subsections

11 Interpolace a aproximace

Interpolace a aproximace funkcí nebo experimentálních dat zahrnuje řadu technik. Obecně se provádí náhradou funkce $ \bf f(x)$, zadané hodnotami $\bf [x_i, y_i], i= 1, 2,....., n$ vhodnou aproximující funkcí $\bf g(x)$. Za aproximující funkci $f(x)$ se často volí lineární kombinace elementárních funkcí $\bf g_j(x)$.

\begin{displaymath}\bf
g(x) = \sum_{j=1}^m c_j  g_j(x).
\end{displaymath} (61)

Příkladem elementárních funkcí $\bf g_j(x)$ jsou polynomy $\bf x^{j-1}$ racionální funkce, podíly polynomů, trigonometrické funkce, exponenciální funkce atd. Aproximující funkce souvisí se zadáním dané úlohy a ovlivňují stupeň aproximace. Ten se obyčejně vyjadřuje jako vzdálenost mezi aproximující funkcí $\bf g(x)$ a aproximovanou funkci $ \bf f(x)$, resp. diskrétními hodnotami $\bf y_i$. Zvláštním případem aproximace je interpolace: při interpolaci závislostí se sestrojuje funkce $\bf g(x)$ tak, aby procházela zadanými body $\bf [x_i, y_i], i= 1, 2,....., n$, a splňovala přitom podmínky týkající se jejího tvaru. Při interpolaci funkcí musí být v definovaných bodech $\xi_i$ $i=1,2,...,n$ nazvaných uzlové body interpolace, funkce $f(x)$$g(x)$ spojité ve funkčních hodnotách a hodnotách zvolených derivací
\begin{displaymath}\bf
f^{(j)}(\xi_i) = g^{(j)}(\xi_i)       i=1,2,.....n,
     j = 0,...., r_i
\end{displaymath} (62)

Zde $f^{(j)}$ označuje j-tou derivaci a $r_i$ je maximální derivací v i-tém uzlu, ve které jsou totožné obě, aproximovaná a aproximující funkce. Interpolace se v technické praxi využívá pro Při aproximaci závislostí se předpokládá aditivní působení chyb typu
\begin{displaymath}
y_i = g(x_i) + \epsilon_i
\end{displaymath} (63)

Pokud je druh funkce $g(x)$ předem znám, přechází úloha aproximace na úlohu lineární nebo nelineární regrese. Pokud se volí $g(x)$ ve tvaru lineární kombinace elementárních funkcí, jde o úlohu lineární regrese. Aproximace se v technické praxi používá k:

11.1 Klasické interpolační postupy

Mezi nejznámější postupy patří polynomická interpolace, která hledá polynom g(x) nejmenšího možného stupně, splňující podmínku (62) Tato úloha má právě jedno řešení a hledaný polynom je stupně nejvýše:

\begin{displaymath}\bf
m=\sum \limits_{i=1}^{n} r_i \: + \: n \: - \: 1.
\end{displaymath} (64)

Pokud je požadavkem shoda pouze ve funkčních hodnotách, jsou $r_i = 0, i = 1,.....,n$, a n-tice bodů je interpolována jednoznačně polynomem (n - 1)ního stupně. Z podmínek (62) se sestaví $m$ lineárních rovnic, ze kterých se vypočtou odpovídající koeficienty $c_j$. Pro větší počty uzlových bodů je výpočet koeficientů interpolačního polynomu výše uvedenou metodou nepohodlný. Užívá se proto rozličných interpolačních vzorců.

11.1.1 Lagrangeoava a Newtonova interpolační formule

Formule se užívají pro případ $r_i= 0$, kdy se konstruuje polynom stupně nejvýše $ m = n - 1$, interpolující $n$ uzlových bodů, a kdy platí $y_i = f(x_i) = g(x_i)$. Interpolační polynom splňující tyto podmínky lze vyjádřit jako lineární kombinaci všech y-ových hodnot

\begin{displaymath}\bf
L_m(x) = \sum \limits_{i=1}^{n}y_i \: g_j(x),
\end{displaymath} (65)

kde $g_j(x)$ jsou polynomy stupně (n - 1) takové, že pro všechna j různá od i platí
\begin{displaymath}\bf
g_j(x_i) = 0, \: \: \: \: \: \: \: g_j(x_j) = 1
\end{displaymath} (66)

Lagrangeův interpolační polynom má tvar:
\begin{displaymath}\bf
L_m(x) = \sum \limits_{j=1}^{n} y_j \prod \limits_{i=1,i\neq j}^{n}
\frac{x - x_i}{x_i-x_j}.
\end{displaymath} (67)

Další podrobnosti je možné nalézt například v $[6]$. Nevýhodou tradičního vyjádření interpolačního polynomu v Lagrangerově tvaru je nutnost opětovného přepočítání všech členů při přidání dalšího bodu $x_{n+1}, y_{n+1}$. Z tohoto hlediska je při postupném přidávání uzlů výhodnější Newtonova interpolační formule
\begin{displaymath}\bf
P_m(x) = \sum \limits_{j=1}^{n} a_j \prod \limits_{k=1}^{j-1} (x - x_k).
\end{displaymath} (68)

Přidání bodu $x_{n+1}, y_{n+1}$ pak vede k interpolačnímu polynomu
\begin{displaymath}\bf
P_{m+1}(x) = P_m(x) \: + \: a_{n+1}\prod \limits_{k=1}^{n} (x - x_k).
\end{displaymath} (69)

Podrobný návod k výpočtu koeficientů $a_j$ naleznete například v $[6]$.

11.1.2 Hermiteovská interpolace

Při této interpolaci se požaduje, aby interpolační polynom $H_m$ se svou první derivací souhlasil ve všech uzlových bodech s danou funkcí a její první derivací. To znamená, že $r_i = 1, i = 1, ..., n$ a interpolační polynom je stupně $(2 n - 1)$. Podrobnosti naleznete opět v $[6]$.

11.1.3 Racionální interpolace

Při této aproximaci je interpolující funkce $\bf R_{m,l}(x)$ definována jako podíl polynomu stupně $ \bf m$ (v čitateli) a polynomu stupně $\bf l$ (ve jmenovateli).

\begin{displaymath}\bf
R_{m,l} = \frac{P_m(x)}{P_l(x)}
\end{displaymath} (70)

Tato aproximace nahrazuje klasickou polynomickou interpolaci stupně (m + 1). Podrobnosti jsou například v $[6]$.

11.2 Spline interpolace

Obrázek: Ukázka nevhodného použití interpolace polynomem (křížky), zadané body zobrazeny kroužky, spojitě nakreslen skutečný průběh funkce
\includegraphics[height=10cm, width=\textwidth, keepaspectratio=false]{inter}

Obrázek: Ukázka použití spline interpolace (spojitá křivka), zadané body zobrazeny kroužky, průběh označený křížky ukazuje pro srovnaní interpolaci polynomem
Image spline.png

Užívání polynomiálních interpolačních formulí má řadu nevýhod. Jsou totiž složeny z elementárních funkcí definovaných na celé reálné ose, což vede u interpolačních formulí vyšších řádů ke vzniku řady lokálních minim, maxim a inflexních bodů, které neodpovídají průběhu funkce $f(x)$ či tabelované závislosti $[x_i, y_i], i=1,....n$. Při interpolaci fyzikálních závislostí se stává, že chování v jistém intervalu se výrazně liší od jejich chování v intervalech sousedních. Jde o závislost tzv. neasociativní povahy. Z těchto úvah plyne, že pro účely interpolace, ale i aproximace bude výhodnější volit lokálně definované funkce, které budou v místech vzájemného styku, tj. v uzlech, spojité ve funkčních hodnotách a v hodnotách zadaných derivací. Vhodné interpolační funkce tohoto typu jsou složeny z polynomických úseků a platí pro ně, že jsou ze třídy $C^m[a, b]$. Obecně jsou funkce třídy $C^m[a, b]$ na intervalu $[a, b]$ spojité v prvních m derivacích a funkčních hodnotách. S využitím uvedených vlastností funkcí ze třídy $C^m[a, b]$ můžeme definovat obecně polynomický spline $S_m(x)$ s uzly $ a = \xi_1 < \xi_2 < ..... < \xi_n = b$. Tento spline je na každém úseku $[\xi_j, \xi_{j+1}], j = 1, ....,n-1$, reprezentován polynomem maximálně m-tého stupně. Pokud je v nějakém bodě $x_i$ některá derivace $S^{(1)}(\xi_i)$ nespojitá, jde o defektní spline.
Vlastnosti spline $S_m(\xi_i)$ závisí na:

11.3 Přehled vzorců pro lineární regresi s jednou nezávislou proměnnou

11.3.1 Předpoklady, které by měly být v regresním modelu splněny.

Formulace problému: K hodnotám $x_1, x_2, \ldots , x_n$ nezávisle proměnné získáme měřením odpovídající hodnoty závisle proměnné $y_1, y_2, \ldots , y_n$. Tyto hodnoty nesplňují regresní model přesně, ale jsou zatíženy chybami. Například pro lineární regresy je možno psát: $ y_i = a + b \: x_i + e_i$, kde $e_i$ jsou chyby.
Musí být splněny následující předpoklady:

Lineární model splňující tyto předpoklady patří do třídy klasických lineárních modelů. Nejdůležitější jsou první tři předpoklady. Nesplnění posledních tří předpokladů se řeší zavedením zobecněného modelu lineární regrese
Dále použijeme následující označení:
$p$ - hladina spolehlivosti (je-li například $p=0,68$, pak existuje 68 % pravděpodobnost, že hodnota veličiny leží ve vymezeném intervalu).
$t_{n \; p}$ - Studentův koeficient odpovídající $n$ stupňů volnosti a pravděpodobnosti $p$.

11.3.2 Přímka procházející počátkem

MODEL: $ \bf y_i = a \; x_i + e_i$
Odhad regresního koeficientu $\hat{a}$ a odhad rozptylu $s$:

\begin{displaymath}\bf
\hat{a} = \frac{\sum \limits _{i=1}^{n}x_i y_i}{\sum \l...
...}^{n} y_i^2 - \hat{a} \sum \limits _{i=1}^{n}
x_i y_i}{n -1}
\end{displaymath} (71)

Interval spolehlivosti pro regresní koeficient:
\begin{displaymath}\bf
\hat{a}\; \pm \; t_{n-1 \; p} \;\;s \;
\sqrt{\sum \limits _{i=1}^{n} x_i^2}
\end{displaymath} (72)

Interval spolehlivosti pro vyrovnávanou hodnotu:
\begin{displaymath}\bf
\hat{a} \;x \;\pm \;t_{n-1 \; p} \;s \;
\sqrt{\sum \limits _{i=1}^{n} x_i^2}
\end{displaymath} (73)

11.3.3 Přímka procházející daným bodem

MODEL: $ \bf y_i = y_0 + b \; ( x_i - x_0) + e_i$
Odhad regresního koeficientu $\hat{b}$ a odhad rozptylu $s$:

\begin{displaymath}\bf
\hat{b} = \frac{\sum \limits _{i=1}^{n} (x_i - x_0) ( y...
...( y_i - y_0))^2}{\sum \limits _{i=1}^{n} (x_i-x_o)^2}}{n - 1}
\end{displaymath} (74)

Interval spolehlivosti pro regresní koeficient:
\begin{displaymath}\bf
\hat{b} \; \pm \; t_{n-1 \; p} \; s \; \sqrt{\frac {1}
{\sum \limits _{i=1}^{n} x_i^2}}
\end{displaymath} (75)

Interval spolehlivosti pro vyrovnávanou hodnotu:
\begin{displaymath}\bf
y_0 + \hat{b} \; (x - x_0) \pm t_{n-1 \; p} \; s \; \sqrt
{\frac{1}{\sum \limits _{i=1}^{n} (x_i - x_0)^2}}
\end{displaymath} (76)

11.3.4 (Obecná) regresní přímka

MODEL: $ \bf y_i = a + b \; x_i + e_i$
Odhad regresních koeficientů:

\begin{displaymath}\bf
\hat{a} = \bar{y} - \hat{b} \bar{x}; \: \: \: \: \: \: ...
...bar{x}) \; y_i }
{\sum \limits _{i=1}^{n} (x_i - \bar{x})^2}
\end{displaymath} (77)

Odhad rozptylu:
\begin{displaymath}\bf
s^2 = \frac{1}{n (n - 2)} \left( n \sum \limits _{i=1}^...
..._{i=1}^{n} x_i^2 - (
\sum \limits _{i=1}^{n} x_i)^2} \right)
\end{displaymath} (78)

Interval spolehlivosti pro regresní koeficienty:
\begin{displaymath}\bf
\hat{a} \; \pm \; t_{n-2 \; p} \; s \; \sqrt{\frac{1}{n...
...qrt{\frac {1}
{\sum \limits _{i=1}^{n} x_i^2 - n \bar{x}^2}}
\end{displaymath} (79)

Interval spolehlivosti pro vyrovnávanou hodnotu:
\begin{displaymath}\bf
\hat{a} + \hat{b} \; x \; \pm \; t_{n-2 \; p} \; s \; \...
...- \bar{x})^2}{\sum \limits _{i=1}^{n} x_i ^2 -
n \bar{x}^2}}
\end{displaymath} (80)

© František Šťastný, 1997