Qual è una spiegazione intuitiva del Teorema di Mercer?
Il Teorema di Mercer è in realtà un analogo della Decomposizione degli autovalori o della Decomposizione dei valori singolari. L'unica differenza qui è che il kernel è ora un oggetto contenuto in uno spazio infinito-dimensionale.
Iniziamo con l'enunciato più semplice del Teorema di Mercer:
Teorema (Mercer): Sia [math] K : [a,b]^2 \rightarrow \mathbb{R} [/math] una funzione simmetrica, non negativa definita, continua. Esiste una sequenza numerabile di funzioni [math] \\pfi_i\}_{i\in\mathbb{N}}[/math] e una sequenza di numeri reali positivi [math]\lambda_i\}_{i\mathbb{N}}[/math] tali che,
[math] K(s,t) = \sum_{i = 1}^{infty} \lambda_i \phi_i(s) \phi_i(t) [/math]
Perciò perché paragonare questo ad una decomposizione di matrice? Supponiamo che [math]K_n \in \mathcal{S}_n^+[/math] sia una matrice non negativa definita e simmetrica [math]n volte n[/math]. Per il teorema dello spettro, esiste una base ortonormale [math]\mathbf{e}_i\}_{i=1}^n[/math] tale che [math]K_n[/math] è diagonale in questa base. Ma cosa significa esattamente? Generalmente, questo significa che esiste una matrice unitaria, [math] U = \left[ \mathbf{e}_1 , \mathbf{e}_2, \cdots \mathbf{e}_n \right] [/math] [0] e una matrice diagonale, [\math] \Lambda = \testo{diag}(\lambda_1, \ldots, \lambda_n)[/math] tale che [math] K_n = U \Lambda U^T [/math]. Ma se lo moltiplichiamo, questo dice semplicemente che [math]K_n = \sum_{i=1}^{n} \lambda_i \mathbf{e}_i \mathbf{e}_i^T[/math], che è esattamente come il Teorema di Mercer.
L'unica differenza qui è che i nostri 'autovettori' sono semplicemente funzioni [math]\phi_i(s)[/math] al contrario di semplici vettori [math]\mathbf{e}_i[/math]. Tuttavia, lo spazio [math] [a,b]^2[/math] è uno spazio compatto, Hausdorff, contraibile e quindi l'insieme delle funzioni integrabili al quadrato, [math]L^2([a,b]^2)[/math] ha una base contata e ortonormale.
Un semplice esempio di questo è quando [math]a = 0, b=1[/math]. Allora una base ortonormale numerabile per [math]L^2([0,1]^2)[/math] è semplicemente le sinusoidi, [math]\phi_{n,m}(x,y) = \exp(i \pi(nx+my) )[/math]. In questa situazione, si noti che la condizione di simmetria extra sul kernel nel Teorema di Mercer ci costringe ad espandere solo nella base [math]\phi_{n}(x) := \phi_{n.n}(x) = \exp(i\pi n(x+y))[/math].
[0] Questa è una matrice con [math]i[/math] la terza colonna uguale a [math]\mathbf{e}_i[/math]; l'implementazione della modalità matematica di Quora's LaTeX è davvero pessima con le matrici e non ho potuto scriverla correttamente.