Détermination du minimum d'une fonction vectorielle à valeurs réelles
★★★★
Soient $A$ une matrice symétrique à valeurs propres strictement positives, $B \in \mathbb{R}^n$, $f : \mathbb{R}^n \to \mathbb{R}$ une fonction vectorielle définie par : $\forall X \in \mathbb{R}^n,\quad f(X) = X^\top A X - 2 B^\top X.$
Démontrer que $f$ possède un minimum et le déterminer.
Démontrer que $f$ possède un minimum et le déterminer.
La fonction vectorielle $f$ est somme de fonctions vectorielles différentiables, donc $f$ est différentiable.
Soit $ X \in \mathbb{R}^n$,
$$
\nabla f(X) = 2AX - 2B
$$
$$
\nabla f(X) = 2(A X - B)
$$
$ \mathbb{R}^n$ est un ouvert, donc si la fonction vectorielle $f$ admet un minimum global $m$ alors $m$ est un minimum local. $f$ étant différentiable, on a que $m$ est l'image d'un point critique. Attention, la réciproque est fausse : l'image d'un point critique peut ne pas être un extremum local.
Soit $X_0 \in \mathbb{R}^n$,
$$(E) : X_0 \text{ est un point critique de }f $$
$$
(E) \iff \nabla f(X_0) = 0_{\mathbb{R}^n}
$$
$$
(E) \iff 2(A X_0 - B) = 0_{\mathbb{R}^n}
$$
$$
(E) \iff A X_0 - B = 0_{\mathbb{R}^n}, \, 2 \neq 0_{\mathbb{R}}
$$
$$
(E) \iff A X_0 = B
$$
Les valeurs propres de la matrice $A$ sont strictement positives, donc les valeurs propres sont non nulles, donc $0$ n'est pas une valeur propre de $A$, donc $A - 0I_n = A$ est une matrice inversible.
$$
(E) \iff X_0 = A^{-1} B
$$
Donc l'unique point critique de la fonction vectorielle $f$ est $X_0 = A^{-1}B$.
On calcule $f(X_0)$ qui pourrait être le minimum de $f$.
$$
f(X_0) = X_0^\top A X_0 - 2 B^\top X_0
$$
$$
f(X_0) = (A^{-1}B)^\top A (A^{-1}B) - 2 B^\top (A^{-1}B)
$$
$$
f(X_0) = B^\top (A^{-1})^\top (A A^{-1}) B - 2 B^\top A^{-1} B
$$
$$
f(X_0) = B^\top (A^\top)^{-1} I_n B - 2 B^\top A^{-1} B, \quad (A^{-1})^\top = (A^\top)^{-1}
$$
$$
f(X_0) = B^\top A^{-1} B - 2 B^\top A^{-1} B, \quad A \text{ est une matrice symétrique donc } A^\top = A.
$$
$$
f(X_0) = (1 - 2) B^\top A^{-1} B
$$
$$
f(X_0) = - B^\top A^{-1} B
$$
Notre objectif est de démontrer que $f(X_0)$ est le minimum de la fonction vectorielle $f$. Soit $X \in \mathbb{R}^n$, on veut démontrer l'inégalité :
$$
(I) : f(X) \geq f(X_0)
$$
$$(I) \iff X^\top A X - 2 B^\top X \geq - B^\top A^{-1} B$$
$$(I) \iff X^\top A X - 2 B^\top X + B^\top A^{-1} B \geq 0$$
$$\text{On pose } g(X) = X^\top A X - 2 B^\top X + B^\top A^{-1} B$$
$$(I) \iff g(X) \geq 0$$
$A$ est une matrice symétrique à valeurs propres positives, donc par théorème de cours
$A$ est une matrice symétrique positive, c'est à dire que $\forall Y \in \mathbb{R}^n, \; Y^\top A Y \geq 0$.
On conjecture que si on construit un vecteur $Y$ bien choisi puis qu'on lui applique le théorème ci-dessus, alors on pourra démontrer l'inégalité $(I)$.
On pose $Y = X - X_0$. On sait que $Y^\top A Y \geq 0$.
D'autre part :
$$Y^\top A Y = (X - X_0)^\top A (X - X_0)$$
$$
Y^\top A Y = (X - A^{-1} B)^\top A (X - A^{-1} B)
$$
$$
Y^\top A Y = (X^\top - (A^{-1} B)^\top) A (X - A^{-1} B)
$$
$$
Y^\top A Y = (X^\top - B^\top (A^{-1})^\top )\left( A (X - A^{-1} B) \right)
$$
$$
Y^\top A Y = (X^\top - B^\top (A^\top)^{-1}) \left( A X - A A^{-1} B \right), \quad (A^{-1})^\top = (A^\top)^{-1}
$$
$$
Y^\top A Y = (X^\top - B^\top A^{-1}) \left( A X - B \right), \quad A \text{ est une matrice symétrique donc } A^\top = A.
$$
$$
Y^\top A Y = X^\top A X - X^\top B - B^\top (A^{-1} A )X + B^\top A^{-1} B
$$
$$
Y^\top A Y = X^\top A X - X^\top B - B^\top X + B^\top A^{-1} B
$$
$$
Y^\top A Y = X^\top A X - B^\top X - B^\top X + B^\top A^{-1} B, \quad \quad X^\top B = B^\top X = b_1 x_1 + \dots + b_n x_n
$$
$$
Y^\top A Y = X^\top A X - 2 B^\top X + B^\top A^{-1} B
$$
$$
Y^\top A Y = g(X)
$$
Donc $g(X) \geq 0$, donc l'inégalité $(I)$ est vraie.
Conclusion : $f$ possède un minimum $m = -B^\top A^{-1} B$ qui est atteint en $X_0 = A^{-1} B$.
Soit $ X \in \mathbb{R}^n$,
$$
\nabla f(X) = 2AX - 2B
$$
$$
\nabla f(X) = 2(A X - B)
$$
$ \mathbb{R}^n$ est un ouvert, donc si la fonction vectorielle $f$ admet un minimum global $m$ alors $m$ est un minimum local. $f$ étant différentiable, on a que $m$ est l'image d'un point critique. Attention, la réciproque est fausse : l'image d'un point critique peut ne pas être un extremum local.
Soit $X_0 \in \mathbb{R}^n$,
$$(E) : X_0 \text{ est un point critique de }f $$
$$
(E) \iff \nabla f(X_0) = 0_{\mathbb{R}^n}
$$
$$
(E) \iff 2(A X_0 - B) = 0_{\mathbb{R}^n}
$$
$$
(E) \iff A X_0 - B = 0_{\mathbb{R}^n}, \, 2 \neq 0_{\mathbb{R}}
$$
$$
(E) \iff A X_0 = B
$$
Les valeurs propres de la matrice $A$ sont strictement positives, donc les valeurs propres sont non nulles, donc $0$ n'est pas une valeur propre de $A$, donc $A - 0I_n = A$ est une matrice inversible.
$$
(E) \iff X_0 = A^{-1} B
$$
Donc l'unique point critique de la fonction vectorielle $f$ est $X_0 = A^{-1}B$.
On calcule $f(X_0)$ qui pourrait être le minimum de $f$.
$$
f(X_0) = X_0^\top A X_0 - 2 B^\top X_0
$$
$$
f(X_0) = (A^{-1}B)^\top A (A^{-1}B) - 2 B^\top (A^{-1}B)
$$
$$
f(X_0) = B^\top (A^{-1})^\top (A A^{-1}) B - 2 B^\top A^{-1} B
$$
$$
f(X_0) = B^\top (A^\top)^{-1} I_n B - 2 B^\top A^{-1} B, \quad (A^{-1})^\top = (A^\top)^{-1}
$$
$$
f(X_0) = B^\top A^{-1} B - 2 B^\top A^{-1} B, \quad A \text{ est une matrice symétrique donc } A^\top = A.
$$
$$
f(X_0) = (1 - 2) B^\top A^{-1} B
$$
$$
f(X_0) = - B^\top A^{-1} B
$$
Notre objectif est de démontrer que $f(X_0)$ est le minimum de la fonction vectorielle $f$. Soit $X \in \mathbb{R}^n$, on veut démontrer l'inégalité :
$$
(I) : f(X) \geq f(X_0)
$$
$$(I) \iff X^\top A X - 2 B^\top X \geq - B^\top A^{-1} B$$
$$(I) \iff X^\top A X - 2 B^\top X + B^\top A^{-1} B \geq 0$$
$$\text{On pose } g(X) = X^\top A X - 2 B^\top X + B^\top A^{-1} B$$
$$(I) \iff g(X) \geq 0$$
$A$ est une matrice symétrique à valeurs propres positives, donc par théorème de cours
$A$ est une matrice symétrique positive, c'est à dire que $\forall Y \in \mathbb{R}^n, \; Y^\top A Y \geq 0$.
On conjecture que si on construit un vecteur $Y$ bien choisi puis qu'on lui applique le théorème ci-dessus, alors on pourra démontrer l'inégalité $(I)$.
On pose $Y = X - X_0$. On sait que $Y^\top A Y \geq 0$.
D'autre part :
$$Y^\top A Y = (X - X_0)^\top A (X - X_0)$$
$$
Y^\top A Y = (X - A^{-1} B)^\top A (X - A^{-1} B)
$$
$$
Y^\top A Y = (X^\top - (A^{-1} B)^\top) A (X - A^{-1} B)
$$
$$
Y^\top A Y = (X^\top - B^\top (A^{-1})^\top )\left( A (X - A^{-1} B) \right)
$$
$$
Y^\top A Y = (X^\top - B^\top (A^\top)^{-1}) \left( A X - A A^{-1} B \right), \quad (A^{-1})^\top = (A^\top)^{-1}
$$
$$
Y^\top A Y = (X^\top - B^\top A^{-1}) \left( A X - B \right), \quad A \text{ est une matrice symétrique donc } A^\top = A.
$$
$$
Y^\top A Y = X^\top A X - X^\top B - B^\top (A^{-1} A )X + B^\top A^{-1} B
$$
$$
Y^\top A Y = X^\top A X - X^\top B - B^\top X + B^\top A^{-1} B
$$
$$
Y^\top A Y = X^\top A X - B^\top X - B^\top X + B^\top A^{-1} B, \quad \quad X^\top B = B^\top X = b_1 x_1 + \dots + b_n x_n
$$
$$
Y^\top A Y = X^\top A X - 2 B^\top X + B^\top A^{-1} B
$$
$$
Y^\top A Y = g(X)
$$
Donc $g(X) \geq 0$, donc l'inégalité $(I)$ est vraie.
Conclusion : $f$ possède un minimum $m = -B^\top A^{-1} B$ qui est atteint en $X_0 = A^{-1} B$.