一:矩阵QR分解
矩阵的QR分解目的是将一个列满秩矩阵\(A\)分解成\(A=QR\)的形式,我们这里暂时讨论\(A\)为方阵的情况。其中\(Q\)为正交矩阵;\(R\)为正线(主对角线元素为正)上三角矩阵,且分解是唯一的。
比如\(A= \begin{bmatrix} 1 & 2 & 2 \\ 2 & 1 & 2 \\ 1 & 2 & 1 \\ \end{bmatrix}\),我们最终要分解成如下形式:
现在主要的问题是如何由矩阵\(A\)计算得到矩阵\(Q\)和\(R\)呢?我们将在下面讨论。
1.1 QR分解原理
在线性代数或矩阵理论中,我们肯定都学过斯密特正交化(Gram-Schmidt Orthogonalization),正交化过程即将欧氏空间的任一基化为标准正交基,构造出的标准正交基正好构成了我们想要的\(Q\)矩阵,而\(R\)矩阵由正交化过程的公式倒推即可得到。
首先假设初始方阵为\(A\),\(\vec{x_i}\)、\(\vec{y_i}\)、\(\vec{z_i}\)都为列向量。我们学过斯密特正交化的步骤如下:
再具体一点(为了好写,之后的\(\vec{x_i}\)、\(\vec{y_i}\)、\(\vec{z_i}\)都不加箭头了,默认为列向量):
由上述公式写出计算\(Q\)和\(R\)的伪代码为:
注:\(A_{:k}\)表示\(A\)的第\(k\)列向量。
可以看出其实矩阵的QR分解的步骤并不多,就是不断地循环进行\(A\)的正交化、标准化、求\(Q\)、求\(R\)这几步。
二:矩阵QR分解的MATLAB实现
clc, clear all, close all
% 矩阵的QR分解
A = [1 2 2;2 1 2;1 2 1] % 考虑非奇异方阵
[m,n] = size(A);
Q = zeros(n,n);
X = zeros(n,1);
R = zeros(n);
for k = 1 : n
R(k,k) = norm(A(:,k)); % 计算R的对角线元素
Q(:,k) = A(:,k) / R(k,k); % A已正交化,现在做标准化,得到正交矩阵Q
for i = k + 1 : n
R(k,i) = A(:,i)\' * Q(:,k); % 计算R的上三角部分
A(:,i) = A(:,i) - R(k,i) .* Q(:,k); % 更新矩阵A,斯密特正交公式
end
end
Q
R
三:矩阵QR分解的C++实现
#include <iostream>
#include <vector>
using namespace std;
int main() /* 矩阵A的QR分解*/
{
vector<vector<double>> a = { {1,2,2},{2,1,2},{1,2,1} };
int n = a.size();
vector<vector<double>> q(n, vector<double>(n));
vector<vector<double>> r(n, vector<double>(n));
cout << "A:" << endl; //输出矩阵A
for (int i = 0; i < n; i++)
{
for (int j = 0; j < n; j++)
{
printf("%.4f ", a[i][j]);
}
cout << endl;
}
for (int k = 0; k < n; k++)
{
double MOD = 0;
for (int i = 0; i < n; i++)
{
MOD += a[i][k] * a[i][k];
}
r[k][k] = sqrt(MOD); // 计算A第k列的模长,由公式(4)等于R的对角线元素||A:k||
for (int i = 0; i < n; i++)
{
q[i][k] = a[i][k] / r[k][k]; // 由公式(2),A第k列标准化之后成为Q的第k列
}
for (int i = k + 1; i < n; i++)
{
for (int j = 0; j < n; j++)
{
r[k][i] += a[j][i] * q[j][k]; // 由公式(4),计算R的上三角部分
}
for (int j = 0; j < n; j++)
{
a[j][i] -= r[k][i] * q[j][k]; // 由公式(1),计算更新A的每一列
}
}
}
cout << endl;
cout << "Q:" << endl; //输出矩阵Q
for (int i = 0; i < n; i++)
{
for (int j = 0; j < n; j++)
{
printf("%.4f ", q[i][j]);
}
cout << endl;
}
cout << endl;
cout << "R:" << endl; //输出矩阵R
for (int i = 0; i < n; i++)
{
for (int j = 0; j < n; j++)
{
printf("%.4f ", r[i][j]);
}
cout << endl;
}
return 0;
}
四:结果对比
由下图可以看到,由MATLAB和C++计算出的\(Q\)和\(R\)矩阵完全相同。
请发表评论