Сегодня будем учиться решать системы с вырожденными, а то и вовсе не квадратными матрицами коэффициентов. Но для этого понадобится ввести ещё одну характеристику матрицы.
Ранг матрицы
Зафиксируем в матрице $A=\left\{ a_{ij}\right\} $ ($i=1\dots m$, $j=1\dots n$) $p$ произвольно выбранных строк и $p$ произвольно выбранных столбцов матрицы. Из элементов, стоящих на пересечении выбранных строк и столбцов, построим квадратную матрицу $p$-го порядка $A_{p}$. Детерминант матрицы $A_{p}$ называется минором $p$-го порядка матрицы $A$.
Число $r$ называется рангом матрицы $A$ ($\mathrm{rk}\,A$), если у нас имеется хотя бы один минор $r$-го порядка, отличный от нуля, а все миноры $\left(r+1\right)$-го порядка (следовательно, и $\left(r+2\right)$-го и т.д.) равны нулю. Всякий отличный от нуля минор $r$-го порядка в таком случае называется базисным, а соответствующие столбцы и строки матрицы $A$ называются базисными столбцами и строками. Можно дать еще одно эквивалентное определение ранга матрицы: рангом матрицы называется максимальное число линейно независимых столбцов (строк) этой матрицы. Если базисного минора у матрицы нет (матрица нулевая), то её ранг равен нулю.
Стандартный прием нахождения ранга матрицы заключается в приведении этой матрицы к треугольному виду с помощью элементарных преобразований, не меняющих ранга матрицы. Число не равных нулю элементов, расположенных по главной диагонали, дает ранг матрицы.
Ранг матрицы не изменится, если (такие преобразования матриц называются элементарными):
- переставить местами столбцы (строки);
- умножить столбец (строку) на число, отличное от нуля;
- прибавить к столбцу (строке) другой столбец (строку), умноженный на некоторый общий множитель.
При помощи элементарных преобразований можно привести матрицу к виду, в котором её ранг становится очевиден.
Пример: найти ранг матрицы \[ \mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 3 & -4 & 0\\ -2 & 3 & -1 & 2\\ 1 & 12 & -13 & 2 \end{array}\right)= \] Приводим матрицу к треугольному виду (справа от матрицы поясняются действия, сохраняющие ранг) \[ =\left(\begin{array}{rrrr} 1 & 3 & -4 & 0\\ -2 & 3 & -1 & 2\\ 1 & 12 & -13 & 2 \end{array}\right)\begin{array}{l} \cdot2\\ \leftarrow\\ \\\end{array}=\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 3 & -4 & 0\\ 0 & 9 & -9 & 2\\ 1 & 12 & -13 & 2 \end{array}\right)\begin{array}{l} \cdot(-1)\\ \\\leftarrow \end{array}=\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 3 & -4 & 0\\ 0 & 9 & -9 & 2\\ 0 & 9 & -9 & 2 \end{array}\right)\begin{array}{l} \\\cdot(-1)\\ \leftarrow \end{array}=\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 3 & -4 & 0\\ 0 & 9 & -9 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)= \] умножим первый столбец на -3 и добавим ко второму; потом на 4 и добавим к третьему: \[ =\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 0 & -4 & 0\\ 0 & 9 & -9 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)=\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 0 & 0 & 0\\ 0 & 9 & -9 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)= \] разделим второй столбец на 9, третий – на -9: \[ =\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 0 & 0 & 0\\ 0 & 1 & -9 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)=\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 0 & 0 & 0\\ 0 & 1 & 1 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)= \] умножим второй столбец на -1 и добавим к третьему; потом на -2 и добавим к четвёртому: \[ =\mathrm{rk}\,\left(\begin{array}{rrrr} 1 & 0 & 0 & 0\\ 0 & 1 & 0 & 2\\ 0 & 0 & 0 & 0 \end{array}\right)=\mathrm{rk}\,\left(\begin{array}{c} \boxed{\begin{array}{cc} 1 & 0\\ 0 & 1 \end{array}}\begin{array}{cc} 0 & 0\\ 0 & 0 \end{array}\\ \begin{array}{cc} 0 & 0\end{array}\begin{array}{cc} \,0 & 0\end{array} \end{array}\right)=2 \] Базисный минор взят в рамку, его размер равен 2, значит, и ранг таков же.
Задание: найти ранг матриц \[ \left(\begin{array}{cc} 0 & 0\\ 0 & 0 \end{array}\right),\qquad\left(\begin{array}{cc} 1 & -1\\ 2 & -2 \end{array}\right),\qquad\left(\begin{array}{cc} 1 & 0\\ 0 & 1 \end{array}\right),\qquad\left(\begin{array}{cc} 0 & 1\\ 0 & 0 \end{array}\right),\qquad\left(\begin{array}{ccc} 1 & 1 & 1\\ 2 & 2 & 3\\ 3 & 3 & 4 \end{array}\right),\qquad\left(\begin{array}{ccccc} 2 & 1 & 1 & 1 & 1\\ 2 & 1 & 1 & 2 & 3\\ 4 & 2 & 2 & 3 & 4\\ 2 & 1 & 1 & 1 & 1 \end{array}\right), \] \[ \left(\begin{array}{rrrrr} 2 & -1 & 3 & -2 & 4\\ 4 & -2 & 5 & 1 & 7\\ 2 & -1 & 1 & 8 & 2 \end{array}\right),\qquad\left(\begin{array}{rrrrr} 4 & 3 & -5 & 2 & 3\\ 8 & 6 & -7 & 4 & 2\\ 4 & 3 & -8 & 2 & 7\\ 4 & 3 & 1 & 2 & -5\\ 8 & 6 & -1 & 4 & -6 \end{array}\right). \]
Метод Гаусса для систем уравнений
Системы линейных уравнений \[ \left\{ \begin{array}{c} a_{11}x_{1}+\dots+a_{1n}x_{n}=b_{1},\\ \cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\cdots\\ a_{m1}x_{1}+\dots+a_{mn}x_{n}=b_{m}, \end{array}\right. \] определялись в прошлый раз и решались в специальных случаях. Сегодня рассмотрим общий случай.
В матричном виде система линейных уравнений записывалась так: \[ AX=B. \] Матрицу $A$ назовём матрицей системы, а её же, но дополненную столбцом $B$ – расширенной матрицей системы. Расширенная матрица полностью описывает систему: если сложить переменные, умноженные на все её элементы, кроме крайне правых, и приравнять крайне правым, получится опять исходная система.
Теорема Кронекера-Капелли. Для того, чтобы неоднородная система линейных уравнений была совместна (имела решения), необходимо и достаточно, чтобы ранг матрицы системы и ранг расширенной матрицы совпадали.
Обозначим буквой $r\equiv\mathrm{rk}\,A=\mathrm{rk}\,B$ – ранг матрицы системы, равный рангу расширенной матрицы; $n$ – число неизвестных в системе.
Общим решением называется набор функций $\Phi_{1}\left(a;b;c_{1},\dots,c_{q}\right),\dots,\Phi_{n}\left(a;b;c_{1},\dots,c_{q}\right)$, зависящих от коэффициентов системы, свободных членов и $q=n-r$ числовых параметров, удовлетворяющий двум условиям:
- подстановка $\Phi_{1},\dots,\Phi_{n}$ в систему вместо $x_{1},\dots,x_{n}$ обращает уравнения в тождества;
- любое решение системы может быть получено из этого набора путем фиксирования определённых значений параметров $c_{1},\dots,c_{q}$.
Уравнения в системе можно умножать на общие множители, складывать между собой и менять местами. При этом с матрицей системы будут происходить элементарные преобразования (в смысле, определённом выше), но только со строками (не со столбцами). Метод Гаусса нахождения общего решения состоит, если его объяснять коротко, в приведении матрицы системы в ступенчатый вид при помощи таких элементарных преобразований. В ступенчатом виде некоторые переменные присутствуют только в одном уравнении и их можно выразить через остальные переменные.
Для тех, кто нуждается в долгом и подробном объяснении, метод Гаусса заключается в следующем.
Пусть $a_{i_{1}j_{1}}$ – ненулевой элемент $j_{1}$-го столбца. Переставим $i_{1}$-ю строку на первое место и разделим её на $a_{i_{1}j_{1}}$. Обозначим элементы преобразованной матрицы через $a_{ij}^{\prime}$. Мы имеем $a_{1j_{1}}^{\prime}=1$. Элементарными преобразованиями строк обратим в нуль все остальные элементы $j_{1}$-го столбца. Для этого надо из каждой строки с (новым) номером $k\neq1$ вычесть первую строку, умноженную на $a_{kj_{1}}^{\prime}$. После этого преобразования наша матрица примет вид \[ A_{1}=\left(\left.\begin{array}{cccc} 0 & \dots & 0 & 1\\ 0 & & 0 & 0\\ . & . & . & .\\ 0 & \dots & 0 & 0 \end{array}\right|\quad U_{1}\quad\right). \]
Здесь $U_{1}$ – матрица размеров $m\times\left(n-j_{1}\right)$. Может оказаться, что последние $m-1$ строк матрицы $A_{1}$ – нулевые. Тогда преобразования закончены. В противном случае пусть $j_{2}$ - номер самого левого столбца, содержащего ненулевой элемент в одной из последних $m-1$ строк. Переставим строки так, чтобы строка с этим ненулевым элементом стала второй, и разделим ее на этот элемент.
Обозначим элементы преобразованной матрицы через $a_{ij}^{\prime\prime}$. Тогда $a_{2j_{2}}^{\prime\prime}=1$
Элементарными преобразованиями строк обратим в нуль все остальные элементы $j_{2}$-го столбца. Для этого из каждой строки с номером $k\neq2$ надо вычесть вторую строку, умноженную на $a_{kj_{2}}^{\prime\prime}$. При этом первые $j_{1}$ столбцов матрицы $A_{1}$ не изменятся, так как вторая строка в этих столбцах имеет нули. Матрица примет вид \[ A_{2}=\left(\left.\begin{array}{ccc} 0 & \dots & 0\\ 0 & \dots & 0\\ . & . & .\\ 0 & \dots & 0 \end{array} \begin{array}{c} 1\\ 0\\ .\\ 0\\ \end{array} \begin{array}{ccc} * & \dots & *\\ 0 & \dots & 0\\ . & . & .\\ 0 & \dots & 0 \end{array} \begin{array}{c} 0\\ 1\\ .\\ 0\\ \end{array} \right|\quad U_{2}\quad\right). \] Здесь $U_{2}$ – матрица размеров $m\times\left(n-j_{1}-j_{2}\right)$; звездочками обозначены элементы, о которых мы ничего не можем сказать. Если в последних $m-2$ строках есть ненулевые элементы, то мы проделываем такое же преобразование, превращая столбец с номером $j_{2}$, в столбец, состоящий из нулей, за исключением единицы на третьем месте. Левее этого столбца в последних $m-2$ строках – только нулевые элементы, поэтому ранее преобразованные столбцы не изменятся. Мы можем продолжать такие преобразования до тех пор, пока не окажется, что последние $m-r$ строк очередной матрицы $A_{r}$ состоят из нулей, или не будут исчерпаны все строки.
Итак, при помощи элементарных преобразований строк каждую матрицу размеров$m\times n$ можно привести к следующему виду: некоторые $r$ столбцов сов-совпадают с первыми $r$ столбцами единичной матрицы порядка $m$. Если $r < m$, то последние $m-r$ строк состоят из нулей. Матрицы такого вида коротко назовем упрощенными.
Рассмотрим упрощенную матрицу. Её минор, расположенный в первых $r$ строках и столбцах $j_{1},\dots,j_{r}$, равен единице. Ненулевых миноров большего порядка, очевидно, нет. Следовательно, минор – базисный, а ранг упрощенной матрицы равен $r$. Если мы привели матрицу $A$ к упрощенному виду и получили упрощенную матрицу ранга $r$, это означает, что ранг исходной матрицы $A$ также был равен $r$.
Если записать систему, соответствующую матрице, то уравнения типа $0=0$ можно отбросить. В остальных первая переменная в левой части будет входить с коэффициентом 1, и не присутствовать в других уравнениях; эту переменную можно выразить, перенеся все слагаемые кроме неё в правую часть. После этих действий удастся выразить $r$ переменных через свободные остальные.
Элементарные преобразования можно производить как с матрицей системы, так и с самой системой: последнее нагляднее, но более трудоёмко.
Пример: решить систему \[ \left\{ \begin{array}{rl} 5x_{1}+3x_{2}+5x_{3}+12x_{4} & =10\\ 2x_{1}+2x_{2}+3x_{3}+5x_{4} & =4\\ x_{1}+7x_{2}+9x_{3}+4x_{4} & =2 \end{array}\right.\begin{array}{l} \cdot(-\frac{2}{5})\\ \leftarrow\\ \\\end{array} \] Составляем матрицу системы и найдём её ранг (см.выше): \[ \mathrm{rk}\,\left(\begin{array}{cccc} 5 & 3 & 5 & 12\\ 2 & 2 & 3 & 5\\ 1 & 7 & 9 & 4 \end{array}\right)=2 \] Составляем расширенную матрицу системы и найдём её ранг: \[ \mathrm{rk}\,\left(\begin{array}{ccccc} 5 & 3 & 5 & 12 & 10\\ 2 & 2 & 3 & 5 & 4\\ 1 & 7 & 9 & 4 & 2 \end{array}\right)=2 \] Ранги совпадают, система совместна, две переменные удастся выразить через другие две. Получив добрые предзнаменования, приступим к решению.
Убираем $x_{1}$: \[ \left\{ \begin{array}{rl} 5x_{1}+3x_{2}+5x_{3}+12x_{4} & =10\\ \frac{4}{5}x_{2}+x_{3}+\frac{1}{5}x_{4} & =0\\ x_{1}+7x_{2}+9x_{3}+4x_{4} & =2 \end{array}\right.\begin{array}{l} \cdot(-\frac{1}{5})\\ \\\leftarrow \end{array} \] \[ \left\{ \begin{array}{rl} 5x_{1}+3x_{2}+5x_{3}+12x_{4} & =10\\ \frac{4}{5}x_{2}+x_{3}+\frac{1}{5}x_{4} & =0\\ \frac{32}{5}x_{2}+8x_{3}+\frac{8}{5}x_{4} & =0 \end{array}\right.\begin{array}{l} \\\cdot5\\ \cdot\frac{5}{8} \end{array} \] Убираем $x_{2}$: \[ \left\{ \begin{array}{rl} 5x_{1}+3x_{2}+5x_{3}+12x_{4} & =10\\ 4x_{2}+5x_{3}+x_{4} & =0\\ 4x_{2}+5x_{3}+x_{4} & =0 \end{array}\right.\begin{array}{l} \\\cdot(-1)\\ \leftarrow \end{array} \] Обратный ход: \[ \left\{ \begin{array}{rl} 5x_{1}+3x_{2}+5x_{3}+12x_{4} & =10\\ 4x_{2}+5x_{3}+x_{4} & =0\\ 0 & =0 \end{array}\right.\begin{array}{l} \leftarrow\\ \cdot(-\frac{3}{4})\\ \\\end{array} \] \[ \left\{ \begin{array}{rl} 5x_{1}+\frac{5}{4}x_{3}+11\frac{1}{4}x_{4} & =10\\ 4x_{2}+5x_{3}+x_{4} & =0 \end{array}\right.\begin{array}{l} \cdot\frac{1}{5}\\ \cdot\frac{1}{4} \end{array} \] \[ \left\{ \begin{array}{rl} x_{1}+\frac{1}{4}x_{3}+\frac{9}{4}x_{4} & =2\\ x_{2}+\frac{5}{4}x_{3}+\frac{1}{4}x_{4} & =0 \end{array}\right. \] Отделение свободных от зависимых: \[ \left\{ \begin{array}{rl} x_{1} & =2-\frac{1}{4}x_{3}-\frac{9}{4}x_{4}\\ x_{2} & =-\frac{5}{4}x_{3}-\frac{1}{4}x_{4} \end{array}\right. \] Можно ещё переобозначить $x_{3}$ и $x_{4}$, и записать окончательное решение через параметры $c$: \[ \left\{ \begin{array}{rl} x_{1} & =2-\frac{1}{4}c_{1}-\frac{9}{4}c_{2},\\ x_{2} & =-\frac{5}{4}c_{1}-\frac{1}{4}c_{2},\\ x_{3} & =c_{1},\\ x_{4} & =c_{2}. \end{array}\right. \]
Задание: исследовать на совместность и найти (если есть) общее решение \[ \left\{ \begin{array}{r} 2x+7y+3z+t=6\\ 3x+5y+2z+2t=4\\ 9x+4y+z+7t=2 \end{array}\right. \] \[ \left\{ \begin{array}{r} 3x-5y+2z+4t=2\\ 7x-4y+z+3t=5\\ 5x+7y-4z-6t=3 \end{array}\right. \] \[ \left\{ \begin{array}{rr} 2x+5y-8z= & 8\\ 4x+3y-9z= & 9\\ 2x+3y-5z= & 7\\ x+8y-7z= & 12 \end{array}\right. \] \[ \left\{ \begin{array}{lr} 2x-y+z+2p+3q & =2\\ 6x-3y+2z+4p+5q & =3\\ 6x-3y+4z+8p+13q & =9\\ 4x-2y+z+p+2q & =1 \end{array}\right. \]
