Преобразование матрицы линейного оператора при смене базиса

Обновлено: 21.11.2024

Напомним, что мы можем связать матрицу \(A\in \mathbb^\) с каждым оператором \(T\in\mathcal(V,V)\). Точнее, столбец \(j^>\) матрицы \(A=M(T)\) относительно базиса \(e=(e_1,\ldots,e_n)\) получается путем разложения \( Te_j\) по базису \(e\). Если базис \(e\) ортонормирован, то коэффициент \(e_i\) является просто скалярным произведением вектора с \(e_i\).
Следовательно,

\begin
M(T) = (\inner)_<1\le i,j\le n>,
\end
где \(i\) — строка index, а \(j\) — индекс столбца матрицы.

Наоборот, если \(A\in\mathbb^\) является матрицей, то мы можем связать линейный оператор \(T\in\mathcal(V,V)\) с \(A\), установив < br />\begin
\begin
Tv &= \sum_^n \inner Te_j
= \sum_^n \sum_^n \inner \inner e_i\\
& = \sum_^n \left( \sum_^n a_ \inner \right) e_i
= \sum_ (A [v]_e)_i e_i,
\end
\end

где \((A[v]_e)_i\) обозначает компонент \(i^>\) вектора-столбца \(A [v]_e\). С этой конструкцией мы имеем \(M(T)=A\).
Коэффициенты \(Tv\) в базисе \((e_1,\ldots,e_n)\) записываются вектор-столбцом, полученным путем умножения \(n\times n\) матрицы \(A\ ) с вектором-столбцом \(n\times 1\) \([v]_e\), компоненты которого \(([v]_e)_j=\inner\).

Пример 10.2.1. Дано

мы можем определить \(T\in \mathcal(V,V)\) относительно канонического базиса следующим образом:

Предположим, что мы хотим использовать другой ортонормированный базис \(f=(f_1,\ldots,f_n)\) для \(V\). Тогда, как и раньше, имеем \(v = \sum_^n \inner f_i.\). Сравнивая это с \(v = \sum_^n \inner e_j\), мы находим, что

Столбец \(j^>\) массива \(S\) задается коэффициентами разложения \(e_j\) по базису \(f=(f_1,\ldots,f_n)\ ). Матрица \(S\) описывает линейное отображение в \(\mathcal(\mathbb^n)\), которое называется преобразованием замены базиса.

Мы также можем поменять местами основания \(e\) и \(f\). В этом случае мы получаем
матрицу \(R=(r_)_^n\), где
\begin
r_ = \inner.
\конец

Тогда в силу единственности разложения по базису получаем
\begin
[v]_e = R[v]_f
\end
так что < br />\begin
RS[v]_e = [v]_e, \qquad \text
\end

Поскольку это уравнение верно для всех \([v]_e\in \mathbb^n\), отсюда следует, что либо \(RS=I\), либо \(R=S^\). В частности, \(S\) и \(R\) обратимы. Мы также можем проверить это явно, используя свойства ортонормированных базисов. А именно,
\begin
\begin
(RS)_ &= \sum_^n r_ s_ = \sum_^n \inner\inner\\
&= \sum_^ n \inner \overline<\inner>
= \inner_<\mathbb^n> = \delta_.
\конец
\конец

Матрица \(S\) (а также \(R\)) обладает интересным свойством: ее столбцы ортонормированы друг к другу. Это следует из того, что столбцы являются координатами ортонормированных векторов относительно другого ортонормированного базиса. Аналогичное утверждение верно для строк \(S\) (а также \(R\)).

До сих пор мы обсуждали только то, как изменяется координатный вектор данного вектора \(v\in V\) при замене базиса с \(e\) на \(f\). Следующий вопрос, который мы можем задать, состоит в том, как изменится матрица \(M(T)\) оператора \(T\in \mathcal(V)\), если мы изменим базис. Пусть \(A\) будет матрицей \(T\) относительно базиса \(e=(e_1,\ldots,e_n)\), а \(B\) будет матрицей для \(T\ ) относительно базиса \(f=(f_1,\ldots,f_n)\). Как мы определяем \(B\) из \(A\)? Обратите внимание, что

Пример 10.2.3. Продолжая пример 10.2.2, пусть
\begin
A = \begin 1 & 1 \\ 1 & 1 \end
\end
— матрица линейного оператора относительно в базис \(e\). Тогда матрица \(B\) относительно базиса \(f\) задается формулой
\begin
B = SAS^ = \frac \begin 1 & 1\\ -1 & 1 \ end
\begin 1 & 1\\ 1 & 1 \end
\begin 1 & -1\\ 1 & 1 \end
= \frac \begin 1 & 1\\ -1 & 1 \end
\begin 2 & 0\\ 2 & 0 \end
= \begin 2 & 0\\ 0 & 0 \end.
\конец

Соавторы

Вклады и атрибуции

Эта страница находится под недекларированной лицензией, авторами, ремиксами и/или кураторами которой являются Исайя Лэнкхем, Бруно Нахтергаэле и Энн Шиллинг. Подробная история версий изменений исходного контента доступна по запросу.

Напомним, что мы можем связать матрицу \(A\in \mathbb^\) с каждым оператором \(T\in\mathcal(V,V)\). Точнее, столбец \(j^>\) матрицы \(A=M(T)\) относительно базиса \(e=(e_1,\ldots,e_n)\) получается путем разложения \( Te_j\) по базису \(e\). Если базис \(e\) ортонормирован, то коэффициент \(e_i\) является просто скалярным произведением вектора с \(e_i\).
Следовательно,

\begin
M(T) = (\inner)_<1\le i,j\le n>,
\end
где \(i\) — строка index, а \(j\) — индекс столбца матрицы.

Наоборот, если \(A\in\mathbb^\) является матрицей, то мы можем связать линейный оператор \(T\in\mathcal(V,V)\) с \(A\), установив < br />\begin
\begin
Tv &= \sum_^n \inner Te_j
= \sum_^n \sum_^n \inner \inner e_i\\
& = \sum_^n \left( \sum_^n a_ \inner \right) e_i
= \sum_ (A [v]_e)_i e_i,
\end
\end

где \((A[v]_e)_i\) обозначает компонент \(i^>\) вектора-столбца \(A [v]_e\). С этой конструкцией мы имеем \(M(T)=A\).
Коэффициенты \(Tv\) в базисе \((e_1,\ldots,e_n)\) записываются вектор-столбцом, полученным путем умножения \(n\times n\) матрицы \(A\ ) с вектором-столбцом \(n\times 1\) \([v]_e\), компоненты которого \(([v]_e)_j=\inner\).

Пример 10.2.1. Дано

мы можем определить \(T\in \mathcal(V,V)\) относительно канонического базиса следующим образом:

Предположим, что мы хотим использовать другой ортонормированный базис \(f=(f_1,\ldots,f_n)\) для \(V\). Тогда, как и раньше, имеем \(v = \sum_^n \inner f_i.\). Сравнивая это с \(v = \sum_^n \inner e_j\), мы находим, что

Столбец \(j^>\) массива \(S\) задается коэффициентами разложения \(e_j\) по базису \(f=(f_1,\ldots,f_n)\ ). Матрица \(S\) описывает линейное отображение в \(\mathcal(\mathbb^n)\), которое называется преобразованием замены базиса.

Мы также можем поменять местами основания \(e\) и \(f\). В этом случае мы получаем
матрицу \(R=(r_)_^n\), где
\begin
r_ = \inner.
\конец

Тогда в силу единственности разложения по базису получаем
\begin
[v]_e = R[v]_f
\end
так что < br />\begin
RS[v]_e = [v]_e, \qquad \text
\end

Поскольку это уравнение верно для всех \([v]_e\in \mathbb^n\), отсюда следует, что либо \(RS=I\), либо \(R=S^\). В частности, \(S\) и \(R\) обратимы. Мы также можем проверить это явно, используя свойства ортонормированных базисов. А именно,
\begin
\begin
(RS)_ &= \sum_^n r_ s_ = \sum_^n \inner\inner\\
&= \sum_^ n \inner \overline<\inner>
= \inner_<\mathbb^n> = \delta_.
\конец
\конец

Матрица \(S\) (а также \(R\)) обладает интересным свойством: ее столбцы ортонормированы друг к другу. Это следует из того, что столбцы являются координатами ортонормированных векторов относительно другого ортонормированного базиса. Аналогичное утверждение верно для строк \(S\) (а также \(R\)).

До сих пор мы обсуждали только то, как изменяется координатный вектор данного вектора \(v\in V\) при замене базиса с \(e\) на \(f\). Следующий вопрос, который мы можем задать, состоит в том, как изменится матрица \(M(T)\) оператора \(T\in \mathcal(V)\), если мы изменим базис. Пусть \(A\) будет матрицей \(T\) относительно базиса \(e=(e_1,\ldots,e_n)\), а \(B\) будет матрицей для \(T\ ) относительно базиса \(f=(f_1,\ldots,f_n)\). Как мы определяем \(B\) из \(A\)? Обратите внимание, что

Пример 10.2.3. Продолжая пример 10.2.2, пусть
\begin
A = \begin 1 & 1 \\ 1 & 1 \end
\end
— матрица линейного оператора относительно в базис \(e\). Тогда матрица \(B\) относительно базиса \(f\) задается формулой
\begin
B = SAS^ = \frac \begin 1 & 1\\ -1 & 1 \ end
\begin 1 & 1\\ 1 & 1 \end
\begin 1 & -1\\ 1 & 1 \end
= \frac \begin 1 & 1\\ -1 & 1 \end
\begin 2 & 0\\ 2 & 0 \end
= \begin 2 & 0\\ 0 & 0 \end.
\конец

Соавторы

Вклады и атрибуции

Эта страница находится под недекларированной лицензией, авторами, ремиксами и/или кураторами которой являются Исайя Лэнкхем, Бруно Нахтергаэле и Энн Шиллинг. Подробная история версий изменений исходного контента доступна по запросу.

поэтому у меня большие трудности со сменой базы. Смотрел кучу уроков на ютубе, но они только больше меня запутали.

Пусть $T: \mathbb \to \mathbb$ определяется как $T(a,b) = (a + 2b, 3a - b)$ . Пусть $\mathcal = \$ и $\mathcal = > \$ . Найдите $[T]_\mathcal$ и $[T]_\mathcal$ и покажите, что $[T]_\mathcal = Q^ \cdot [T]_\mathcal\cdot Q$ для некоторой обратимой матрицы $Q$ .

Итак, я подумал, а матрица $Q$ может быть матрицей, которая переходит от базиса $c$ к $b$? а затем, если я инвертирую это, я получаю матрицу $ Q ^ $? Я просто понятия не имею, с чего начать, например, с какой первой матрицей мне нужно работать?

Начать ли с базиса в $R^2$, то есть $\$, и применить к нему преобразование?

1 Ответ 1

Посмотрите здесь

В вашем случае вы знаете матрицу канонического базиса:

И два других основания:

и нужно найти матрицы $T_$ и $T_$ относительно этих двух базисов.

Для этого вы можете следовать предыдущему примеру.

Давайте посмотрим, например, как узнать $T_B$.

Пусть $w$ представляет собой любой вектор, заданный в каноническом базисе, и обозначим через: $v_1=(1,1)$ и $v_2=(1,0)$ два вектора базиса $\mathcal$, а также дано относительно канонической основы.

Мы ищем коэффициенты $x_1$ и $x_2$ такие, что:

$$w=x_1\cdot v_1+x_2\cdot v_2$$

или в матричной форме:

Обратите внимание, что $V$ содержит в качестве столбца векторы нового базиса относительно канонического базиса. Важно отметить, что $V$ представляют собой матрицу изменения базиса с $\mathcal$ на канонический.

Таким образом, компоненты любого вектора $w$ относительно нового базиса задаются следующим образом:

Таким образом, $V^$ представляют собой матрицу смены базиса с канонического на новый базис $\mathcal$ .

Отображение $w$ относительно канонического базиса определяется следующим образом:

Поскольку мы ищем матрицу $T_B$, представляющую $T$ относительно нового базиса $\mathcal$, давайте подставим замену базиса:

$$u=T_A\cdot w \iff V \cdot y=T_A\cdot V \cdot x \iff y=V^T_A\cdot V \cdot x=T_B\cdot x$$

Таким образом, матрица:

$$T_B=V^\cdot T_A\cdot V$$

представляет преобразование относительно нового базиса $\mathcal $.

Для $T_C$ можно действовать таким же образом, находя: $$T_C=W^\cdot T_A\cdot W$$ Теперь, поскольку $$T_B=V^ \cdot T_A\cdot V \подразумевает T_A=V \ cdot T_B\cdot V^$$ вы заключаете $$T_C=W^ \cdot T_A\cdot W=W^ \cdot V \cdot T_B\cdot V^\cdot W$$

В линейной алгебре есть два связанных понятия, которые на первый взгляд могут показаться запутанными: замена базиса и линейное преобразование. Формула изменения базиса связывает координаты одного и того же вектора в двух разных базисах, тогда как линейное преобразование связывает координаты двух разных векторов в одном базисе. Трудность различения этих двух случаев связана с тем, что слово вектор часто ошибочно используется для обозначения координат вектора. Вообще говоря, $\newcommand <\mathbf>\vec \neq (x_1, x_2)^T$, если не понята определенная основа.

Изменение основы

Давайте рассмотрим конкретный пример. Пусть $(\vec_1, \vec_2)$ — ортонормированный базис в $\mathbb^2$. Представьте, что мы делаем его копию $(\vec_1, \vec_2)$ и поворачиваем копию на $\theta$ градусов.

Поворот базисных векторов на угол $\theta$.

Без ограничения общности мы можем отождествить начальные базисные векторы с стандартными единичными векторами $\mathbb^2$:

Теперь векторы $\vec_1$ и $\vec_2$ можно легко представить в базисе $(\vec_1, \vec_2)$ в виде

Более компактно пишется

Матрица вращения в правой части связывает базы $(\vec_1, \vec_2)$ и $(\vec_1, \vec_2)$. В общем случае смена базиса в $\mathbb^2$ описывается формулой

где $(\vec_1, \vec_2)$ — старый базис, $(\vec_1, \vec_2)$ — новый базис, а матрица $(\vec \to \vec)$ задает связь между ними.

Изменение координат вектора

Вектор — это объект, который существует независимо от базиса. Хотя в технике и математике принято писать $\vec = (x_1, x_2)^T$, следует помнить, что это обозначение подразумевает определенный выбор базиса; а именно, это означает, что выбран стандартный базис $\mathbb^2$. То есть

Разложение вектора $\vec$ по двум основаниям.

Рассмотрим координаты $\vec$ в базисе $(\vec_1, \vec_2)$. Аналогично \eqref,

Приравнивая разложения $\vec$ к \eqref и \eqref и подставляя \eqref вместо $(\vec_1, \vec_2)$, получаем

С обеих сторон у нас есть расширения $\vec$ по базису $(\vec_1, \vec_2)$, поэтому координаты с обеих сторон должны быть равны. Таким образом, мы приходим к формуле изменения координат вектора при замене базиса

координаты $\vec$ в старом базисе $\vec^\vec = (x_1, x_2)^T$, а координаты $\vec$ в новом базисе $\vec^\vec = (x '_1, х'_2)^T$.

Линейное преобразование

В отличие от предыдущего раздела, теперь мы фиксируем базис $(\vec_1, \vec_2)$ и представляем все векторы в этом базисе. Вопрос, на который мы хотим ответить, звучит так: «Как представить линейное преобразование $\newcommand<\boldsymbol<\phi>> \bphi : \mathbb^2 \to \mathbb^2$ с помощью матрицы?»

Вектор $\vec$ повернут на угол $\theta$.

Применим $\bphi$ к некоторому вектору $\vec$:

Раскладывая $\vec$ по базису $(\vec_1, \vec_2)$ и переписывая правую часть как умножение матрицы на вектор, мы получаем

Теперь мы приближаемся к точке, где возникает путаница. Предположим, что $\bphi$ поворачивает каждый вектор на $\theta$. Тогда матричное представление $\bphi$ — это в точности та матрица $(\vec \to \vec)$, которая была у нас раньше. Поэтому

где мы отождествляем векторы с их координатами в стандартном базисе, как это принято в естественных науках (т. е. $\vec = \vec^\vec$ и $\vec = \vec^\vec$).

Сравните формулы \eqref и \eqref. Они выглядят очень похожими, так как оба связывают два вектора-столбца через одну и ту же матрицу. Однако между ними есть большая разница. Уравнение \eqref выражает координаты $\vec$ в старой системе отсчета при заданных его координатах в новой, тогда как уравнение \eqref выражает координаты преобразованного вектора $\vec$ при заданных координатах непреобразованного вектора $\vec$ — все в одной системе отсчета. Мы также можем инвертировать \eqref, чтобы всегда иметь новые координаты в левой части, $\vec^\vec = (\vec \to \vec)^ \vec^\vec$. В этой форме становится понятным смысл разницы между \eqref и \eqref.

Поворот базиса на угол $\theta$ эквивалентен повороту всех векторов на угол $-\theta$. То есть можно либо преобразовать базис, либо выполнить обратное преобразование всех векторов — конечный результат будет одинаковым.

Лучшая стратегия, позволяющая избежать ошибок, – выбрать один из двух вариантов – либо преобразование баз, либо преобразование векторов – и придерживаться его.

Как трансформация трансформируется

Давайте посмотрим, как трансформируются линейные преобразования при изменении базиса. Обозначения в этом разделе немного отличаются от остальной части статьи; а именно, мы используем штрихованные символы для обозначения объектов, связанных с новым базисом.

Рассмотрите преобразование базиса $\vec = \vec’ \vec^$, где $\vec$ — старый базис, а $\vec’$ — новый базис. Затем

Читайте также: