行列式

出典: フリー百科事典『ウィキペディア(Wikipedia)』
移動先: 案内検索

テンプレート:Sister

ファイル:Determinant parallelepiped.svg
この平行六面体体積ベクトル r1, r2, and r3 の成す 3 × 3 行列の行列式の絶対値に一致する。

数学における行列式(ぎょうれつしき、テンプレート:Lang-en-short)とは、正方行列に対して定義される量で、歴史的には行列が表す一次方程式の可解性を判定する指標として導入された。幾何的には線型空間上の自己準同型に対して定義され、線型変換によって空間の体積要素が何倍に変わるかという概念を抽象化したものと見なすことができる。行列の可逆性を判定する指標として線型代数学における最も重要な指標の一つと見なされている。

概要

X を成分が実数である2次の正方行列

<math>X = \begin{pmatrix} a & b \\ c & d \end{pmatrix}</math>

とするとき、これは

<math> \begin{pmatrix} x \\ y \end{pmatrix} \mapsto \begin{pmatrix} ax + by \\ cx + dy \end{pmatrix}</math>

という平面上の線型変換を定めている。一方で平面における二つのベクトル u = (u0, u1), v = (v0, v1) について、これらが張る平行四辺形の「向きも込めた」面積は

A(u, v) = u0v1u1v0

によって指定される数だと考えることができる。このとき A(X.u, X.v) = (adbc)A(u, v) が成り立っているが、これは X の定める線型変換によって平面内の図形の面積が (adbc) 倍される、と解釈できる。

したがって各2次正方行列 X に対し(上の記号の下で)det X = adbc を対応させると、det(XY) = (det X)(det Y) であることや、det X > 0 であるとき X の定める変換は図形の向きを保ち、反対に det X < 0 であるとき図形の向きは反転させられることがわかる。det の乗法性から X が可逆ならば det X は逆数を持つ数であることが従うが、反対に X が退化した行列であるとき、つまり X の定める変換の像が1次元の部分空間になる場合にはすべての図形の変換後の面積が 0 になることから det X = 0 となることがいえる。こうして行列 X が正則になることと X の行列式が可逆になることが同値であるということがわかる。

同様にして一般の次数の正方行列 X に対し、X の定める線型変換が図形の体積を何倍にしているかという量を X の行列式として定義することができる。これは行列の成分を変数とする多項式の形でかけ、2次の場合と同様にこれは正則性など正方行列の重要な性質に対する指標を与えている。一次方程式系が与えられるとき、方程式の係数行列に対してその行列式の値を調べることにより、方程式系の根の状態をある程度知ることができる。特にクラメルの公式により、が一意に決まるような線型方程式系の公式が行列式を用いて表示される。

定義

抽象的な定義

A可換環とし、E を階数 nA 上の自由加群とする。En 次外冪 n EA 上の一次元自由加群である。E 上の A-線型写像 φ について、nE 上に引き起こされる A-準同型 n(φ) は一意的に定まるある aA に関する定数倍写像と一致するが、この a は φ の行列式 det φ と呼ばれる。

明示的な定義

n 次正方行列 Xij 列成分を xij で表せば、X の行列式とは、

<math>\sum_{\sigma \in \mathfrak{S}_n}

\sgn(\sigma) x_{\sigma(1)1} x_{\sigma(2)2} \cdots x_{\sigma(n)n} = \sum_{\sigma \in \mathfrak{S}_n} \sgn(\sigma) x_{1\sigma(1)} x_{2\sigma(2)} \cdots x_{n\sigma(n)} </math> で与えられるn-次の多項式n-次形式)である(ライプニッツの公式)。ただし、<math>\mathfrak{S}_n</math> は n 次の置換全体で、sgn は置換の符号と呼ばれるものである(対称群を参照)。したがって、n 次正方行列の行列式は n! 個の項を持つ。

正方行列 A の行列式は、|A| あるいは det(A) と表記される。行列の成分を明示する場合は

<math>\left|\begin{pmatrix} a & b \\ c & d \end{pmatrix}\right|</math>

を単に

<math>\begin{vmatrix} a & b \\ c & d \end{vmatrix}</math>

と書く。

二つの定義の同値性

Kn の標準的な基底を (e1, ..., en) とする。行列 X の各列を表す縦ベクトル v1, ..., vn とすると、vjとは Xej にほかならない。

<math>\left({\bigwedge\nolimits\!}^n X\right)(e_1 \wedge \cdots \wedge e_n) = v_1 \wedge \cdots \wedge v_n</math>

であるが、ここで

<math>v_1 \wedge \cdots \wedge v_n = \left(\sum_{\sigma \in \mathfrak{S}_n}

\sgn(\sigma) v_{\sigma(1)}^1 v_{\sigma(2)}^2 \cdots v_{\sigma(n)}^n\right) e_1 \wedge \cdots \wedge e_n </math> である。ただし、 vi の第 j 成分を vij と表した)。これは Kn∧</sup>nXテンプレート:Indent 倍写像として作用していることを示している。

n 次外積の普遍性により、行列式とは行列の各行の縦ベクトルに関する n 重交代線型写像で単位行列について 1 を与えるようなものとして特徴づけられることがわかる。

複線型交代形式

n-次行列に関する行列式は列に関して n-重交代線型性をもつ。つまり、行列を (x1, x2, ..., xn) のように列ベクトルの組の形に書くことにすれば

  • <math>\det(\ldots,\mathbf{x}_{i} + \mathbf{x}'_{i},\ldots) =
 \det(\ldots,\mathbf{x}_{i},\ldots) + \det(\ldots,\mathbf{x}'_{i},\ldots)

</math>

  • <math>\det(\ldots,c\mathbf{x}_{i},\ldots) = c \cdot \det(\ldots,\mathbf{x}_{i},\ldots)</math>
  • <math>\det(\ldots,\mathbf{x}_{i},\ldots,\mathbf{x}_{j},\ldots) =
 - \det(\ldots,\mathbf{x}_{j},\ldots,\mathbf{x}_{i},\ldots)

</math> が成り立っている。例えば、線型性によって

<math>\begin{vmatrix}
 \lambda a_{11} + \mu a_{11}' & a_{12} & a_{13} \\
 \lambda a_{21} + \mu a_{21}' & a_{22} & a_{23} \\
 \lambda a_{31} + \mu a_{31}' & a_{32} & a_{33} 

\end{vmatrix} \, =\, \lambda \, \begin{vmatrix}

 a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\
 a_{31} & a_{32} & a_{33} 

\end{vmatrix} \, +\, \mu \, \begin{vmatrix}

 a_{11}' & a_{12} & a_{13} \\ a_{21}' & a_{22} & a_{23} \\
 a_{31}' & a_{32} & a_{33} 

\end{vmatrix}</math> が成立しており、さらに交代性によって

<math>\begin{vmatrix}
 a_{11} & a_{12} & a_{13} \\
 a_{21} & a_{22} & a_{23} \\
 a_{31} & a_{32} & a_{33} 

\end{vmatrix} \, =\, -\, \begin{vmatrix}

 a_{12} & a_{11} & a_{13} \\
 a_{22} & a_{21} & a_{23} \\
 a_{32} & a_{31} & a_{33} 

\end{vmatrix}</math> も成り立っている。特に、どれか二つの列が全く同一の成分を持つような行列の行列式は 0 である。

A の行列式と、A転置行列の行列式は等しい。これによって、行列式が列に関してある性質を持てば、行に関しても同様の性質を持つことが分かる。つまり、上記の性質は全て行に対するものにも書き直せる

二つの行列の積の行列式は、それぞれの行列式の積に等しい: A, Bn 次正方行列とするとき、|A||B| = |AB| である。これより特に行列式が基底の取り替えによって不変であることが従う。

歴史

西洋で行列式が考えられるようになったのは16世紀であり、これは19世紀に導入された行列そのものよりも遥かに昔に導入されていたことになる。また、数を表の形に並べたものや、現在ガウス(・ジョルダン)消去法と呼ばれているアルゴリズムは最も古くには中国の数学者たちによって考えられていたことにも注意する必要がある。

行列式に関する最初期の計算

楊輝(中国、1238年?~1298年)は『詳解九章算術』で数字係数の二元連立一次方程式の解をクラメルの公式の形で、行列式的なものを含んだ形で与えている。 また1545年にジェロラモ・カルダノは、 Ars Magna の中で同じく2×2の場合のクラメルの公式を与えている。この公式は regula de modo と呼ばれている。 彼らは「行列式」を定義したわけではないが、その概念の萌芽をみてとることができる。

高階の行列に関する行列式

高階の行列に関する行列式の定義はそれから百年ほどたって日本で和算関孝和、田中由真、そしてドイツのライプニッツによりほとんど同時にかつ独立に与えられた。

ライプニッツは数多くの線型方程式系を研究していたが、その頃は行列記法がまだなかったので、彼は未知数の係数を、現在のような ai,j のかわりに ij のように添字の対によって表現していた。1678年に彼は3つの未知数に関する3つの方程式に興味を抱き、列に関する行列式の展開式を与えている。同じ年に彼は4次の行列式についても(符号の間違いを別にすれば)正しい式を与えている。ちなみにライプニッツはこの成果を公表しなかったので、50年後に彼とは独立に再発見されるまでこの成果は人々に認識されていなかった。

同じ時期に関孝和は『解伏題之法』で行列式について述べている。本手稿のテーマは多変数の高次方程式から変数を消去して一変数の方程式に帰着することで、変数消去の一般的方法、つまり終結式の理論を提示している。本手稿では3次と4次に関しては行列式の正しい表示を与えているが、より5次の場合はつねに0になってしまい、あきらかに間違っている。これが単純な誤記の類であるか否かは不明である。また、次節で述べるように、関西で活躍していた田中由真や井関知辰らの研究も同様の問題を考えており、類似の結果にたどり着いている。これらの研究では、いずれも行列式は終結式を表すための手段にすぎず、行列式そのものを意味のある対象として捉えていたかについては異論がある。実際、それをあらわす用語すら提案されていない。 また、日本が鎖国によって外界から遮断されていたこともあり、西洋数学に影響を与えることはなかった。

一般的な行列式

関孝和は、最初の手稿からやや後の『大成算成』(建部賢明、建部賢弘と共著、執筆は1683年(天和3年) - 1710年(宝永7年)頃)で、第一列についての余因子展開を一般の場合について正しく与えている。また、田中由真は『算学紛解』(1690年(元禄3年)ごろ)で 5次までの行列式を、井関知辰は『算法発揮』(1690年(元禄3年)刊)で第一行についての余因子展開を一般の場合で与えている。ちなみに関や田中の著作は写本のみであるが、井関の著作は出版がなされている。

ヨーロッパにおいても、行列式の理論は日本の場合と同じく(一次ではなく)高次の代数方程式の変数消去の研究のために発展した。1748年にマクローリンの(死後に刊行された)代数学の著作において4つの未知数に関する4つの方程式の系の解が正しい形で述べられ、行列式の研究が再開されることになった。1750年にクラメルは(証明抜きで)N個の変数に関するN個の方程式からなる方程式の解を求める規則を定式化した。この行列式の計算方法は順列の符号にもとづく繊細なものだった。

ベズー(1764年)やファンデルモント(1771年、ファンデルモンド行列式の計算)などがそれに続き、1772年にはラプラスによって余因子展開の公式が確立された。さらに翌年にはラグランジュによって行列式と体積との関係が発見されている。

今日の determinant(決定するもの)にあたる言葉が初めてあらわれたのはガウスによる1801年の Disquisitiones Arithmeticae である。そこで彼は二次形式の判別式(今日的な意味での行列式の特別な例と見なせる)を用いている。彼はさらに行列式と積の関係についても後少しのところまでいっている。

現代的な行列式の概念の確立

現代的な意味での行列式という用語はコーシーによって初めて導入された。彼はそれまでに得られていた知識を統合し、1812年には積と行列式の関係を発表している(同じ年にビネも独立に証明をあたえていた)。コーシーは平行して準同型の簡約化についての基礎付けの研究も行っている。

1841年に「クレレ誌」で発表されたヤコビの3本の著作によって行列式の概念の重要性が確立された。ヤコビによって初めて行列式の計算の系統的なアルゴリズムが与えられ、またヤコビアンの概念によって写像の行列式も同様に考察できるようになった。行列の枠組みはケイリーシルベスターによって導入された。ちなみにケイリーは逆行列の公式を確立させており、行列式の記号として縦棒を導入したのも彼である。

行列式の理論は様々な対称性を持つような行列についての行列式の研究や、線型微分方程式系のロンスキアンなど数学の様々な分野にあらたに行列式を持ち込むことが追求されている。

いくつかの行列式

<math>\mathfrak{S}_2</math> は恒等置換 id(id(1) = 1, id(2) = 2)と互換 σ = (1,2)(σ(1) = 2, σ(2) = 1)の 2 つの置換からなるので

<math>
\begin{vmatrix}
 a_{11} & a_{12} \\
 a_{21} & a_{22} 
\end{vmatrix}=
a_{11} a_{22} - a_{21} a_{12}.

</math> となる(第 1 項が id, 第 2 項が (1,2) に対応する項である)。

ファイル:Det (mod1).GIF
サラスの方法

2 次あるいは 3 次の正方行列については、左上から右下へ向かう方向に「+」、右上から左下へ向かう方向に「-」の符号を付けて積を取りそれらの和を取ると行列式が求められる。これを「サラス(Sarrus)の方法」または「サラス展開」、「たすきがけの法」と言う。n 次正方行列に対して、サラスの方法で取り出せる項の数は高々 2n であり、一般には行列式の総項数 n! に比べてはるかに少ないため、4次以上の正方行列にはこの方法は使えない

三角行列の行列式は、主対角成分の総乗をとることで求まる。三角行列の主対角成分には固有値が並ぶから、行列式の値は固有値の総乗である。このことは、基底の取替えによる行列の三角化可能性と行列式の乗法性によって、一般の正方行列に対しても正しい。つまり、与えられた行列の行列式の値は、その行列の固有値の総乗に等しい。

発展的な話題

小行列式

正方行列とは限らない一般の行列 A = (aij) が与えられたとき、その行と列を一定の数 k 個選んで正方行列をつくって、その行列式を考えることができる:

<math>\begin{vmatrix}
a_{i_1 j_1} & a_{i_1 j_2}& \cdots & a_{i_1 j_k}\\ 
a_{i_2 j_1} & a_{i_2 j_2}& \cdots & a_{i_2 j_k}\\ 
 \vdots     &  \vdots    & \ddots & \vdots \\
a_{i_k j_1} & a_{i_k j_2}& \cdots & a_{i_k j_k}

\end{vmatrix}</math> これを A から作られる小行列式(しょうぎょうれつしき、minor determinant)という。行列が一つ与えられたとき、その値が 0 でないような小行列式の最大サイズは行列の階数に一致する。とくに同じ番号の行と列を選んで

<math>\begin{vmatrix}
a_{i_1 i_1} & a_{i_1 i_2}& \cdots & a_{i_1 i_k}\\ 
a_{i_2 i_1} & a_{i_2 i_2}& \cdots & a_{i_2 i_k}\\ 
 \vdots     &  \vdots    & \ddots & \vdots \\
a_{i_k i_1} & a_{i_k i_2}& \cdots & a_{i_k i_k}

\end{vmatrix}</math> の形に書かれる(対角線上にある)小行列式を主小行列式(しゅしょうぎょうれつしき、principal minor)と呼ぶ。

また、正方行列から行と列を 1 つずつ取り去って作られる小行列式

<math>\begin{vmatrix}
a_{11} &\cdots &a_{1,j-1} &a_{1,j+1} &\cdots &a_{1n}\\
\vdots &\vdots &\vdots    &\vdots  &\vdots &\vdots\\
a_{i-1,1} &\cdots &a_{i-1,j-1} &a_{i-1,j+1} &\cdots &a_{i-1,n}\\
a_{i+1,1} &\cdots &a_{i+1,j-1} &a_{i+1,j+1} &\cdots &a_{i+1,n}\\
\vdots &\vdots &\vdots    &\vdots  &\vdots &\vdots\\
a_{n1} &\cdots &a_{n,j-1} &a_{n,j+1} &\cdots &a_{nn}

\end{vmatrix}</math> あるいはこれに (−1)i+j を乗じたものを (i, j)-余因子(よいんし、cofactor)という。

余因子展開

列(あるいは行)に関する線型性から、正方行列の行列式は、ある列(あるいはある行)の変数に関して斉 1 次である。n 次正方行列 X = (xij) の行列式は j 列に関して

<math>\det(X) =
\Delta_{1j}x_{1j} + \Delta_{2j}x_{2j} +\cdots+\Delta_{nj}x_{nj}

</math> と展開される。ただし、係数 Δij は (i, j)-余因子。また同様に i 行に関して

<math>\det(X) =
\Delta_{i1}x_{i1} + \Delta_{i2}x_{i2} +\cdots+\Delta_{in}x_{in}

</math> と展開される。余因子は次数が 1 少ない行列式であるから、展開を繰り返すことで元の行列の行列式を小さなサイズの行列式の計算に帰着させることができる。基本変形に対する行列式の性質をうまく組み合わせると展開の効率を高めることができる。

余因子行列と逆行列

n 次正方行列 A = (aij) に対し、(i, j)-余因子を (j, i)-成分に持つ行列

<math>\tilde{A} := \begin{pmatrix}
\Delta_{11} & \Delta_{21} & \cdots & \Delta_{n1} \\
\Delta_{12} & \Delta_{22} & \cdots & \Delta_{n2} \\
\vdots      & \vdots      & \ddots & \vdots \\
\Delta_{1n} & \Delta_{2n} & \cdots & \Delta_{nn}

\end{pmatrix}</math> を A余因子行列という。余因子行列については、余因子展開を逆に用いると

<math>\tilde{A}A = A\tilde{A} = \det(A)I_n</math>

となることが確かめられる。ただし、Inn単位行列である。またここから、A の行列式 det(A) の値が 0 でない場合には

<math>\frac{1}{\det(A)}\tilde{A} = \begin{pmatrix}
\cfrac{\Delta_{11}}{\det(A)} & \cfrac{\Delta_{21}}{\det(A)} & \cdots & \cfrac{\Delta_{n1}}{\det(A)} \\
\cfrac{\Delta_{12}}{\det(A)} & \cfrac{\Delta_{22}}{\det(A)} & \cdots & \cfrac{\Delta_{n2}}{\det(A)} \\
\vdots      & \vdots      & \ddots & \vdots \\
\cfrac{\Delta_{1n}}{\det(A)} & \cfrac{\Delta_{2n}}{\det(A)} & \cdots & \cfrac{\Delta_{nn}}{\det(A)}

\end{pmatrix}</math> は A逆行列 A−1 に一致する (クラメルの公式cramer's fomula))。

なお、余因子行列としてここでの余因子行列の転置行列、すなわち (i, j)-余因子を (i, j)-成分に持つ行列 を採用する流儀もあるので、単に「余因子行列」といったときにはどちらの流儀であるか注意が必要である。

行列式の性質

基本的な行列式の性質を以下に示す。

<math>\det(I) = 1</math>
<math>\det(AB) = \det(A) \det(B)</math>
<math>\det(A^{-1}) = \frac{1}{\det(A)}.</math>
<math>\det(A^T) = \det(A)</math>
<math>\det(\overline{A}) = \overline{\det(A)}</math>

固有値との関係

行列 A固有値λi (i = 1 ... n) と置くと、

<math>\det(A) = \prod_{k=1}^n \lambda_k</math>

となる。このことは、A を三角化すると、固有値の並んだ行列が作られること、すなわち

<math>\left(

\begin{matrix} \lambda_1 & & & * & \\ & \lambda_2 & & &\\ & & \lambda_3 & &\\ & & & \ddots &\\ & & & & \lambda_n \end{matrix} \right) = P^{-1} A P</math> の両辺の det を取ることで導かれる。

特異値との関係

正方行列 A特異値σi(A) (i = 1 ... n) と置くと、

<math>|\det(A)| = \prod_{k=1}^n \sigma_k(A)</math>

となる。このことは、特異値分解を用いて示される。

(証明) <math> |\det(A)| = |\det(U \Sigma V)| = |\det(U) \det(\Sigma) \det(V)| = |\det(\Sigma)| = \prod_k \Sigma_{kk} = \prod_k \sigma_k(A) \;</math>  (対角行列Σの対角成分は非負)

正方行列 An に関して行列式と固有値および特異値の間には次の関係が成り立つ。

<math>|\det(A_n)| = \prod_{k=1}^n |\lambda_k(A_n)| = \prod_{k=1}^n \sigma_k(A_n) </math>

跡との関係

(trace) は、正方行列の対角成分の総和である。それは固有値の総和に一致する。 そのため、固有値の積である行列式とは指数関数 (exponential) を介してつながっている。 行列に対する指数関数は

<math>\exp(A) = \sum_{k=0}^\infty \frac{A^k}{k!}</math>

と書けるが、A の固有値 λi とそれに属する固有ベクトル xi に対して、

<math>x_i \exp(A) = x_i \sum_{k=0}^\infty \frac{A^k}{k!} = x_i \sum_{k=0}^\infty \frac{\lambda_i^k}{k!}=x_i \exp(\lambda_i)</math>

となることより、exp(A) は固有値 exp(λi) と固有ベクトル xi を持つことがわかる。よって、関係式

<math>\det(\exp(A)) = \exp(\mathrm{tr}(A))</math>

が成立する。

微分

行列式は多項式であり、微分が可能である。余因子展開の式から、A の行列式 det(A) の微分として次の関係が成り立つ。

<math>\frac{\partial\det (A)}{\partial a_{ij}} =\Delta_{ij}</math>
<math>d\det (A) = \sum_{i,j=1}^n \Delta_{ij} da_{ij}
= \mathrm{tr}(\tilde{A} dA)=\det(A)\, \mathrm{tr}(A^{-1}\, dA)</math>

関連項目

参考文献