創作內容

56 GP

自己的高中數學整理 -2- 行列式、矩陣和矩陣乘法

作者:侵略!花枝丸│2014-07-25 23:14:30│巴幣:2,212│人氣:67755
就和我上一篇整理一樣,這一篇也是因為好奇心驅使之下產生的,在此重申一次,因為我不是大學數學、物理、或資訊學系,所以以下言論對於某些人可能會很荒謬。
行列式和矩陣的發展歷史比較少人提及,不像上一篇的向量有很多資料,此篇整理看起來會比較沒有連貫性。我的初衷就是想把網路上比較分散的各種資料觀點集合起來變成一篇相對統整的文章。

(以下是內文參考的文章(事實上參考的文章太多了,以下只列出內文重點文章):
Cayley-Hamilton 定理(此為pdf檔案MEGA下載連結)
從複數到四元數(PDF第三篇)
內文統稱以上文章為 見文)

矩陣對高中生(我)來講是很新奇的東西,更甚於向量
向量的表達很常用數對(a,b,c)
國中生學過直角座標之後都應該熟悉這種符號,
是矩陣卻是全新的表達方式

還有和它很像的行列式

我在學到矩陣之前,非常納悶,向量就算是新教的量,它起碼可以說是一種另類數字,
矩陣寫成這樣,正方形的也就算了,它甚至還有
長這樣的
又長這樣的
這是在集思廣益玩創意嗎,這麼多種排法,哪天有三角陣,八邊形陣都不奇怪了,
這到底要怎麼用,要怎麼算,為什麼這麼詭異的東西可以被說廣為應用在各種科學領域?

(上面提到的八邊形陣
實際上應該沒這東西吧
                                           這想法的最初來源我忘了,好像是班上哪個天兵寫出來的。)

在課本裡,我們首先學到二階行列式,之後就清楚,行列式是可以算出一個值的表達方式,用圖像化的方式讓它變得更好做計算和理解,當初的我不清楚矩陣和行列式這兩個長得很像的東西差在哪裡,我以為矩陣或許像行列式一樣可以算出一個值,後來才發現不是這樣。

歷史上也是先出現行列式再出現矩陣,有趣的是,它們的計算規則也比它們的表達方式更早出現,
根據見文1.3和其他一些文件,公認最早的行列式規則出現在1750年,高二也都熟悉的克拉瑪公式(但是之後又發現其實此規則在更早的文件中就已經出現了,像是1693年萊布尼茲(Gottfried Wilhelm von Leibniz)就用了類似克拉瑪公式來解方程組),
發明行列式的方形記法有人說是由柯西先使用類似寫法(也就是上一篇整理提到柯西不等式的發明者),而大部分人則說凱萊(Arthur Cayley)在1841年發明,之後此寫法便通行。

另外,范德蒙(Alexandre-Théophile Vandermonde)和拉普拉斯(Pierre-Simon Laplace)在1770年代提出行列式的餘因子降階計算
不過,在1770年時,行列式顯然應該還不是「方形」的,雖然只要看著三階行列式的那六個項
aei + bfg + cdh - ceg - bdi - afh
再稍微結合一下
a(ei-fh) - b(di-fg) + c(dh-eg)
就看得出來現在降階的影子,不過當時數學家們怎麼去記憶這些複雜的正負號排列,顯然不會是我們現在的

況且,事實上只有二三階行列式可以用斜線相乘來計算,到四階以上時,餘因子降階才是標準的計算規則,否則會出現問題。
設一個四階行列式

若以斜線相乘計算,會得出8項
afkp + bglm + chin + dejo - dgjm - cfip - belo - ahkn
若是以餘因子降階計算,則會有24項
正負規則如同三階推廣

以最上列的 a b c d 來做降階,

最後就可得出互相都不會消去的24個項,

和原本斜線算法完全不同,雖然這24個項也包含斜線算法的8項,
但是8項當中又只有四個項的正負與斜線算法相同:
+afkp  +bglm  +chin  +dejo  -dgjm  -cfip  -belo  -ahkn
8個項當中,只有
afkp、chin一樣是正cfip、ahkn一樣是負

把二三階的兩個方法推廣到四階之後,得出兩個截然不同的結果,那要如何知道哪一個才能定義成正確的行列式值?
就是回歸到行列式起源的用途:解方程組。
只要行列式值用在克拉瑪公式得出正確的解,那就是正確的行列式值了。
所以,就來確定一下,
先設解為a = 1b = 2c = 3d = 4,再挑幾個係數組成四元一次方程組,

首先用斜線算法計算得:a = 44/3b = 2c = 5d = 40/3
再來用降階算法得:
a = -1/-1 = 1
b = -2/-1 = 2
c = -3/-1 = 3
d = -4/-1 = 4
為了求慎重,把斜線算法結果代入第一式,得 a+b+c+d = 35
從這結果看來十分明顯,只有降階算法得出完全正確的結果,斜線算法雖然算出正確的b,但是整體不符合方程式,所以降階算法名正言順的應該被定義成正確的行列式值算法。
這也表示當初在行列式還不是方的情況下,提出正確的降階算法的兩人,實在有先見之明。

矩陣其實就是把數字排成方形然後框起來,先不論矩陣複雜的計算,看起來其實還滿和藹可親的,從小到大在學數學時,都有一大堆規矩和寫法,像是國小四則運算單元,要一行一行標準的計算,實在是酷刑,
相較之下,找幾個數字隨意排成方形,再畫個框框,這樣就是一個數學物件,第一印象感覺實在比目前看過的各種數都要來的有人性。
矩陣裡面橫的名為列,豎向稱為行,橫的數過去是行數,直的數下去是列數。
矩陣的加減一切合理,兩個矩陣需要是等列等行才能加減,否則就會多幾個少幾個,但是乘法就不是這樣,我想第一次看到矩陣乘法的定義大概都不知道它為何這樣乘,即便是做完課本上很生活化的例題,還是很不明白,「這樣的普通計算為何硬要用矩陣啊?」,就如同課本還提到矩陣的行、列向量一樣很突兀。

就像是見文4所說的,若是不知道矩陣的真正意義和用法,又何以去定義什麼是正確的乘法,如同上面的四階行列式,若沒有克拉瑪公式賦予行列式值意義,又怎可以說斜線算法是錯誤的。

在1857年,凱萊(發明行列式記法那位),發表了關於矩陣的研究,其中包含重要的矩陣乘法
矩陣當初是為了簡化線性變換(函數)的標記法,把

簡記成

因此,像是高二下教的列運算和四個變換(伸縮、推移、鏡射、旋轉)等,都是由這點而衍生。
凱萊的乘法也是以這點為原則定義的,兩個矩陣相乘便是兩個函數的複合,也就是先經過一個函數變換,再經過下一個函數變換的結果,
矩陣乘法不符合交換律,原因就是因為兩次函數變換不一定會有交換性,就像上面提到的鏡射,就沒有交換性,
先對 a 軸鏡射,再對 b 軸鏡射,相比先對 b 再對 a,結果不一定會一樣,常常會不一樣。

兩個函數,

其實(現代的讀音寫成英文等於Fee,我知道很多人都念Phi)函數這個名字應該早就被用走了,這裡是我個人興趣才用希臘字母)
函數代入 f 函數,得

再把 x y 項係數合併

最後簡寫成矩陣

這複合函數(矩陣)就是 f 矩陣 乘以矩陣的結果,
若是將兩者交換,就變成

很明顯不相等。
凱萊就這樣定義出一個劃時代的乘法定義,雖然這樣的複合函數計算之前就有,但是他是首先想到用在矩陣上面的,
線性變換的應用現在非常廣泛,定義來代表線性變換的矩陣好寫又好記,所以這看似只是把數字排在一起的矩陣,自然也被應用在各領域,
但究竟是線性變換促成矩陣的泛用,還是矩陣造就線性變換的應用,這就不得而知了。

而對於文章一開始的八邊形陣,我的老師回答:你當然可以自己創造很多形狀的陣,但是你得要定義出有用的計算法則,這樣排才能有意義。就是因為矩陣被定義出有用的運算,也才會被寫在課本裡教給你們。

矩陣乘法還有一個性質,就是

det是行列式(determinant)的縮寫,意思是決定性因素)
換句話說,這性質表示「兩個函數的係數行列式值相乘,會等於它們複合後函數的係數行列式值。
也就是

這也提示了一點,剛剛雖然說矩陣乘法不可以交換,交換後的結果不相等,
可是視角換到行列式的世界後,卻發現其實是可以交換的,當然,僅在行列式的世界裡成立。

這個性質當初我問很多個數學老師,也包含知名補習班老師,有的說因為矩陣相乘的行列式代表面積變化,有的臨時想不到證明,有的甚至不知道這性質,
我個人想要看到的是直接由行列式來證明,或是經由和函數的關係證明,不經過矩陣性質,畢竟這個性質可是聽說在1812年柯西就證明過了,表示這性質不需要經過矩陣也能證明,
我試過用克拉瑪公式,但是最後沒有成功,
後來看到見文5,才知道原來證明如此簡單,這就印證了人在學習和習慣太多東西之後,反而看不出最簡單的那條路。
證明重點就只是行列式的這個性質

以下

再提出數字
然後合併係數

我個人很著迷於這個性質,它巧妙的連結了矩陣和行列式,也提示了矩陣乘法和複合函數的關係,這性質對我個人來說有如歐拉公式一般神奇

也許有人會生氣,兩個公式的層級相差甚遠,一個是純數學的美妙公式,一個則只是一般人不會注意到的小石頭。
的確,數學課的重點在於矩陣乘法的定義和計算等等,這個性質一般只是稍微帶過,我學校的第一類組甚至完全沒講這個性質,好玩的是段考選擇題卻考出來,我想很多人一定為了這個比矩陣乘法還早出現的基本性質,戰戰兢兢的乘了好幾組矩陣來確定吧。
(或許到了四階證明方法會有差異,不過就不追究下去了)

上面提到行列式的英文determinant
當初的行列式有很多名字同時存在,柯西先用這名字,之後由有名的高斯(Johann Karl Friedrich Gauß(ß讀音等於ss))在1801年使用這名字,從此定下來。
一說是因為行列式對方程組的解是「決定性因素」,一說行列式是決定矩陣可逆的因素,
但是我覺得,矩陣可逆的探討,關鍵來自矩陣乘法的定義,但是矩陣乘法直到1857年才出現,
高斯在56年前應該不是因為有無反矩陣才取這名字,所以我比較相信前者的說法。

這裡想講一個我自己覺得超級方便很常用,但是看起來卻很少同學用的性質,

這個性質表示你可以把好幾個矩陣的常數都提出來,先乘完矩陣部分,再和乘完的常數部分相乘,遇到矩陣裡有很多分數時很好用,
像是下面的例子,用這個性質就很方便:

(題目滿常遇到常數會自己消掉~ 然後只要處理剩下的矩陣就好了)
   還有

(這種是最常遇到的,乘完之後再和常數乘,有時答案幸運是整數,也有時是分數)

凱萊在發表矩陣乘法當時,也發表了矩陣的各個特徵物件。
一個二階方陣 A

設有一個常數 C 和一個向量X = (x,y) 滿足一個方程式:

也就是 AX = CX
為了求出 C X,把右邊移項到左邊,再提出 X,得

這時因為要維持矩陣相乘的封閉性(矩陣乘完應該還是矩陣),所以加上一個單位矩陣 I
同時把0改為 O 矩陣,也就是元素都是0的矩陣

再轉成方陣化簡一下得

這時思考一下,我們想要 X 不為 (0,0),就表示 (A-CI) 應該不會有反方陣,否則只要在等號兩邊同乘反方陣,就會知道

而矩陣沒有反方陣的條件,就是矩陣行列式值等於0,所以

這個就是二階矩陣的特徵多項式
求出來的C就叫做特徵值

凱萊對於特徵多項式提出一個凱萊─漢彌爾頓定理
定理表示,若在特徵多項式裡,特徵值(C) 的位置,代入原本的矩陣,
結果也會等於0,也就是O矩陣

其實這是凱萊一人發現的,名字會加上漢彌爾頓,是因為凱萊說他是在聽過漢彌爾頓的四元數演講時想到的,所以加上漢彌爾頓。
凱萊當初只證明到三階方陣的情況,並說再上去的證明是沒有必要的,後來才由弗洛貝尼伍斯
Ferdinand Georg Frobenius)在1875年推廣證明。
這個式子其實高二下也應該會很熟悉,或許數學老師會有略提過,因為有種題目就是以這個下去出題:
有一個二階方陣A,設它滿足,求出數對(x,y)
這個題目其實算簡單,只要算出A平方之後解方程組就好,而若是知道這定理,只消幾秒就可算出來了。
這個定理聽說也可以用在計算矩陣的次方,
將上式移項得

知道四個元素,就可以很快算出A平方,這時要算A三次方,只要把A平方乘以A就可得出,四五次方以後同理,
這個方法聽說可以化成程式語言交給電腦計算。
(不過我覺得對電腦來說,直接把 A 做平方 和 計算 (a+d)A-(ad-bc)I 應該不會有太大差別,況且之後同樣是連續的矩陣相乘,兩種方法誰優誰劣,或許就看寫程式的人的智慧了吧。)

再來就設實際數字算算看,設一個矩陣B

它的特徵多項式為

得出特徵值 C = 3-2 也就是對於這個矩陣,會有特徵值 3 和 -2 分別滿足,

算出在特徵值 3 的時候,(X,Y)是符合方程式 X = Y 的所有解,也就 (t , t)
而在 -2 時,則是滿足方程式 3X = -2Y,也就是 (-2t , 3t)
而這兩個向量 (t , t)(-2t , 3t) 就是分別對應兩個特徵值的特徵向量
把所有的數字代入 t得出符合條件的所有向量,以原點為起點的這些向量就會形成兩條直線,
也就是說,在這兩條直線上所有的點或方向向量,經過B矩陣變換後,依然在各自原本的直線上。這種特性在很多地方用得到,不過這裡不繼續多談。
而會不會有不同特徵值最後得出同樣的特徵向量?如果會的話,就表示這個向量和矩陣相乘,結果會有很多個,分別都是和不同特徵值相乘,這情況應該是不會發生才對,所以說,有幾個特徵值,就會得出幾個不同的特徵向量。

特徵向量可以用在一個地方,就是矩陣的對角化
在高二下也會看到一種題目,裡面出現一個讓人滿有印象的相乘形式:

這個東西的特別之處在於,把它做次方計算時,中間的都會消掉,最後只剩下

我們也知道,一個矩陣若是只有主對角線(左上到右下)有數字,其他都是0,次方計算就只要把這些數字做次方就可以了,
所以,我們只要在此找出適當的P矩陣,使變成對角矩陣,就可以把矩陣次方變成數字次方計算,次方完之後就在左右兩邊再各乘P,就可以得出A的n次方了
其實這個 P 就是取特徵向量排起來變成矩陣,而所有數字代入 t ,對角化完都會是一樣的結果,所以這裡取 (1,1)(-2,3)
   所以   
(反方陣就是使用上面那個提出常數性質的好時機,高二下時最常用在這裡)
然後把三個矩陣依照上面的順序乘起來,就完成了對角化:

可以看到對角上的數字就是特徵值,而且會對應P矩陣中特徵向量放的位置順序,若是把P改成
則對角化後的矩陣就會變成

為什麼特徵向量剛好符合對角化需要的P,這裡大概可以想成,因為特徵向量的性質就是在矩陣右邊相乘之後,會等於只是乘上特徵值,而又再經過反P矩陣處理過後,這個乘上的特徵值便會在對角上顯現出來。

那所有矩陣都可以對角化嗎?不是
以下這個矩陣就不能對角化

它的特徵多項式為

特徵值只有 2,特徵向量(t , -t)
如果要把它對角化,因為是重根,所以表示需要的兩個特徵向量都是(t , -t),P就會是

而想要計算這個矩陣的行列式來求反方陣時,我們都知道,行列式任兩行或兩列相等,行列式值等於0,
也就是這個矩陣沒有反矩陣,
對角化宣告失敗。
所以說,n 階方陣可以對角化的條件,就是特徵值要有 n 個。

因為版面太長,所以文章在此切開,接續2.1

(2017年6月後敘:以上所講到不可對角化的條件其實有誤,真正可對角化的條件是特徵向量要有 n 個,這時一個特徵值可以對應多個特徵向量。也就是特徵值有重根的矩陣還是可能可對角化,對角化之後還是會在對角線上出現特徵值。而上面那個矩陣因為特徵值2不存在第二個特徵向量,所以不可對角化。)
引用網址:https://home.gamer.com.tw/TrackBack.php?sn=2526628
All rights reserved. 版權所有,保留一切權利

相關創作

同標籤作品搜尋:矩陣|行列式|克拉瑪|四元數|複數|線性|函數|特徵

留言共 6 篇留言

蒲醉
樓主其實研究的頗深入,許多都是已經是大學線性代數的範疇了,例如對角化的部分正常高中應該完全不會教授。

04-17 14:33

蒲醉

如果樓主有興趣繼續研究數學的話,可以拿本高等微積分的課本來研究研究xd

04-17 14:33

侵略!花枝丸
當初我本來就是想講超過高中教的範圍。我現在確實是有在找時間看高等微積分的課,系上的量子力學也會用到矩陣,主要是講到特徵方程式,對角化也很重要,應該和線性代數有很多重疊04-17 14:51
蒲醉
對 量子力學跟線性代數有很多相似的地方,有空也可以看看線性代數的書
高微看完可以順便再看看複變ww

04-17 15:08

侵略!花枝丸
看都看04-17 15:19
蒲醉
然後就可以轉數學系了(大誤

04-17 15:23

qazer
看看我挖到了什麼≧ω≦

05-05 00:17

侵略!花枝丸
高中數學沒教你的事~05-05 02:01
戴著綠帽的五柳先生
猛欸

06-27 11:37

我要留言提醒:您尚未登入,請先登入再留言

56喜歡★ericlee0602 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:修正和補充-自己的數學整... 後一篇:自己的高中數學整理 -2...

追蹤私訊切換新版閱覽

作品資料夾

Charles021來此小屋參觀的觀眾
新篇小說上線,有興趣的觀眾歡迎來看(被學務主任喜歡的壞學生)的最新章節,最新頁數看更多我要大聲說昨天06:34


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】