理解矩陣(關于矩陣最精彩的理解)_第1頁
理解矩陣(關于矩陣最精彩的理解)_第2頁
理解矩陣(關于矩陣最精彩的理解)_第3頁
理解矩陣(關于矩陣最精彩的理解)_第4頁
理解矩陣(關于矩陣最精彩的理解)_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、理解矩陣(關于矩陣最精彩的理解)線性代數(shù)課程,無論你從行列式入手還是直接從矩陣入手,從一開始就充斥著莫名其妙。比如說,在全國一般工科院系教學中應用最廣泛的同濟線性代數(shù)教材(現(xiàn)在到了第四版),一上來就介紹逆序數(shù)這個“前無古人,后無來者”的古怪概念,然后用逆序數(shù)給出行列式的一個極不直觀的定義,接著是一些簡直犯傻的行列式性質和習題把這行乘一個系數(shù)加到另一行上,再把那一列減過來,折騰得那叫一個熱鬧,可就是壓根看不出這個東西有嘛用。大多數(shù)像我一樣資質平庸的學生到這里就有點犯暈:連這是個什么東西都模模糊糊的,就開始鉆火圈表演了,這未免太“無厘頭”了吧!于是開始有人逃課,更多的人開始抄作業(yè)。這下就中招了,因

2、為其后的發(fā)展可以用一句峰回路轉來形容,緊跟著這個無厘頭的行列式的,是一個同樣無厘頭但是偉大的無以復加的家伙的出場矩陣來了!多年之后,我才明白,當老師犯傻似地用中括號把一堆傻了吧嘰的數(shù)括起來,并且不緊不慢地說:“這個東西叫做矩陣”的時候,我的數(shù)學生涯掀開了何等悲壯辛酸、慘絕人寰的一幕!自那以后,在幾乎所有跟“學問”二字稍微沾點邊的東西里,矩陣這個家伙從不缺席。對于我這個沒能一次搞定線性代數(shù)的笨蛋來說,矩陣老大的不請自來每每搞得我灰頭土臉,頭破血流。長期以來,我在閱讀中一見矩陣,就如同阿Q見到了假洋鬼子,揉揉額角就繞道走。事實上,我并不是特例。一般工科學生初學線性代數(shù),通常都會感到困難。這種情形在

3、國內外皆然。瑞典數(shù)學家Lars Garding在其名著Encounter with Mathematics中說:“如果不熟悉線性代數(shù)的概念,要去學習自然科學,現(xiàn)在看來就和文盲差不多?!?,然而“按照現(xiàn)行的國際標準,線性代數(shù)是通過公理化來表述的,它是第二代數(shù)學模型,.,這就帶來了教學上的困難?!笔聦嵣?,當我們開始學習線性代數(shù)的時候,不知不覺就進入了“第二代數(shù)學模型”的范疇當中,這意味著數(shù)學的表述方式和抽象性有了一次全面的進化,對于從小一直在“第一代數(shù)學模型”,即以實用為導向的、具體的數(shù)學模型中學習的我們來說,在沒有并明確告知的情況下進行如此劇烈的paradigm shift,不感到困難才是奇怪的。

4、大部分工科學生,往往是在學習了一些后繼課程,如數(shù)值分析、數(shù)學規(guī)劃、矩陣論之后,才逐漸能夠理解和熟練運用線性代數(shù)。即便如此,不少人即使能夠很熟練地以線性代數(shù)為工具進行科研和應用工作,但對于很多這門課程的初學者提出的、看上去是很基礎的問題卻并不清楚。比如說:* 矩陣究竟是什么東西?向量可以被認為是具有n個相互獨立的性質(維度)的對象的表示,矩陣又是什么呢?我們如果認為矩陣是一組列(行)向量組成的新的復合向量的展開式,那么為什么這種展開式具有如此廣泛的應用?特別是,為什么偏偏二維的展開式如此有用?如果矩陣中每一個元素又是一個向量,那么我們再展開一次,變成三維的立方陣,是不是更有用?* 矩陣的乘法規(guī)則

5、究竟為什么這樣規(guī)定?為什么這樣一種怪異的乘法規(guī)則卻能夠在實踐中發(fā)揮如此巨大的功效?很多看上去似乎是完全不相關的問題,最后竟然都歸結到矩陣的乘法,這難道不是很奇妙的事情?難道在矩陣乘法那看上去莫名其妙的規(guī)則下面,包含著世界的某些本質規(guī)律?如果是的話,這些本質規(guī)律是什么?* 行列式究竟是一個什么東西?為什么會有如此怪異的計算規(guī)則?行列式與其對應方陣本質上是什么關系?為什么只有方陣才有對應的行列式,而一般矩陣就沒有(不要覺得這個問題很蠢,如果必要,針對m x n矩陣定義行列式不是做不到的,之所以不做,是因為沒有這個必要,但是為什么沒有這個必要)?而且,行列式的計算規(guī)則,看上去跟矩陣的任何計算規(guī)則都沒

6、有直觀的聯(lián)系,為什么又在很多方面決定了矩陣的性質?難道這一切僅是巧合?* 矩陣為什么可以分塊計算?分塊計算這件事情看上去是那么隨意,為什么竟是可行的?* 對于矩陣轉置運算AT,有(AB)T = BTAT,對于矩陣求逆運算A-1,有(AB)-1 = B-1A-1。兩個看上去完全沒有什么關系的運算,為什么有著類似的性質?這僅僅是巧合嗎?* 為什么說P-1AP得到的矩陣與A矩陣“相似”?這里的“相似”是什么意思?* 特征值和特征向量的本質是什么?它們定義就讓人很驚訝,因為Ax =x,一個諾大的矩陣的效應,竟然不過相當于一個小小的數(shù),確實有點奇妙。但何至于用“特征”甚至“本征”來界定?它們刻劃的究竟是

7、什么?這樣的一類問題,經(jīng)常讓使用線性代數(shù)已經(jīng)很多年的人都感到為難。就好像大人面對小孩子的刨根問底,最后總會迫不得已地說“就這樣吧,到此為止”一樣,面對這樣的問題,很多老手們最后也只能用:“就是這么規(guī)定的,你接受并且記住就好”來搪塞。然而,這樣的問題如果不能獲得回答,線性代數(shù)對于我們來說就是一個粗暴的、不講道理的、莫名其妙的規(guī)則集合,我們會感到,自己并不是在學習一門學問,而是被不由分說地“拋到”一個強制的世界中,只是在考試的皮鞭揮舞之下被迫趕路,全然無法領略其中的美妙、和諧與統(tǒng)一。直到多年以后,我們已經(jīng)發(fā)覺這門學問如此的有用,卻仍然會非常迷惑:怎么這么湊巧?我認為,這是我們的線性代數(shù)教學中直覺性

8、喪失的后果。上述這些涉及到“如何能”、“怎么會”的問題,僅僅通過純粹的數(shù)學證明來回答,是不能令提問者滿意的。比如,如果你通過一般的證明方法論證了矩陣分塊運算確實可行,那么這并不能夠讓提問者的疑惑得到解決。他們真正的困惑是:矩陣分塊運算為什么竟然是可行的?究竟只是湊巧,還是說這是由矩陣這種對象的某種本質所必然決定的?如果是后者,那么矩陣的這些本質是什么?只要對上述那些問題稍加考慮,我們就會發(fā)現(xiàn),所有這些問題都不是單純依靠數(shù)學證明所能夠解決的。像我們的教科書那樣,凡事用數(shù)學證明,最后培養(yǎng)出來的學生,只能熟練地使用工具,卻欠缺真正意義上的理解。自從1930年代法國布爾巴基學派興起以來,數(shù)學的公理化、

9、系統(tǒng)性描述已經(jīng)獲得巨大的成功,這使得我們接受的數(shù)學教育在嚴謹性上大大提高。然而數(shù)學公理化的一個備受爭議的副作用,就是一般數(shù)學教育中直覺性的喪失。數(shù)學家們似乎認為直覺性與抽象性是矛盾的,因此毫不猶豫地犧牲掉前者。然而包括我本人在內的很多人都對此表示懷疑,我們不認為直覺性與抽象性一定相互矛盾,特別是在數(shù)學教育中和數(shù)學教材中,幫助學生建立直覺,有助于它們理解那些抽象的概念,進而理解數(shù)學的本質。反之,如果一味注重形式上的嚴格性,學生就好像被迫進行鉆火圈表演的小白鼠一樣,變成枯燥的規(guī)則的奴隸。對于線性代數(shù)的類似上述所提到的一些直覺性的問題,兩年多來我斷斷續(xù)續(xù)地反復思考了四、五次,為此閱讀了好幾本國內外線

10、性代數(shù)、數(shù)值分析、代數(shù)和數(shù)學通論性書籍,其中像前蘇聯(lián)的名著數(shù)學:它的內容、方法和意義、龔昇教授的線性代數(shù)五講、前面提到的Encounter with Mathematics(數(shù)學概觀)以及Thomas A. Garrity的數(shù)學拾遺都給我很大的啟發(fā)。不過即使如此,我對這個主題的認識也經(jīng)歷了好幾次自我否定。比如以前思考的一些結論曾經(jīng)寫在自己的blog里,但是現(xiàn)在看來,這些結論基本上都是錯誤的。因此打算把自己現(xiàn)在的有關理解比較完整地記錄下來,一方面是因為我覺得現(xiàn)在的理解比較成熟了,可以拿出來與別人探討,向別人請教。另一方面,如果以后再有進一步的認識,把現(xiàn)在的理解給推翻了,那現(xiàn)在寫的這個snapsh

11、ot也是很有意義的。因為打算寫得比較多,所以會分幾次慢慢寫。也不知道是不是有時間慢慢寫完整,會不會中斷,寫著看吧。今天先談談對線形空間和矩陣的幾個核心概念的理解。這些東西大部分是憑著自己的理解寫出來的,基本上不抄書,可能有錯誤的地方,希望能夠被指出。但我希望做到直覺,也就是說能把數(shù)學背后說的實質問題說出來。首先說說空間(space),這個概念是現(xiàn)代數(shù)學的命根子之一,從拓撲空間開始,一步步往上加定義,可以形成很多空間。線形空間其實還是比較初級的,如果在里面定義了范數(shù),就成了賦范線性空間。賦范線性空間滿足完備性,就成了巴那赫空間;賦范線性空間中定義角度,就有了內積空間,內積空間再滿足完備性,就得到

12、希爾伯特空間??傊?,空間有很多種。你要是去看某種空間的數(shù)學定義,大致都是“存在一個集合,在這個集合上定義某某概念,然后滿足某些性質”,就可以被稱為空間。這未免有點奇怪,為什么要用“空間”來稱呼一些這樣的集合呢?大家將會看到,其實這是很有道理的。我們一般人最熟悉的空間,毫無疑問就是我們生活在其中的(按照牛頓的絕對時空觀)的三維空間,從數(shù)學上說,這是一個三維的歐幾里德空間,我們先不管那么多,先看看我們熟悉的這樣一個空間有些什么最基本的特點。仔細想想我們就會知道,這個三維的空間:1. 由很多(實際上是無窮多個)位置點組成;2. 這些點之間存在相對的關系;3. 可以在空間中定義長度、角度;4. 這個空

13、間可以容納運動,這里我們所說的運動是從一個點到另一個點的移動(變換),而不是微積分意義上的“連續(xù)”性的運動,上面的這些性質中,最最關鍵的是第4條。第1、2條只能說是空間的基礎,不算是空間特有的性質,凡是討論數(shù)學問題,都得有一個集合,大多數(shù)還得在這個集合上定義一些結構(關系),并不是說有了這些就算是空間。而第3條太特殊,其他的空間不需要具備,更不是關鍵的性質。只有第4條是空間的本質,也就是說,容納運動是空間的本質特征。認識到了這些,我們就可以把我們關于三維空間的認識擴展到其他的空間。事實上,不管是什么空間,都必須容納和支持在其中發(fā)生的符合規(guī)則的運動(變換)。你會發(fā)現(xiàn),在某種空間中往往會存在一種相

14、對應的變換,比如拓撲空間中有拓撲變換,線性空間中有線性變換,仿射空間中有仿射變換,其實這些變換都只不過是對應空間中允許的運動形式而已。因此只要知道,“空間”是容納運動的一個對象集合,而變換則規(guī)定了對應空間的運動。下面我們來看看線性空間。線性空間的定義任何一本書上都有,但是既然我們承認線性空間是個空間,那么有兩個最基本的問題必須首先得到解決,那就是:1. 空間是一個對象集合,線性空間也是空間,所以也是一個對象集合。那么線性空間是什么樣的對象的集合?或者說,線性空間中的對象有什么共同點嗎?2. 線性空間中的運動如何表述的?也就是,線性變換是如何表示的?我們先來回答第一個問題,回答這個問題的時候其實

15、是不用拐彎抹角的,可以直截了當?shù)慕o出答案。線性空間中的任何一個對象,通過選取基和坐標的辦法,都可以表達為向量的形式。通常的向量空間我就不說了,舉兩個不那么平凡的例子:L1. 最高次項不大于n次的多項式的全體構成一個線性空間,也就是說,這個線性空間中的每一個對象是一個多項式。如果我們以x0, x1, ., xn為基,那么任何一個這樣的多項式都可以表達為一組n+1維向量,其中的每一個分量ai其實就是多項式中x(i-1)項的系數(shù)。值得說明的是,基的選取有多種辦法,只要所選取的那一組基線性無關就可以。這要用到后面提到的概念了,所以這里先不說,提一下而已。L2. 閉區(qū)間a, b上的n階連續(xù)可微函數(shù)的全體

16、,構成一個線性空間。也就是說,這個線性空間的每一個對象是一個連續(xù)函數(shù)。對于其中任何一個連續(xù)函數(shù),根據(jù)魏爾斯特拉斯定理,一定可以找到最高次項不大于n的多項式函數(shù),使之與該連續(xù)函數(shù)的差為0,也就是說,完全相等。這樣就把問題歸結為L1了。后面就不用再重復了。所以說,向量是很厲害的,只要你找到合適的基,用向量可以表示線性空間里任何一個對象。這里頭大有文章,因為向量表面上只是一列數(shù),但是其實由于它的有序性,所以除了這些數(shù)本身攜帶的信息之外,還可以在每個數(shù)的對應位置上攜帶信息。為什么在程序設計中數(shù)組最簡單,卻又威力無窮呢?根本原因就在于此。這是另一個問題了,這里就不說了。下面來回答第二個問題,這個問題的回

17、答會涉及到線性代數(shù)的一個最根本的問題。線性空間中的運動,被稱為線性變換。也就是說,你從線性空間中的一個點運動到任意的另外一個點,都可以通過一個線性變化來完成。那么,線性變換如何表示呢?很有意思,在線性空間中,當你選定一組基之后,不僅可以用一個向量來描述空間中的任何一個對象,而且可以用矩陣來描述該空間中的任何一個運動(變換)。而使某個對象發(fā)生對應運動的方法,就是用代表那個運動的矩陣,乘以代表那個對象的向量。簡而言之,在線性空間中選定基之后,向量刻畫對象,矩陣刻畫對象的運動,用矩陣與向量的乘法施加運動。是的,矩陣的本質是運動的描述。如果以后有人問你矩陣是什么,那么你就可以響亮地告訴他,矩陣的本質是

18、運動的描述??墒嵌嗝从幸馑及?,向量本身不是也可以看成是n x 1矩陣嗎?這實在是很奇妙,一個空間中的對象和運動竟然可以用相類同的方式表示。能說這是巧合嗎?如果是巧合的話,那可真是幸運的巧合!可以說,線性代數(shù)中大多數(shù)奇妙的性質,均與這個巧合有直接的關系。接著理解矩陣。上一篇里說“矩陣是運動的描述”,到現(xiàn)在為止,好像大家都還沒什么意見。但是我相信早晚會有數(shù)學系出身的網(wǎng)友來拍板轉。因為運動這個概念,在數(shù)學和物理里是跟微積分聯(lián)系在一起的。我們學習微積分的時候,總會有人照本宣科地告訴你,初等數(shù)學是研究常量的數(shù)學,是研究靜態(tài)的數(shù)學,高等數(shù)學是變量的數(shù)學,是研究運動的數(shù)學。大家口口相傳,差不多人人都知道這句

19、話。但是真知道這句話說的是什么意思的人,好像也不多。簡而言之,在我們人類的經(jīng)驗里,運動是一個連續(xù)過程,從A點到B點,就算走得最快的光,也是需要一個時間來逐點地經(jīng)過AB之間的路徑,這就帶來了連續(xù)性的概念。而連續(xù)這個事情,如果不定義極限的概念,根本就解釋不了。古希臘人的數(shù)學非常強,但就是缺乏極限觀念,所以解釋不了運動,被芝諾的那些著名悖論(飛箭不動、飛毛腿阿喀琉斯跑不過烏龜?shù)人膫€悖論)搞得死去活來。因為這篇文章不是講微積分的,所以我就不多說了。有興趣的讀者可以去看看齊民友教授寫的重溫微積分。我就是讀了這本書開頭的部分,才明白“高等數(shù)學是研究運動的數(shù)學”這句話的道理。不過在我這個理解矩陣的文章里,“

20、運動”的概念不是微積分中的連續(xù)性的運動,而是瞬間發(fā)生的變化。比如這個時刻在A點,經(jīng)過一個“運動”,一下子就“躍遷”到了B點,其中不需要經(jīng)過A點與B點之間的任何一個點。這樣的“運動”,或者說“躍遷”,是違反我們日常的經(jīng)驗的。不過了解一點量子物理常識的人,就會立刻指出,量子(例如電子)在不同的能量級軌道上跳躍,就是瞬間發(fā)生的,具有這樣一種躍遷行為。所以說,自然界中并不是沒有這種運動現(xiàn)象,只不過宏觀上我們觀察不到。但是不管怎么說,“運動”這個詞用在這里,還是容易產生歧義的,說得更確切些,應該是“躍遷”。因此這句話可以改成:“矩陣是線性空間里躍遷的描述”??墒沁@樣說又太物理,也就是說太具體,而不夠數(shù)學

21、,也就是說不夠抽象。因此我們最后換用一個正牌的數(shù)學術語變換,來描述這個事情。這樣一說,大家就應該明白了,所謂變換,其實就是空間里從一個點(元素/對象)到另一個點(元素/對象)的躍遷。比如說,拓撲變換,就是在拓撲空間里從一個點到另一個點的躍遷。再比如說,仿射變換,就是在仿射空間里從一個點到另一個點的躍遷。附帶說一下,這個仿射空間跟向量空間是親兄弟。做計算機圖形學的朋友都知道,盡管描述一個三維對象只需要三維向量,但所有的計算機圖形學變換矩陣都是4 x 4的。說其原因,很多書上都寫著“為了使用中方便”,這在我看來簡直就是企圖蒙混過關。真正的原因,是因為在計算機圖形學里應用的圖形變換,實際上是在仿射空

22、間而不是向量空間中進行的。想想看,在向量空間里相一個向量平行移動以后仍是相同的那個向量,而現(xiàn)實世界等長的兩個平行線段當然不能被認為同一個東西,所以計算機圖形學的生存空間實際上是仿射空間。而仿射變換的矩陣表示根本就是4 x 4的。又扯遠了,有興趣的讀者可以去看計算機圖形學幾何工具算法詳解。一旦我們理解了“變換”這個概念,矩陣的定義就變成:“矩陣是線性空間里的變換的描述?!钡竭@里為止,我們終于得到了一個看上去比較數(shù)學的定義。不過還要多說幾句。教材上一般是這么說的,在一個線性空間V里的一個線性變換T,當選定一組基之后,就可以表示為矩陣。因此我們還要說清楚到底什么是線性變換,什么是基,什么叫選定一組基

23、。線性變換的定義是很簡單的,設有一種變換T,使得對于線性空間V中間任何兩個不相同的對象x和y,以及任意實數(shù)a和b,有:T(ax + by) = aT(x) + bT(y),那么就稱T為線性變換。定義都是這么寫的,但是光看定義還得不到直覺的理解。線性變換究竟是一種什么樣的變換?我們剛才說了,變換是從空間的一個點躍遷到另一個點,而線性變換,就是從一個線性空間V的某一個點躍遷到另一個線性空間W的另一個點的運動。這句話里蘊含著一層意思,就是說一個點不僅可以變換到同一個線性空間中的另一個點,而且可以變換到另一個線性空間中的另一個點去。不管你怎么變,只要變換前后都是線性空間中的對象,這個變換就一定是線性變

24、換,也就一定可以用一個非奇異矩陣來描述。而你用一個非奇異矩陣去描述的一個變換,一定是一個線性變換。有的人可能要問,這里為什么要強調非奇異矩陣?所謂非奇異,只對方陣有意義,那么非方陣的情況怎么樣?這個說起來就會比較冗長了,最后要把線性變換作為一種映射,并且討論其映射性質,以及線性變換的核與像等概念才能徹底講清楚。我覺得這個不算是重點,如果確實有時間的話,以后寫一點。以下我們只探討最常用、最有用的一種變換,就是在同一個線性空間之內的線性變換。也就是說,下面所說的矩陣,不作說明的話,就是方陣,而且是非奇異方陣。學習一門學問,最重要的是把握主干內容,迅速建立對于這門學問的整體概念,不必一開始就考慮所有

25、的細枝末節(jié)和特殊情況,自亂陣腳。接著往下說,什么是基呢?這個問題在后面還要大講一番,這里只要把基看成是線性空間里的坐標系就可以了。注意是坐標系,不是坐標值,這兩者可是一個“對立矛盾統(tǒng)一體”。這樣一來,“選定一組基”就是說在線性空間里選定一個坐標系。就這意思。好,最后我們把矩陣的定義完善如下:“矩陣是線性空間中的線性變換的一個描述。在一個線性空間中,只要我們選定一組基,那么對于任何一個線性變換,都能夠用一個確定的矩陣來加以描述?!崩斫膺@句話的關鍵,在于把“線性變換”與“線性變換的一個描述”區(qū)別開。一個是那個對象,一個是對那個對象的表述。就好像我們熟悉的面向對象編程中,一個對象可以有多個引用,每個

26、引用可以叫不同的名字,但都是指的同一個對象。如果還不形象,那就干脆來個很俗的類比。比如有一頭豬,你打算給它拍照片,只要你給照相機選定了一個鏡頭位置,那么就可以給這頭豬拍一張照片。這個照片可以看成是這頭豬的一個描述,但只是一個片面的的描述,因為換一個鏡頭位置給這頭豬拍照,能得到一張不同的照片,也是這頭豬的另一個片面的描述。所有這樣照出來的照片都是這同一頭豬的描述,但是又都不是這頭豬本身。同樣的,對于一個線性變換,只要你選定一組基,那么就可以找到一個矩陣來描述這個線性變換。換一組基,就得到一個不同的矩陣。所有這些矩陣都是這同一個線性變換的描述,但又都不是線性變換本身。但是這樣的話,問題就來了如果你給我兩張豬的照片,我怎么知道這兩張照片上的是同一頭豬呢?同樣的,你給我兩個矩陣,我怎么知道這兩個矩陣是描述的同一個線性變換呢?如果是同一個線性變換的不同的矩陣描述,那就是本家兄弟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論