深入了解php底層機制_第1頁
深入了解php底層機制_第2頁
深入了解php底層機制_第3頁
深入了解php底層機制_第4頁
深入了解php底層機制_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、深入了解php底層機制作為一門動態(tài)語言,php是如何實現(xiàn)的,其底層機制如何,具有什么樣的特點,本文深入淺出介紹了包括php設(shè)計理念、整體結(jié)構(gòu)、核心數(shù)據(jù)結(jié)構(gòu)和變量在內(nèi)的相關(guān)底層知識,對我們更好的開發(fā)php程序,優(yōu)化性能等有一定的指導(dǎo)意義。TAGPhp 底層機制 性能優(yōu)化目錄1、概述 1what is php?. 1了解它底層實現(xiàn)的目的?. 12、php的設(shè)計理念及特點 13、Php的四層體系 24、Sapi 35、Php的執(zhí)行流程&opcode. 56、HashTable  核心數(shù)據(jù)結(jié)構(gòu) 67、Php變量 8概述 8Zval 9整數(shù)、浮點數(shù)類型變量 10字符串變量 10數(shù)組變量

2、 11資源類型變量 11Php變量的作用域 121、概述what is php?一種適用于web開發(fā)的動態(tài)語言。具體點說:就是一個用c語言實現(xiàn)包含大量組件的軟件框架。更狹義點看,可以把它認(rèn)為是一個強大的ui框架。了解它底層實現(xiàn)的目的?· 動態(tài)語言要像用好首先得了解它· 內(nèi)存管理、框架模型值得我們借鑒· 通過擴展開發(fā)實現(xiàn)更多更強大的功能,優(yōu)化我們程序的性能 2、php的設(shè)計理念及特點· 多進(jìn)程模型由于php是多進(jìn)程模型,不同請求間互不干涉,這樣保證了一個請求掛掉不會對全盤服務(wù)造成影響,當(dāng)然,隨著時代發(fā)展,php也早已支持多線程模型。·

3、弱類型語言和c/c+、java、c#等語言不同,Php是一門弱類型語言:一個變量的類型并不是一開始就確定不變,運行中才會確定并可能發(fā)生隱式或顯式的類型轉(zhuǎn)換,這種機制的靈活性在web開發(fā)中非常方便、高效,具體會在后面php變量中詳述。· 引擎(Zend)+組件(ext)的模式降低內(nèi)部耦合 · 中間層(sapi)隔絕web server和php · 語法簡單靈活,沒有太多規(guī)范。(導(dǎo)致風(fēng)格混雜) · 再差的程序員也不會寫出太離譜危害全局的程序。 3、Php的四層體系Php的核心架構(gòu)如下圖圖1 php結(jié)構(gòu)從圖上可以看出,p

4、hp從下到上是一個4層體系· Zend引擎Zend整體用純c實現(xiàn),是php的內(nèi)核部分,它將php代碼翻譯(詞法、語法解析等一系列編譯過程)為可執(zhí)行opcode的處理并實現(xiàn)相應(yīng)的處理方法、實現(xiàn)了基本的數(shù)據(jù)結(jié)構(gòu)(如hashtable、oo)、內(nèi)存分配及管理、提供了相應(yīng)的api方法供外部調(diào)用,是一切的核心,所有的外圍功能均圍繞zend實現(xiàn)。· Extensions圍繞著zend引擎,extensions通過組件式的方式提供各種基礎(chǔ)服務(wù),我們常見的各種內(nèi)置函數(shù)(如array系列)、標(biāo)準(zhǔn)庫等都是通過extension來實現(xiàn),用戶也可以根據(jù)需要實現(xiàn)自己的extension以達(dá)到功能擴展

5、、性能優(yōu)化等目的(如貼吧正在使用的php中間層、富文本解析就是extension的典型應(yīng)用)。· SapiSapi全稱是Server Application Programming Interface,也就是服務(wù)端應(yīng)用編程接口,sapi通過一系列鉤子函數(shù),使得php可以和外圍交互數(shù)據(jù),這是php非常優(yōu)雅和成功的一個設(shè)計,通過sapi成功的將php本身和上層應(yīng)用解耦隔離,php可以不再考慮如何針對不同應(yīng)用進(jìn)行兼容,而應(yīng)用本身也可以針對自己的特點實現(xiàn)不同的處理方式。后面將在sapi章節(jié)中介紹· 上層應(yīng)用這就是我們平時編寫的php程序,通過不同的sapi方式得到各種各樣的應(yīng)用模式

6、,如通過webserver實現(xiàn)web應(yīng)用、在命令行下以腳本方式運行等等。如果php是一輛車,那么· 車的框架就是php本身· Zend是車的引擎(發(fā)動機)· Ext下面的各種組件就是車的輪子· Sapi可以看做是公路,車可以跑在不同類型的公路上而一次php程序的執(zhí)行就是汽車跑在公路上。因此,我們需要:性能優(yōu)異的引擎+合適的車輪+正確的跑道4、Sapi如前所述,sapi通過通過一系列的接口,使得外部應(yīng)用可以和php交換數(shù)據(jù)并可以根據(jù)不同應(yīng)用特點實現(xiàn)特定的處理方法,我們常見的一些sapi有:· apache2handler這是以apache作為we

7、bserver,采用mod_php模式運行時候的處理方式,也是現(xiàn)在應(yīng)用最廣泛的一種。· cgi這是webserver和php直接的另一種交互方式,也就是大名鼎鼎的fastcgi協(xié)議,在最近今年fastcgi+php得到越來越多的應(yīng)用,也是異步webserver所唯一支持的方式。關(guān)于fastcgi和mod_php,可以參見另外一篇文章php性能調(diào)研-mod_php vs fastcgi· cli命令行調(diào)用的應(yīng)用模式         Sapi的定義及主要接口函數(shù)如下圖圖2 Sapi協(xié)議這里介紹一下其

8、中一些主要函數(shù)· startup:php被調(diào)用時初始化操作比如cgi模式,在startup的時候會加載所有的extension并執(zhí)行模塊初始化工作。· shutdown:php關(guān)閉時收尾工作 · activate:請求初始化 · dectivate:請求結(jié)束時收尾工作 · ub_write:指定數(shù)據(jù)輸出方式比如apache2handler方式,由于php作為apache的一個so存在,因此其輸出也就是調(diào)用apache的ap_write函數(shù),而在cgi模式下,會系統(tǒng)調(diào)用write。· sapi_error:

9、錯誤處理函數(shù) · read_post:讀取post數(shù)據(jù) · register_server_variables:往$_SERVER中注冊環(huán)境變量這個一般根據(jù)不同協(xié)議標(biāo)準(zhǔn)注冊注冊的變量。5、Php的執(zhí)行流程&opcode我們先來看看php代碼的執(zhí)行所經(jīng)過的流程。圖3 php代碼的執(zhí)行過程從圖上可以看到,php實現(xiàn)了一個典型的動態(tài)語言執(zhí)行過程:拿到一段代碼后,經(jīng)過詞法解析、語法解析等階段后,源程序會被翻譯成一個個指令(opcodes),然后ZEND虛擬機順次執(zhí)行這些指令完成操作。Php本身是用c實現(xiàn)的,因此最終調(diào)用的也都是c的函數(shù),實際上,我們可以把

10、php看做是一個c開發(fā)的軟件。         通過上面描述不難看出,php的執(zhí)行的核心是翻譯出來的一條一條指令,也即opcodeu  opcodeOpcode是php程序執(zhí)行的最基本單位。一個opcode由兩個參數(shù)(op1,op2)、返回值和處理函數(shù)組成。Php程序最終被翻譯為一組opcode處理函數(shù)的順序執(zhí)行常見的幾個處理函數(shù)         ZEND_ASSIGN_SPEC_CV_CV_HANDLER : 變量

11、分配 ($a=$b)         ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER:函數(shù)調(diào)用         ZEND_CONCAT_SPEC_CV_CV_HANDLER:字符串拼接 $a.$b         ZEND_ADD_SPEC_CV_CONST_HANDLER: 加法運算 $a+2   

12、60;     ZEND_IS_EQUAL_SPEC_CV_CONST:判斷相等 $a=1         ZEND_IS_IDENTICAL_SPEC_CV_CONST:判斷相等 $a=16、HashTable  核心數(shù)據(jù)結(jié)構(gòu)HashTable是zend的核心數(shù)據(jù)結(jié)構(gòu),在php里面幾乎并用來實現(xiàn)所有常見功能,我們知道的php數(shù)組即是其典型應(yīng)用,此外,在zend內(nèi)部,如函數(shù)符號表、全局變量等也都是基于hash table來實現(xiàn)。   &

13、#160;     php的hash table具有如下特點:· 支持典型的key->value查詢· 可以當(dāng)做數(shù)組使用· 添加、刪除節(jié)點是O(1)復(fù)雜度· key支持混合類型:同時存在關(guān)聯(lián)數(shù)組合索引數(shù)組· Value支持混合類型:array (“string”,2332)· 支持線性遍歷:如foreach        Zend hash table實現(xiàn)了典型的hash表散列結(jié)構(gòu),同時通過附加一個雙向鏈表,提

14、供了正向、反向遍歷數(shù)組的功能。其結(jié)構(gòu)如下圖圖4 zend hash table數(shù)據(jù)結(jié)構(gòu)可以看到,在hash table中既有key->value形式的散列結(jié)構(gòu),也有雙向鏈表模式,使得它能夠非常方便的支持快速查找和線性遍歷。· 散列結(jié)構(gòu)Zend的散列結(jié)構(gòu)是典型的hash表模型,通過鏈表的方式來解決沖突。需要注意的是zend的hash table是一個自增長的數(shù)據(jù)結(jié)構(gòu),當(dāng)hash表數(shù)目滿了之后,其本身會動態(tài)以2倍的方式擴容并重新元素位置。初始大小均為8。另外,在進(jìn)行key->value快速查找時候,zend本身還做了一些優(yōu)化,通過空間換時間的方式加快速度。比如在每個元素中都會

15、用一個變量nKeyLength標(biāo)識key的長度以作快速判定。· 雙向鏈表Zend hash table通過一個鏈表結(jié)構(gòu),實現(xiàn)了元素的線性遍歷。理論上,做遍歷使用單向鏈表就夠了,之所以使用雙向鏈表,主要目的是為了快速刪除,避免遍歷。         Zend hash table是一種復(fù)合型的結(jié)構(gòu),作為數(shù)組使用時,即支持常見的關(guān)聯(lián)數(shù)組也能夠作為順序索引數(shù)字來使用,甚至允許2者的混合。· Php關(guān)聯(lián)數(shù)組關(guān)聯(lián)數(shù)組是典型的hash_table應(yīng)用。一次查詢過程經(jīng)過如下幾步  

16、0;       getKeyHashValue h;          index = n & nTableMask;          Bucket *p = arBucketindex;          while (p)   

17、60;           if (p->h = h) && (p->nKeyLength = nKeyLength)                  RETURN p->data;            

18、;                          p=p->next;    RETURN FALTURE;從代碼可以看出,這是一個常見的hash查詢過程并增加一些快速判定加速查找。· Php索引數(shù)組索引數(shù)組就是我們常見的數(shù)組,通過下標(biāo)訪問。例如 $arr0Zend HashTable內(nèi)部進(jìn)行了歸一化處理,對于inde

19、x類型key同樣分配了hash值和nKeyLength(為0)。內(nèi)部成員變量nNextFreeElement就是當(dāng)前分配到的最大id,每次push后自動加一。正是這種歸一化處理,php才能夠?qū)崿F(xiàn)關(guān)聯(lián)和非關(guān)聯(lián)的混合由于push操作的特殊性,索引key在php數(shù)組中先后順序并不是通過下標(biāo)大小來決定,而是由push的先后決定。例如 $arr1 = 2; $arr2 = 3;對于double類型的key,Zend HashTable會將他當(dāng)做索引key處理7、Php變量概述· Php是一門弱類型語言,本身不嚴(yán)格區(qū)分變量的類型。 · Php在變量申明的時候不需要指定類型。&

20、#160;· Php在程序運行期間可能進(jìn)行變量類型的隱示轉(zhuǎn)換。 · 和其他強類型語言一樣,程序中也可以進(jìn)行顯示的類型轉(zhuǎn)換。 · Php變量可以分為簡單類型(int、string、bool)、集合類型(array resource object)和常量(const) · 以上所有的變量在底層都是同一種結(jié)構(gòu) zvalZvalZval是zend中另一個非常重要的數(shù)據(jù)結(jié)構(gòu),用來標(biāo)識并實現(xiàn)php變量,其數(shù)據(jù)結(jié)構(gòu)如下Zval主要由三部分組成:1、  type:指定了變量所述的類型(整數(shù)、字符串、數(shù)組等)2、  ref

21、count&is_ref:用來實現(xiàn)引用計數(shù)(后面具體介紹)3、  value:核心部分,存儲了變量的實際數(shù)據(jù)u  zvalueZvalue是用來保存一個變量的實際數(shù)據(jù)。因為要存儲多種類型,所以zvalue是一個union,也由此實現(xiàn)了弱類型。Php變量類型和其實際存儲對應(yīng)關(guān)系如下IS_LONG   -> lvalueIS_DOUBLE -> dvalueIS_ARRAY  -> htIS_STRING -> strIS_RESOURCE -> lvalueu  引用計數(shù)引用計數(shù)在內(nèi)存回收、字符串操

22、作等地方使用非常廣泛。Php中的變量就是引用計數(shù)的典型應(yīng)用Zval的引用計數(shù)通過成員變量is_ref和ref_count實現(xiàn),通過引用計數(shù),多個變量可以共享同一份數(shù)據(jù)。避免頻繁拷貝帶來的大量消耗在進(jìn)行賦值操作時,zend將變量指向相同的zval同時ref_count+,在unset操作時,對應(yīng)的ref_count-1。只有ref_count減為0時才會真正執(zhí)行銷毀操作如果是引用賦值,則zend會修改is_ref為1u  寫時拷貝Php變量通過引用計數(shù)實現(xiàn)變量共享數(shù)據(jù),那如果改變其中一個變量值呢?當(dāng)試圖寫入一個變量時,Zend若發(fā)現(xiàn)該變量指向的zval被多個變量共享,則為其復(fù)制一份re

23、f_count為1的zval,并遞減原zval的refcount,這個過程稱為“zval分離”。可見,只有在有寫操作發(fā)生時zend才進(jìn)行拷貝操作,因此也叫copy-on-write(寫時拷貝)對于引用型變量,其要求和非引用型相反,引用賦值的變量間必須是捆綁的,修改一個變量就修改了所有捆綁變量。整數(shù)、浮點數(shù)類型變量整數(shù)、浮點數(shù)是php中的基礎(chǔ)類型之一,也是一個簡單型變量。對于整數(shù)和浮點數(shù),在zvalue中直接存儲對應(yīng)的值。其類型分別是long和double。從zvalue結(jié)構(gòu)中可以看出,對于整數(shù)類型,和c等強類型語言不同,php是不區(qū)分int、unsigned int、long、long lon

24、g等類型的,對它來說,整數(shù)只有一種類型也就是long。由此,可以看出,在php里面,整數(shù)的取值范圍是由編譯器位數(shù)來決定而不是固定不變的。對于浮點數(shù),類似整數(shù),它也不區(qū)分float和double而是統(tǒng)一只有double一種類型。· 在php中,如果整數(shù)范圍越界了怎么辦?這種情況下會自動轉(zhuǎn)換為double類型,這個一定要小心,很多trick都是由此產(chǎn)生。字符串變量和整數(shù)一樣,字符變量也是php中的基礎(chǔ)類型和簡單型變量通過zvalue結(jié)構(gòu)可以看出,在php中,字符串是由由指向?qū)嶋H數(shù)據(jù)的指針和長度結(jié)構(gòu)體組成,這點和c+中的string比較類似。由于通過一個實際變量表示長度,和c不同,它的字符

25、串可以是2進(jìn)制數(shù)據(jù)(包含0),同時在php中,求字符串長度strlen是O(1)操作。在新增、修改、追加字符串操作時,php都會重新分配內(nèi)存生成新的字符串。最后,出于安全考慮,php在生成一個字符串時末尾仍然會添加0· 常見的字符串拼接方式及速度比較假設(shè)有如下4個變量:$strA=123;  $strB = 456; $intA=123; intB=456;現(xiàn)在對如下的幾種字符串拼接方式做一個比較和說明1、$res = $strA.$strB和$res = “$strA$strB”        

26、; 這種情況下,zend會重新malloc一塊內(nèi)存并進(jìn)行相應(yīng)處理,其速度一般2、$strA = $strA.$strB         這種是速度最快的,zend會在當(dāng)前strA基礎(chǔ)上直接relloc,避免重復(fù)拷貝3、$res = $intA.$intB這種速度較慢,因為需要做隱式的格式轉(zhuǎn)換,實際編寫程序中也應(yīng)該注意盡量避免4、$strA = sprintf (“%s%s”,$strA.$strB);這會是最慢的一種方式,因為sprintf在php中并不是一個語言結(jié)構(gòu),本身對于格式識別和處理就需要耗費比較多時間,另

27、外本身機制也是malloc。不過sprintf的方式最具可讀性,實際中可以根據(jù)具體情況靈活選擇。數(shù)組變量如前所述,Php的數(shù)組通過Zend HashTable來天然實現(xiàn)· foreach操作如何實現(xiàn)?         對一個數(shù)組的foreach就是通過遍歷hashtable中的雙向鏈表完成。對于索引數(shù)組,通過foreach遍歷效率比for高很多,省去了key->value的查找Count操作直接調(diào)用HashTable->NumOfElements,O(1)操作對于123這樣的字符串,zend會

28、轉(zhuǎn)換為其整數(shù)形式。$arr123和$arr123是等價的資源類型變量         這是php中最復(fù)雜的一種變量,也是一種復(fù)合型結(jié)構(gòu)。Php的zval可以表示廣泛的數(shù)據(jù)類型,但是對于自定義的數(shù)據(jù)類型卻很難充分描述。由于沒有有效的方式描繪這些復(fù)合結(jié)構(gòu),因此也沒有辦法對它們使用傳統(tǒng)的操作符。要解決這個問題,只需要通過一個本質(zhì)上任意的標(biāo)識符(label)引用指針,這種方式被稱為資源。在zval中,對于resource,lval作為指針來使用,直接指向資源所在的地址。Resource可以是任意的復(fù)合結(jié)構(gòu),我們熟悉的mysqli、fsock、memcached等都是資源。· 使用資源· 注冊對于一個自定義的數(shù)據(jù)類型,要想將它作為資源。首先需要進(jìn)行注冊,zend會為它分配全局唯一標(biāo)示· 獲取一個資源變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論