![【隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析9600字【論文】】_第1頁(yè)](http://file4.renrendoc.com/view12/M0A/0D/2E/wKhkGWXSHACAauVkAAFv-j0ZSiw129.jpg)
![【隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析9600字【論文】】_第2頁(yè)](http://file4.renrendoc.com/view12/M0A/0D/2E/wKhkGWXSHACAauVkAAFv-j0ZSiw1292.jpg)
![【隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析9600字【論文】】_第3頁(yè)](http://file4.renrendoc.com/view12/M0A/0D/2E/wKhkGWXSHACAauVkAAFv-j0ZSiw1293.jpg)
![【隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析9600字【論文】】_第4頁(yè)](http://file4.renrendoc.com/view12/M0A/0D/2E/wKhkGWXSHACAauVkAAFv-j0ZSiw1294.jpg)
![【隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析9600字【論文】】_第5頁(yè)](http://file4.renrendoc.com/view12/M0A/0D/2E/wKhkGWXSHACAauVkAAFv-j0ZSiw1295.jpg)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
隨機(jī)森林模型在方對(duì)此價(jià)值評(píng)估中的應(yīng)用實(shí)證分析目錄TOC\o"1-3"\h\u7514一、引言 引言(一)研究背景“素質(zhì)教育”的教育理念的提出,對(duì)原本的教育方式帶來(lái)了猛烈的撞擊。自2014年起,“劃片就讀”、“取消擇校費(fèi)”等相似詞語(yǔ)出現(xiàn)在了人們的視野當(dāng)中,國(guó)家教育局對(duì)此出臺(tái)了相關(guān)教育文件,讓劃片就讀成為現(xiàn)如今中小學(xué)生就讀于哪所學(xué)校的主要方式之一。在重點(diǎn)學(xué)校供小于求的情況下,學(xué)校的選擇對(duì)適齡孩子家庭吸引力不斷變大,也就出現(xiàn)了所謂的學(xué)區(qū)房。因?qū)W區(qū)房具有游離于普通住宅房地產(chǎn)的兩種基本屬性(投資和住宅)之外的第三屬性——“教育”屬性,使學(xué)區(qū)房市場(chǎng)價(jià)格高于普通住宅房地產(chǎn)。該如何尋找到新的評(píng)估方法評(píng)估學(xué)區(qū)房所具有的“教育”屬性對(duì)房地產(chǎn)價(jià)格的影響,是評(píng)估人員應(yīng)盡的責(zé)任和義務(wù)。本文將以隨機(jī)森林理論為基礎(chǔ)建立關(guān)于Y區(qū)學(xué)區(qū)房的隨機(jī)森林模型來(lái)解決以上問(wèn)題。(二)研究意義在理論方面,據(jù)2015年國(guó)家出臺(tái)的《房地產(chǎn)估價(jià)規(guī)范》中的要求,估價(jià)師在房地產(chǎn)評(píng)估報(bào)告中應(yīng)至少使用兩種評(píng)估方法對(duì)住宅房地產(chǎn)進(jìn)行評(píng)定估算,但當(dāng)前房地產(chǎn)估價(jià)行業(yè)主流的評(píng)估方法有著一定的局限性。本文將以Y區(qū)學(xué)區(qū)房評(píng)估為例,以隨機(jī)森林模型原理為基礎(chǔ),通過(guò)房地產(chǎn)中介網(wǎng)站和實(shí)際勘察收集相關(guān)數(shù)據(jù)最終得出關(guān)于S市Y區(qū)學(xué)區(qū)房的住宅房地產(chǎn)評(píng)估模型,并對(duì)隨機(jī)森林模型在S市Y區(qū)學(xué)區(qū)房估價(jià)領(lǐng)域中所具有的優(yōu)點(diǎn)進(jìn)行探討分析。經(jīng)過(guò)本次研究,期望為學(xué)區(qū)房?jī)r(jià)格的評(píng)估提供新的評(píng)估方法。在實(shí)踐方面,由于房地產(chǎn)評(píng)估存在著諸多局限性,例如定性指標(biāo)難量化、評(píng)估程序繁瑣。本次研究,將通過(guò)隨機(jī)森林算法,建造回歸模型并通過(guò)房地產(chǎn)中介網(wǎng)站和實(shí)際查勘收集相關(guān)數(shù)據(jù),將收集到的數(shù)據(jù)進(jìn)行歸一化處理后得到學(xué)區(qū)房影響因素與掛牌價(jià)格之間的關(guān)系。與當(dāng)前房地產(chǎn)估價(jià)行業(yè)中主流的估價(jià)方法進(jìn)行對(duì)比。得出前者具有準(zhǔn)確度高、預(yù)測(cè)趨勢(shì)更為平緩以及偏差更小的優(yōu)點(diǎn)。隨機(jī)森林模型的使用希望為政府的宏觀調(diào)控提供理論依據(jù)和數(shù)據(jù)支持。二、國(guó)內(nèi)外研究現(xiàn)狀(一)國(guó)外研究現(xiàn)狀在傳統(tǒng)的房地產(chǎn)估價(jià)行業(yè)中,英國(guó)的住宅房地產(chǎn)評(píng)估體系對(duì)我國(guó)房地產(chǎn)估價(jià)行業(yè)的影響較大。實(shí)際估價(jià)作業(yè)時(shí),主要還是依靠市場(chǎng)信息以及估價(jià)師的工作經(jīng)驗(yàn),以市場(chǎng)法、收益還原法、開(kāi)發(fā)法、成本法、長(zhǎng)期趨勢(shì)法為主[1]。現(xiàn)如今我國(guó)主要借鑒美國(guó)的估價(jià)方法,我國(guó)的學(xué)者將數(shù)學(xué)模型和統(tǒng)計(jì)方法引用到房地產(chǎn)估價(jià)當(dāng)中,例如多元回歸法、逐步回歸法(2003)。隨著計(jì)算機(jī)技術(shù)的推廣,空間分析法,模糊邏輯法,價(jià)格特征法等數(shù)學(xué)模型方法也逐漸被引用與房地產(chǎn)估價(jià)中,其中,價(jià)格特征模型當(dāng)前在住宅房地產(chǎn)評(píng)估方面的應(yīng)用上是比較廣泛的。如Saderionetal(1994)[2]依據(jù)上個(gè)世紀(jì)80年代美國(guó)德州的住宅市場(chǎng)成交數(shù)據(jù)構(gòu)造價(jià)格特征模型,使用回報(bào)率分析與傳統(tǒng)的特征價(jià)格相結(jié)合的方法,印證了該模型在住宅房地產(chǎn)估價(jià)中的適用性。國(guó)外對(duì)于學(xué)區(qū)房類房地產(chǎn)價(jià)格影響因素研究主要分為住宅因素和教育因素兩個(gè)方面:國(guó)外學(xué)者Oates(1969)[3]在基于特征價(jià)格模型的基礎(chǔ)之上,得出學(xué)校的投資對(duì)相關(guān)住宅的價(jià)格產(chǎn)生正向的影響的結(jié)論。Bogart(1997)[4]等學(xué)者收集美國(guó)房地產(chǎn)樣本數(shù)據(jù),在特征價(jià)格法的基礎(chǔ)上,在探討過(guò)程中察覺(jué)到學(xué)校這一變量不易確定,于是研究人員采用控制變量法對(duì)這一問(wèn)題進(jìn)行解決。經(jīng)過(guò)研究得出,房?jī)r(jià)的高低隨學(xué)校的辦學(xué)質(zhì)量和所交稅費(fèi)而產(chǎn)生波動(dòng),這兩個(gè)因子(學(xué)校辦學(xué)質(zhì)量和所交稅費(fèi))對(duì)房?jī)r(jià)的提升有著促進(jìn)作用。(二)國(guó)內(nèi)研究現(xiàn)狀國(guó)內(nèi)評(píng)估人員在實(shí)際評(píng)估作業(yè)時(shí)通常在三個(gè)基本評(píng)估方法中選取兩種對(duì)房地產(chǎn)價(jià)格進(jìn)行評(píng)估。然而,因?yàn)閭鹘y(tǒng)方法自身的局限性,使得傳統(tǒng)評(píng)估方法的評(píng)估結(jié)果未能完全符合被估價(jià)對(duì)象的實(shí)際價(jià)格。為促進(jìn)評(píng)估行業(yè)的發(fā)展,業(yè)內(nèi)人員開(kāi)始嘗試將各種數(shù)學(xué)模型引用至對(duì)評(píng)估對(duì)象的評(píng)估中。由于國(guó)內(nèi)對(duì)于住宅房地產(chǎn)評(píng)估的研究起步比較晚,近年來(lái),國(guó)內(nèi)諸多學(xué)者開(kāi)始逐步借鑒國(guó)外的研究方法。與國(guó)外相同,我國(guó)對(duì)房地產(chǎn)價(jià)格的影響因素也分為住宅因素及教育因素。而與國(guó)外有所不同的在于:在住宅因素的表述方面,國(guó)外的宏觀因素在國(guó)內(nèi)被表述為一般因素,國(guó)外的微觀因素在國(guó)內(nèi)則被拆分成區(qū)域因素以及個(gè)別因素。我們?cè)诳紤]一般因素時(shí),常常會(huì)考慮到供求因素以及宏觀經(jīng)濟(jì)政策。趙雪瑤(2018)[5]在計(jì)量分析和逐步分析的基礎(chǔ)上對(duì)房?jī)r(jià)影響因子進(jìn)行分析,得出經(jīng)濟(jì)因素對(duì)我國(guó)房?jī)r(jià)有著比較重要的影響。還有在教育因素方面,李從容和朱世見(jiàn)等(2019)將江蘇秦淮作為研究對(duì)象用以研究學(xué)區(qū)房?jī)r(jià)格影響變量,原秦淮區(qū)為“多校劃片”政策,而原將白下區(qū)則為“單校劃片”政策。李從容和朱世見(jiàn)將兩者進(jìn)行對(duì)比和研究,并在空間計(jì)量模型以及自相關(guān)檢驗(yàn)的基礎(chǔ)上,得到結(jié)論:秦淮區(qū)房地產(chǎn)價(jià)格有著空間異質(zhì)性,小學(xué)學(xué)校等級(jí)與小學(xué)距離學(xué)校的距離對(duì)二區(qū)房?jī)r(jià)都沒(méi)有太大的影響,而原本白下區(qū)區(qū)域的房地產(chǎn)價(jià)格則受到初中學(xué)校等級(jí)和初中距離學(xué)校距離的影響比較明顯,研究結(jié)果表明,初中的教育質(zhì)量的高低對(duì)原秦淮區(qū)的房?jī)r(jià)影響非常顯著[6]。胡濤(2020)[7]將北京市的地鐵八號(hào)線作為研究對(duì)象,得出以八號(hào)線的站點(diǎn)為中心,在一千米范圍當(dāng)中,隨著住宅與站點(diǎn)距離越遠(yuǎn),房?jī)r(jià)受到的其影響程度降低的結(jié)論。鞏寧(2020)[8]不管是以學(xué)校內(nèi)老師與學(xué)生的比重、學(xué)校質(zhì)量分類還是學(xué)生成績(jī)哪一個(gè)特征表示學(xué)校教學(xué)質(zhì)量,都得到了小學(xué)質(zhì)量與學(xué)區(qū)房房?jī)r(jià)成正相關(guān)關(guān)系的結(jié)論。其中擁有教育資源較多的學(xué)校比教育資源一般的學(xué)校能為對(duì)應(yīng)學(xué)區(qū)的房?jī)r(jià)帶來(lái)4%左右的溢價(jià),老師與學(xué)生之間的比重每提高10個(gè)點(diǎn),房?jī)r(jià)便會(huì)提高1-2%,平均成績(jī)每提高10分,房?jī)r(jià)便會(huì)提高1-3%。同時(shí),通過(guò)對(duì)比分析2013年與一2017年的信息能夠得出,濟(jì)南市重點(diǎn)學(xué)校劃片的學(xué)區(qū)房溢價(jià)呈現(xiàn)出上升狀態(tài),教育資源不公平有著擴(kuò)大的趨勢(shì),同時(shí)濟(jì)南各地區(qū)情況也存在著差異,天橋區(qū)、歷下區(qū)及歷城區(qū)中小學(xué)的學(xué)校類型對(duì)房?jī)r(jià)的影響系數(shù)呈現(xiàn)出下降趨勢(shì),而市中區(qū)學(xué)校類型對(duì)房?jī)r(jià)則呈上升趨勢(shì)。。通過(guò)國(guó)內(nèi)外研究發(fā)現(xiàn),較之國(guó)內(nèi),國(guó)外評(píng)估方法發(fā)展速度較快且不局限于傳統(tǒng)方法,國(guó)外學(xué)者在結(jié)合房地產(chǎn)評(píng)估發(fā)展現(xiàn)狀的情況下,引用其他領(lǐng)域的研究成果以此來(lái)彌補(bǔ)傳統(tǒng)方法的缺陷。如市場(chǎng)法房地產(chǎn)價(jià)格的一些影響因素的判定主要來(lái)源于評(píng)估人員的經(jīng)驗(yàn)判斷,自主性較強(qiáng),難以體現(xiàn)估價(jià)結(jié)果的客觀性。收益法報(bào)酬率的選取,多以估價(jià)師的主觀印象進(jìn)行確定,并沒(méi)有標(biāo)準(zhǔn)的報(bào)酬率的確定方法;成本法的運(yùn)算主要考慮房地產(chǎn)的開(kāi)發(fā)費(fèi)用、財(cái)務(wù)成本以及管理成本等實(shí)物價(jià)值但其忽略了無(wú)形價(jià)值對(duì)房地產(chǎn)價(jià)值的影響。例如一些地區(qū)靠近景區(qū)的房產(chǎn)景觀資源較為豐富,靠近地鐵、公交站點(diǎn)的房產(chǎn)交通資源較為豐富,劃片學(xué)區(qū)的房產(chǎn)教育資源較為豐富等,這些無(wú)形價(jià)值對(duì)價(jià)格的影響都可能比較巨大。因此忽略無(wú)形價(jià)值對(duì)房產(chǎn)價(jià)格的影響極易增加誤差率。因?yàn)閭鹘y(tǒng)房地產(chǎn)估價(jià)方法擁有主觀性較強(qiáng)等弊端,容易造成傳統(tǒng)的估價(jià)方法很難準(zhǔn)確反應(yīng)被評(píng)估房地產(chǎn)自身的真實(shí)價(jià)格。為了使住宅房地產(chǎn)估價(jià)行業(yè)更加迅速且平穩(wěn)的發(fā)展,國(guó)內(nèi)諸多學(xué)者以改善上述方法的局限性為目的將各類數(shù)學(xué)模型引用于房地產(chǎn)的估價(jià)當(dāng)中。三、學(xué)區(qū)房評(píng)估方法分析學(xué)區(qū)房相關(guān)理論學(xué)區(qū)房的概念學(xué)區(qū)房指的是有著高質(zhì)量教育資源的住宅房地產(chǎn)[9],是根據(jù)當(dāng)?shù)亟逃块T有關(guān)規(guī)定的,依據(jù)劃片入學(xué)原則,將各學(xué)校招生范圍進(jìn)行限制,在被限制的區(qū)域內(nèi)的學(xué)生可以免去入學(xué)考試這一環(huán)節(jié)直接試進(jìn)入規(guī)定的學(xué)校就讀并且享受為期九年的義務(wù)教育。這樣區(qū)域內(nèi)的房產(chǎn)便是我們所說(shuō)的“學(xué)區(qū)房”。本文以S市Y區(qū)重點(diǎn)小學(xué)劃片住宅為本次實(shí)證研究的研究對(duì)象。學(xué)區(qū)房的形成因素1962年教育部出臺(tái)規(guī)定,各地選定一批重點(diǎn)中小學(xué),加強(qiáng)師資教育和教育資金的投入。因這一歷史原因使得重點(diǎn)學(xué)校教育資源長(zhǎng)期處于優(yōu)勢(shì)地位,從而引起了重點(diǎn)學(xué)校片區(qū)內(nèi)房產(chǎn)價(jià)格居高不下。學(xué)區(qū)房擁有重點(diǎn)學(xué)校的入學(xué)名額,能夠給予孩子更為優(yōu)越的教育環(huán)境;因?yàn)閷W(xué)區(qū)房具有“教育”的特殊屬性,在孩子畢業(yè)后,可以將學(xué)區(qū)房在二手房市場(chǎng)上出售,因貨幣的貶值以及近幾年家長(zhǎng)對(duì)孩子的教育越來(lái)越重視,出售價(jià)格往往會(huì)接近甚至高于當(dāng)初的購(gòu)買價(jià)格。(二)傳統(tǒng)評(píng)估方法的弊端傳統(tǒng)評(píng)估方法中,市場(chǎng)法是指基于替代理論,通過(guò)近期房地產(chǎn)市場(chǎng)成交的類似案例,并調(diào)整選取的各個(gè)交易案例的系數(shù)(樓幢位置、朝向、居住聚集度、房屋新舊程度、小區(qū)規(guī)模、小區(qū)檔次等),以求出被評(píng)估房地產(chǎn)的價(jià)值的一種方法。收益法是指通過(guò)收集房地產(chǎn)相關(guān)數(shù)據(jù)(房屋建成年限、房屋已使用年限、土地標(biāo)準(zhǔn)使用年限、土地剩余使用年限、房屋月租金等)、選取測(cè)試參數(shù)(轉(zhuǎn)售費(fèi)率、未來(lái)價(jià)格上漲率、投資風(fēng)險(xiǎn)補(bǔ)償率等)從而求取被評(píng)估住宅房地產(chǎn)價(jià)格的一種方法。成本法則是指通過(guò)估算被評(píng)估房地產(chǎn)的重置成本,計(jì)算被評(píng)估房地產(chǎn)的各項(xiàng)貶值,并將其從重置成本中扣除而得到被評(píng)估住宅房地產(chǎn)價(jià)格的一種方法。雖然當(dāng)前傳統(tǒng)的評(píng)估方法一直在進(jìn)行著不斷完善,但對(duì)于學(xué)區(qū)房的估價(jià)來(lái)說(shuō),仍然存在諸多弊端。市場(chǎng)法的弊端房地產(chǎn)價(jià)格影響因素判定主要來(lái)源于評(píng)估人員的經(jīng)驗(yàn)判斷,自主性較強(qiáng),難以體現(xiàn)估價(jià)結(jié)果的客觀性。(2)市場(chǎng)法通常是指在一般情況下,將過(guò)去成交的市場(chǎng)實(shí)際案例與被評(píng)估房地產(chǎn)價(jià)格進(jìn)行對(duì)比分析,但由于價(jià)值時(shí)點(diǎn)之前的交易案例僅代表過(guò)去時(shí)點(diǎn)的市場(chǎng)價(jià)格。而隨時(shí)間的改變與政策導(dǎo)向的變化,房地產(chǎn)的價(jià)格也較易產(chǎn)生重大差異。收益法的弊端不同類型的收益性房地產(chǎn)的獲利方式有所差別,房?jī)r(jià)漲跌會(huì)影響收益。(2)在實(shí)際評(píng)估作業(yè)中,多以估價(jià)師的主觀印象進(jìn)行報(bào)酬率的確定,并沒(méi)有標(biāo)準(zhǔn)的報(bào)酬率的確定方法。成本法的弊端(1)房地產(chǎn)估價(jià)市場(chǎng)的平衡性作為成本法使用的前提,大大增加了成本法在實(shí)際應(yīng)用中的局限性。許多時(shí)候住宅房地產(chǎn)估價(jià)市場(chǎng)變化較快,房地產(chǎn)的成本與其價(jià)值由供求關(guān)系而決定,此時(shí)若使用成本法進(jìn)行住宅房地產(chǎn)價(jià)格的評(píng)估,易造成成本法的準(zhǔn)確性大大降低。(2)成本法僅僅只考慮到有形價(jià)值對(duì)住宅房地產(chǎn)價(jià)格的影響,而卻忽略了無(wú)形價(jià)值對(duì)房地產(chǎn)價(jià)格的影響。例如一些地區(qū)靠近景區(qū)的房產(chǎn)景觀資源較為豐富,靠近地鐵、公交站點(diǎn)的房產(chǎn)交通資源比較豐富,劃片學(xué)區(qū)的房產(chǎn)教育資源較為豐富等,這些無(wú)形價(jià)值對(duì)價(jià)格的影響都可能比較巨大。因此忽略無(wú)形價(jià)值對(duì)房產(chǎn)價(jià)格的影響,從而增加誤差率。(三)隨機(jī)森林理論隨機(jī)森林(RF)理論是BreimanL[10]在本世紀(jì)初提出的,它是一種采用多棵決策樹(shù)運(yùn)算的一種分類器,能夠通過(guò)對(duì)樣本集的訓(xùn)練進(jìn)行回歸以及分類。方匡南等[11]闡述了和隨機(jī)森林相關(guān)的理論、性質(zhì)以及應(yīng)用,帶動(dòng)了國(guó)內(nèi)學(xué)者對(duì)于隨機(jī)森林模型理論、方法研究的一波新的浪潮。有關(guān)隨機(jī)森林模型的長(zhǎng)處在一些文獻(xiàn)中已經(jīng)有所體現(xiàn):BiauG[12]覺(jué)得隨機(jī)森林模型具有平穩(wěn)性且適用于計(jì)算少量數(shù)據(jù)集的特點(diǎn),同時(shí)它的收斂速率只是由強(qiáng)特征數(shù)來(lái)決定而非由噪聲變量數(shù)來(lái)決定。BiauG等[13]總結(jié)概括了隨機(jī)森林的理論以及方法。1.隨機(jī)森林算法流程(1)采用bootstrap方法,在已經(jīng)收集的50個(gè)樣本數(shù)據(jù)中,按照樣本集:測(cè)試集=9:1的比例隨機(jī)的抽取45個(gè)樣本構(gòu)成樣本集,再所得到的樣本集構(gòu)建出決策樹(shù),每次抽樣剩下的樣本成為測(cè)試集,作為隨機(jī)森林模型的測(cè)試樣本。(2)根據(jù)參考的文獻(xiàn)以及收集的資料,假設(shè)所收集的因素特征有有學(xué)校屬性、小學(xué)就讀名額、室、廳、衛(wèi)、朝向、裝修情況、建筑面積、所在樓層、距小學(xué)最短步行距離、商業(yè)指數(shù)、交通指數(shù)、醫(yī)療指數(shù)、建成年代、綠化率、總樓層、學(xué)區(qū)房掛牌價(jià)格、建筑結(jié)構(gòu)這17種變量特征,對(duì)每棵樹(shù)的每個(gè)結(jié)點(diǎn)處都隨機(jī)抽取mtry個(gè)變量,mtry為節(jié)點(diǎn)值所對(duì)應(yīng)的最小節(jié)點(diǎn)數(shù),把mtry=2作為備選的變量,依靠分支優(yōu)度的準(zhǔn)則從中選取最優(yōu)的分支。(3)每棵回歸樹(shù)按照自上而下的輪回方式對(duì)齊進(jìn)行分裂,設(shè)房地產(chǎn)的屬性和特征可能出現(xiàn)的行為結(jié)果最少個(gè)數(shù)為2,并將其作為回歸樹(shù)停止分裂的規(guī)定。(4)重復(fù)上述步驟,直至模型建立完成。(5)最后,將測(cè)試集的17個(gè)變量特征屬性輸入至已經(jīng)構(gòu)造的隨機(jī)森林模型當(dāng)中,便可以得到學(xué)區(qū)房的估價(jià)結(jié)果。本文將以以上述思路為基礎(chǔ)并借助Python,搭建并計(jì)算隨機(jī)森林模型。過(guò)程如下圖所示:圖3-1隨機(jī)森林建模過(guò)程2.決策樹(shù)的建立決策樹(shù)是指在已經(jīng)知道的各類可能發(fā)生的情況的概率基礎(chǔ)之上,通過(guò)構(gòu)造決策樹(shù)用以求出凈現(xiàn)值中的期望值大于或者等于零的概率的一種方法。完整的決策樹(shù)包含著一個(gè)根節(jié)點(diǎn),諸多的內(nèi)節(jié)點(diǎn)以及諸多的葉節(jié)點(diǎn);其中,根節(jié)點(diǎn)是唯一的、起始的節(jié)點(diǎn)。內(nèi)部節(jié)點(diǎn)表示房地產(chǎn)的屬性和特征的集合。即:小學(xué)就讀名額、室、廳、衛(wèi)、朝向、裝修情況、學(xué)校屬性、建筑面積、所在樓層、距小學(xué)最短步行距離、商業(yè)指數(shù)、交通指數(shù)、醫(yī)療指數(shù)、建成年代、綠化率、總樓層、學(xué)區(qū)房掛牌價(jià)格、建筑結(jié)構(gòu),這17種變量特征的集合;葉節(jié)點(diǎn)則對(duì)應(yīng)每一個(gè)可能會(huì)出現(xiàn)的行為結(jié)果。3.特征變量的重要性排序隨機(jī)森林模型中對(duì)樣本數(shù)據(jù)重要性的排列方法主要有袋外數(shù)據(jù)(OOB)和基尼系數(shù)(Gini)兩種方法,本文采用基尼系數(shù)(Gini)對(duì)采集到的樣本中的17種特征變量因素的集合中,隨機(jī)性的抽取一個(gè)子項(xiàng),計(jì)算其被錯(cuò)分到其他組和之中的概率,這個(gè)概率,便稱為基尼不純度,基尼不純度與變量特征之間呈反向關(guān)系。具體公式如下:(3-1)其中,Px為某特征變量發(fā)生的概率;y為總的特征變量數(shù),即y=17;Gini(p)為基尼不純度。隨機(jī)森林模型的優(yōu)點(diǎn)(1)隨著信息技術(shù)的發(fā)展,機(jī)器學(xué)習(xí)被不斷推廣,隨機(jī)森林在個(gè)行業(yè)的應(yīng)用中也愈發(fā)廣泛。隨機(jī)森林不僅可以對(duì)預(yù)測(cè)離散值同時(shí)也還可以預(yù)測(cè)連續(xù)值。在數(shù)據(jù)處理上也起到了較大的作用。[14](2)隨機(jī)森林(RF)模型在建模過(guò)程中可以評(píng)估所有輸入變量對(duì)輸出結(jié)果的重要性。[15](3)對(duì)于很多種資料的數(shù)據(jù),隨機(jī)森林模型可以產(chǎn)生高準(zhǔn)確度的分類器。(4)隨機(jī)森林模型包含一個(gè)好方法可以估計(jì)遺失的資料,并且,如果有很大一部分的資料遺失,隨機(jī)森林模型仍可以維持準(zhǔn)確度。四、學(xué)區(qū)房指標(biāo)體系建立(一)研究對(duì)象描述評(píng)估中以Y區(qū)學(xué)區(qū)房學(xué)位緊張為篩選依據(jù),基于教育局發(fā)布的相關(guān)信息,選取S市Y區(qū)實(shí)驗(yàn)小學(xué)、S市揚(yáng)真小學(xué)、S市勝利小學(xué)三所小學(xué)劃片內(nèi)的學(xué)區(qū)房數(shù)據(jù)作為本文價(jià)格測(cè)算的數(shù)據(jù)來(lái)源。學(xué)校概括如表4-1所示:表4-1學(xué)校概括表學(xué)校名稱簡(jiǎn)介S市Y區(qū)實(shí)驗(yàn)小學(xué)\o"/lemma/ShowInnerLink.htm?lemmaId=7623885&ss_c=ssc.citiao.link"位于Y區(qū)文體路106號(hào)。學(xué)??傉嫉孛娣e4182㎡,校舍面積3548㎡。有20多個(gè)教學(xué)班,學(xué)生總數(shù)1500余人。有特級(jí)教師1人,小中高教師3人,小學(xué)高級(jí)教師40余人。S市揚(yáng)真小學(xué)座落于省級(jí)示范小區(qū)——楊真新區(qū)。學(xué)校用地面積3842.07平方米。現(xiàn)有24個(gè)教學(xué)班,學(xué)生1200余人,在任教師70余人,其中小高職稱40余人,大專以上學(xué)歷60余人,在崗黨員教師20余人。S市勝利小學(xué)位于城區(qū)勝利街65號(hào),原名天河小學(xué)。學(xué)?,F(xiàn)有教學(xué)班26個(gè),在校生1259人,在編教師7余人(其中中學(xué)高級(jí)教師4人,小學(xué)高級(jí)教師50余人,區(qū)、市級(jí)骨干教師20余人,具有大專以上學(xué)歷40余人,占教師總數(shù)的68.6%。)(二)數(shù)據(jù)來(lái)源及獲取方式1.房屋數(shù)據(jù)本次通過(guò)當(dāng)?shù)胤慨a(chǎn)中介網(wǎng)站(安居客、悟空找房等)上收集到的數(shù)據(jù)用來(lái)作為本文對(duì)Y區(qū)學(xué)區(qū)房研究的主要數(shù)據(jù)來(lái)源,本文將收集S市Y區(qū)2020年10月15日后的學(xué)區(qū)房出售信息數(shù)據(jù),并降低宏觀因素對(duì)學(xué)區(qū)房?jī)r(jià)格的影響。2.現(xiàn)場(chǎng)研究通過(guò)二手房中介網(wǎng)站(安居客、悟空找房等)的線上調(diào)查,能夠獲得被選定學(xué)區(qū)房對(duì)應(yīng)小區(qū)的一些基本特征,包括戶型(室、衛(wèi)、廳)、建成年份、建筑面積等。本文通過(guò)地圖軟件中的實(shí)景地圖對(duì)小區(qū)環(huán)境及基礎(chǔ)設(shè)施進(jìn)行調(diào)查,獲取小區(qū)附近的商業(yè)、醫(yī)療及交通設(shè)施數(shù)量,通過(guò)數(shù)據(jù)歸化處理后得出小區(qū)的商業(yè)指數(shù)、交通指數(shù)以及醫(yī)療指數(shù)。(三)候選指標(biāo)的構(gòu)成在安居客、悟空找房等交易網(wǎng)站上都有房東預(yù)期住宅的出售價(jià)格,因掛牌價(jià)格波動(dòng)較大,同小區(qū)內(nèi)的住宅價(jià)格也常常相差甚遠(yuǎn)。因此,預(yù)期交易價(jià)格僅為參考依據(jù),最終成交價(jià)格需買方與賣方達(dá)成統(tǒng)一,顯然,交易價(jià)格在諸多響應(yīng)變量值最具代表性。但因?qū)嶋H成交價(jià)格較難獲得,因此本文以二手房中介網(wǎng)站(安居客、悟空找房等)中的價(jià)格充當(dāng)實(shí)際市場(chǎng)交易價(jià)格,即,將二手房中介網(wǎng)站(安居客、悟空找房等)上的掛牌價(jià)格做為因變量。自變量的選取,則是依靠實(shí)際勘察、其他學(xué)者的研究文獻(xiàn)及成果、二手房中介交易網(wǎng)站數(shù)據(jù),綜合評(píng)價(jià)數(shù)據(jù)的關(guān)鍵性、可量化來(lái)確定指標(biāo),最終篩選四大影響類別和十七項(xiàng)具體指標(biāo)。具體情況見(jiàn)下表4-1。表4-1學(xué)區(qū)房評(píng)估體系候選指標(biāo)表變量類型影響因素類別具體指標(biāo)因變量住宅單價(jià)學(xué)區(qū)房掛牌價(jià)格自變量學(xué)校特征小學(xué)就讀名額學(xué)校屬性距小學(xué)最短步行距離個(gè)體特征室廳衛(wèi)朝向裝修情況建筑面積所在樓層區(qū)位特征商業(yè)指數(shù)交通指數(shù)醫(yī)療指數(shù)樓盤特征建成年代綠化率總樓層建筑結(jié)構(gòu)1.學(xué)校特征因本次研究對(duì)象為學(xué)區(qū)房,故將學(xué)校特征中的就讀名額作為第一考慮要素,學(xué)校屬性作為第二考慮要素,小區(qū)至學(xué)校步行距離為第三考慮要素。2.個(gè)體特征個(gè)體特征為學(xué)區(qū)房本身特征,除了具有教育特征,房屋本身狀況也是選取的考慮因素,比如戶型、朝向、結(jié)構(gòu)、面積等,這些個(gè)體因素的全面性能夠?yàn)殡S機(jī)森林模型的構(gòu)建提供更好的擬合度做支撐。3.區(qū)位特征區(qū)位特征作為區(qū)位地理特征形成和功能變化的前提,主要是由周邊生活配套設(shè)施、醫(yī)療以及交通的便捷程度來(lái)決定。往往越處于市中心、醫(yī)療情況較好、交通便利等區(qū)域,住宅價(jià)值越高的。反之,越遠(yuǎn)離市中心、基礎(chǔ)設(shè)施欠發(fā)達(dá)的地區(qū),住宅價(jià)值越低。4.樓盤特征樓盤特征為建成年代、綠化率、總樓層和建筑類型,例如,建筑結(jié)構(gòu)分為鋼混與磚混,鋼混結(jié)構(gòu)價(jià)格較之磚混結(jié)構(gòu)會(huì)較高、綠化覆蓋率的高低與房屋價(jià)格價(jià)格成正相關(guān)等。(四)數(shù)據(jù)預(yù)處理通過(guò)對(duì)網(wǎng)站查詢以及實(shí)際勘察所得到的信息進(jìn)行檢索,篩選出50條完整的房產(chǎn)信息。通過(guò)數(shù)據(jù)歸化對(duì)收集到的數(shù)據(jù)進(jìn)行預(yù)處理并將一些變量量化為可運(yùn)算的數(shù)據(jù),以便于隨機(jī)森林(RF)模型的建立,量化標(biāo)準(zhǔn)如表4-2所示。表4-2可量化標(biāo)準(zhǔn)表名稱量化標(biāo)準(zhǔn)就讀名額有=1,無(wú)=0朝向南北=1,非南北=0裝修情況普通裝修=1,中檔裝修=2,高檔裝修=3建筑結(jié)構(gòu)鋼混=1,磚混=0所在層數(shù)低層或頂層=1,中層=2,高層=3交通根據(jù)實(shí)際情況賦值0-5商業(yè)根據(jù)實(shí)際情況賦值0-5醫(yī)療根據(jù)實(shí)際情況賦值0-5學(xué)校屬性根據(jù)實(shí)際情況賦值0-1數(shù)值型變量建筑面積,建筑結(jié)構(gòu)等數(shù)值型變量通過(guò)最值法使其數(shù)值映射在0-1范圍內(nèi)。最值法:也稱為離差標(biāo)準(zhǔn)化法,指基于線性變化的方式上對(duì)原始數(shù)據(jù)進(jìn)行變換,讓每一個(gè)原始的數(shù)據(jù)得出的結(jié)果位于0-1的范圍內(nèi),其公式如下:(4-1)其中,為經(jīng)過(guò)處理后的值,為預(yù)處理后的數(shù)據(jù),、分別為所在數(shù)據(jù)組的最大值和最小值。案例分析——以S市Y區(qū)為例隨機(jī)森林最優(yōu)參數(shù)的選擇本文運(yùn)用Python軟件構(gòu)建隨機(jī)森林(RF)模型,在使用計(jì)算機(jī)構(gòu)建隨機(jī)森林模型時(shí),隨機(jī)森林最優(yōu)參數(shù)(mtry、ntree)的值極為關(guān)鍵。RF函數(shù)的參數(shù)是默認(rèn),本文為節(jié)省程序運(yùn)行時(shí)間,預(yù)先設(shè)定ntree值處于0-20之間進(jìn)行參數(shù)尋優(yōu),繪制ntree學(xué)習(xí)曲線。計(jì)算機(jī)運(yùn)行結(jié)果顯示,最佳ntree個(gè)數(shù)為17時(shí),mtry節(jié)點(diǎn)對(duì)應(yīng)的是最小節(jié)點(diǎn)數(shù),默認(rèn)2為最佳選擇,ntree分布圖如圖5-1所示: 圖5-1確定最佳ntree的分布圖變量的重要性排序基于隨機(jī)森林(RF)對(duì)收集的四大類變量,十七個(gè)具體影響因素進(jìn)行重要性排序,程序運(yùn)行結(jié)果表明17個(gè)影響因素的具體排名從大到小依次為:建筑面積>小學(xué)就讀名額>學(xué)校屬性>總樓層>建成年代>商業(yè)指數(shù)>距小學(xué)最短步行距離>所在樓層>醫(yī)療指數(shù)>裝修情況>交通指數(shù)>廳>室>綠化率>衛(wèi)>朝向>建筑結(jié)構(gòu)。搭建Y區(qū)學(xué)區(qū)房評(píng)估模型本文將收集到的50個(gè)數(shù)據(jù)按照訓(xùn)練集:測(cè)試集=9:1的比例劃分,將45個(gè)樣本作為訓(xùn)練集樣本進(jìn)行學(xué)區(qū)房?jī)r(jià)格的評(píng)估,得出計(jì)算機(jī)運(yùn)行結(jié)果決定系數(shù)為0.533。通過(guò)對(duì)剩余的五個(gè)樣本構(gòu)成測(cè)試集,得到圖5-2,圖中,橙線代表真實(shí)值,藍(lán)線代表預(yù)測(cè)值,可以直觀的看出,真實(shí)值與預(yù)測(cè)值之間相差率較小檢驗(yàn)隨機(jī)森林模型的預(yù)測(cè)能力較高。運(yùn)算結(jié)果如下圖所示:圖5-2預(yù)測(cè)價(jià)格與實(shí)際價(jià)格的對(duì)比傳統(tǒng)的房地產(chǎn)評(píng)估法計(jì)算數(shù)據(jù)與隨機(jī)森林模型計(jì)算數(shù)據(jù)結(jié)果對(duì)比分析本文選取固有的房地產(chǎn)與收益法相結(jié)合的方法,選取五個(gè)收集到的房產(chǎn)數(shù)據(jù),借用云評(píng)眾聯(lián)管理平臺(tái),采取收益法與市場(chǎng)比較法相結(jié)合的方法計(jì)算被收集的參數(shù)房產(chǎn)的評(píng)估價(jià)格,將其與實(shí)際的市場(chǎng)成交價(jià)格做出對(duì)比。市場(chǎng)法是基于替代理論的一種評(píng)估方法,通過(guò)選取近期市場(chǎng)上成交的相同或者相似案例進(jìn)行對(duì)比分析,調(diào)整案例價(jià)格最終算出被評(píng)估資產(chǎn)的評(píng)估值。計(jì)算公式如下:市場(chǎng)比較法單價(jià)=可比實(shí)例建立比較基準(zhǔn)后的單價(jià)×市場(chǎng)狀況×實(shí)物狀況調(diào)整系數(shù)×交易情況修正系數(shù)調(diào)整系數(shù)×權(quán)益狀況調(diào)整系數(shù)×區(qū)位狀況調(diào)整系數(shù)。市場(chǎng)比較法評(píng)估價(jià)值=評(píng)估單價(jià)×面積所得稅稅費(fèi)=(評(píng)估價(jià)值/1.05)×0.01或0.056其中,住宅成交日未滿兩年取0.056,成交日滿兩年取0.01市場(chǎng)比較法凈值=評(píng)估價(jià)值-稅費(fèi)收益法是指通過(guò)選取被估價(jià)對(duì)象合適的報(bào)酬率、資本化率等系數(shù)將其折現(xiàn)到價(jià)值時(shí)點(diǎn)后對(duì)其進(jìn)行累加,以此來(lái)估算被評(píng)估資產(chǎn)的收益。其計(jì)算公式如下:收益法單價(jià)=V=A1/(Y-G)×{1-[(1+G)/(1+Y)]t}+Vt/(1+Y)t(5-1)其中:V—收益法評(píng)估價(jià)值;A1—房地產(chǎn)未來(lái)第一年期間收益;Y—房地產(chǎn)報(bào)酬率;G—期間收益的年遞增率;Vt—期末轉(zhuǎn)售收益;t—房地產(chǎn)持有期收益法與比較法相結(jié)合的方法是指將收益法計(jì)算得出的結(jié)果與比較法計(jì)算結(jié)果進(jìn)行簡(jiǎn)單的算術(shù)平均計(jì)算或者加權(quán)計(jì)算,得出被評(píng)估資產(chǎn)的價(jià)值。其計(jì)算公式如下:評(píng)估價(jià)值單價(jià)=(比較法單價(jià)+收益法單價(jià))/2或評(píng)估價(jià)值單價(jià)=比較法單價(jià)×0.6+收益法單價(jià)×0.4其中:當(dāng)比較法單價(jià)與收益法價(jià)格相差不大時(shí)取簡(jiǎn)單算數(shù)平均法,兩者價(jià)格相差較大時(shí)取加權(quán)法。抵押凈值單價(jià)=抵押價(jià)值單價(jià)-個(gè)人所得稅其中:個(gè)人所得稅取1%。通過(guò)云評(píng)眾聯(lián)平臺(tái)計(jì)算整和所得結(jié)果如下圖表所示:表6-1評(píng)估價(jià)格與實(shí)際價(jià)格比較結(jié)果表市場(chǎng)實(shí)際價(jià)格評(píng)估價(jià)格相差率8864776512.40%8479752511.25%93251061913.88%862588562.68%90001046116.23%圖5-3估價(jià)結(jié)果與實(shí)際結(jié)果相差率通過(guò)圖5-2與圖5-3的對(duì)比,可以直觀的看出,隨機(jī)森林模型無(wú)論是在預(yù)測(cè)結(jié)果趨勢(shì)的平緩程度還是與實(shí)際價(jià)格的相近程度上,都優(yōu)于傳統(tǒng)的估價(jià)方法。研究結(jié)論本文通過(guò)對(duì)S市Y區(qū)房產(chǎn)中介網(wǎng)站和實(shí)地勘察數(shù)據(jù)作為本文研究的數(shù)據(jù)來(lái)源,本文收集了S市Y區(qū)2020年10月15日后的二手房出售信息數(shù)據(jù),共收集到50個(gè)樣本數(shù)據(jù),將其劃分為包括個(gè)體特征,區(qū)位特征,學(xué)校特征好樓盤特征在內(nèi)的17個(gè)具體指標(biāo)進(jìn)行RF模型的建立。本文運(yùn)用隨機(jī)森林模型將其與當(dāng)前評(píng)估行業(yè)主流估價(jià)方法進(jìn)行對(duì)比,得出以下結(jié)論。(1)本文基于python,建立隨機(jī)森林模型,借用云評(píng)眾聯(lián)平臺(tái),運(yùn)用比較法與收益法結(jié)合的方法,對(duì)隨機(jī)選取的五個(gè)樣本進(jìn)行計(jì)算處理,通過(guò)兩種方法的預(yù)測(cè)結(jié)果與實(shí)際價(jià)格的對(duì)比,無(wú)論是估計(jì)結(jié)果相差程度還是預(yù)測(cè)結(jié)果趨勢(shì)的平緩程度上,隨機(jī)森林的結(jié)果都較優(yōu)。(2)通過(guò)隨機(jī)森林(RF)算法對(duì)Y區(qū)學(xué)區(qū)房估價(jià)的影響變量進(jìn)行排序,建筑面積、小學(xué)就讀名額、學(xué)校屬性、小區(qū)至學(xué)校的步行距離、總樓層這幾個(gè)特征變量比較靠前。建筑面積位于第一,體現(xiàn)房屋面積對(duì)房屋價(jià)格影響較大,小學(xué)就讀名額位于第二位,體現(xiàn)教育資源對(duì)學(xué)區(qū)房?jī)r(jià)格的影響較大。由訓(xùn)練集運(yùn)算得出的結(jié)果可以得知,各個(gè)變量對(duì)模型的貢獻(xiàn)大小為:建筑面積>小學(xué)就讀名額>學(xué)校屬性>總樓層>建成年代>商業(yè)指數(shù)>距小學(xué)最短步行距離>所在樓層>醫(yī)療指數(shù)>裝修情況>交通指數(shù)>廳>室>綠化率>衛(wèi)>朝向>建筑結(jié)構(gòu)。參考文獻(xiàn)[1]黃大兵.基于模糊數(shù)學(xué)的房地產(chǎn)評(píng)估體系的模擬與實(shí)現(xiàn)[D].長(zhǎng)安大學(xué),2005.[2]SaderionZ,SmithB,SmithCA.AnIntegratedApproachtotheEvaluationofCommercialRealE
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2031年中國(guó)凈白去角質(zhì)素行業(yè)投資前景及策略咨詢研究報(bào)告
- 2025至2030年中國(guó)碳鋼離子交換器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)氟碳噴涂百葉窗數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)光線治療儀數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025至2030年中國(guó)MJX防水膩?zhàn)訑?shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2025年中國(guó)紙制化妝品包裝盒市場(chǎng)調(diào)查研究報(bào)告
- 印刷設(shè)備結(jié)構(gòu)優(yōu)化與仿真分析考核試卷
- 冷藏車運(yùn)輸行業(yè)發(fā)展趨勢(shì)與政策導(dǎo)向考核試卷
- 化工產(chǎn)品批發(fā)商銷售業(yè)績(jī)?cè)u(píng)價(jià)與激勵(lì)策略考核試卷
- 體育表演運(yùn)動(dòng)康復(fù)與體能訓(xùn)練結(jié)合考核試卷
- JGJ46-2024 建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)
- 家譜、宗譜頒譜慶典講話
- 元代文學(xué)-緒論課件
- 2023年版勞動(dòng)實(shí)踐河北科學(xué)技術(shù)出版社一年級(jí)下冊(cè)全冊(cè)教案
- 方案報(bào)審表(樣表)
- pp顧問(wèn)的常見(jiàn)面試問(wèn)題
- 法理學(xué)原理與案例完整版教學(xué)課件全套ppt教程
- 隧道仰拱施工之仰拱棧橋結(jié)構(gòu)計(jì)算書
- 軟體家具、沙發(fā)質(zhì)量檢驗(yàn)及工藝
- Q∕GDW 12118.1-2021 人工智能平臺(tái)架構(gòu)及技術(shù)要求 第1部分:總體架構(gòu)與技術(shù)要求
- 中建一局醫(yī)院直線加速器室專項(xiàng)施工方案
評(píng)論
0/150
提交評(píng)論