Python大數(shù)據(jù)分析 教案 教學(xué)設(shè)計 第1章-Python與數(shù)據(jù)分析_第1頁
Python大數(shù)據(jù)分析 教案 教學(xué)設(shè)計 第1章-Python與數(shù)據(jù)分析_第2頁
Python大數(shù)據(jù)分析 教案 教學(xué)設(shè)計 第1章-Python與數(shù)據(jù)分析_第3頁
Python大數(shù)據(jù)分析 教案 教學(xué)設(shè)計 第1章-Python與數(shù)據(jù)分析_第4頁
Python大數(shù)據(jù)分析 教案 教學(xué)設(shè)計 第1章-Python與數(shù)據(jù)分析_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

授課時間第1次課,第周星期第節(jié)課時2授課方式理論課√討論課□習題課□實驗課□上機課□技能課□其他□授課題目第一章Python與數(shù)據(jù)分析目的與要求1.熟悉數(shù)據(jù)分析的相關(guān)概念。2.了解數(shù)據(jù)分析的應(yīng)用。3.了解Python在數(shù)據(jù)分析領(lǐng)域的優(yōu)勢。4.熟悉Python數(shù)據(jù)分析常用的類庫。5.掌握Python數(shù)據(jù)分析的類庫安裝。6.掌握JupyterNotebook的基本使用。重點與難點重點:Python數(shù)據(jù)分析常用類庫難點:JupyterNotebook的基本你使用教學(xué)基本內(nèi)容方法及手段1.1數(shù)據(jù)分析概念數(shù)據(jù)分析作為數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)的重要組成部分,近年來成為了數(shù)據(jù)科學(xué)領(lǐng)域中數(shù)據(jù)從業(yè)人員必須具備的技能,越來越被重視。1.1.1數(shù)據(jù)分析數(shù)據(jù)分析是指選用適當?shù)姆治龇椒▽κ占瘉淼拇罅繑?shù)據(jù)進行分析、提取有用信息和形成結(jié)論,對數(shù)據(jù)加以詳細的研究和概括總結(jié)的過程。廣義的數(shù)據(jù)分析包括狹義數(shù)據(jù)分析和數(shù)據(jù)挖掘兩部分。狹義數(shù)據(jù)分析是指根據(jù)分析目的,采用對比分析、分組分析、交叉分析和回歸分析等分析方法,對收集的數(shù)據(jù)進行處理與分析,提取有價值的信息,發(fā)揮數(shù)據(jù)的作用,得到一個特征統(tǒng)計量結(jié)果的過程。數(shù)據(jù)挖掘則是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應(yīng)用數(shù)據(jù)中,通過應(yīng)用聚類模型、分類模型、回歸和關(guān)聯(lián)規(guī)則等技術(shù),挖掘潛在價值的過程。數(shù)據(jù)分析的目的是把隱藏在一大批看來雜亂無章的數(shù)據(jù)中的信息集中、萃取和提煉出來,以找出所研究對象的內(nèi)在規(guī)律,并加以利用,從而創(chuàng)建經(jīng)濟和社會價值。1.1.2數(shù)據(jù)分析流程數(shù)據(jù)分析已經(jīng)逐漸演化為一種解決問題的過程,典型的數(shù)據(jù)分析流程如下所述。1.需求分析需求分析的主要內(nèi)容是根據(jù)數(shù)據(jù)分析需求方的要求和實際情況,結(jié)合現(xiàn)有的數(shù)據(jù)情況,提出數(shù)據(jù)分析需求的整體分析方向、分析內(nèi)容,最終和需求方達成一致意見。2.數(shù)據(jù)獲取數(shù)據(jù)獲取是根據(jù)與需求分析的結(jié)果提取、收集數(shù)據(jù)。數(shù)據(jù)獲取主要有兩種方式:網(wǎng)絡(luò)數(shù)據(jù)與本地數(shù)據(jù)。網(wǎng)絡(luò)數(shù)據(jù)是指存儲在互聯(lián)網(wǎng)中的各類視頻、圖片、語言和文字等信息;本地數(shù)據(jù)則是指存儲在本地數(shù)據(jù)庫中的數(shù)據(jù)。本地數(shù)據(jù)按照數(shù)據(jù)時間又可以劃分為兩部分:歷史數(shù)據(jù)和實時數(shù)據(jù)。歷史數(shù)據(jù)是指系統(tǒng)在運行過程中遺存下來的數(shù)據(jù),其數(shù)據(jù)隨系統(tǒng)運行時間的增加而增長;實時數(shù)據(jù)是指最近一個單位周期內(nèi)產(chǎn)生的數(shù)據(jù)。3.數(shù)據(jù)預(yù)處理數(shù)據(jù)預(yù)處理是指對數(shù)據(jù)進行數(shù)據(jù)合并、數(shù)據(jù)清洗和數(shù)據(jù)變換,并直接用于分析建模的這一過程的總稱。其中,數(shù)據(jù)合并可以將多張相互關(guān)聯(lián)的表格合并成為一張;數(shù)據(jù)清洗可以處理重復(fù)值、缺失值和異常值;數(shù)據(jù)變換可以通過一定規(guī)則把原始數(shù)據(jù)進行為適合分析的形式,滿足后期分析與建模的數(shù)據(jù)要求。4.分析與建模分析與建模是指通過對比分析、分組分析、交叉分析、回歸分析等分析方法,以及聚類模型、分類模型、關(guān)聯(lián)模型等模型與算法,發(fā)現(xiàn)數(shù)據(jù)中有價值信息,并得出結(jié)論的過程。分析與建模的方法按照目標不同可以劃分幾大類。如果分析目標是描述行為模式的,可采用描述性數(shù)據(jù)分析方法,同時還可以考慮關(guān)聯(lián)規(guī)則、序列規(guī)則和聚類模型等。如果分析目標是量化未來一段時間內(nèi)某個時間發(fā)生概率的,則可以使用分類預(yù)測模型和回歸預(yù)測模型。5.模型評價與優(yōu)化模型評價是指對于已經(jīng)建立的模型,根據(jù)其模型的類別,使用不同指標評價其性能優(yōu)劣的過程。常用的聚類模型評價方法有ARI評價法(蘭特系數(shù))、AMI評價(互信息)、V-measure評分等。常用的分類模型評價方法有準確率(Accuracy)、精確率(Precision)、召回率(Recall)等。常用的回歸模型評價指標有平均絕對誤差、均方誤差、中值絕對誤差等。模型優(yōu)化則是指模型在經(jīng)過模型評價后已經(jīng)達到了要求,但在實際生產(chǎn)環(huán)境應(yīng)用中,發(fā)現(xiàn)模型并不理想,繼而對模型進行重構(gòu)與優(yōu)化的過程。6.部署部署是指將數(shù)據(jù)分析結(jié)果與結(jié)論應(yīng)用至實際生產(chǎn)系統(tǒng)的過程。1.1.3數(shù)據(jù)分析應(yīng)用數(shù)據(jù)分析可以解決大量的實際問題,已經(jīng)應(yīng)用于各行各業(yè),并取得了很好的效果。1.客戶與營銷分析客戶分析是根據(jù)客戶的基本數(shù)據(jù)進行的商業(yè)行為分析比如根據(jù)客戶的需求、所處行業(yè)的特征以及客戶的經(jīng)濟情況等,使用統(tǒng)計分析方法和預(yù)測驗證法分析目標客戶,提高銷售效率;根據(jù)已有的客戶特征進行客戶特征分析、忠誠度分析和客戶收益分析等。營銷分析囊括了產(chǎn)品分析、價格分析、渠道分析、廣告與促銷分析。產(chǎn)品分析主要是競爭產(chǎn)品分析,通過對競爭產(chǎn)品分析制定自身產(chǎn)品策略。價格分析又可以分為成本分析和售價分析。成本分析的目的是降低不必要的成本;售價分析的目的是制定符合市場的價格。渠道分析是指對產(chǎn)品的銷售渠道進行分析,確定最優(yōu)的渠道配比。廣告與促銷分析則能夠結(jié)合客戶分析,實現(xiàn)銷量的提升、利潤的增加。2.業(yè)務(wù)流程優(yōu)化數(shù)據(jù)分析可以幫助企業(yè)優(yōu)化業(yè)務(wù)流程,比如可以通過業(yè)務(wù)系統(tǒng)和GPS定位系統(tǒng)獲得數(shù)據(jù),使用數(shù)據(jù)構(gòu)建交通狀況預(yù)測分析模型,有效預(yù)測實時路況、物流狀況、車流量、客流量和貨物吞吐量,進而提前補貨,制定庫存管理策略和路線優(yōu)化;人力資源業(yè)務(wù)可以通過數(shù)據(jù)分析來優(yōu)化人才招聘;交通部門可以在數(shù)據(jù)分析的基礎(chǔ)上建立智能化交管方案降低高峰時段的路線擁堵情況。3.完善執(zhí)法利用傳感器、閉路電視安裝并接入中央云數(shù)據(jù)庫、車牌識別、語音識別、犯罪嫌疑人及罪犯GPS追蹤等數(shù)據(jù)分析,實現(xiàn)智能警務(wù);監(jiān)控并識別異?;顒印⑿袨榛蚴鹿?,加快決策制定速度并防止及減少犯罪事件;通過分類模型分析方法對非法集資和洗錢的邏輯路徑進行分析,找到其行為特征,聚類模型分析方法可以分析相似價格的運動模式,可能發(fā)現(xiàn)關(guān)聯(lián)交易及內(nèi)幕交易的可疑信息,關(guān)聯(lián)規(guī)則分析方法可以監(jiān)控多個用戶的關(guān)聯(lián)交易行為,為發(fā)現(xiàn)跨賬號協(xié)同的金融欺騙行為提供依據(jù)。4.網(wǎng)絡(luò)安全新型的病毒防御系統(tǒng)可使用數(shù)據(jù)分析技術(shù),建立潛在攻擊識別分析模型,檢測大量網(wǎng)絡(luò)活動數(shù)據(jù)和相應(yīng)的訪問行為,識別可能進行入侵的可疑模式,做到未雨綢繆。5.優(yōu)化機器和設(shè)備性能通過物聯(lián)網(wǎng)技術(shù)收集和分析設(shè)備上的數(shù)據(jù)流,包括連續(xù)用電、零部件溫度、環(huán)境濕度和污染物顆粒等多種潛在特征,建立設(shè)備管理模型,從而預(yù)測設(shè)備故障,合理安排預(yù)防性的維護,以確保設(shè)備正常作業(yè),降低因設(shè)備故障帶來的安全風險。6.改善日常生活利用穿戴的裝備生成最新的數(shù)據(jù),根據(jù)熱量的消耗以及睡眠模式來進行追蹤;交友網(wǎng)站利用數(shù)據(jù)分析工具來幫助需要的人匹配合適的對象;基于城市實時交通信息、利用社交網(wǎng)絡(luò)和天氣數(shù)據(jù)來優(yōu)化最新的交通情況。7.醫(yī)療衛(wèi)生與生命科學(xué)利用遠程醫(yī)療監(jiān)控能夠簡化醫(yī)護人員訪問并分析病患醫(yī)療記錄的流程,從而確保病人得到有效診療并降低不必要的成本;臨床數(shù)據(jù)流分析能夠順利識別出異?;蛘哳A(yù)料之外的行為或者表現(xiàn),從而輔助做出更準確的診斷意見;實時傳感器數(shù)據(jù)分析有助于檢測傳染病的暴發(fā)可能性,并通過早期預(yù)警系統(tǒng)提示預(yù)防及準備;數(shù)據(jù)分析應(yīng)用能夠在幾分鐘內(nèi)解碼整個DNA,從而制定出更科學(xué)的治療方案,甚至對疾病進行預(yù)測,達到疾病預(yù)防的目的。1.2數(shù)據(jù)分析工具隨著云計算、大數(shù)據(jù)以及人工智能技術(shù)的快速發(fā)展,Python及其開發(fā)生態(tài)環(huán)境正在受到越來越多的關(guān)注。Python已經(jīng)成為了計算機世界最重要的語言之一,更是數(shù)據(jù)分析的首選語言。1.2.1常用工具主流數(shù)據(jù)分析語言有Python、R、MATLAB。Python具有豐富和強大的類庫能夠把其他語言模塊很輕松的連接在一起,是一門易學(xué)易用的程序設(shè)計語言。R語言主要用于統(tǒng)計分析、繪圖等,它屬于GNU系統(tǒng)的一個自由、免費、源代碼開放的軟件。MATLAB的作用是進行矩陣運算、回執(zhí)函數(shù)與數(shù)據(jù)、實現(xiàn)算法、創(chuàng)建用戶界面和連接其他編程語言的程序等,主要應(yīng)用于工程計算、控制設(shè)計、信號處理與通信、圖像處理、信號檢測、金融建模設(shè)計與分析等領(lǐng)域。Python、R和MATLAB數(shù)據(jù)分析工具對比如表1-1所示。表1-1Python、R和MATLAB對比 Python R MATLAB難易程度 接口統(tǒng)一,學(xué)習曲線平緩 接口眾多,學(xué)習曲線陡峭 自由度大,學(xué)習曲線較為平緩使用場景 數(shù)據(jù)分析、機器學(xué)習、矩陣運算、科學(xué)可視化、數(shù)字圖像處理、Web應(yīng)用、網(wǎng)絡(luò)爬蟲、系統(tǒng)運維等 統(tǒng)計分析、機器學(xué)習、科學(xué)數(shù)據(jù)可視化 矩陣預(yù)算、數(shù)值分析、科學(xué)數(shù)據(jù)可視化、機器學(xué)習、符號計算、數(shù)字圖像處理、數(shù)字信號處理、仿真模擬等第三方支持 擁有大量的第三方庫,能夠簡便的調(diào)用C、C++、Java等其他語言 擁有大量的包,能夠調(diào)用C、C++、Java等其他語言 擁有大量專業(yè)的工具箱,在新版本中加入了對C、C++、Java的支持流行領(lǐng)域 工業(yè)界>學(xué)術(shù)界 工業(yè)界≈學(xué)術(shù)界 工業(yè)界≤學(xué)術(shù)界軟件成本 開源免費 開源免費 商業(yè)收費1.2.2Python數(shù)據(jù)分析Python是一門應(yīng)用十分廣泛的計算機編程語言,在數(shù)據(jù)科學(xué)領(lǐng)域具有無可比擬的優(yōu)勢,逐漸成為數(shù)據(jù)科學(xué)領(lǐng)域的主流語言,Python數(shù)據(jù)分析具有5個方面優(yōu)勢。1.語法簡單精煉。比起其他編程語言,Python更容易學(xué)習和使用。2.功能強大的庫。大量優(yōu)秀好用的第三方庫,擴充了Python功能,提升了Python的能力,使Python如虎添翼。3.功能強大。Python是一個混合體,豐富的工具使它介于傳統(tǒng)的腳本語言和系統(tǒng)語言之間。Python不僅具備簡單易用的特點,還提供了編譯語言所具有的軟件工程能力。4.不僅適用于研究和原型構(gòu)建,同時也適用于構(gòu)建生產(chǎn)系統(tǒng)。研究人員和工程技術(shù)人員使用同一種編程工具,會給企業(yè)帶來顯著的組織效益,并降低企業(yè)的運營成本。5.Python是一門膠水語言。Python程序能夠以多種方式輕易地與其他語言的組件“粘接”在一起,例如Python的C語言API可以幫助Python程序靈活地調(diào)用C程序。因此可以根據(jù)需要給Python程序添加功能,或者其他環(huán)境系統(tǒng)中使用Python。Python數(shù)據(jù)分析除了使用Python基礎(chǔ)外,還需要第三方庫。1.NumPyNumPy是NumericalPython的簡稱,是Python語言的一個科學(xué)計算的擴展程序庫,支持大量的多維度數(shù)組與矩陣運算,此外也針對數(shù)組運算提供大量的數(shù)學(xué)函數(shù)庫。NumPy主要提供以下內(nèi)容。(1)快速高效的多維數(shù)組對象ndarray。(2)廣播功能函數(shù),廣播是一種對數(shù)組執(zhí)行數(shù)學(xué)運算的函數(shù),其執(zhí)行的是元素級計算。廣播提供了算術(shù)運算期間處理不同形狀的數(shù)組的能力。(3)讀/寫硬盤上基于數(shù)組的數(shù)組集的工具。(4)線性代數(shù)運算、傅里葉變換及隨機數(shù)生成的功能。(5)將C、C++、Fortran代碼集成到Python的工具。除了為Python提供快速的數(shù)組處理能力外,NumPy在數(shù)據(jù)分析方面還有另外一個主要的作用,即作為算法之間傳遞數(shù)據(jù)的容器。對于數(shù)值型數(shù)據(jù),使用NumPy數(shù)組存儲和處理數(shù)據(jù)要比使用內(nèi)置的Python數(shù)據(jù)結(jié)構(gòu)高效的多。此外,有低級語言(比如C語言)編寫的庫可以直接操作NumPy數(shù)組中數(shù)據(jù),無須進行任何數(shù)據(jù)復(fù)制工作。2.PandasPandas是Python的數(shù)據(jù)分析核心庫,最初被作為金融數(shù)據(jù)分析工具而開發(fā)出來。Pandas為時間序列分析提供了很好的支持。Pandas納入了大量庫和一些標準的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具,提供一系列能夠快速、便捷地處理結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)和函數(shù)。Python之所以成為強大而高效的數(shù)據(jù)分析環(huán)境與它息息相關(guān)。Pandas兼具NumPy高性能的數(shù)組計算功能以及電子表格和關(guān)系型數(shù)據(jù)庫(如SQL)的靈活數(shù)據(jù)處理功能,它提供了復(fù)雜精細的索引功能,以便便捷地完成重塑、切片和切換、聚合及選取數(shù)據(jù)子集等操作。3.MatplotlibMatplotlib是最流行的用于繪制數(shù)據(jù)圖形的Python庫,它以各種硬拷貝格式和跨平臺的交互式環(huán)境生成出高質(zhì)量的圖形。Matplotlib最初由JohnD.Hunter創(chuàng)建,目前由一個龐大的開發(fā)團隊維護。Matplotlib的操作比較容易,只需要幾行代碼即可生成線形圖、散點圖、直方圖、條形圖和箱圖等,甚至可以繪制三維圖形。4.SklearnSklearn(Scikit-Learn)是一個簡單高效的數(shù)據(jù)挖掘和數(shù)據(jù)分析工具,可以提供用戶在各種環(huán)境下重復(fù)使用。而且Scikit-learn建立在NumPy、SciPy和Matplotlib基礎(chǔ)之上,對一些常用的算法進行了封裝。目前,Sklearn的基本模塊主要有數(shù)據(jù)預(yù)處理、模型選擇、分類、聚類、數(shù)據(jù)降維和回歸6個。在數(shù)據(jù)量不大的情況下,Sklearn可以解決大部分問題。對算法不精通的用戶在執(zhí)行建模任務(wù)時,并不需要自行編寫所有算法,只需要簡單地調(diào)用Sklearn庫里的模塊就可以。5.其他xlrd和openpyxl是讀取Excel文件需要的類庫,Seaborn與Matplotlib類似,主要作用是繪制圖形,但是Seaborn自帶了一些數(shù)據(jù)集,可以用來練習。1.3Python數(shù)據(jù)分析環(huán)境Python數(shù)據(jù)分析環(huán)境的搭建包括Python安裝以及多個第三方庫的安裝。先安裝Python,再分別安裝需要的第三方庫。讀者如果想省事,也可以采用安裝Anaconda的方式簡化安裝。Anaconda包含了本書使用的所有第三方庫,有興趣的讀者也可以自行安裝Anaconda。因為本書使用的開發(fā)環(huán)境并不復(fù)雜,因此沒有使用Anaconda。注意:安裝過程需要網(wǎng)絡(luò),因為需要先下載再安裝。1.安裝Python2.安裝數(shù)據(jù)分析庫3.JupyterNotebook的使用JupyterNotebook是IPythonNotebook的繼承者,是一個交互式筆記本,支持運行40多種編程語言。它本質(zhì)上是一個支持實施代碼、數(shù)學(xué)方程、可視化和Markdown的Web應(yīng)用程序。對于數(shù)據(jù)分析,JupyterNotebook最大的優(yōu)點是可以重現(xiàn)整個分析過程,并將說明文字、代碼、圖表、公式和結(jié)論都整合在一個文檔中。用戶可以通過電子郵件、Dropbox、GitHub和JupyterNotebookViewer將分析結(jié)果分享給其他人。JupyterNotebook是一個非常強大的工具,常用于交互式地開發(fā)和展示數(shù)據(jù)科學(xué)項目。它將代碼和它的輸出集成到一個文檔中,并且結(jié)合了可視的敘述性文本、數(shù)學(xué)方程和其他豐富的媒體。它直觀的工作流促進了迭代和快速的開發(fā),使得Jypyternotebook在當代數(shù)據(jù)科學(xué)、分析和越來越多的科學(xué)研究中越來越受歡迎。最重要的是,作為開源項目,它是完全免費的。(1)安裝JupyterNotebook使用如下命令安裝JupyterNotebook。pip3installjupyter(2)啟動JupyterNotebook注意:JupyterNotebook在啟動后只允許訪問啟動目錄中包含的文件(包括子目錄中包含的文件),并且在JupyterNotebook中創(chuàng)建的文件也保存在啟動目錄中,在啟動JupyterNotebook之前需要修改當前目錄。其中JupyterNotebook之前先做準備工作。(a)創(chuàng)建目錄(文件夾)。比如在D盤下創(chuàng)建notebook文件夾。(b)改變系統(tǒng)的當前目錄,把當前目錄更改為創(chuàng)建的目錄(文件夾)。準備工作完成后,開始啟動JupyterNotebook。在Windows系統(tǒng)下的命令行或者在Linux系統(tǒng)下的終端輸入了命令“Jupyternotebook”后回車即可啟動JupyterNotebook。啟動后會自動打開系統(tǒng)默認的瀏覽器,瀏覽器自動展示JupyterNotebook的界面。推薦使用Chrome瀏覽器,讀者可以在啟動JupyterNotebook之前,設(shè)置操作系統(tǒng)的默認瀏覽器。啟動后瀏覽器地址欄顯示:http://localhost:8888/tree。其中l(wèi)ocalhost不是一個網(wǎng)站,而是表示從你的本地機器中服務(wù)的內(nèi)容。JupyterNotebook是Web應(yīng)用程序,它啟動了一個本地的Python服務(wù)器,將這些應(yīng)用程序提供給你的Web瀏覽器,使其從根本上獨立于平臺,并具有Web上共享的優(yōu)勢。(3)新建一個Notebook打開JupyterNotebook以后會在系統(tǒng)默認的瀏覽器中出現(xiàn)JupyterNotebook的界面(Home)。單擊右邊上方的“New”下拉按鈕,出現(xiàn)下拉列表,選擇“Python3”選項,進入Python腳本編輯界面。下拉列表中是創(chuàng)建的Notebook類型,其中,“TextFile”為純文本型,“Folder”為文件夾,“Python3”表示Python運行腳本,灰色字體表示不可用項目。(4)JupyterNotebook界面JupyterNoteBook文檔由一系列單元(Cell)構(gòu)成,單元有兩種形式。①代碼單元。代碼單元是編寫代碼的地方,代碼單元左邊有“In[]:”符號,編寫代碼后,單擊界面上方的工具類中的“運行”按鈕,執(zhí)行程序,其結(jié)果會在對應(yīng)代碼單元的下方顯示。②Markdown單元。Markdown單元對文本進行編輯,采用Markdown語法規(guī)范,可以設(shè)置文本格式,插入鏈接、圖片甚至數(shù)學(xué)公式。Markdown也可以運行,運行后顯示格式化的文本(原文本被替代)。(5)JupyterNotebook兩種模式在JupyterNotebook中有兩種模式。①編輯模式。用于編輯文本和代碼。對于Markdown單元,選中單元并按“Enter”鍵(或者雙擊)進入編輯模式;對于代碼單元,選中單元后直接進入編輯模式。編輯模式的單元左側(cè)顯示綠色豎線。②命令模式。命令模式用于執(zhí)行鍵盤輸入的快捷命令,在編輯模式下通過按“Esc”鍵進入命令模式。命令模式的單元左側(cè)顯示藍色豎線。注意:在命令模式下,才能使用快捷鍵。(6)檢查點當創(chuàng)建一個新的Notebook時,JupyterNotebook都會創(chuàng)建一個檢查點文件和一個Notebook文件;它將位于保存位置的隱藏子目錄中,稱作.ipynb_checkpoints,也是一個.ipynb文件。默認情況下,Jupyter將每隔120秒自動保存Notebook,而不會改變你的主Notebook文件。當你“保存和檢查點”時,Notebook和檢查點文件都將被更新。因此檢查點能夠在發(fā)生意外事件時恢復(fù)未保存的工作,通過菜單“File>ReverttoCheckpoint”恢復(fù)到檢查點。(7)MarkdownMarkdown是一種輕量級的、易于學(xué)習的可以使用普通文本編輯器編寫的標記語言,通過簡單的標記語法,它可以使普通文本內(nèi)容具有一定的格式。JupyterNotebook的Markdown單元作為基礎(chǔ)的Markdown的功能更加強大,下面將從標題、列表、字體、表格和數(shù)學(xué)公式編輯5個方面進行介紹。①標題標題是標明文章和作品等內(nèi)容的簡短語句,在行前加一個“#”字符代表一級標題,加兩個“#”字符代表二級標題,以此類推。②列表列表是一種有數(shù)據(jù)項構(gòu)成的有限序列,即按照一定的線性順序排列而成的數(shù)據(jù)項的集合。列表一般分為兩種:一種是無序列表,使用一些圖標標記,沒有序號,沒有排列順序;另一種是有序列表,使用數(shù)字標記,有排列順序。Markdown對于無序列表,可使用星號、加號或者減號作為列表標記;Markdown對于有序列表,則使用數(shù)字“.”“”(一個空格)表示。③字體文檔中為了凸顯部分內(nèi)容,一般對文字的使用加粗或斜體格式,使得該部分內(nèi)容變得更加醒目。對于Markdown排版工具而言,通常使用星號“*”和下劃線“_”作為標記字詞的符號。前面有兩個星號或下劃線表示加粗,前后有3個星號或下劃線表示斜體。④表格使用Markdown同樣也可以繪制表格。代碼的第一行表示表頭。第二行分隔表頭和主體部分。從第三行開始,每一行代表一個表格行。列與列之間用符號“|”隔開,表格的一行兩邊也要有符號“|”。⑤數(shù)學(xué)公式編輯在JupyterNotebook的Markdown的單元中也可以是使用LaTeX來插入數(shù)學(xué)公式。在文本行中插入數(shù)學(xué)公式,應(yīng)使用兩個“$”符號。如果要插入一個數(shù)學(xué)區(qū)塊,則使用兩個“$$”。(8)導(dǎo)出功能Notebook可以導(dǎo)出多種格式,例如HTML、Markdown、reST、PDF等格式。導(dǎo)出功能可通過選擇“File”→“Downloadsas”級聯(lián)菜單中的命令實現(xiàn)。4.PyCharm的使用PyCharm是一款功能強大的Python編輯器,具有跨平臺性,使用最廣泛,功能最齊全。(1)下載/pycharm/download/#section=windows是PyCharm的下載地址,PyCharm有兩個版本:Professional版本和Community版本,推薦下載Community版本,此版本可以免費使用,而Professional是商業(yè)版本,當然Professional版本功能更加強大,但對于初學(xué)者來說Community版本也是夠用的。(2)安裝PyCharm在Windows下的安裝比較簡單,此處不在詳細介紹。需要注意在安裝選項界面中,選中“創(chuàng)建桌面快捷方式”,選中創(chuàng)建關(guān)聯(lián)的“.py”。(3)啟動安裝PyCharm后打開(啟動),需要確認用戶協(xié)議。(4)創(chuàng)建項目單擊PyCharm的“NewProject”按鈕,或菜單“File”|“NewProject”,打開“新建項目”窗口,輸入項目位置。單擊“create”按鈕生成新的項目。創(chuàng)建Python源文件4.PyCharm的使用PyCharm是一款功能強大的Python編輯器,具有跨平臺性,使用最廣泛,功能最齊全。(1)下載/pycharm/download/#section=windows是PyCharm的下載地址,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論