【LaTex】LaTex論文排版入門+速成
阿新 • • 發佈:2020-12-09
摘要
無腦LaTex教程,採用texlive+texworks/自選編輯器+XeLaTex,上手就能用,可以滿足個人撰寫文件的基本需求。如果有更高要求或文中沒有提到的內容,通過百度可以解決一切。
本文僅適用於Windows使用者,Mac使用者請到文末參考資料中尋找對應教程。
LaTex很好上手!不要畏難哦~
下載和安裝
- 從國內映象源下載安裝包:https://mirrors.tuna.tsinghua.edu.cn/CTAN/systems/mac/mactex/MacTeX.pkg
- 下載成功後單擊install-tl-advanced.bat,以管理員許可權執行,開始長達1h~3h的安裝(注意選中安裝texworks)。
- 安裝成功後,Win+R,輸入texworks,開啟texworks
使用
- ...:LaTex使用\作為標識,表示對應的功能。
- %:表示註釋,其後的內容不被編譯
- 如果需要打出'_','%','^'等功能性字元,在這些字元前加''即可
將每一個模組撰寫完成後,選擇排版工具為“XeLaTex”,單擊左上角的開始綠三角,則會在當前資料夾編譯出pdf文件。
模組
撰寫LaTex原始碼時,可將其分為三個模組。
“標頭檔案”
以下是一個簡單的範例:
%使之適用中文 \documentclass[UTF8]{ctexart} %\usepackage為呼叫所需的包,用到哪個功能就要在這裡新增對應的包 \usepackage{graphicx} \usepackage{geometry} \usepackage{multirow} \usepackage{booktabs} \usepackage[fleqn]{amsmath} %紙張規格,scale=''意為文件文字部分佔整個紙張的比例 \geometry{a4paper,scale=0.75} %標題 \title{葡萄酒質量評價資料分析} %作者 \author{Y.X.Sun} %日期 \date{\today} \begin{document} %新增目錄 \maketitle \tableofcontents
正文
和markdown一樣,latex有一級、二級……n級標題:
\section{一級標題}
\subsection{二級標題}
\subsubsection{三級標題}
在每個部分,都可以隨意的插入段落。但我們有更好的段落插入方法:
\paragraph{繪製直方圖}在資料預處理步驟中,計算出的描述性統計量是針對紅葡萄酒和白葡萄酒兩個資料集。接下來我們針對兩個資料集分別分析,檢視二者的質量分佈。 \paragraph{t檢驗}為檢驗紅葡萄酒和白葡萄酒質量是否不同,此處用到數理統計中的假設檢驗方法,此處使用t檢驗判斷紅葡萄酒和白葡萄酒的平均評分是否有區別。由於我們想知道紅葡萄酒和白葡萄酒評分的標準差是否相同,所以在t檢驗中可使用合併方差。
效果:
“尾檔案”
通常情況下,結束只需要:
\end{document}
此處是開頭\begin{document}的補全,千萬不要忘記,否則會出現一直編譯不出來的情況。
具體方法
換行、空格
- 換行:兩次enter
- 空格:\quad
圖片
\begin{figure}[h]
\centering
\includegraphics[width=0.7\textwidth]{圖片名稱.png}
\caption{顯示出來的圖片名稱}
\label{pic1}
\end{figure}
公式
- $abc$代表公式嵌入行內
- $$abc$$代表公式單獨一行
參考資料:https://zhuanlan.zhihu.com/p/110756681
表格
可以參考表格生成器進行編輯:https://zhuanlan.zhihu.com/p/62317790
參考文獻
簡略方法:
\begin{thebibliography}{99}
\bibitem{ref1}Clinton W.Brownley. Foundations for Analysis with Python
\bibitem{ref2}現代密碼學教程. 谷利澤,鄭世慧,楊義先.北京郵政大學出版社. 2009
\bibitem{ref5}推薦系統中的演算法[J]. 黃茂洲. 科技風. 2019(01).
\bibitem{ref3}https://www.zhihu.com/question/397159736
\bibitem{ref4}https://baike.baidu.com/item/%E7%94%9F%E6%97%A5%E6%82%96%E8%AE%BA
\end{thebibliography}
\end{document}
效果:
總結
我的文章[https://www.cnblogs.com/fighterkaka22/p/14100517.html]被編譯為LaTex後:
\documentclass[UTF8]{ctexart}
\usepackage{graphicx}
\usepackage{geometry}
\usepackage{multirow}
\usepackage{booktabs}
\usepackage[fleqn]{amsmath}
\geometry{a4paper,scale=0.75}
\title{葡萄酒質量評價資料分析}
\author{Y.X.Sun}
\date{\today}
\begin{document}
\maketitle
\tableofcontents
\setlength{\parindent}{0pt}
\section{概述}
本例為演示資料分析的流程和對概率論和數理統計基礎知識的應用,使用Python的pandas和statmodels生成標準的描述性統計量和模型,對資料集進行探索和摘要分析,並利用多元線性迴歸進行迴歸分析。
本例以葡萄酒型別為標籤,分為白葡萄酒和紅葡萄酒。比較這兩種葡萄酒的差別並選取葡萄酒的化學成分:固定酸度、揮發性酸度、檸檬酸、氯化物、遊離二氧化硫、總硫度、密度、PH值、硫酸鹽、酒精度數共11個,針對酒的各類化學成分建立線性迴歸模型,從而預測該葡萄酒的質量評分。
應用到數理統計知識點:隨機變數標準化,隨機變數數字特徵,正態分佈,假設檢驗,線性迴歸
\section{資料收集和預處理}
資料集來源:UCI Machine Learning Repository
首先進行資料預處理和資料描述性統計,其中描述性統計量包括總數、均值、標準差、最小值、第25個百分位數、中位數、第75個百分位數和最大值。
經過對各描述性統計量知,沒有缺失值和異常值,不需進行補充和處理。
\section{資料分析}
\subsection{分組、直方圖和t檢驗}
\paragraph{繪製直方圖}在資料預處理步驟中,計算出的描述性統計量是針對紅葡萄酒和白葡萄酒兩個資料集。接下來我們針對兩個資料集分別分析,檢視二者的質量分佈。
\begin{figure}[h]
\centering
\includegraphics[width=0.7\textwidth]{QualityScore.png}
\caption{葡萄酒質量直方圖}
\label{pic1}
\end{figure}
從得到的統計圖中可以看出,兩種葡萄酒的評分都近似正態分佈。
\paragraph{t檢驗}為檢驗紅葡萄酒和白葡萄酒質量是否不同,此處用到數理統計中的假設檢驗方法,此處使用t檢驗判斷紅葡萄酒和白葡萄酒的平均評分是否有區別。由於我們想知道紅葡萄酒和白葡萄酒評分的標準差是否相同,所以在t檢驗中可使用合併方差。
原假設:紅白兩種葡萄酒質量的標準差相同。
\begin{figure}[h]
\centering
\includegraphics[width=0.4\textwidth]{假設檢驗結果.png}
\caption{假設檢驗結果}
\label{pic2}
\end{figure}
從檢驗的結果來看,p值<0.0005。根據實際推斷原理,拒絕原假設,即認為紅白兩種葡萄酒質量有顯著性差異,並且從均值上來看白葡萄酒的平均質量等級在統計意義上大於紅葡萄酒的平均質量等級。
\subsection{變數關係和相關性}接下來我們研究一下變數之間的相關性,並建立部分變數之間帶有迴歸直線的散點圖。資料集中有6000多個點,如果將它們都畫在統計圖中,就很難分辨出清楚的點。因此我們使用take\_sample函式進行抽樣。
\begin{figure}[h]
\centering
\includegraphics[width=0.9\textwidth]{相關性.png}
\caption{相關性}
\label{pic3}
\end{figure}
從各變數的相關係數來看酒精含量、硫酸酯、pH 值、遊離二氧化硫和檸檬酸這些指標與質量呈現正相關,即當這些指標的含量增加時,葡萄酒的質量會提高;非揮發性酸、揮發性酸、殘餘糖分、氯化物、總二氧化硫和密度這些指標與質量呈負相關即當這些指標的含量增加時,葡萄酒的質量會降低。從相關係數可以看出,對葡萄酒質量影響最大的是葡萄酒是酒精含量,其相關係數為0.444,其次是酒的密度,但酒的密度對酒的質量是負影響的。
\subsection{最小二乘法線性迴歸}
\paragraph{係數解釋}
相關係數和兩兩變數之間的統計圖有助於對兩個變數之間的關係進行量化和視覺化。但它們不能測量出每個自變數在其他自變數不變時與因變數之間的關係,線性迴歸可以解決這個問題。
線性迴歸模型如下:
$$ y_i\sim N(\mu_i,\sigma^2) $$
$$ \mu_i=\beta_0+\beta_1x_{i1}+\beta_2x_{i2}+\cdots+\beta_px_{ip} $$
這個模型表示觀測$y_i$服從均值為$ \mu_i $方差為$ \sigma^2 $的正態分佈,其中$\mu_i$依賴於自變數,$ \sigma^2 $為一個常數。也就是說,給定了自變數的值以後,我們就可以得到一個具體的質量評分,但在另一天,給定同樣的自變數值,我們可能會得到一個與前面不同的質量評分。但經過一個較長的週期,質量評分會落在$ \mu\pm\sigma $這個範圍內。
\paragraph{自變數標準化}
關於這個模型,還需要注意的一點是,普通最小二乘迴歸是通過使殘差平方和最小化來估計未知的β引數值。由於殘差大小依賴於自變數的測量單位。所以當自變數測量單位不同,我們需要將自變數標準化。
$$ Z\sim\frac{X-\mu}{\sigma} $$
由上一步的觀測資料知,各變數間最大值和最小值之間差別很大,因此應進行標準化。
pandas在資料框中對變數進行標準化非常容易。你可以對一個觀測寫一個變換公式,pandas將其擴充套件到行和列中,來標準化所有變數。
\begin{figure}[h]
\centering
\includegraphics[width=0.9\textwidth]{result.png}
\caption{線性迴歸結果}
\label{pic4}
\end{figure}
觀測標準化後的資料知,線性迴歸模型為:
\begin{equation}
\begin{split}
quality= 0.0877fixed acidity -0.2186volatile acidity -0.0159citric\_acid+ 0.2072residual\_sugar\\
-0.0169chlorides+ 0.1060free\_sulfur\_dioxide -0.1648density-0.1402total\_sulfur\_dioxide\\
+0.0706pH+0.1143sulphates+ 0.3185alcohol+5.8184
\end{split}
\end{equation}
在我們的模型摘要中,截距係數的意義就是當一種葡萄酒的所有成分都取均值時,它的質量評分均值應該是5.8,標準差為0.009。
\subsection{預測}
有了線性迴歸模型,當給出了葡萄酒的化學成分的資料就可以預測該葡萄酒的質量評分。
\end{document}
效果: