一元回歸_平均值和個別值的置信區間

阿新 • • 發佈：2017-07-10

dex otl ssi utf-8 src arr sam ylabel font

數據統計分析項目聯系：QQ：231469242

技術分享

# -*- coding: utf-8 -*-
"""
Created on Mon Jul 10 11:04:51 2017

@author: toby
"""

# Import standard packages
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as stats

def fitLine(x, y, alpha=0.05, newx=[], plotFlag=1):
    ‘‘‘ Fit a curve to the data using a least squares 1st order polynomial fit ‘‘‘
    
    # Summary data
    n = len(x)			   # number of samples     
    
    Sxx = np.sum(x**2) - np.sum(x)**2/n
#    Syy = np.sum(y**2) - np.sum(y)**2/n    # not needed here
    Sxy = np.sum(x*y) - np.sum(x)*np.sum(y)/n    
    mean_x = np.mean(x)
    mean_y = np.mean(y)
    
    # Linefit
    b = Sxy/Sxx
    a = mean_y - b*mean_x
    
    # Residuals
    fit = lambda xx: a + b*xx    
    residuals = y - fit(x)
    
    var_res = np.sum(residuals**2)/(n-2)
    sd_res = np.sqrt(var_res)
    
    # Confidence intervals
    se_b = sd_res/np.sqrt(Sxx)
    se_a = sd_res*np.sqrt(np.sum(x**2)/(n*Sxx))
    
    df = n-2                            # degrees of freedom
    tval = stats.t.isf(alpha/2., df) 	# appropriate t value
    
    ci_a = a + tval*se_a*np.array([-1,1])
    ci_b = b + tval*se_b*np.array([-1,1])

    # create series of new test x-values to predict for
    npts = 100
    px = np.linspace(np.min(x),np.max(x),num=npts)
    
    se_fit     = lambda x: sd_res * np.sqrt(  1./n + (x-mean_x)**2/Sxx)
    se_predict = lambda x: sd_res * np.sqrt(1+1./n + (x-mean_x)**2/Sxx)
    
    print((‘Summary: a={0:5.4f}+/-{1:5.4f}, b={2:5.4f}+/-{3:5.4f}‘.format(a,tval*se_a,b,tval*se_b)))
    print((‘Confidence intervals: ci_a=({0:5.4f} - {1:5.4f}), ci_b=({2:5.4f} - {3:5.4f})‘.format(ci_a[0], ci_a[1], ci_b[0], ci_b[1])))
    print((‘Residuals: variance = {0:5.4f}, standard deviation = {1:5.4f}‘.format(var_res, sd_res)))
    print((‘alpha = {0:.3f}, tval = {1:5.4f}, df={2:d}‘.format(alpha, tval, df)))
    
    # Return info
    ri = {‘residuals‘: residuals, 
        ‘var_res‘: var_res,
        ‘sd_res‘: sd_res,
        ‘alpha‘: alpha,
        ‘tval‘: tval,
        ‘df‘: df}
    
    if plotFlag == 1:
        # Plot the data
        plt.figure()
        
        plt.plot(px, fit(px),‘k‘, label=‘Regression line‘)
        #plt.plot(x,y,‘k.‘, label=‘Sample observations‘, ms=10)
        plt.plot(x,y,‘k.‘)
        
        x.sort()
        limit = (1-alpha)*100
        plt.plot(x, fit(x)+tval*se_fit(x), ‘r--‘, lw=2, label=‘Confidence limit ({0:.1f}%)‘.format(limit))
        plt.plot(x, fit(x)-tval*se_fit(x), ‘r--‘, lw=2 )
        
        plt.plot(x, fit(x)+tval*se_predict(x), ‘--‘, lw=2, color=(0.2,1,0.2), label=‘Prediction limit ({0:.1f}%)‘.format(limit))
        plt.plot(x, fit(x)-tval*se_predict(x), ‘--‘, lw=2, color=(0.2,1,0.2))

        plt.xlabel(‘X values‘)
        plt.ylabel(‘Y values‘)
        plt.title(‘Linear regression and confidence limits‘)
        
        # configure legend
        plt.legend(loc=0)
        leg = plt.gca().get_legend()
        ltext = leg.get_texts()
        plt.setp(ltext, fontsize=14)

        # show the plot
        outFile = ‘regression_wLegend.png‘
        plt.savefig(outFile, dpi=200)
        print(‘Image saved to {0}‘.format(outFile))
        plt.show()
        
    if newx != []:
        try:
            newx.size
        except AttributeError:
            newx = np.array([newx])
    
        print((‘Example: x = {0}+/-{1} => se_fit = {2:5.4f}, se_predict = {3:6.5f}‘        .format(newx[0], tval*se_predict(newx[0]), se_fit(newx[0]), se_predict(newx[0]))))
        
        newy = (fit(newx), fit(newx)-se_predict(newx), fit(newx)+se_predict(newx))
        return (a,b,(ci_a, ci_b), ri, newy)
    else:
        return (a,b,(ci_a, ci_b), ri)
    

        
def Draw_confidenceInterval(x,y): 
    x=np.array(x)    
    y=np.array(y)
    goodIndex = np.invert(np.logical_or(np.isnan(x), np.isnan(y)))        
    (a,b,(ci_a, ci_b), ri,newy) = fitLine(x[goodIndex],y[goodIndex], alpha=0.01,newx=np.array([1,4.5]))   
          
y=[6.47,6.13,6.19,4.89,5.63,4.52,5.89,4.79,5.27,6.08]
x=[4.03,3.76,3.77,3.34,3.47,2.92,3.20,2.71,3.53,4.51]        

Draw_confidenceInterval(x,y)

一元回歸_平均值和個別值的置信區間

dex otl ssi utf-8 src arr sam ylabel font 數據統計分析項目聯系：QQ：231469242 # -*- coding: utf-8 -*- """ Created on Mon Jul 10 11:04:51

logistic 回歸（線性和非線性）

num itl [1] tex sns RKE rec 損失函數 pos 一：線性logistic 回歸代碼如下： import numpy as np import pandas as pd import matplotlib.pyplot as plt import

計量經濟與時間序列_時間序列過程的移動平均和自回歸表示

div 條件變量過去描述相關 ive 包含就是 1 在時間序列分析中有兩種有用的表示來描述時間序列過程。一種是將過程寫成一列不相關的隨機變量的線性組合。這個過程叫moving average過程，也叫MA過程。 2 Wold（1938年）證明：純非確定性的

R語言統計分析技術研究——嶺回歸技術的原理和應用

gts 根據誤差 med 分享 jce not -c rt4 嶺回歸技術的原理和應用

R語言——一元線性回歸

tro 8.0 出現本質距離 -128 call 什麽同時 1 一元線性回歸高爾頓被譽為現代回歸的創始人，"回歸效應"的發現源於高爾頓的豌豆遺傳試驗。在這個試驗中，高爾頓發現，並非尺寸大的豌豆，其後代尺寸也大，尺寸小的豌豆，其後代尺寸也小。而是具有一種不同的趨勢，即

Logistic回歸模型和Python實現

logistic rip ast 步長 glm 常見 gist nes sel 回歸分析是研究變量之間定量關系的一種統計學方法，具有廣泛的應用。 Logistic回歸模型線性回歸先從線性回歸模型開始，線性回歸是最基本的回歸模型，它使用線性函數描述兩個變量之間的關系，將連

分類與回歸的關系和區別

ava 輸入 use richtext head esc 分類序列 auth 走刀口分類和回歸的區別在於輸出變量的類型。定量輸出稱為回歸，或者說是連續變量預測；定性輸出稱為分類，或者說是離散變量預測。舉個例子：預測明天的氣溫是多少度，這是一個

分類和邏輯回歸(Classification and logistic regression)，廣義線性模型(Generalized Linear Models) ，生成學習算法(Generative Learning algorithms)

line learning nbsp ear 回歸 logs http zdb del 分類和邏輯回歸(Classification and logistic regression) http://www.cnblogs.com/czdbest/p/5768467.html

python入門-分類和回歸各種初級算法

學習 -- rst dip 混淆 random bottom gin 實踐引自：http://www.cnblogs.com/taichu/p/5251332.html ########################### #說明： # 撰寫本文的原因是，筆

關於邏輯回歸和感知器一些基礎知識的理解

最大基礎知識 tro 分類函數學習分類概率深入顯式 1.貝葉斯學派和頻率學派在數理統計領域，貝葉斯學派和頻率學派兩派爭論已久，關於兩派的具體思想不做深入研究，僅探討它們在機器學習中的一點粗淺的應用。機器學習中的樸素貝葉斯

分析決策樹算法和邏輯回歸算法的不同之處

人工智能機器學習首先我們導入一組airplan.xlsx數據。數據表中的age表示年齡、FLIGHT_COUNT表示飛行次數、BASE_POINTS_SUM表示飛行裏程、runoff_flag表示流失與否，定義1為正樣本，代表已流失。現在讓我們來看一下最後的效果：可以看到決策樹算法和邏輯回歸算法

極大既然估計和高斯分布推導最小二乘、LASSO、Ridge回歸

baidu 器） ridge 連續概率重要 eal 函數應用 map 最小二乘法可以從Cost/Loss function角度去想，這是統計（機器）學習裏面一個重要概念，一般建立模型就是讓loss function最小，而最小二乘法可以認為是 loss function

遞歸_三角數字和階乘

turn blog 編程需要 body 程序了解 pos 就會遞歸是自己調用自己的編程技術，是程序設計中的數學歸納法。特征：調用自身；當調用自身的時候，是為了解決更小的問題；存在某個足夠簡單的問題的層次，在這一層算法中不需要調用自己就可以直接解答，且返回結果。當遞歸不

插值回歸擬合逼近的區別

簡單的曲線 .... 規律 n) 連續 recommend 條件集合 1回歸一般指線性回歸，是求最小二乘解的過程。在求回歸前，已經假設所有型值點同時滿足某一曲線方程，計算只要求出該方程的系數 2多項式插值：用一個多項式來近似代替數據列表函數，並要求多項式通過列表函

【機器學習】--線性回歸中L1正則和L2正則

last clas nbsp post pan red font 推廣 http 一、前述 L1正則，L2正則的出現原因是為了推廣模型的泛化能力。相當於一個懲罰系數。二、原理 L1正則：Lasso Regression L2正則：Ridge Regression

邏輯回歸和梯度下降簡單應用案例

error () body xlabel 所有 def app 4.6 9.4 實例：我們將建立一個邏輯回歸模型來預測一個學生是否被大學錄取。假設你是一個大學系的管理員，你想根據兩次考試的結果來決定每個申請人的錄取機會。你有以前的申請人的歷史數據，你可以用它作為邏輯回

machine learning 之導論一元線性回歸

IT 預測 ogr ideal 博客找到 lan env 圖片整理自Andrew Ng 的 machine learnig 課程 week1 目錄：什麽是機器學習監督學習非監督學習一元線性回歸模型表示損失函數梯度下降算法 1、什麽是機器學

問題單提單和回歸規範

size 管理公司如何人員特殊方便依賴回測問題單是版本測試過程中發現問題問題，也可以稱作為bug、缺陷。提單是每一個測試人員必備技能之一。但是並不是所有的測試人員都會很好的完成這一項工作。當發現問題時如何提單、如何確保自己提單內容合理，可以減少與開發

關於線性回歸和邏輯回歸一些深入的思考

bubuko 9.png 思考 AR size log href tails net 轉載：會飛的蝸牛專欄關於線性回歸和邏輯回歸一些深入的思考

邏輯回歸和正規化

線性回歸 fun class alt cal option image 參數就會邏輯回歸(logistic regression) 1.用來解決歸類問題（只是由於歷史上的原因取了回歸的名字） 2.二分歸類（binary classification）定義：對於輸入，

一元回歸_平均值和個別值的置信區間

相關推薦