Matlab灰色預測和統計分析

阿新 • • 發佈：2019-02-01

如何利用Matlab讀取資料進行統計分析？

假設有我在D盤根目錄下有5個txt文字，其檔案格式如下：
data
我們需要如何讀取這個這樣中英文數字混編的資料進行統計分析呢？
假設我們的資料都是以ANSI編碼，如果不是，需要進行另存為覆蓋儲存為這種編碼格式。
接下來，老規矩，廢話不多說，直接上程式碼。

編寫drop.m函式檔案，功能是篩去校選修課資料（院選修課我沒見過，故不能臆斷）。

function s=drop(s,term_type)
[bool,inx]=ismember('校_任選課',term_type);
if bool
s(inx)=[];
end

編寫grade.m函式檔案，以zzu績點計算規則，計算每學期的平均績點。

function grade=grade(term_credit,term_grade,term_type)
credit=drop(term_credit,term_type);
weight=credit/sum(credit);
grade=str2double(drop(term_grade,term_type));
grade=sum(weight.*grade);
end

編寫主函式，作圖分析，分析包括簡單灰色預測，預測準確性不做評判。

%% 初始化變數。
clc
clear
for i=1:5

str_i=num2str(i);   
filename = ['D:\第' 
 str_i '學期.txt'];
delimiter = ',';

%% 每個文字行的格式字串:
%   列1: 文字 (%s)
%   列2: 文字 (%s)
%   列3: 雙精度值 (%f)
%   列4: 文字 (%s)
%   列5: 雙精度值 (%f)
% 有關詳細資訊，請參閱 TEXTSCAN 文件。
formatSpec = '%s%s%f%s%s%[^\n\r]';

%% 開啟文字檔案。
fileID = fopen(filename,'r');

%% 根據格式字串讀取資料列。
% 如果其他檔案出現錯誤，請嘗試通過匯入工具重新生成程式碼。
dataArray = textscan(fileID, formatSpec, 'Delimiter' 
, delimiter,  'ReturnOnError', false);

%% 關閉文字檔案。
fclose(fileID);


%% 將匯入的陣列分配給列變數名稱
eval(['term' str_i '_sub' '=' 'dataArray{:, 1}' ';']);
eval(['term',str_i,'_type' '=' 'dataArray{:, 2}' ';'] );
eval(['term',str_i,'_credit' '=' 'dataArray{:, 3}' ';']);
eval(['term',str_i,'_score' '=' 'dataArray{:, 4}' ';'] );
eval(['term',str_i,'_grade' '=' 'dataArray{:, 5}' ';'] );

%% 清除臨時變數
clearvars filename delimiter formatSpec fileID dataArray ans;
end
grade_1=grade(term1_credit,term1_grade,term1_type);
grade_2=grade(term2_credit,term2_grade,term2_type);
grade_3=grade(term3_credit,term3_grade,term3_type);
grade_4=grade(term4_credit,term4_grade,term4_type);
grade_5=grade(term5_credit,term5_grade,term5_type);
grade=[grade_1,grade_2,grade_3,grade_4,grade_5]
term=1:5
ave_grade=(grade_1+grade_2+grade_3+grade_4+grade_5)/5;

% 建立 axes
axes1 = axes('Parent',figure,...
    'XTickLabel',{'第1學期','第2學期','第3學期','第4學期','第5學期'},...
    'XTick',[1 2 3 4 5]);
box(axes1,'on');
hold(axes1,'all');

% 建立 plot

plot(term,grade,'-mo',...
                'LineWidth',2,...
                'MarkerEdgeColor','k',...
                'MarkerFaceColor',[.49 1 .63],...
                'MarkerSize',12)%plot修飾命令
plot(1:0.01:5,ave_grade)
for i=1:5
text(term(i),grade(i)+0.1,num2str(grade(i)))
end


% 建立 xlabel
xlabel('學期');

% 建立 title
title(['學期績點變化(平均值：' num2str(ave_grade) ')']);

% 建立 ylabel
ylabel({'績點'});
hold off;
%% 
figure
credit2=drop(term2_credit,term2_type);
sub2=drop(term2_sub,term2_type);
explode=zeros(1,length(credit2));
explode(5)=1;
pie3(credit2,explode,sub2)
title('第二學期學科學分分佈（學科重要性）');
%%

score1=str2double(drop(term1_score,term1_type))
sub1=drop(term1_sub,term1_type)

% 建立 figure
%figure;

% 建立 axes
axes1 = axes('Parent',figure,...
    'XTickLabel',sub1,...
    'XTick',[1 2 3 4 5 6 7 8],'FontSize',8);
box(axes1,'on');
hold(axes1,'all');

% 建立 title
title('第一學期各科成績');

% 建立 xlabel
xlabel('科目');

% 建立 ylabel
ylabel('成績');
for i=1:length(score1)
text(i,score1(i)+1,num2str(score1(i)))
end
% 建立 bar
bar(score1,'FaceColor',[0 0 0.5625],'BaseValue',60);
%% 灰色預測
figure
x0=grade;
m=1;
n=length(x0);%求x0的長度
x1=zeros(1,n);%生成與x0等長度的零向量
x1(1)=x0(1);%將x0首位賦值給x1
for i=2:n        %計算累加序列 x1    
    x1(i)=x1(i-1)+x0(i); %x1為x0的累加序列
end
i=2:n;     %對原始數列平行移位並賦給y 
y(i-1)=x0(i);
y=y' %將 y 變成列向量 
i=1:n-1;   %計算資料矩陣 B 的第一列資料
c(i)=-0.5*(x1(i)+x1(i+1));  %兩個數平均值取負數，總感覺饒了一大圈
B=[c' ones(n-1,1)];%構造矩陣 B ，轉置後找個1伴隨
au=inv(B'*B)*B'*y;%計算引數 au 矩陣 
i=1:n+1+m;       %計算預測累加數列的值 
ago(i)=(x0(1)-au(2)/au(1))*exp(-au(1)*(i-1))+ au(2)/au(1); 
yc(1)=ago(1);
i=1:n-1;         %還原數列的值 
yc(i+1)=ago(i+1)-ago(i); 
i=2:n;
error(i)=yc(i)-x0(i);  %計算殘差值 yc(1)=ago(1);
i=1:n-1+m;           %修正的還原數列的值 ，我怎麼感覺沒修正的樣子
yc(i+1)=ago(i+1)-ago(i);
c=std(error)/std(x0);  %計算後驗差比，也就是殘差標準差和原數值標準差的比值
p=0; 
for i=2:n  
    if(abs(error(i)-mean(error))<0.6745*std(x0))      
        p=p+1; 
    end
end%看殘差中有幾個數值和殘差均值的相差不大
p=p/(n-1);%p分配到每個參與的殘差上，即為小誤差概率的值
w1=min(abs(error)); 
w2=max(abs(error)); %計算殘差的最大最小位
i=1:n;                %計算關聯度 w
w(i)=(w1+0.5*w2)./(abs(error(i))+0.5*w2);
w=sum(w)/(n-1);

au             %輸出引數 a,u 的值
x0            %輸出原始序列值
ago   %輸出累加數列 ago 的值          
yc              %輸出預測的值 
error            %輸出殘差的值
c     %輸出後驗差比的值
p    %輸出小誤差概率的值
w    %輸出關聯度 w



plot(1:n,x0,'-.r+',1:m+n,yc,'--k*'); 
xlabel('學期');
ylabel('績點');
title(['學期績點灰色預測（預測得下一學期績點為' num2str(yc(6)) ')']);              
legend(' 實測值','預測值');

結果如下：

也沒有其他要說的，強調一下eval函式的妙用，可以自動命名變數並進行賦值。另外，除了學分是純的數字以外，其他列的資料或多或少都摻雜著兩種以上的資料型別，因此都當做字串的格式讀入。之後再根據需要進行轉化處理。

Matlab灰色預測和統計分析

如何利用Matlab讀取資料進行統計分析？假設有我在D盤根目錄下有5個txt文字，其檔案格式如下：我們需要如何讀取這個這樣中英文數字混編的資料進行統計分析呢？假設我們的資料都是以ANSI編碼，如果不是，需要進行另存為覆蓋儲存為這種編碼格式。接

【雷達與對抗】【2010.12】實驗雷達雜波資料的譜和統計分析

本文為土耳其中東技術大學（作者：NAZLI DEN˙ IZ KAHYAOGLU）的碩士論文，共157頁。雷達探測和成像系統的效能很大程度上取決於雷達雜波的特性。為了改善雷達訊號處理演算法，需要對雷達雜波進行成功的分析和建模。對於一個成功的雷達雜波模型，應當能夠揭示出雜波的頻譜和統計特

R資料探勘技術-基於R語言的資料探勘和統計分析技術

培訓要點網際網路點選資料、感測資料、日誌檔案、具有豐富地理空間資訊的移動資料和涉及網路的各類評論，成為了海量資訊的多種形式。當資料以成百上千TB不斷增長的時候，我們在內部交易系統的歷史資訊之外，需要一種基於大資料分析的決策模型和技術支援。目前對大資料的分析工具，有Had

銷量預測和用戶行為的分析--基於ERP的交易數據

測試數據為什麽 5% 重要思考發的 span 左右參考寫在前面：這段時間一直都在看一些機器學習方面的內容，其中又花了不少時間在推薦系統這塊，然後自己做了一套簡單的推薦系統，但是跑下來的結果總覺得有些差強人意，我在離線實驗中得到Precision,Recall一般

R語言統計分析技術研究——嶺回歸技術的原理和應用

gts 根據誤差 med 分享 jce not -c rt4 嶺回歸技術的原理和應用

來學學數據分析吧（二）第一章預測和關聯數量特征

想要夠快均方誤差容易預測適用於 color 就是工程 Chapter 1 Regression: Predicting and Relating Quantitative Features 1.1 統計學，數據分析，回歸統計學是利用數學來研究和提高從不完

NAR：MicrobiomeAnalyst微生物組分析師——統計、視覺化和元分析微生物組資料的網頁工具

文章目錄微生物組分析師：統計、可視和元分析微生物組資料的網頁工具導讀摘要背景專案描述和方法圖1. 平臺流程圖資料上傳和處理輸入資料資料過濾資料標準化

灰色預測模型的學習筆記（MATLAB 包含模型的建立求解及檢驗）

本博文是本人在學習灰色預測模型時所做的筆記，原理及程式碼部分都是基於學習各位大佬的博文，詳見後面的參考，一、實操，利用灰色預測模型預測未來十年湖南的人口數量二、具體實現，從國家統計局獲取湖南省過去十年的人口資料，作為原始資料，見Excel檔案，利用MAT

GM(1,1)灰色預測模型及matlab程式碼

原理 https://blog.csdn.net/zxiang248/article/details/72833016/ 例項程式碼 clc;clear; %建立符號變數a(發展係數)和b(灰作用量) syms a b; c = [a b]'; %原始數列 A A =

分析資料，持續預測和累計預測資料的區別

ECMWF data can be split into 3 main categories: analyses, instaneous forecasts and accumulated forecasts. Analyses are produced by combining short-

精通Excel資料統計與分析 - 摘要（第11章：主成分分析和因子分析）

一、簡介 11.1主成分分析主成分分析，是將多個變數通過線性變換以選出較少個數重要變數的一種多元統計分析方法，又稱主分量分析；主成分分析是在減少分析變數個數的同時，保留較多的原始資訊；可以理解為減少一個矩陣的行； 11.2因子分析

python資料分析pandas包入門學習（三）彙總和統計描述

本文參考《利用Python進行資料分析》的第五章 pandas入門 pandas擁有一組常用的數學和統計方法。它們大部分屬於約簡和彙總統計，用於從Series中提取單個值（如sum和mean），或從DataFrame的行或列中提取一個Series。跟對應的Numpy陣列

linux下使用awk,wc,sort,uniq,grep對nginx日誌進行分析和統計

通過對awk, wc, uniq, grep, sort等命令的組合，分析nginx的access和error日誌。統計各種總量、單位時間量。 access.log日誌格式(見下圖）說明： a). 按照Tab鍵拆分每項資料 b). 欄位含義（如下說明）

灰色預測模型GM(1,1) 與例題分析

灰色預測模型灰色預測的概念（1）灰色系統、白色系統和黑色系統白色系統是指一個系統的內部特徵是完全已知的，既系統資訊是完全充分的。黑色系統是一個系統的內部資訊對外界來說是一無所知的，只能通過它與外界的聯絡來加以觀測研究。灰色系統介於白色和

sas簡單描述統計分析和散點圖

簡單描述統計分析一、 means過程（一）例題和語句分析例題1：某車間有30個人分成4組，求車間工人平均每小時製作的配件個數 data data3_1; input no w n; /*按自由格式輸入變數no、

《灰色預測(GM)的MATLAB實現》

一、灰色模型GM(1,1) 1. 問題請以下表的資料為依據，預測2005-2014年長江的汙水排放量(單位：億噸)。

數學建模筆記1——灰色預測matlab例子

案列一長江水質的預測 matlab程式碼： clc,clear; syms a b; c=[a b]'; A=[174 179 183 189 207 234 220.5 256 270

Excel在統計分析中的應用—第二章—描述性統計-Part3-偏度（偏斜度和矩偏度係數）

分佈的偏度是指分佈不對稱的方向和程度，這種離散的偏差用偏度來衡量。分為正偏、負偏和無偏（對稱）三種情況。衡量偏度的指標有：偏斜度、矩偏度係數、四分位數偏度係數和Spearman偏度係數。偏斜度及矩

關於嵌入式和java，網際網路的行業統計分析，判斷未來房地產以及發展趨勢

上圖是java崗位的，分別是成都，武漢，杭州，廣州，可以看出武漢和廣州在java工程師上的崗位招聘數量基本持平，可是廣州的房價卻是最高的 ==================================================分界限========

統計分析：偏度和峰度

偏度偏度（Skewness）：是對Sample構成的分佈的對稱性狀況的描述。計算時間序列 xx 的偏度，偏度用於衡量 xx 的對稱性。若偏度為負，則 xx 均值左側的離散度比右側強;若偏度為正，則 xx均值左側的離散度比右側弱。對於正態分佈(或嚴格對稱分佈)偏度

Matlab灰色預測和統計分析

如何利用Matlab讀取資料進行統計分析？

相關推薦