一些關於蛋白質序列分類的總結
畢設題目是“基於神經網路的蛋白質分類器設計”
經過一些努力現在分類的精度到達了98%,但其實仍然不理想,導師其實希望我能做個100%精度的。
總結一下那2%失敗的原因:
GPCR家族LEVEL2的分類裡,有兩類序列特別少,只有3條。我如果拿兩條建模,一條測試,就會導致建模不準確,測試序列也無法正確分類,如果我拿全部的3條序列進行建模,模型是準確了,但沒有用來測試的序列,誰會信你的模型是精確的呢?
但是好就好在,,別的類數量都挺多,我可以把別的類多抽出點,錯誤的這兩條錯就錯吧,那樣的話,正確分類的序列數量就多了,精度也就高了,,,雖然沒有解決實際問題,但是吧,,最起碼好看了些。
關於我具體是怎麼提取蛋白序列特徵段,以及如何使用神經網路工具製作分類器,等我最後答辯完了,我把論文放出來。也和大家相互學習進步吧。
相關推薦
一些關於蛋白質序列分類的總結
畢設題目是“基於神經網路的蛋白質分類器設計” 經過一些努力現在分類的精度到達了98%,但其實仍然不理想,導師其實希望我能做個100%精度的。 總結一下那2%失敗的原因: GPCR家族LEVEL2的分類裡,有兩類序列特別少,只有3條。我如果拿兩條建模,一條測試,就會導致建模不準確,測試序列
html學習——基礎分類總結
rect log 內容 sem ron text html pid 頁面 1. html 超文本標記語言HyperText Markup Language。html文檔基本結構: <!DOCTYPE html><head> &
【BioCode】將多個蛋白質序列分成單個的txt文檔
span package bsp -1 http println != show ade 代碼說明: fasta格式的蛋白質序列,一個txt裏面有很多蛋白質序列,計算ss、pssm或disorder score時候都需要單條計算,需要分開。 分割前: 分割後: show
C#、Java中的一些小功能點總結(持續更新......)
grid datagrid item 其他 cnblogs hid roc oid sha 前言:在項目中,有時候一些小的功能點,總是容易讓人忽略,但是這些功能加在項目中往往十分的有用,因此筆者在這裏總結項目中遇到的一些實用的小功能點,以備用,並持續更新...... 1.禁
C#序列化總結
dll except val typeof read 曾經 mls string ria 貼一下自己序列化的代碼: public class XMLUtil { /// <summary> /// XML &
軟件測試分類總結
子程序 最小 基本功 覆蓋 存在 靜態 測試用例設計 轉化 引入 在這之前,如果你問我,軟件測試的分類有哪些,我可能會回答的語無倫次。最近溫習了一下軟件測試分類的知識,覺得有必要總結一下。 從不同的角度可以將軟件測試分為六種分類方式:項目流程階段
python字符串操作分類總結
imp 文件名 step isspace 開始 rst 大小寫 解碼 als 1、切片操作: str[start:end:step]包括頭,不包括尾巴step為步長,意思是每隔step-1個元素,取一個字符"while"[::-1] 反向取字符串,實現字符串的反轉--》"e
js下IE和FF的一些兼容寫法總結
eth set 獲取 阻止 scrip top 鼠標 order fse 一、腳本差異: 1、事件綁定:addEventListener 與 attachEvent 事件處理函數中this指向不同, IE中指向window 2、獲取事件對象 :事件處理函數 win
決策樹算法(五)——處理一些特殊的分類
字典 如果 span items 分類 lis 函數 可能 一個 在之前的決策樹算法中我們已經講解了從數據集構造決策樹算法的功能模塊。 首先是創建數據集,然後計算香農熵,然後基於最好的屬性值劃分數據集,由於特征值可能多於兩個,因此可能存在大於兩個分支的數據集劃分。第一次劃
MariaDB ColumnStore一些限制和BUG總結
mpp columnstore 限制1、不支持CHARACTER SET語法MariaDB [test]> create table t1(id int,name varchar(10) CHARACTER SET utf8)-> engine=Columnstore;ERROR 1178
PYTHON 一些基礎面試題目總結
外部 刪除一個文件 tel 信息 mpi seq break list 請求 PYTHON 一些基礎面試題目總結http://www.bieryun.com/1191.html1. Python是如何進行內存管理的?答:從三個方面來說,一對象的引用計數機制,二垃
R語言常用包分類總結
arr const poisson string arm ova 處理 port 線性規劃 常用包: ——數據處理:lubridata ,plyr ,reshape2,stringr,formatR,mcmc; ——機器學習:nnet,rpart,tree,party,la
一些項目的基本總結
註解 jsp 中文亂碼問題 數據 密碼 javabean 用戶 流程 封裝 使用jsp顯示頁面信息 使用servlet進行流程控制 使用Javabean實現業務封裝 使用數據源+JDBC訪問數據庫 使用jQuery進行頁面交互 使用過濾器完成中文亂碼問題 使用servlet
有關素數判斷的一些算法(總結&&對比)
stat names 最小 csdn fread AR 目前 ike new 素性測試是數論題中比較常用的一個技巧。它可以很基礎,也可以很高級(哲學)。這次主要要介紹一下有關素數判斷的奇技淫巧 素數的判斷主要分為兩種:範圍篩選型&&單個判斷型 我們先從範圍篩
Hadoop中一些重要概念簡要總結
分享圖片 quest 文件映射 node hadoop 計算機 index hdf 分布式協調 Hadoop是一個利用大規模計算機集群,可處理大量數據的分布式並行框架。 Hadoop 官網 Hadoop的核心設計包括HDFS和MapReduce。 HDFS HDFS(Had
java中緩存分類總結
後臺 mon 一級緩存 計算機系 memcache ava 本地 維基百科 場景 在平時的開發中會經常用到緩存,比如locache、redis等,但一直沒有對緩存有過比較全面的總結。下面從什麽是緩存、為什麽使用緩存、緩存的分類以及對每種緩存的使用分別進行分析,從而對緩存有更
Keras一些常用的API總結
amp 猜想 奇怪 交叉 回調 batch target n) 暫時 使用了一段時間的tensorflow,並且花費了比較大的精力學習了《實戰google深度學習框架》這本書,發現純粹使用tensorflow是比較繁瑣的,所以抽時間學一下keras的內容,以後使用tenso
一些mysql小技巧總結
刪除數據 clas pan sql spa alt mys style ron 1、mysql中不清除表裏的數據重新設置自增的id的方法 設置主鍵id自增的數據庫表刪除數據後,自增id不會自動重新計算,想要重新設置自增的id可以用如下命令: alter table
一些有用的連結總結
本博文內容可能隨時修改。 其他格式的圖片轉化為EPS格式: https://image.online-convert.com/convert-to-eps. (說明: 在LaTeX中常常要使用eps格式的圖片, 可用此連結進行轉化). 各類數學軟體下載: htt
關於jdk7和jdk8 一些新特性的總結
java7新特性 1. 自動資源管理 只要資源實現AutoCloseable介面JVM可以幫我們自動關閉資源 jdk7的流實現了都該介面。 try(裡面寫要開啟的資源){