x265中encodeResAndCalcRdInterCU()分析(版本2.8)

阿新 • • 發佈：2018-12-17

二. 原始碼註釋分析：

/*
 =======Analysed by:  yangxin
 =======Date:         2018.10
 =======Function:     encodeResAndCalcRdInterCU()   merge模式編碼殘差並進行RD-cost計算，以及進行熵編碼
*/
/* encode residual and calculate rate-distortion for a CU block.
 * Note: this function overwrites the RD cost variables of interMode, but leaves the sa8d cost unharmed */
void Search::encodeResAndCalcRdInterCU(Mode& interMode, const CUGeom& cuGeom)
{
    ProfileCUScope(interMode.cu, interRDOElapsedTime[cuGeom.depth], countInterRDO[cuGeom.depth]);

    CUData& cu = interMode.cu;
    Yuv* reconYuv = &interMode.reconYuv;
    Yuv* predYuv = &interMode.predYuv;
    uint32_t depth = cuGeom.depth;
    ShortYuv* resiYuv = &m_rqt[depth].tmpResiYuv;
    const Yuv* fencYuv = interMode.fencYuv;

    X265_CHECK(!cu.isIntra(0), "intra CU not expected\n");

    uint32_t log2CUSize = cuGeom.log2CUSize;
    int sizeIdx = log2CUSize - 2;

    resiYuv->subtract(*fencYuv, *predYuv, log2CUSize, m_frame->m_fencPic->m_picCsp);//--原始影象和預測圖象相減，計算殘差

    uint32_t tuDepthRange[2];
    cu.getInterTUQtDepthRange(tuDepthRange, 0);//--得到tu深度範圍

    m_entropyCoder.load(m_rqt[depth].cur);

    if ((m_limitTU & X265_TU_LIMIT_DFS) && !(m_limitTU & X265_TU_LIMIT_NEIGH))
        m_maxTUDepth = -1;
    else if (m_limitTU & X265_TU_LIMIT_BFS)
        memset(&m_cacheTU, 0, sizeof(TUInfoCache));

	////////===================================////////
    Cost costs;
    if (m_limitTU & X265_TU_LIMIT_NEIGH)
    {
        /* Save and reload maxTUDepth to avoid changing of maxTUDepth between modes */
        int32_t tempDepth = m_maxTUDepth;
        if (m_maxTUDepth != -1)
        {
            uint32_t splitFlag = interMode.cu.m_partSize[0] != SIZE_2Nx2N;
            uint32_t minSize = tuDepthRange[0];
            uint32_t maxSize = tuDepthRange[1];
            maxSize = X265_MIN(maxSize, cuGeom.log2CUSize - splitFlag);
            m_maxTUDepth = x265_clip3(cuGeom.log2CUSize - maxSize, cuGeom.log2CUSize - minSize, (uint32_t)m_maxTUDepth);
        }
        estimateResidualQT(interMode, cuGeom, 0, 0, *resiYuv, costs, tuDepthRange);//--估計殘差的率失真代價和位元代價，量化和變換****
        m_maxTUDepth = tempDepth;
    }
    else
        estimateResidualQT(interMode, cuGeom, 0, 0, *resiYuv, costs, tuDepthRange);//--******


    uint32_t tqBypass = cu.m_tqBypass[0];//--lossless flags
    if (!tqBypass)
    {
        sse_t cbf0Dist = primitives.cu[sizeIdx].sse_pp(fencYuv->m_buf[0], fencYuv->m_size, predYuv->m_buf[0], predYuv->m_size);
        if (m_csp != X265_CSP_I400 && m_frame->m_fencPic->m_picCsp != X265_CSP_I400)
        {
            cbf0Dist += m_rdCost.scaleChromaDist(1, primitives.chroma[m_csp].cu[sizeIdx].sse_pp(fencYuv->m_buf[1], predYuv->m_csize, predYuv->m_buf[1], predYuv->m_csize));
            cbf0Dist += m_rdCost.scaleChromaDist(2, primitives.chroma[m_csp].cu[sizeIdx].sse_pp(fencYuv->m_buf[2], predYuv->m_csize, predYuv->m_buf[2], predYuv->m_csize));
        }

        /* Consider the RD cost of not signaling any residual */
        m_entropyCoder.load(m_rqt[depth].cur);
        m_entropyCoder.resetBits();
        m_entropyCoder.codeQtRootCbfZero();
        uint32_t cbf0Bits = m_entropyCoder.getNumberOfWrittenBits();

        uint32_t cbf0Energy; uint64_t cbf0Cost;
        if (m_rdCost.m_psyRd)
        {
            cbf0Energy = m_rdCost.psyCost(log2CUSize - 2, fencYuv->m_buf[0], fencYuv->m_size, predYuv->m_buf[0], predYuv->m_size);
            cbf0Cost = m_rdCost.calcPsyRdCost(cbf0Dist, cbf0Bits, cbf0Energy);
        }
        else if(m_rdCost.m_ssimRd)
        {
            cbf0Energy = m_quant.ssimDistortion(cu, fencYuv->m_buf[0], fencYuv->m_size, predYuv->m_buf[0], predYuv->m_size, log2CUSize, TEXT_LUMA, 0);
            cbf0Cost = m_rdCost.calcSsimRdCost(cbf0Dist, cbf0Bits, cbf0Energy);
        }
        else
            cbf0Cost = m_rdCost.calcRdCost(cbf0Dist, cbf0Bits);

        if (cbf0Cost < costs.rdcost)
        {
            cu.clearCbf();
            cu.setTUDepthSubParts(0, 0, depth);
        }
    }

    if (cu.getQtRootCbf(0))
        saveResidualQTData(cu, *resiYuv, 0, 0);//--儲存殘差量化變化資料，四叉樹遞迴呼叫，應該有tu的再次劃分

	//--熵編碼*****//
    /* calculate signal bits for inter/merge/skip coded CU */
    m_entropyCoder.load(m_rqt[depth].cur);

    m_entropyCoder.resetBits();//--清零操作
    if (m_slice->m_pps->bTransquantBypassEnabled)
        m_entropyCoder.codeCUTransquantBypassFlag(tqBypass);


	//--計算bits
    uint32_t coeffBits, bits, mvBits;
    if (cu.m_mergeFlag[0] && cu.m_partSize[0] == SIZE_2Nx2N && !cu.getQtRootCbf(0))//--merge/skip
    {
        cu.setPredModeSubParts(MODE_SKIP);

        /* Merge/Skip */
        coeffBits = mvBits = 0;
        m_entropyCoder.codeSkipFlag(cu, 0);
        int skipFlagBits = m_entropyCoder.getNumberOfWrittenBits();
        m_entropyCoder.codeMergeIndex(cu, 0);
        mvBits = m_entropyCoder.getNumberOfWrittenBits() - skipFlagBits;
        bits = mvBits + skipFlagBits;//--
    }
    else//--Amvp
    {
        m_entropyCoder.codeSkipFlag(cu, 0);
        int skipFlagBits = m_entropyCoder.getNumberOfWrittenBits();
        m_entropyCoder.codePredMode(cu.m_predMode[0]);
        m_entropyCoder.codePartSize(cu, 0, cuGeom.depth);
        m_entropyCoder.codePredInfo(cu, 0);
        mvBits = m_entropyCoder.getNumberOfWrittenBits() - skipFlagBits;

        bool bCodeDQP = m_slice->m_pps->bUseDQP;
        m_entropyCoder.codeCoeff(cu, 0, bCodeDQP, tuDepthRange);
        bits = m_entropyCoder.getNumberOfWrittenBits();//--

        coeffBits = bits - mvBits - skipFlagBits;
    }

    m_entropyCoder.store(interMode.contexts);//--

    if (cu.getQtRootCbf(0))//--從已經編碼塊標誌進行量化變換
        reconYuv->addClip(*predYuv, *resiYuv, log2CUSize, m_frame->m_fencPic->m_picCsp);
    else
        reconYuv->copyFromYuv(*predYuv);//--重建影象直接copy預測影象


	//////--------------------------------------------------------------------------------------------------------/////
    // update with clipped distortion and cost (qp estimation loop uses unclipped values)
	//--luma
    sse_t bestLumaDist = primitives.cu[sizeIdx].sse_pp(fencYuv->m_buf[0], fencYuv->m_size, reconYuv->m_buf[0], reconYuv->m_size);
    interMode.distortion = bestLumaDist;
	//--chroma
    if (m_csp != X265_CSP_I400 && m_frame->m_fencPic->m_picCsp != X265_CSP_I400)
    {
        sse_t bestChromaDist = m_rdCost.scaleChromaDist(1, primitives.chroma[m_csp].cu[sizeIdx].sse_pp(fencYuv->m_buf[1], fencYuv->m_csize, reconYuv->m_buf[1], reconYuv->m_csize));
        bestChromaDist += m_rdCost.scaleChromaDist(2, primitives.chroma[m_csp].cu[sizeIdx].sse_pp(fencYuv->m_buf[2], fencYuv->m_csize, reconYuv->m_buf[2], reconYuv->m_csize));
        interMode.chromaDistortion = bestChromaDist;
        interMode.distortion += bestChromaDist;//--總失真
    }
    if (m_rdCost.m_psyRd)
        interMode.psyEnergy = m_rdCost.psyCost(sizeIdx, fencYuv->m_buf[0], fencYuv->m_size, reconYuv->m_buf[0], reconYuv->m_size);
    else if(m_rdCost.m_ssimRd)
        interMode.ssimEnergy = m_quant.ssimDistortion(cu, fencYuv->m_buf[0], fencYuv->m_size, reconYuv->m_buf[0], reconYuv->m_size, cu.m_log2CUSize[0], TEXT_LUMA, 0);

    interMode.resEnergy = primitives.cu[sizeIdx].sse_pp(fencYuv->m_buf[0], fencYuv->m_size, predYuv->m_buf[0], predYuv->m_size);
    interMode.totalBits = bits;//--總bits
    interMode.lumaDistortion = bestLumaDist;
    interMode.coeffBits = coeffBits;
    interMode.mvBits = mvBits;
    cu.m_distortion[0] = interMode.distortion;//--儲存總失真
    updateModeCost(interMode);//--總代價cost
    checkDQP(interMode, cuGeom);
}

x265中encodeResAndCalcRdInterCU()分析(版本2.8)

二. 原始碼註釋分析： /* =======Analysed by: yangxin =======Date: 2018.10 =======Function: encodeResAndCalcRdInterCU() merge模式編碼

x265中codeIntraLumaQT()分析(版本2.8)

一. 原始碼註釋分析： /* ==== Analysed by: yangxin ==== Date: 2018.9 ==== Function: codeIntraLumaQT():// generate predict

x265幀內一個CU的編碼過程（版本2.8）

一. 幀內CU、PU、TU： 1. CU：編碼單元，在幀內只有 64x64-8x8; 2. PU：預測單元，幀內有2Nx2N、NxN兩種劃分方式，其中2Nx2N對應所屬編碼單元CU的尺寸，而NxN只存在於8x8的CU中，因為對於其他尺寸的

二、SpringBoot 整合 swagger2 (swagger2 版本 2.8.0)

（一）新增依賴 <swagger.version>2.8.0</swagger.version>  <dependency> <gro

ubuntu 14.04下安裝cmake 3.2.2（自帶版本2.8.2）

Either use a PPA or compile it yourself: Installation by a PPA (Upgrade to 3.2) sudo apt-get install software-properties-common sudo add-apt-repository p

dubbox（dubbo 版本2.8.4）新增到本地maven倉庫

1、下載原始碼：然後解壓；2、在原始碼路徑下執行： mvn clean install -Dmaven.test.skip=true然後在每一個資料夾下有一個target目錄，裡面有jar包和war包。3、執行 mvn install:install-file -Dfile

【Django Series - 01】以前用 1.6.11，最近用 1.10.8，現在又想換最新版本 2.1.2（探索中...）

Django Series（Django2.1.2 + Anaconda3）（一）安裝並配置 Django 環境 ||| 基於 Django 進行 Web 開發（二）Django 基礎知識：語法、教程（三）使用者管理模組：建立使用者、登入、退出（四）資料的增刪改：使用者提交資

01】以前用 1.6.11，最近用 1.10.8，現在又想換最新版本 2.1.2（探索中...）

Django Series（Django2.1.2 + Anaconda3）說明：本系列教程根據最近實踐過程進行整理、總結和分享。由於時間和精力有限，發表時內容分析部分可能不是很完整，後續有時間會慢慢補充。同時！！也希望感興趣的同學可以提出一些細節問題

項目版本不同導致Eclipse報錯問題——關於在JDK1.7環境中，運行JDK1.8環境下編寫的項目

water 錯誤顯示 lips 1.8 ips avi 序號 fill 本人電腦環境配置的是JDK1.7，朋友的是JDK1.8 ，我把她編的java文件導入到我電腦裏的Eclipse（LUNA版本）的時候，項目出現一個紅色嘆號，當然運行是肯定出錯了。SO我就開始了解決之旅

Mariadb 10.2.8版本GTID主從環境搭建以及切換

mas 從庫 ica ack relay_log mys repo oba 數據庫 1.首先搭建主從主環境:192.168.1.117 從環境:192.168.1.123 a.首先以二進制包的形式安裝好MariaDB （忽略不計） b.配置環境的變量通配 [mysqld

Android開發遇到的坑-----融雲2.8.+版本修改插件列表

rsa 圖片項目需求 tex 顯示根據 -- 移除 pre 簡介　　融雲在2.8.+的時候,對輸入區域進行了重構,輸入區域整個為RongExtension,插件為RongExtension區域的Plugin模塊 List<IPluginModule&g

2.8.2 並發下的ArrayList，以及源碼分析

blog util join() explicit ted cep ole 問題： port package 第二章.並發下的ArrayList;import java.util.ArrayList;import java.util.List;/** * Created b

吳恩達 2.7 2.8 2.9 logistic中的梯度下降

mage normal XML 它的 image 2.7 計算 png gis 邏輯回歸中包含了正向傳播和反向傳播,用一個計算圖來表示其過程計算圖: 舉一個簡單的例子例: 把j(a,b,c)看作logistic回歸成本函數j=3(a+bc),它的計算過程為讓u=bc

java中排序原始碼分析（JDK1.8）

List排序在開發過程中常用的是jdk自帶的排序 Collections.sort(List<T> list, Comparator<? super T> c); 開啟原始碼如下： @SuppressWarnings({"unchecked",

資料基礎---《利用Python進行資料分析·第2版》第8章資料規整：聚合、合併和重塑

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。在許多應用中，資料可能分散在許多檔案或資料庫中，儲存的形式也不利於分析。本章關注可以聚合、合併、重塑資料的方法。首先

LINUX系統中安裝Redis3.2.8

http://blog.csdn.net/chiaotien/article/details/62524655 一，下載redis 壓縮包命令：[[email protected] usr]# wget http://download.redis.io/releases/redi

深入理解計算機系統（2.8）---浮點數的舍入，Java中的舍入例子以及浮點數運算（重要）

https://www.cnblogs.com/zuoxiaolong/p/computer12.html 前言　　上一章我們簡單介紹了IEEE浮點標準，本次我們主要講解一下浮點運算舍入的問題，以及簡單的介紹浮點數的運算。　　之前我們已經提到過，有很多小數是二進位制

下載了最新版本的wxpython後執行不起robot framework ride，原來是wxpython版本必須是2.8.12.1的

robot framework ride安裝之後，在cmd 環境下執行python27/Scripts/ride.py失敗，提示需要2.8.12.1的wxPython，下載wxPython2.8-win64-unicode-2.8.12.1-py27.exe安裝上後，再次執行就好了。下載連結：

Android進階3：Activity原始碼分析（2） —— Activity啟動和銷燬流程（8.0）

上篇文章講述了app從啟動建立Activity呼叫onCreate，onStart, onResume方法，這篇文章講述一下Activity啟動的另一個切入點：startActivity方法，啟動Activity。通過上一篇文章，我們總結一下： 1：A

webpack-tapable-0.2.8 原始碼分析

webpack 是基於事件流的打包構建工具，也就是內建了很多 hooks。作為使用方，可以在這些鉤子當中，去插入自己的處理邏輯，而這一切的實現都得益於 tapable 這個工具。它有多個版本，webpack 前期的版本是依賴於 tapable 0.2.8 這個版本，後來重構了，發了 2.0.0 beta 版本

x265中encodeResAndCalcRdInterCU()分析(版本2.8)

二. 原始碼註釋分析：

相關推薦