如何轉換音訊資料格式1

阿新 • • 發佈：2019-02-11

前面的音訊處理背景知識就先跳過，需要的請自行腦補。

直接上乾貨。

一、聲道轉換

1、單聲道轉立體聲

原理，雙聲道的16位取樣，每16位是一個聲道，也就是兩位元組；下一個16位是另外一個聲道，交錯進行。

private byte[] MonoToStereo(byte[] input)
{
    byte[] output = new byte[input.Length * 2];
    int outputIndex = 0;
    for (int n = 0; n < input.Length; n+=2)
    {
        // copy in the first 16 bit sample
        output[outputIndex++] = input[n];
        output[outputIndex++] = input[n+1];
        // now copy it in again
        output[outputIndex++] = input[n];
        output[outputIndex++] = input[n+1];        
    }
    return output;
}

2、立體聲轉單聲道

原理，去掉一半的資料即可。

private byte[] StereoToMono(byte[] input)
{
    byte[] output = new byte[input.Length / 2];
    int outputIndex = 0;
    for (int n = 0; n < input.Length; n+=4)
    {
        // copy in the first 16 bit sample
        output[outputIndex++] = input[n];
        output[outputIndex++] = input[n+1];
    }
    return output;
}

3、混合立體聲轉單聲道

如果是混合立體聲，則可以把左右聲道的資料求平均，得到單聲道的值

private byte[] MixStereoToMono(byte[] input)
{
    byte[] output = new byte[input.Length / 2];
    int outputIndex = 0;
    for (int n = 0; n < input.Length; n+=4)
    {
        int leftChannel = BitConverter.ToInt16(input,n);
        int rightChannel = BitConverter.ToInt16(input,n+2);
        int mixed = (leftChannel + rightChannel) / 2;
        byte[] outSample = BitConverter.GetBytes((short)mixed);
        
        // copy in the first 16 bit sample
        output[outputIndex++] = outSample[0];
        output[outputIndex++] = outSample[1];
    }
    return output;
}

二、位寬轉換

4、16位轉32位float

相對簡單，把每個16bit（兩個byte，合成一個short）除以16位的最大值，得到一個相對的float值（介於0-1之間）。

public float[] Convert16BitToFloat(byte[] input)
{
    int inputSamples = input.Length / 2; // 16 bit input, so 2 bytes per sample
    float[] output = new float[inputSamples];
    int outputIndex = 0;
    for(int n = 0; n < inputSamples; n++)
    {
        short sample = BitConverter.ToInt16(input,n*2);
        output[outputIndex++] = sample / 32768f;
    }
    return output;
}

5、24位轉32位float

這個就稍微麻煩了，從原資料中每次取24位，即3個byte，補上一個0，摺合成一個int，然後除以3個byte組成的資料最大值，得到一個相對float值（介於0-1之間）。

public float[] Convert24BitToFloat(byte[] input)
{
    int inputSamples = input.Length / 3; // 24 bit input
    float[] output = new float[inputSamples];
    int outputIndex = 0;
    var temp = new byte[4];
    for(int n = 0; n < inputSamples; n++)
    {
        // copy 3 bytes in
        Array.Copy(input,n*3,temp,0,3);
        int sample = BitConverter.ToInt32(temp,0);
        output[outputIndex++] = sample / 16777216f;
    }
    return output;
}

這種方式其實也相當於把3個取樣點，線性擬合變成了2個了。

6、還原資料

兩種方式還原的程式碼一樣（後一種多的一個點資訊已經丟失，還原也只有2個byte了）：

for (int sample = 0; sample < sourceSamples; sample++)
{
    // adjust volume
    float sample32 = sourceBuffer[sample] * volume;
    // clip
    if (sample32 > 1.0f)
        sample32 = 1.0f;
    if (sample32 < -1.0f)
        sample32 = -1.0f;
    destBuffer[destOffset++] = (short)(sample32 * 32767);
}

三、重取樣

取樣是這個文章中比較複雜的部分。

=================== 佔坑，以後講原理====================

7、一個簡單的重取樣演算法

原理就是，拉大或縮小取樣點的間距。當然，明顯的是，如果如果新取樣率大於舊的，其實沒有意義，造成很多點只會簡單重複。

新取樣率小於舊的，就會在現有的點上，等比例往後拉。

// Just about worst resampling algorithm possible:
private float[] ResampleNaive(float[] inBuffer, int inputSampleRate, int outputSampleRate)
{
    var outBuffer = new List<float>();
    double ratio = (double) inputSampleRate / outputSampleRate;
    int outSample = 0;
    while (true)
    {
        int inBufferIndex = (int)(outSample++ * ratio);
        if (inBufferIndex < read)
            writer.WriteSample(inBuffer[inBufferIndex]);
        else
            break;    
    } 
    return outBuffer.ToArray();    
}

========== 留坑，講重取樣的測試==========

下一部分，音訊檔案格式的轉換

如何轉換音訊資料格式1

前面的音訊處理背景知識就先跳過，需要的請自行腦補。直接上乾貨。一、聲道轉換 1、單聲道轉立體聲原理，雙聲道的16位取樣，每16位是一個聲道，也就是兩位元組；下一個16位是另外一個聲道，交錯進行。 private byte[] MonoToStereo(byte[]

java 程式碼轉換音訊資料格式(位元組陣列轉換)

目前音訊格式有很多，本文針對PCM 音訊檔案進行轉換所謂pcm 就是將聲音等模擬訊號變成符號化的脈衝列，再予以記錄。PCM訊號是由[1]、[0]等符號構成的數字訊號。與模擬訊號比，它不易受傳送系統的雜波及失真的影響。動態範圍寬，可得到音質相當好的影響效果。PCM軌跡與視訊

MATLAB轉換TXT中灰度值資料格式，將灰度資料輸出為影象

在整理地圖測繪資料時，需要將資料先匯出，然後將資料轉化為影象資訊，使用MATLAB進行轉化遇到點問題，最後算是能出影象了，就將這一點經驗分享下。首先看下匯出來的資料格式，匯出來的為TXT格式，其中橢圓是有效資料，但是這種資料比較格魯的一點是，輸出的資料是40*400的

MySQL中資料格式轉換

MySQL 的CAST()和CONVERT()函式可用來獲取一個型別的值，併產生另一個型別的值。具體用法如下： CAST(value as type); CONVERT(value,

轉換資料格式

cates = [{cate1:"銷售",cate2:"銷售主管"},{cate1:"銷售",cate2:"銷售代表"},{cate1:"司機",cate2:"火車司機"},{cate1:"司機",cate2:"客車司機"}] 兩種方案當時做的時候花時間最多的就是push 需要注意兩

將caltech資料集轉換成VOC格式

目的：將Caltech行人資料集轉換為Pascal VOC格式參考來源https://www.cnblogs.com/arkenstone/p/7337077.html 但是這裡面的程式碼有一些問題，我在其中修改了一些操作步驟如下：將下載好的caltech ped

SpringMVC總結--資料格式轉換和資料校驗

SpringMVC資料繫結流程 A：SpingMVC 主框架將 ServletRequest 物件及目標方法的入參例項傳遞 WebDataBinderFactory 例項，以建立DataBinder 例項物件 &nbs

1分鐘將PPT轉換成exe格式

教你如何使用RAR壓縮1分鐘將ppt轉換成exe格式。 1）把要轉換的PPT檔案另存為“PowerPoint放映”，字尾名為pps或ppsx, 2）右鍵ppsx檔案選擇新增到壓縮檔案”如圖 3）將ppsx檔案修改成教學版大下手眼腦協調訓練.exe 4）點選高階選擇自

Atitit 持久化 Persistence概念的藝術目錄 1. 持久化是將程式資料在持久狀態和瞬時狀態間轉換的機制。 1 2. DBC就是一種持久化機制。檔案IO也是一種持久化機制。 2 3.

Atitit 持久化 Persistence概念的藝術目錄 1. 持久化是將程式資料在持久狀態和瞬時狀態間轉換的機制。 1 2. DBC就是一種持久化機制。檔案IO也是一種持久化機制。 2 3. 日常持久化的方法 2 4. 理解與分類 3 4.1

【CV】如何使用Tensorflow提供的Object Detection API --2--資料轉換為TFRecord格式

本篇主要講的是如何將現存的資料變成Tensorflow記錄格式，然後我們就可以用這些資料來進行微調模型，以解決我們關心的問題了。什麼是TFRecord格式一般使用TF讀取資料有四種方式：預先把所有資料載入進記憶體在每輪訓練中使用原生Python程式碼讀取

關於json時間資料格式轉換與修改

使用easyui獲取JSON時間資料時間資料時，通常是一長串的數字而不是我們想要的類似2018-11-01的普通時間格式。此時我們就需要使用到關於JSON時間的格式化，而將時間轉化成我們想要的格式。一般轉化格式之前一直使用的 toLocaleDateString() 但是用

Android開發使用Lame把音訊檔案轉換成mp3格式

轉自：http://www.pocketdigi.com/20130306/996.html Android錄音預設不支援mp3格式，為了生成mp3，可以錄製raw格式，再使用lame轉換成mp3.Lame是用C語言寫的，所以需要NDK編譯。編譯方法：http://developer.samsu

如何快速轉換音訊格式？

　　音樂，有人將它比作花朵，因為它鋪滿在人生的道路上，散發出不絕的芬芳，把生活裝飾得更美。音訊格式的批量轉換以及快速轉換都可以通過迅捷視訊轉換器來完成。從歷史風格的範疇而言，現代音樂特指20世紀中非傳統作曲技法，非功能和聲體系作為理論支撐的音樂作品。不同於傳統音樂體系與流行音樂體系這兩種純調性音樂體系的音

svm格式資料轉換為tensorflow資料格式

#!/usr/bin/env pythonimport tensorflow as tfimport numpy as npbatch_size = 100w1 = tf.Variable(tf.random_normal([5,8],stddev=1,seed=1)) #第一層權重初始化，方差為1w2 =

.vbb格式轉換為txt格式（matlab實現)，在此以Caltech Pedestrian Dataset資料集的annotations為例

%% 下載matlab的vbb工具庫連結：https://pan.baidu.com/s/1GVvimekjNh4M_D4grM0Btw 提取碼：ymfn %% clc clear all addpath(genpath('自己存放code3.2.1資料夾

如何使用音訊轉換器快速轉換音訊格式？

　　音樂，有人將它比作花朵，因為它鋪滿在人生的道路上，散發出不絕的芬芳，把生活裝飾得更美。音訊格式的批量轉換以及快速轉換都可以通過迅捷視訊轉換器來完成。從歷史風格的範疇而言，現代音樂特指20世紀中非傳統作曲技法，非功能和聲體系作為理論支撐的音樂作品。不同於傳統音樂體系與流行音樂體系這兩種純調性音樂體

iOS音視訊—FFmepg基礎知識：命令列工具使用&封裝格式&視訊編碼音訊編碼資料瞭解&視訊畫素音訊取樣資料格式

iOS音視訊相關目錄 FFmepg基礎知識封裝格式 1、封裝格式：mp4、mov、flv、wmv等等… 2、作用：視訊流+音訊流按照格式進行儲存在一個檔案中 3、MPEG2-TS格式：傳輸流，又稱TS、TP、MPEG-TS或M2T，用於音效、影象與資料的通訊協議。屬於

處理json資料格式各種轉換

JSON的全稱是”JavaScript Object Notation”，意思是JavaScript物件表示法,JSON是特別重要的輕量級的資料交換格式,比XML傳輸資料更加方便,它是基於Jav

提取視訊中的音訊怎麼將視訊轉換為ape格式

怎麼將視訊中的視訊的音訊提取出來？小編在網上看視訊的時候，經常會被視訊中的背景音樂給吸引，但是又找不到背景音樂的音樂名稱，所以就沒法搜尋到相應歌曲。直到今天，到今天，小編我終於找到一個不用知道音樂名稱，就能把視訊中背景音樂給下載下來的方法。有時候我們在做視訊編輯

怎麼將wav音訊中的一小段轉換為m4r格式

很多人手機都是使用預設鈴聲，在公共場合一個手機鈴聲響了，會有一群人檢視是不是自己的手機響了。小編比較喜歡與眾不同、追求個性化，所以手機鈴聲當然也要是獨一無二的！既然想要獨特的，那就自己製作！相信很多網友在聽到一首好聽的音樂的時候也會有想拿來製作鈴聲的衝動，而一般

如何轉換音訊資料格式1

一、聲道轉換

1、單聲道轉立體聲

2、立體聲轉單聲道

3、混合立體聲轉單聲道

二、位寬轉換

4、16位轉32位float

5、24位轉32位float

6、還原資料

三、重取樣

7、一個簡單的重取樣演算法

相關推薦