Windows下wave API 音訊採集

阿新 • • 發佈：2019-01-02

目的：Windows下wave API採集PCM

環境：

系統：Win10
環境：VS2015 64bit

操作步驟：

1. 匯入系統wave標頭檔案及庫

#include <mmsystem.h>   
#pragma comment(lib, "winmm.lib")

2. 獲取音訊裝置資訊 - 確認是否有音訊輸入裝置

1. UINT WINAPI waveInGetNumDevs(void); //返回音訊輸入裝置的數量

2. MMRESULT WINAPI waveInGetDevCaps(   //獲取輸入裝置資訊
    _In_ UINT_PTR uDeviceID,
    _Out_writes_bytes_(cbwic) LPWAVEINCAPSW pwic,
    _In_ UINT cbwic
    );

3. 
 示例：
    int iAudioDev = waveInGetNumDevs();    //獲取裝置數量
    printf("[Capture] input device Num:[%d]\n", iAudioDev);

    for (int i = 0; i < iAudioDev; i++)    //迴圈列印裝置的資訊
    {
        WAVEINCAPS wic;
        waveInGetDevCaps(i, &wic, sizeof(WAVEINCAPS));   //注意，i即為DeviceID
        printf("[Capture] DeviceNum:[%d], DevicePID:[%d], DeviceName：%s\n" 
, i, wic.wPid, wic.szPname);
    }

ps: 實際測試筆記本可以獲取到兩個音訊輸入裝置，DeviceID分別為0和1。當在waveInOpen()開啟0的時候是系統聲音+麥克風採集;當在waveInOpen()開啟1的時候是麥克風採集，沒有系統音。

3. 開啟音訊裝置

1. typedef struct tWAVEFORMATEX    //音訊資訊結構體
{
    WORD wFormatTag; /* format type */
    WORD nChannels; /* number of channels (i.e. mono, stereo...) */
    DWORD nSamplesPerSec; /* sample rate */ 

    DWORD nAvgBytesPerSec; /* for buffer estimation */
    WORD nBlockAlign; /* block size of data */
    WORD wBitsPerSample; /* number of bits per sample of mono data */
    WORD cbSize; /* the count in bytes of the size of */
    /* extra information (after cbSize) */
} WAVEFORMATEX, *PWAVEFORMATEX, NEAR *NPWAVEFORMATEX, FAR *LPWAVEFORMATEX;

2. WINMMAPI MMRESULT WINAPI waveInOpen(  //開啟音訊裝置
    _Out_opt_ LPHWAVEIN phwi,
    _In_ UINT uDeviceID,
    _In_ LPCWAVEFORMATEX pwfx,
    _In_opt_ DWORD_PTR dwCallback,
    _In_opt_ DWORD_PTR dwInstance,
    _In_ DWORD fdwOpen
    );

3. 示例：
    HWAVEIN hWave;
    WAVEFORMATEX waveForm;   
    memset(&waveForm, 0, sizeof(WAVEFORMATEX));
    waveForm.wFormatTag = WAVE_FORMAT_PCM;   
    waveForm.nChannels = 1;     
    waveForm.nSamplesPerSec = 8000;   
    waveForm.nAvgBytesPerSec = waveForm.nChannels*waveForm.nSamplesPerSec*waveForm.wBitsPerSample / 8;
    waveForm.nBlockAlign = 4;
    waveForm.wBitsPerSample = 16;   
    waveForm.cbSize = 0;

    waveInOpen(&hWave, WAVE_MAPPER, &waveForm, (DWORD_PTR)waveCaptureProc, 0, CALLBACK_FUNCTION);   //waveInProc音訊採集回掉，在設定的回掉函式中獲取音訊資料，DeviceID可以預設設定為WAVE_MAPPER，自動選擇採集(系統音+麥克風，類似於 0), DeviceID設定為非0值，即是對應的麥克風聲音。

//回撥函式   
void CALLBACK waveCaptureProc(HWAVEIN hwi,
    UINT uMsg,
    DWORD_PTR dwInstance,
    DWORD_PTR dwParam1,
    DWORD_PTR dwParam2)
{
    LPWAVEHDR waveH = (LPWAVEHDR)dwParam1;  
    if ((WIM_DATA == uMsg))
    {
        fwrite(waveH->lpData, 1, waveH->dwBytesRecorded, fpInPCM);   //寫出資料
        printf("Capture:[%d]\n", waveH->dwBytesRecorded);
        waveInAddBuffer(hwi, waveH, sizeof(WAVEHDR));              //buffer重新放入採集佇列
    }
}

ps：回掉或者主執行緒可以做策略來實現錄音的停止控制

4. 裝置音訊緩衝區，並開始錄音

1. 填充WAVEHDR結構體。
2. WINMMAPI MMRESULT WINAPI waveInPrepareHeader( // 準備緩衝區
    _In_ HWAVEIN hwi,
    _Inout_updates_bytes_(cbwh) LPWAVEHDR pwh,
    _In_ UINT cbwh
    );
3. WINMMAPI MMRESULT WINAPI waveInAddBuffer( //新增buffer到音訊採集
    _In_ HWAVEIN hwi,
    _Inout_updates_bytes_(cbwh) LPWAVEHDR pwh,
    _In_ UINT cbwh
    );
4. WINMMAPI MMRESULT WINAPI waveInStart(_In_ HWAVEIN hwi);//開始錄音

示例：
#define FRAGMENT_SIZE 1024        // 設定快取區大小  
#define FRAGMENT_NUM 4            // 設定快取區個數  
static WAVEHDR waveHDR[FRAGMENT_NUM];  
for (int i = 0; i<FRAGMENT_NUM; i++)
{
    waveHDR[i].lpData = new char[FRAGMENT_SIZE];
    waveHDR[i].dwBufferLength = FRAGMENT_SIZE;
    waveHDR[i].dwBytesRecorded = 0;
    waveHDR[i].dwUser = NULL;
    waveHDR[i].dwFlags = 0;
    waveHDR[i].dwLoops = 1;
    waveHDR[i].lpNext = NULL;
    waveHDR[i].reserved = 0;

    waveInPrepareHeader(hWave, &waveHDR[i], sizeof(WAVEHDR));
    waveInAddBuffer(hWave, &waveHDR[i], sizeof(WAVEHDR));
}

waveInStart(hWave);

5. 錄音結束關閉

1. WINMMAPI MMRESULT WINAPI waveInStop(_In_ HWAVEIN hwi);
2. WINMMAPI MMRESULT WINAPI waveInReset(_In_ HWAVEIN hwi);
3. 釋放新增的緩衝區
4. WINMMAPI MMRESULT WINAPI waveInClose(_In_ HWAVEIN hwi);

示例：
waveInStop(hWave);
waveInReset(hWave);

for (int i = 0; i < FRAGMENT_NUM; i++)
{
    waveInUnprepareHeader(hWave, &waveHDR[i], sizeof(WAVEHDR));
    delete waveHDR[i].lpData;
    delete waveHDR[i].lpData = NULL;
}

waveInClose(hWave);

Windows下wave API 音訊採集

目的：Windows下wave API採集PCM 環境：系統：Win10 環境：VS2015 64bit 操作步驟： 1. 匯入系統wave標頭檔案及庫 #include <mmsystem.h> #pragma com

windows下簡單的音訊採集示例

最近需要在window下進行音訊採集,網上找了很久都沒找到win7下如何採集pcm資料的完整示例,經過一翻折騰後寫了一個很簡單的demo程式以供同行進行參考,如有不正確的地方請指正本例是採用audio core進行音訊採集程式碼塊 #include "

windows下ffmpeg音視訊採集並推流【較亂，懶的整理了】

【大多為蒐集的文章，都歸類為，轉載。所以沒有標明，來處。】 1.windows下ffmpeg的編譯：如：./configure --disable-yasm --enable-static --enable-indev=dshow 如果裝了yasm，x2

< python音訊庫：Windows下pydub安裝配置、過程出現的問題及常用API >

< python音訊庫：Windows下pydub安裝配置、過程出現的問題及常用API > 背景剛從B站上看過倒放挑戰之後也想體驗下，心血來潮一個晚上完成了基本的實現。其中倒放與播放部分使用了pydub這個音訊庫，十分快捷方便，但是它完整一套的配置讓我還是踩了幾個坑。特將其配置過程記錄於此，方

Windows下Libvirt Java API使用教程(三)

突兀的出來一個libvirt的教程三，您可能會覺得奇怪，其實這是OneCoder以前寫的一個小系列教程，原來發在51cto的部落格上，前兩篇已經發了過來，考慮到完整性，就把第三篇也發過來。前兩篇地址：之前已經介紹過了libvirt api

Windows下Libvirt Java API使用教程(二)

libvirt的管理單位是單個主機，所以探測和監控介面所能獲取的資訊的最大範圍也是主機。所以先從主機入手，驗證libvirt介面。主機（libvirt所在管理節點）探測相關介面驗證程式碼如下： @Before public void

Windows下Libvirt Java API使用教程

Libvirt是一個優秀的虛擬化環境管理的工具包。核心用c實現，不過提供了不同語言的呼叫API。官網的簡介如下： libvirt is: A toolkit to interact with the virtualizat

windows下實現Linux下的dirent.h API介面

將https://github.com/tronkko/dirent，下的include的dirent.h拷貝到當前工程的目錄下。在這個工程中，將directory字串轉換為寬位元組的時候，如果目錄是漢字的時候會出現問題。解決方法： #include <locale.h>

Windows下安裝TensorFlow Object Detection API，訓練自己的資料集

Object Detection API 環境搭建 1、首先安裝配置好TensorFlow，參考地址 3、通過pip安裝：pillow, jupyter, matplotlib, lxml，如下： pip install pillow 4、編

windows下使用MFC對六維力感測器資料採集與繪製

本文主要通過mfc建立一個對話方塊，新建個子執行緒讀取感測器資料，在主執行緒中新增定時器和chartctrl控制元件進行動態曲線的繪製。執行效果與感測器自帶軟體效果如下： 1 使用控制檯程式新建感測器介面的配置和資料的讀寫如下：將OMD庫放入根目錄下程式碼如下： // ss

手機直播系統偶爾會需要到的：Windows 下視訊採集技術

Windows下視訊採集的方法在 Windows 下主要有兩種方法來採集視訊: 一種是通過 Media Foundation，另一種是通過 DirectShow。 Meida Foundation 是 Windows 從 vista 之後推出的一套全新的多媒體SDK，簡

Python+Opencv+Qt4編寫Windows下攝像頭影象採集顯示程式

# -*- coding: utf-8 -*- # Form implementation generated from reading ui file '1.ui' # # Created: Tue Nov 14 09:45:29 2017 # by: Py

Windows遠端桌面實現之六（新版本框架更新，以及網頁HTML5音訊採集通訊）

by fanxiushu 2018-08-21 轉載或引用請註明原始作者。到

Windows下Core Audio APIS 音訊應用開發（五）

之前做開發是一直有個疑問（博主qq，1204802552，歡迎交流）按照Core Audio上面的文件，音訊裝置本身會有個裝置週期，這個週期決定了音訊裝置所能快取的最大資料量；而另外一方面，我們在初始化Core Audio 音訊管理物件的時候，也可以設定

WebRTC：如何從WebRTC中提取出音訊QoS程式碼(Windows下並編譯成dll庫檔案)

WebRTC版本：M66 WebRTC的語音QoS機制幾乎可以說是行業的標杆，其實現的方式主要融入了三種技術，包括丟包重傳(NACK)，前向糾錯(FEC)以及原GIPS公司的網路均衡器(NetEqualizer，簡稱NetEQ)。前兩種都是在犧牲一定成本的

Windows上的音訊採集技術

前一段時間接到一個任務，需要採集到音效卡的輸出訊號，以便與麥克風的輸入訊號進行混音。之前一直沒有研究過音訊的相關技術，這次就順便抽出一點時間去了解了一下Windows上採集音訊的相關技術。對於音訊處理的技術，主要有如下幾種：採集麥克風輸入採集音效卡輸出將音訊資料送入音效卡進行播放對多路音

Windows下配置啟動面安裝版本mysql

mysql一，下載Zip版本的免安裝版本的Mysql，並解壓之安裝目錄下面二，在Windows的Path中添加Mysql的Bin目錄，使得可訪問mysql等命令。*遇到奇怪問題，在win10的path加入了mysql運行記錄。但是執行mysql依然未找到。此時mysql的bin目錄為path中的最後一項。後來

windows下mysql 5.7的配置全過程

希望圖片 all str success ans bst alt database 這是一套在好多次的安裝下總結出來的經驗，包括很多種遇到的問題，查過很多資料，特此總結一下。一、從官網下載MySQL的zip(免安裝的) 解壓mysql-5.7.11-winx64.zip

在Windows下編譯Lua

play pre functions aries programs mem lba other pil http://blog.csdn.net/yue7603835/article/details/41739085 http://blog.csdn.net/birdfl

windows 下隱藏 system 函數彈窗

hwnd log main hat wchar lose byte ces sys 概述下面的程序是解決windows 下面調用 system() 函數的時候，會有窗口彈出的問題頭文件 #include <windows.h> 源碼 /** * @br

Windows下wave API 音訊採集

目的：Windows下wave API採集PCM

環境：

操作步驟：

1. 匯入系統wave標頭檔案及庫

2. 獲取音訊裝置資訊 - 確認是否有音訊輸入裝置

3. 開啟音訊裝置

4. 裝置音訊緩衝區，並開始錄音

5. 錄音結束關閉

相關推薦