speex演算法在android上的移植

阿新 • • 發佈：2019-01-27

l最近在調speex介面引數，將speex演算法的一些特性給新增進去，比如：降噪，靜音檢測，白噪聲新增，增益等等。下面我們就先簡單介紹一些spexx算

法。speex語音演算法主要是針對VOIP應用的一個開源演算法，他集合了多種功能，除了如上所述的，還增加了回聲消除（ACE）等功能，能夠在多種平臺

進行應用。下面我主要介紹一下speex在android平臺上的應用。

首先我們來介紹一下speex演算法的模組劃分。在介紹之前，我們最好去speex官網 http://www.speex.org/downloads/ 去下載他的相關文件以及原始碼。其

中有一個包speex-api-reference.tar.gz 就有speex模組的相關介紹。其API介紹在1.2為止，speex總共分為以下9大模組：

--Speex encoder and decoder。——編碼和解碼模組。

--SpeexBits:Bit-stream mainpulations。——位元流操作模組，也就是資料的讀寫模組。

--Various definitions for Speex callbacks supported by the decoder。——解碼回撥模組。

--SpeexEchoState:Acoustic echo caceller。——回聲消除模組。

--SpeexHeader:Makes it easy to writ/parse an Ogg/Speex header。——ogg格式相關的處理模組。

--JitterBuffer:Adaptive jitter buffer。——語音抖動緩衝模組。

--SpeexJitter:Adaptive jitter buffer specifically for Speex。——針對speex演算法特點優化的語言抖動處理模組。

--SpeexPreprocessState:The Speex preprocessor。——Speex其他相關特點的處理模組，如：降噪，靜音檢測等。

--SpeexStereoState:Handing Speex stereo files。——立體聲處理的相關模組。

.以上就是Speex演算法的主要模組，每個模組都有相關功能的函式介面，具體我們可以去檢視其api的相關介紹。

好了現在我們來介紹其在android平臺的使用。由於其使用的是C實現的，所以要想在android進行呼叫其相關方法就必須通過JNI的方法進行呼叫，所以

我們首先就必須獲得speex演算法的一個.so檔案，因此我們先使用cygwin編譯獲取.so檔案。

一、將speex相關原始碼複製進專案

下載speex原始碼，在專案中新建資料夾，命名為jni。將speex原始碼下的include，libspeex兩個檔案的原始碼複製進jni資料夾中。將include資料夾下的

speex_config_types.h.in檔案改為speex_config_types.h檔案，並且將其中的內容改為以下內容：

#ifndef _SPEEX_CONFIG_TYPES_H
#define _SPEEX_CONFIG_TYPES_H

   typedef signed short spx_int16_t;
   typedef unsigned short spx_uint16_t;
   typedef signed int spx_int32_t;
   typedef unsigned int spx_uint32_t;

#endif  /* _SPEEX_CONFIG_TYPES_H */

二、編寫Android.mk以及Application.mk相關檔案。

Android.mk檔案內容如下：

LOCAL_PATH := $(call my-dir)

include $(CLEAR_VARS)

LOCAL_MODULE    := libspeex
LOCAL_CFLAGS = -DFIXED_POINT -DUSE_KISS_FFT -DEXPORT="" -UHAVE_CONFIG_H
LOCAL_C_INCLUDES := $(LOCAL_PATH)/include

LOCAL_SRC_FILES := speex_jni.cpp \
				./libspeex/bits.c \
				./libspeex/buffer.c \
				./libspeex/cb_search.c \
				./libspeex/exc_10_16_table.c \
				./libspeex/exc_10_32_table.c \
				./libspeex/exc_20_32_table.c \
				./libspeex/exc_5_256_table.c \
				./libspeex/exc_5_64_table.c \
				./libspeex/exc_8_128_table.c \
				./libspeex/fftwrap.c \
				./libspeex/filterbank.c \
				./libspeex/filters.c \
				./libspeex/gain_table.c \
				./libspeex/gain_table_lbr.c \
				./libspeex/hexc_10_32_table.c \
				./libspeex/hexc_table.c \
				./libspeex/high_lsp_tables.c \
				./libspeex/jitter.c \
				./libspeex/kiss_fft.c \
				./libspeex/kiss_fftr.c \
				./libspeex/lpc.c \
				./libspeex/lsp.c \
				./libspeex/lsp_tables_nb.c \
				./libspeex/ltp.c \
				./libspeex/mdf.c \
				./libspeex/modes.c \
				./libspeex/modes_wb.c \
				./libspeex/nb_celp.c \
				./libspeex/preprocess.c \
				./libspeex/quant_lsp.c \
				./libspeex/resample.c \
				./libspeex/sb_celp.c \
				./libspeex/scal.c \
				./libspeex/smallft.c \
				./libspeex/speex.c \
				./libspeex/speex_callbacks.c \
				./libspeex/speex_header.c \
				./libspeex/stereo.c \
				./libspeex/vbr.c \
				./libspeex/vq.c \
				./libspeex/window.c

include $(BUILD_SHARED_LIBRARY)

具體每行的含義可以參看我之前的一篇部落格，或者自行搜尋Android.mk的編寫方法。

Applicatio.mk 內容如下：

APP_ABI := armeabi armeabi-v7a

三、編寫本地方法介面檔案speex

	public native int open(int compression);
	public native int getFrameSize();
	public native int decode(byte encoded[], short lin[], int size);
	public native int encode(short lin[], int offset, byte encoded[], int size);
	public native void close();

四、使用java當中的javah工具編譯這個jni介面檔案。

使用cmd進入到專案bin/classes目錄下，輸入以下命令：javah -jni xxx.xxx.xxx.speex。前面的xxx為speex檔案的包名。編譯完成後會在classes檔案下看到

一個com_poctalk_codec_Speex.h檔案，將這個檔案複製進jni目錄下。

五、編寫speex.cpp檔案

#include <jni.h>
#include "com_poctalk_codec_Speex.h"
#include <string.h>
#include <unistd.h>
#include <speex/speex.h>
#include <speex/speex_preprocess.h>
#include <speex/speex_echo.h>
#pragma comment(lib,"libspeexdsp.lib")

static int codec_open = 0;
static int dec_frame_size;
static int enc_frame_size;

static SpeexBits ebits, dbits;
void *enc_state;
void *dec_state;
SpeexPreprocessState *preprocess_state;
//SpeexEchoState *echo_state;
static JavaVM *gJavaVM;

extern "C"{
	 JNIEXPORT jint JNICALL Java_com_poctalk_codec_Speex_open(JNIEnv *env, jobject obj, jint compression) {
		int tmp;

		if (codec_open++ != 0)
			return (jint)0;

		speex_bits_init(&ebits);
		speex_bits_init(&dbits);
		//設定編碼為窄帶編碼
		enc_state = speex_encoder_init(&speex_nb_mode);
		dec_state = speex_decoder_init(&speex_nb_mode);
		//設定編碼為寬頻編碼
		//enc_state = speex_encoder_init(&speex_wb_mode);
		//dec_state = speex_decoder_init(&speex_wb_mode);
		tmp = compression;
		speex_encoder_ctl(enc_state, SPEEX_SET_QUALITY, &tmp);//設定編碼的位元率，即語音質量。由引數tmp控制
		speex_encoder_ctl(enc_state, SPEEX_GET_FRAME_SIZE, &enc_frame_size);
		speex_decoder_ctl(dec_state, SPEEX_GET_FRAME_SIZE, &dec_frame_size);

		preprocess_state =speex_preprocess_state_init(160, 8000);//建立預處理物件

		//echo_state = speex_echo_state_init(160, 5000);//建立回聲消除物件
		//int sampleRate = 8000;
		//speex_echo_ctl(echo_state, SPEEX_ECHO_SET_SAMPLING_RATE, &sampleRate);

		int denoise = 1;
		int noiseSuppress = -25;
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_DENOISE, &denoise); //降噪
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_NOISE_SUPPRESS, &noiseSuppress); //設定噪聲的dB


		int agc = 1;
		float q=24000;
		//actually default is 8000(0,32768),here make it louder for voice is not loudy enough by default. 8000
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_AGC, &agc);//增益
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_AGC_LEVEL,&q);

		int vad = 1;
		int vadProbStart = 80;
		int vadProbContinue = 65;
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_VAD, &vad); //靜音檢測
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_PROB_START , &vadProbStart); //Set probability required for the VAD to go from silence to voice
		speex_preprocess_ctl(preprocess_state, SPEEX_PREPROCESS_SET_PROB_CONTINUE, &vadProbContinue); //Set probability required for the VAD to stay in the voice state (integer percent)

		return (jint)0;
	 }
	
	 JNIEXPORT jint JNICALL Java_com_poctalk_codec_Speex_encode
		(JNIEnv *env, jobject obj, jshortArray lin, jint offset, jbyteArray encoded, jint size) {

		jshort buffer[enc_frame_size];
		jbyte output_buffer[enc_frame_size];
		int nsamples = (size-1)/enc_frame_size + 1;
		int i, tot_bytes = 0;

		if (!codec_open)
			return 0;

		speex_bits_reset(&ebits);//在每幀輸入之前將所有的編碼狀態重置

		speex_echo_state_reset(echo_state);//

		for (i = 0; i < nsamples; i++) {
			env->GetShortArrayRegion(lin, offset + i*enc_frame_size, enc_frame_size, buffer);

			//input_frame麥克風採集到的資料,Echo_Data是從speaker處獲取到的資料，out_frame為回聲消除後的資料
			//speex_echo_cancellation(echo_state,input_frame,Echo_Data,out_frame);//回聲消除

			speex_preprocess_run(preprocess_state, buffer);
			speex_encode_int(enc_state, buffer, &ebits);
		}

		tot_bytes = speex_bits_write(&ebits, (char *)output_buffer,enc_frame_size);//返回實際被寫入的位元組數
		env->SetByteArrayRegion(encoded, 0, tot_bytes,output_buffer);

		return (jint)tot_bytes;
	 }

	 JNIEXPORT jint JNICALL Java_com_poctalk_codec_Speex_decode
		(JNIEnv *env, jobject obj, jbyteArray encoded, jshortArray lin, jint size) {

			jbyte buffer[dec_frame_size];
			jshort output_buffer[dec_frame_size];
			jsize encoded_length = size;

		if (!codec_open)
			return 0;

		env->GetByteArrayRegion(encoded, 0, encoded_length, buffer);
		speex_bits_read_from(&dbits, (char *)buffer, encoded_length);
		speex_decode_int(dec_state, &dbits, output_buffer);
		env->SetShortArrayRegion(lin, 0, dec_frame_size,
					 output_buffer);

		return (jint)dec_frame_size;
	 }

	 JNIEXPORT jint JNICALL Java_com_poctalk_codec_Speex_getFrameSize(JNIEnv *env, jobject obj) {

		if (!codec_open)
			return 0;
		return (jint)enc_frame_size;
	 }

	 JNIEXPORT void JNICALL Java_com_poctalk_codec_Speex_close(JNIEnv *env, jobject obj) {

		if (--codec_open != 0){
			return;
		}
		//speex_echo_state_destroy(echo_state);//

		speex_preprocess_state_destroy(preprocess_state);
		speex_bits_destroy(&ebits);
		speex_bits_destroy(&dbits);

		speex_decoder_destroy(dec_state);
		speex_encoder_destroy(enc_state);
	 }
}

六、使用cygwin對整個專案進行編譯。

編譯完成後，refresh專案會在libs目錄下生成兩個資料夾armeabi，armeabi-v7a 其中分別有一個libspeex.so檔案。

至此.so檔案的編譯已經完成了，我們就可以在專案中對本地方法進行呼叫，去進行語音的編解碼。由於使用方面我已經在專案中進行應用了，所以就不

掛出來了，不過我的語言模組也是參考網上的一個專案進行編寫的，名字叫做android-recorder-6.0，你可以下載他的原始碼進行模仿。不過還有一點需要

說明的是在編寫.cpp檔案時，我沒有將回聲消除的功能給加進去，在回聲消除的這個問題上浪費了我很多時間，剛開始沒有看他的api，不知道回聲消除

是哪個模組實現的，不知道該怎樣使用回聲消除的api，後來看了api，又不知道怎樣在呼叫回聲消除的函式時，該怎樣傳遞引數進去，後來問同事知道，

回聲消除的功能是針對全雙工的通訊方式，也就是喇叭和錄音模組都開啟，如果是半雙工的通訊方式，比如：手持機，回聲消除的功能其實可有可無。

但是既然提到了又浪費了很多時間，那就不妨講一講回聲消除功能的呼叫。

首先我們在預處理時，就應該回聲消除的預處理：

		//echo_state = speex_echo_state_init(160, 5000);//建立回聲消除物件
		//int sampleRate = 8000;
		//speex_echo_ctl(echo_state, SPEEX_ECHO_SET_SAMPLING_RATE, &sampleRate);

sampleRate就是我們設定好的錄音採用頻率。

然後在語音編碼的時候，進行回聲消除功能的呼叫：

			//input_frame麥克風採集到的資料,Echo_Data是從speaker處獲取到的資料，out_frame為回聲消除後的資料
			//speex_echo_cancellation(echo_state,input_frame,Echo_Data,out_frame);//回聲消除

上面speex_echo_cancellation函式的三個引數一次為，回聲消除物件，inpt_frame為喇叭播放資料，Echo_Data為從麥克風獲取的資料，out_frame為最後

回聲消除後的資料。可能有人會對這幾個引數比較迷惑，那是因為不瞭解回聲的產生原因。由於是全雙工通訊，當我們在錄音的時候，也可能在進行聲音

播放，這樣就會導致有時候錄音也會將喇叭正在播放的聲音給錄進去，這樣就產生了回聲的效果，所以第二個引數才要將播放的資料作為引數傳遞進去。

在編譯.so檔案的過程中，我還遇到了這樣一個問題：multiple definition 。後來才發現在我的android.mk檔案中將speex_jni.cpp引用了兩次。

參考部落格：

speex 在android上降噪與迴音消除使用

音訊的錄製，播放傳輸，勢必離不開音訊的降噪和迴音消除，特別是在語音的雙向對講過程中，迴音消除是必須跨越的門檻，總結在jni程式碼中，程式碼實現如下，具體除錯流程，引數設定則只能說多次測試的結果。配合speex原始碼編譯成so後即可使用。#include <

speex演算法在android上的移植

l最近在調speex介面引數，將speex演算法的一些特性給新增進去，比如：降噪，靜音檢測，白噪聲新增，增益等等。下面我們就先簡單介紹一些spexx算法。speex語音演算法主要是針對VOIP應用的一個開源演算法，他集合了多種功能，除了如上所述的，還增加了回聲消除（ACE

hikey970學習-012 hikey970上移植影象去雨深度神經網路演算法

摘要：本文在hikey970嵌入式裝置上執行影象去雨深度神經網路演算法，驗證hikey970執行神經網路模型的效能與效果。一、影象去雨簡介影象去雨處理指的是對於一張雨中的圖片，去除畫面中的雨滴，得到還原後的圖片，與圖片去霧、超解析度等同屬CV領域中影

android上的快取、快取演算法和快取框架

Least Frequently Used（LFU）對每個快取物件計算他們被使用的頻率。把最不常用的快取物件換走。 Least Recently User（LRU）把最近最少使用的快取物件給換走。總是需要去了解在什麼時候，用了哪個快取物件。如果有人想要了解為什麼總能把最近最少使用的物件踢掉，是非常困難的。

【Tensorflow】Tensorflow移植Android上的過程和坑

文章目錄我的環境後話寫一段我將tensorflow移植到Android上的歷程，希望後者能夠避免我的坑，能更多的發展這個東西。過程中參考了其他一些部落格，外加自己的修改，填坑，由於可能比較長，剩下的之後再

Android上用speex做迴音消除

1. 問題我們在做語音實時對講的時候往往會碰到一個瓶頸，這個瓶頸就是在不戴耳機的情況下會有很大的迴音，本文就討論如何解決。 2.解決方式：（1）其實有做了同一時間只有一端能夠說或者聽，類似於對講機，這種雖然是實時的，但是體驗不好，還不如微信；（

Android系統移植(一)-讓android系統在目標平臺上執行起來【轉】

Android系統由於用的是linux核心，因此核心移植和嵌入式linux核心移植差異不大，過程如下： (1)移植boot-loader和linux2.6核心到目標平臺上，讓linux核心可以啟動起來，基本的驅動允許正常。此過程完全是嵌入式linux的開發，這裡直接跳過。

FFmpeg在Android上的移植優化步驟

從事多媒體軟體開發的人幾乎沒有不知道FFmpeg的，很多視訊播放器都是基於FFmpeg開發的。如今最火的智慧手機作業系統Android上的很多第三方視訊播放器也是基於FFmpeg實現全格式支援。由於Android通常跑在ARM處理器上，而且Android使用了自己的l

Android上Sensor移植的總結

Sensor作為Android系統的一個輸入裝置，對Android裝置來說是必不可少的。Sensor主要報告G-Sensor、LightsSensor、ProximitySensor、TemperatureSensor等。由於各個Sensor的移植大同小異。本文就主要對G-Sensor和LightS

轉: Android上ffmpeg移植（4）-終結篇

今天終於在模擬器上面可以看到視訊了，雖然隨機性會有一些問題，但總體來說，效果還可以測試了avi和flv檔案，播放的都比較好，因為是模擬器，我設定的輸出格式是RGB565，這樣看起來可能色彩不是很好。上層的呼叫完全是標準的java介面，應用程式是參考一本資料書上面的，程式碼如下

用Anko和Kotlin實現Android上的對話框和警告提示（KAD 24）

posit eve linear 免費 clas testing size uil 如何作者：Antonio Leiva 時間：Mar 9, 2017 原文鏈接：https://antonioleiva.com/dialogs-android-anko-kotlin/

Cocos2d-x v3.0正式版嘗鮮體驗【2】 Android平臺移植

生成 ble ack nts 做的導入 eclipse so文件腳本今天沒事又嘗試了下3.0正式版關於Android平臺的移植，把新建的項目移植了下。過程僅用了十分鐘左右，什麽概念？！好吧，事實上我想說，這個版本號真的移植非常輕松啊，只是還沒加上其它東西，只是就眼

JavaFX打包到Android上

nts 資源興趣項目之前重要 nbsp XML fcm 讓JavaFX執行到移動平臺一直是社區努力完畢的事。當然，眼下已經能夠讓JavaFX執行到Android和IOS平臺了，以下我們來看看怎樣打包自己的JavaFX項目到Android平臺。首

android BSP與硬件相關子系統讀書筆記（1）android BSP移植綜述

tin 不用 googl csdn splay 編寫 app開發意圖過濾器 trac 從linux驅動轉行至Android驅動開發大半年了，一開始就產生了一個很糾結目標和問題，就是不停的google如何porting android！這個問題得到的結果對於初出茅廬的我，感

android 上AES解密是報錯javax.crypto.BadPaddingException: pad block corrupted

corrupted init block dom see roi and sha1 pad 網上看到兩種方法： 1.SecretKeySpec skeySpec = new SecretKeySpec(getRawKey(key), "AES"); private s

在Android上使用酷狗歌詞API

ets 部分 tiff bject class clas down origin exception 參考自http://blog.csdn.net/u010752082/article/details/50810190 代碼先貼出來： 1 public void se

android上使用藍牙設備進行語音輸入

view return 對話 nvi pat 顯示 you esc 註意主要實現步驟如下：1.確保已經和藍牙耳機配對連接上。2.開啟藍牙信道AudioManager mAudioManager = (AudioManager)getSystemService(Contex

【轉】stm32CubeMx上移植自己的printf()和scanf()函數

smi config 用戶 type 連接器標準庫 can 修改 esp 要想printf()和scanf() 函數工作，我們需要把printf()和scanf() 重新定向到串口中。重定向是指用戶可以自己重寫C 的庫函數，當連接器檢查到用戶編寫了與C 庫函數相同名字的函

在win和android上同時進行OpenCV程序設計

line abi path width esp rgb888 轉換最終 his 基於qt進行Android圖像處理項目設計的時候，初期可以首先在windows上進行調試，等到比較成熟後將代碼轉換到adnroid上。這裏僅以widget為例，如果使用qtquick是一樣的。

Android上傳圖片之調用系統拍照和從相冊選擇圖片

item 取圖空指針 ctu setimage tro edate eas tostring Android上傳圖片之調用系統拍照和從相冊選擇圖片本篇文章已授權

speex演算法在android上的移植

一、將speex相關原始碼複製進專案

二、編寫Android.mk以及Application.mk相關檔案。

三、編寫本地方法介面檔案speex

四、使用java當中的javah工具編譯這個jni介面檔案。

五、編寫speex.cpp檔案

六、使用cygwin對整個專案進行編譯。

相關推薦