linux编译libmp3lame,使用libmp3lame库编码mp3
使用libmp3lame庫(kù)編碼mp3
LAME
lame是一個(gè)有名的開(kāi)源mp3編碼庫(kù),但是目前網(wǎng)上使用lame庫(kù)的教程基本都是直接貼一篇代碼,沒(méi)有任何的解釋,而每個(gè)使用者需要編碼的需求都不一樣,這些所謂的教程基本沒(méi)什么作用。
這篇文章將會(huì)介紹如何調(diào)用lame庫(kù)的接口編碼出mp3。不同于目前網(wǎng)上的大多數(shù)lame教程,本文不會(huì)干巴巴的貼一屏幕代碼,而是盡量對(duì)lame庫(kù)提供的各種參數(shù)設(shè)置的接口做講解。讓讀者能夠舉一反三,根據(jù)自己的需求編碼出各種格式的mp3。
lame庫(kù)編譯
lame對(duì)linux的編譯支持比較好,但是對(duì)于vc的支持基本停留在10年以前。所幸編碼庫(kù)的代碼只有幾個(gè)文件(下載的代碼還包括命令行程序代碼和gui程序代碼,我們?cè)诖酥恍枰幋a庫(kù)的代碼,在libmp3lame目錄中),自己新建個(gè)項(xiàng)目包含進(jìn)來(lái)編譯就行。
MP3
mp3(MPEG Layer III)這種格式在生活中很常見(jiàn),但是mp3有很多種參數(shù),這里討論一下mp3編碼所必須知道的一些參數(shù)。
采樣率(sampleRate):采樣率越高聲音的還原度越好。
比特率(bitrate):每秒鐘的數(shù)據(jù)量,越高音質(zhì)越好。
聲道數(shù)(channels):聲道的數(shù)量,通常只有單聲道和雙聲道,雙聲道即所謂的立體聲。
比特率控制模式:ABR、VBR、CBR,這3中模式含義很容易查詢(xún)到,不在贅述。
MPEG Layer III
MPEG有幾個(gè)版本的協(xié)議,不同版本的協(xié)議能夠支持的參數(shù)能力是不同的。編碼庫(kù)的使用者必須清楚不同版本的區(qū)別才能正確的設(shè)置參數(shù)。
有以下3個(gè)版本的協(xié)議,MPEG1、MPEG2、MPEG2.5。其中MPEG2.5是非官方的標(biāo)準(zhǔn),但是流傳廣泛,所以基本也都支持。他們的區(qū)別主要集中在支持的比特率和采樣率不同。
采樣率支持(Hz)
MPEG1
MPEG2
MPEG2.5
44100
22050
11025
48000
24000
12000
32000
16000
8000
比特率支持(bit/s)
MPEG1
MPEG2
MPEG2.5
32
8
8
40
16
16
48
24
24
56
32
32
64
40
40
80
48
48
96
56
56
112
64
64
128
80
160
96
192
112
224
128
256
144
320
160
編碼
流程
使用lame庫(kù)只需要包含lame.h頭文件,編碼mp3基本上遵循以下的流程,
初始化編碼參數(shù)
lame_init:初始化一個(gè)編碼參數(shù)的數(shù)據(jù)結(jié)構(gòu),給使用者用來(lái)設(shè)置參數(shù)。
設(shè)置編碼參數(shù)
lame_set_in_samplerate:設(shè)置被輸入編碼器的原始數(shù)據(jù)的采樣率。
lame_set_out_samplerate:設(shè)置最終mp3編碼輸出的聲音的采樣率,如果不設(shè)置則和輸入采樣率一樣。
lame_set_num_channels :設(shè)置被輸入編碼器的原始數(shù)據(jù)的聲道數(shù)。
lame_set_mode :設(shè)置最終mp3編碼輸出的聲道模式,如果不設(shè)置則和輸入聲道數(shù)一樣。參數(shù)是枚舉,STEREO代表雙聲道,MONO代表單聲道。
lame_set_VBR:設(shè)置比特率控制模式,默認(rèn)是CBR,但是通常我們都會(huì)設(shè)置VBR。參數(shù)是枚舉,vbr_off代表CBR,vbr_abr代表ABR(因?yàn)锳BR不常見(jiàn),所以本文不對(duì)ABR做講解)vbr_mtrh代表VBR。
lame_set_brate:設(shè)置CBR的比特率,只有在CBR模式下才生效。
lame_set_VBR_mean_bitrate_kbps:設(shè)置VBR的比特率,只有在VBR模式下才生效。
其中每個(gè)參數(shù)都有默認(rèn)的配置,如非必要可以不設(shè)置。這里只介紹了幾個(gè)關(guān)鍵的設(shè)置接口,還有其他的設(shè)置接口可以參考lame.h(lame的文檔里只有命令行程序的用法,沒(méi)有庫(kù)接口的用法)。
初始化編碼器器
lame_init_params:根據(jù)上面設(shè)置好的參數(shù)建立編碼器
編碼PCM數(shù)據(jù)
lame_encode_buffer或lame_encode_buffer_interleaved:將PCM數(shù)據(jù)送入編碼器,獲取編碼出的mp3數(shù)據(jù)。這些數(shù)據(jù)寫(xiě)入文件就是mp3文件。
其中l(wèi)ame_encode_buffer輸入的參數(shù)中是雙聲道的數(shù)據(jù)分別輸入的,lame_encode_buffer_interleaved輸入的參數(shù)中雙聲道數(shù)據(jù)是交錯(cuò)在一起輸入的。具體使用哪個(gè)需要看采集到的數(shù)據(jù)是哪種格式的,不過(guò)現(xiàn)在的設(shè)備采集到的數(shù)據(jù)大部分都是雙聲道數(shù)據(jù)是交錯(cuò)在一起。
單聲道輸入只能使用lame_encode_buffer,把單聲道數(shù)據(jù)當(dāng)成左聲道數(shù)據(jù)傳入,右聲道傳NULL即可。
調(diào)用這兩個(gè)函數(shù)時(shí)需要傳入一塊內(nèi)存來(lái)獲取編碼器出的數(shù)據(jù),這塊內(nèi)存的大小lame給出了一種建議的計(jì)算方式:采樣率/20+7200。
結(jié)束編碼
lame_encode_flush:結(jié)束編碼,獲取編碼出的結(jié)束數(shù)據(jù)。這部分?jǐn)?shù)據(jù)也需要寫(xiě)入mp3文件。
銷(xiāo)毀編碼器
lame_close銷(xiāo)毀編碼器,釋放資源。
參數(shù)的有效性
不規(guī)范的參數(shù)
對(duì)于編碼器的參數(shù)設(shè)置,所能接受的參數(shù)值并不是任意的。上一節(jié)的表格中列出了編碼器器能夠支持的參數(shù)值,如果我們?cè)O(shè)置的參數(shù)值不在其中,那么編碼器會(huì)自動(dòng)幫我們選擇一個(gè)最近的值。
不一致的版本
但是如果仔細(xì)看了上面表格中的參數(shù)后會(huì)發(fā)現(xiàn)一個(gè)問(wèn)題,每個(gè)版本支持的參數(shù)范圍不一致,假如設(shè)置了MPEG2的比特率又設(shè)置了MPEG1的采樣率那么會(huì)發(fā)生什么?
這里先給結(jié)論,lame庫(kù)會(huì)優(yōu)先服從采樣率(這里指的是輸出采樣率)設(shè)置,根據(jù)采樣率選擇協(xié)議版本,然后在這個(gè)版本所能支持的比特率中選一個(gè)和設(shè)置比特率最接近的。
這個(gè)結(jié)論是我研究了lame的源碼后分析得到的,lame的文檔中并沒(méi)有對(duì)此有任何描述,網(wǎng)上也沒(méi)有任何相關(guān)的資料描述這一問(wèn)題,接下來(lái)給出源碼分析,如果不關(guān)心的可以跳過(guò)這一節(jié)。
/*
* 0: MPEG-2 LSF
* 1: MPEG-1
* 2: MPEG-2.5 LSF FhG extention (1995-07-11 shn)
*/
typedef enum {
MPEG_2 = 0,
MPEG_1 = 1,
MPEG_25 = 2
} MPEG_t;
const int bitrate_table[3][16] = {
{0, 8, 16, 24, 32, 40, 48, 56, 64, 80, 96, 112, 128, 144, 160, -1}, /* MPEG 2 */
{0, 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256, 320, -1}, /* MPEG 1 */
{0, 8, 16, 24, 32, 40, 48, 56, 64, -1, -1, -1, -1, -1, -1, -1}, /* MPEG 2.5 */
};
const int samplerate_table[3][4] = {
{22050, 24000, 16000, -1}, /* MPEG 2 */
{44100, 48000, 32000, -1}, /* MPEG 1 */
{11025, 12000, 8000, -1}, /* MPEG 2.5 */
};
這是lame庫(kù)中的參數(shù)能力表,lame庫(kù)最終會(huì)從表中選擇和設(shè)置值最接近的值。
下面的代碼是在CBR模式下確定比特率的代碼
if (gfp->VBR == vbr_off && gfp->compression_ratio > 0) {
if (gfp->samplerate_out == 0)
gfp->samplerate_out = map2MP3Frequency((int) (0.97 * gfp->samplerate_in)); /* round up with a margin of 3% */
/* choose a bitrate for the output samplerate which achieves * specified compression ratio */
gfp->brate = gfp->samplerate_out * 16 * cfg->channels_out / (1.e3 * gfp->compression_ratio);
/* we need the version for the bitrate table look up */
cfg->samplerate_index = SmpFrqIndex(gfp->samplerate_out, &cfg->version);
if (!cfg->free_format) /* for non Free Format find the nearest allowed bitrate */
gfp->brate = FindNearestBitrate(gfp->brate, cfg->version, gfp->samplerate_out);
}
int
map2MP3Frequency(int freq)
{
if (freq <= 8000)
return 8000;
if (freq <= 11025)
return 11025;
if (freq <= 12000)
return 12000;
if (freq <= 16000)
return 16000;
if (freq <= 22050)
return 22050;
if (freq <= 24000)
return 24000;
if (freq <= 32000)
return 32000;
if (freq <= 44100)
return 44100;
return 48000;
}
int
BitrateIndex(int bRate, /* legal rates from 32 to 448 kbps */
int version, /* MPEG-1 or MPEG-2/2.5 LSF */
int samplerate)
{ /* convert bitrate in kbps to index */
int i;
if (samplerate < 16000)
version = 2;
for (i = 0; i <= 14; i++) {
if (bitrate_table[version][i] > 0) {
if (bitrate_table[version][i] == bRate) {
return i;
}
}
}
return -1;
}
/* convert samp freq in Hz to index */
int
SmpFrqIndex(int sample_freq, int *const version)
{
switch (sample_freq) {
case 44100:
*version = 1;
return 0;
case 48000:
*version = 1;
return 1;
case 32000:
*version = 1;
return 2;
case 22050:
*version = 0;
return 0;
case 24000:
*version = 0;
return 1;
case 16000:
*version = 0;
return 2;
case 11025:
*version = 0;
return 0;
case 12000:
*version = 0;
return 1;
case 8000:
*version = 0;
return 2;
default:
*version = 0;
return -1;
}
}
可以看到首先如果沒(méi)有設(shè)置輸出采樣率,調(diào)用map2MP3Frequency根據(jù)輸入采樣率算出輸出采樣率,默認(rèn)和輸入采樣率一致的。
然后根據(jù)輸出采樣率調(diào)用SmpFrqIndex計(jì)算出MPEG版本,這里注意將MPEG2和MPEG2.5都視為MPEG2。
根據(jù)已經(jīng)設(shè)置的比特率、輸出采樣率、版本調(diào)用FindNearestBitrate去尋找合適的比特率。FindNearestBitrate在相應(yīng)的版本的能力范圍中找一個(gè)最接近的值的索引。
接下來(lái)分析一下VBR情況下的處理
if (gfp->samplerate_out) {
if (gfp->samplerate_out < 16000) {
gfp->VBR_mean_bitrate_kbps = Max(gfp->VBR_mean_bitrate_kbps, 8);
gfp->VBR_mean_bitrate_kbps = Min(gfp->VBR_mean_bitrate_kbps, 64);
}
else if (gfp->samplerate_out < 32000) {
gfp->VBR_mean_bitrate_kbps = Max(gfp->VBR_mean_bitrate_kbps, 8);
gfp->VBR_mean_bitrate_kbps = Min(gfp->VBR_mean_bitrate_kbps, 160);
}
else {
gfp->VBR_mean_bitrate_kbps = Max(gfp->VBR_mean_bitrate_kbps, 32);
gfp->VBR_mean_bitrate_kbps = Min(gfp->VBR_mean_bitrate_kbps, 320);
}
}
可以看到這里沒(méi)有查表,直接是和采樣率對(duì)應(yīng)的版本允許的比特率的范圍比較。這是因?yàn)閂BR模式下比特率不固定,只要不超出范圍即可。
感想
我在使用lame庫(kù)的過(guò)程中發(fā)現(xiàn)資料很少,大部分博客也是不負(fù)責(zé)任的直接貼一篇代碼,所以我把自己使用lame庫(kù)種總結(jié)出的一些心得和體會(huì)在此分享出來(lái),希望能幫助其他使用lame庫(kù)的人。
總結(jié)
以上是生活随笔為你收集整理的linux编译libmp3lame,使用libmp3lame库编码mp3的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 中国天气预报网城市对应代码
- 下一篇: Linux系统下Lame环境的搭建