當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

使用MediaCodeC将图片集编码为视频

發(fā)布時間：2025/3/20 编程问答 32 豆豆

生活随笔收集整理的這篇文章主要介紹了使用MediaCodeC将图片集编码为视频小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

原文地址 原創(chuàng)文章，轉(zhuǎn)載請聯(lián)系作者

綠生鶯啼春正濃，釵頭青杏小，綠成叢。玉船風(fēng)動酒鱗紅。歌聲咽，相見幾時重？

提要

這是MediaCodeC系列的第三章，主題是如何使用MediaCodeC將圖片集編碼為視頻文件。在Android多媒體的處理上，MediaCodeC是一套非常有用的API。此次實驗中，所使用的圖片集正是MediaCodeC硬解碼視頻，并將視頻幀存儲為圖片文件文章中，對視頻解碼出來的圖片文件集，總共332張圖片幀。
若是對MediaCodeC視頻解碼感興趣的話，也可以瀏覽之前的文章：MediaCodeC解碼視頻指定幀，迅捷、精確

核心流程

MediaCodeC的常規(guī)工作流程是：拿到可用輸入隊列，填充數(shù)據(jù)；拿到可用輸出隊列，取出數(shù)據(jù)，如此往復(fù)直至結(jié)束。在一般情況下，填充和取出兩個動作并不是即時的，也就是說并不是壓入一幀數(shù)據(jù)，就能拿出一幀數(shù)據(jù)。當(dāng)然，除了編碼的視頻每一幀都是關(guān)鍵幀的情況下。
一般情況下，輸入和輸出都使用buffer的代碼寫法如下：

for (;;) {//拿到可用InputBuffer的idint inputBufferId = codec.dequeueInputBuffer(timeoutUs);if (inputBufferId >= 0) {ByteBuffer inputBuffer = codec.getInputBuffer(…);// inputBuffer 填充數(shù)據(jù)codec.queueInputBuffer(inputBufferId, …);}// 查詢是否有可用的OutputBufferint outputBufferId = codec.dequeueOutputBuffer(…); 復(fù)制代碼

本篇文章的編碼核心流程，和以上代碼相差不多。只是將輸入Buffer替換成了Surface，使用Surface代替InputBuffer來實現(xiàn)數(shù)據(jù)的填充。

為什么使用Surface

在MediaCodeC官方文檔里有一段關(guān)于Data Type的描述：

CodeC接受三種類型的數(shù)據(jù)，壓縮數(shù)據(jù)（compressed data）、原始音頻數(shù)據(jù)（raw audio data）以及原始視頻數(shù)據(jù)（raw video data）。這三種數(shù)據(jù)都能被加工為ByteBuffer。但是對于原始視頻數(shù)據(jù)，應(yīng)該使用Surface去提升CodeC的性能。

在本次項目中，使用的是MediaCodeCcreateInputSurface函數(shù)創(chuàng)造出Surface，搭配OpenGL實現(xiàn)Surface數(shù)據(jù)輸入。
這里我畫了一張簡單的工作流程圖：

整體流程上其實和普通的MediaCodeC工作流程差不多，只不過是將輸入源由Buffer換成了Surface。

知識點

在代碼中，MediaCodeC只負責(zé)數(shù)據(jù)的傳輸，而生成MP4文件主要靠的類是MediaMuxer。整體上，項目涉及到的主要API有：

MediaCodeC，圖片編碼為幀數(shù)據(jù)
MediaMuxer，幀數(shù)據(jù)編碼為Mp4文件
OpenGL，負責(zé)將圖片繪制到Surface

接下來，我將會按照流程工作順序，詳解各個步驟：

流程詳解

在詳解流程前，有一點要注意的是，工作流程中所有環(huán)節(jié)都必須處在同一線程。

配置

首先，啟動子線程。配置MediaCodeC：

var codec = MediaCodec.createEncoderByType(MediaFormat.MIMETYPE_VIDEO_AVC) // mediaFormat配置顏色格式、比特率、幀率、關(guān)鍵幀間隔 // 顏色格式默認為MediaCodecInfo.CodecCapabilities.COLOR_FormatSurface var mediaFomat = MediaFormat.createVideoFormat(MediaFormat.MIMETYPE_VIDEO_AVC, size.width, size.height).apply {setInteger(MediaFormat.KEY_COLOR_FORMAT, colorFormat)setInteger(MediaFormat.KEY_BIT_RATE, bitRate)setInteger(MediaFormat.KEY_FRAME_RATE, frameRate)setInteger(MediaFormat.KEY_I_FRAME_INTERVAL, iFrameInterval)} codec.configure(mediaFormat, null, null, MediaCodec.CONFIGURE_FLAG_ENCODE) var inputSurface = codec.createInputSurface() codec.start() 復(fù)制代碼

將編碼器配置好之后，接下來配置OpenGL的EGL環(huán)境以及GPU Program。由于OpenGL涉及到比較多的知識，在這里便不再贅述。視頻編碼項目中，為方便使用，我將OpenGL環(huán)境搭建以及GPU program搭建封裝在了GLEncodeCore類中，感興趣的可以看一下。
EGL環(huán)境在初始化時，可以選擇兩種和設(shè)備連接的方式，一種是eglCreatePbufferSurface;另一種是eglCreateWindowSurface,創(chuàng)建一個可實際顯示的windowSurface，需要傳一個Surface參數(shù)，毫無疑問選擇這個函數(shù)。

var encodeCore = GLEncodeCore(...) encodeCore.buildEGLSurface(inputSurface)fun buildEGLSurface(surface: Surface) {// 構(gòu)建EGL環(huán)境eglEnv.setUpEnv().buildWindowSurface(surface)// GPU program構(gòu)建encodeProgram.build() } 復(fù)制代碼

圖片數(shù)據(jù)傳入，并開始編碼

在各種API配置好之后，開啟一個循環(huán)，將File文件讀取的Bitmap傳入編碼。

val videoEncoder = VideoEncoder(640, 480, 1800000, 24) videoEncoder.start(Environment.getExternalStorageDirectory().path+ "/encodeyazi640${videoEncoder.bitRate}.mp4") val file = File(圖片集文件夾地址) file.listFiles().forEachIndexed { index, it ->BitmapFactory.decodeFile(it.path)?.apply {videoEncoder.drainFrame(this, index)} } videoEncoder.drainEnd() 復(fù)制代碼

在提要里面也提到了，編碼項目使用的圖片集是之前MediaCodeC硬解碼視頻，并將視頻幀存儲為圖片文件中的視頻文件解碼出來的，332張圖片。
循環(huán)代碼中，我們逐次將圖片Bitmap傳入drainFrame(...)函數(shù)，用于編碼。當(dāng)所有幀編碼完成后，使用drainEnd函數(shù)通知編碼器編碼完成。

視頻幀編碼

接著我們再來看drameFrame(...)函數(shù)中的具體實現(xiàn)。

/**** @b : draw bitmap to texture** @presentTime: frame current time* */fun drainFrame(b: Bitmap, presentTime: Long) {encodeCore.drainFrame(b, presentTime)drainCoder(false)}fun drainFrame(b: Bitmap, index: Int) {drainFrame(b, index * mediaFormat.perFrameTime * 1000)}fun drainCoder(...){偽代碼：MediaCodeC拿到輸出隊列數(shù)據(jù)，使用MediaMuxer編碼為Mp4文件} 復(fù)制代碼

首先使用OpenGL將Bitmap繪制紋理上，將數(shù)據(jù)傳輸?shù)絊urface上，并且需要將這個Bitmap所代表的時間戳傳入。在傳入數(shù)據(jù)后使用drainCoder函數(shù)，從MediaCodeC讀取輸出數(shù)據(jù)，使用MediaMuxer編碼為Mp4視頻文件。drainCoder函數(shù)具體實現(xiàn)如下：

loopOut@ while (true) {// 獲取可用的輸出緩存隊列val outputBufferId = dequeueOutputBuffer(bufferInfo, defTimeOut)Log.d("handleOutputBuffer", "output buffer id : $outputBufferId ")if (outputBufferId == MediaCodec.INFO_TRY_AGAIN_LATER) {if (needEnd) {// 輸出無響應(yīng)break@loopOut}} else if (outputBufferId == MediaCodec.INFO_OUTPUT_FORMAT_CHANGED) {// 輸出數(shù)據(jù)格式改變，在這里啟動mediaMuxer} else if (outputBufferId >= 0) {// 拿到相應(yīng)的輸出數(shù)據(jù)if (bufferInfo.flags and MediaCodec.BUFFER_FLAG_END_OF_STREAM != 0) {break@loopOut}}} 復(fù)制代碼

就像之前提到過的，并不是壓入一幀數(shù)據(jù)就能即時得到一幀數(shù)據(jù)。在使用OpenGL將Bitmap繪制到紋理上，并傳到Surface之后。要想得到輸出數(shù)據(jù)，必須在一個無限循環(huán)的代碼中，去拿MediaCodeC輸出數(shù)據(jù)。
也就是在這里的代碼中，當(dāng)輸出數(shù)據(jù)格式改變時，為MediaMuxer加上視頻軌，并啟動。

trackIndex = mediaMuxer!!.addTrack(codec.outputFormat)mediaMuxer!!.start() 復(fù)制代碼

整體上的工作流程就是以上這些代碼了，傳入一幀數(shù)據(jù)到Surface-->MediaCodeC循環(huán)拿輸出數(shù)據(jù)--> MediaMuxer寫入Mp4視頻文件。
當(dāng)然，后兩步的概念已經(jīng)相對比較清晰，只有第一步的實現(xiàn)是一個難點，也是當(dāng)時比較困擾我的一點。接下來我們將會詳解，如何將一個Bitmap通過OpenGL把數(shù)據(jù)傳輸?shù)絊urface上。

Bitmap --> Surface

項目中，將Bitmap數(shù)據(jù)傳輸?shù)絊urface上，主要靠這一段代碼：

fun drainFrame(b: Bitmap, presentTime: Long) {encodeProgram.renderBitmap(b)// 給渲染的這一幀設(shè)置一個時間戳eglEnv.setPresentationTime(presentTime)eglEnv.swapBuffers() } 復(fù)制代碼

其中encodeProgram是顯卡繪制程序，它內(nèi)部會生成一個紋理，然后將Bitmap繪制到紋理上。此時這個紋理就代表了這張圖片，再將紋理繪制到窗口上。
之后，使用EGL的swapBuffer提交當(dāng)前渲染結(jié)果，在提交之前，使用setPresentationTime提交當(dāng)前幀代表的時間戳。

更加具體的代碼實現(xiàn)，都在我的Github項目中。GLEncodeCore以及EncodeProgram GPU Program還有EGL 環(huán)境構(gòu)建

結(jié)語

此處有項目地址，點擊傳送

與50位技術(shù)專家面對面20年技術(shù)見證，附贈技術(shù)全景圖

總結(jié)

以上是生活随笔為你收集整理的使用MediaCodeC将图片集编码为视频的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：如何简单地利用Bitmap为中介储存图片
下一篇：工具-Xmind常用快捷键/使用