Swift iOS实现把PCM语音转成MP3格式

Swift iOS实现把PCM语音转成MP3格式,第1张

概述最近折腾了swift的语音录制识别和转码,这块还是比较坑的,由于语音识别的准确度实测大概也就80%左右,所以还是需要上传录音文件啊。 首先是用讯飞语音SDK实现语音录制和识别(语音听写),第一个坑是讯飞SDK只录制了PCM格式的文件,这个文件是原始格式,默认比较大,另外播放器支持也不好,因此需要先把它转成mp3,本来考虑使用系统的AudioConverter转aac格式,不过aac好像不能在浏览器

最近折腾了swift的语音录制识别和转码,这块还是比较坑的,由于语音识别的准确度实测大概也就80%左右,所以还是需要上传录音文件啊。

首先是用讯飞语音SDK实现语音录制和识别(语音听写),第一个坑是讯飞SDK只录制了PCM格式的文件,这个文件是原始格式,默认比较大,另外播放器支持也不好,因此需要先把它转成mp3,本来考虑使用系统的AudioConverter转aac格式,不过aac好像不能在浏览器上播放。

转成mp3需要lame库支持,注意国内网搜到的lame.a库@R_419_6963@64位,所以现在不能用了。

还好已经有人做了这个事情,直接提供了最新编译脚本和编译好的framework库,地址是https://github.com/wuqiong/mp3lame-for-iOS

我直接用了上面编译的framework,没有自己去编译,直接把lame.framework拖到工程里。

然后需要用oc写个封装类,我不确定这个封装类能不能用swift写,毕竟里面用了很多c的语法,还是用oc桥接一层比较保险。oc封装类如下:


#import <Foundation/Foundation.h>#import "AudioWrapper.h"#import "lame/lame.h"@implementation AudioWrapper+ (voID)audioPCMtoMP3 :(Nsstring *)audiofileSavePath :(Nsstring *)mp3filePath{        @try {        int read,write;                file *pcm = fopen([audiofileSavePath cStringUsingEnCoding:1],"rb");  //source 被转换的音频文件位置        fseek(pcm,4*1024,SEEK_CUR);                                   //skip file header        file *mp3 = fopen([mp3filePath cStringUsingEnCoding:1],"wb");  //output 输出生成的Mp3文件位置                const int PCM_SIZE = 8192;        const int MP3_SIZE = 8192;        short int pcm_buffer[PCM_SIZE*2];        unsigned char mp3_buffer[MP3_SIZE];                lame_t lame = lame_init();        lame_set_in_samplerate(lame,11025.0);        lame_set_VBR(lame,vbr_default);        lame_init_params(lame);                do {            read = fread(pcm_buffer,2*sizeof(short int),PCM_SIZE,pcm);            if (read == 0)                write = lame_encode_flush(lame,mp3_buffer,MP3_SIZE);            else                write = lame_encode_buffer_interleaved(lame,pcm_buffer,read,MP3_SIZE);                        fwrite(mp3_buffer,write,1,mp3);                    } while (read != 0);                lame_close(lame);        fclose(mp3);        fclose(pcm);    }    @catch (NSException *exception) {        NSLog(@"%@",[exception description]);    }    @finally {        NSLog(@"MP3 converted: %@",mp3filePath);    }    }@end


然后在桥接文件XXX-BrIDging-header.h中加入

#import "AudioWrapper.h"

最后 swift文件的调用如下:

 dispatch_async(dispatch_get_global_queue(disPATCH_QUEUE_PRIORITY_DEFAulT,0)) {                AudioWrapper.audioPCMtoMP3(path,pathMp3)}
我觉得在主线程调用容易出问题,就新开了个线程调用,实测没有问题。 总结

以上是内存溢出为你收集整理的Swift iOS实现把PCM语音转成MP3格式全部内容,希望文章能够帮你解决Swift iOS实现把PCM语音转成MP3格式所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/1076714.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2022-05-26
下一篇2022-05-26

发表评论

登录后才能评论

评论列表(0条)

    保存