关于音频视频格式的问题_服务器

二者的根本区别就是格式。
音乐格式五花八门，多如牛毛，但不外乎分为两大类：一类为音乐指令文件（如MIDI），一般由音乐创作软件制作而成，它实质上是一种音乐演奏的命令，不包括具体的声音数据，故文件很小；另一类为声音文件，是通过录音设备录制的原始声音，其实质上是一种二进制的采样数据，故文件较大。
从播放形式上，声音文件还可以分为“音频流”和“非音频流”两种，前者能够一边下载一边收听，比如“WMA”、“RA”、“MOV”等，后者则不能。所谓流媒体技术就是把连续的影像和声音信息经过压缩处理后放上网站服务器，让用户一边下载一边观看、收听，而不需要等整个压缩文件全部下载到自己机器后才可以观看的技术。
下面，将各种音乐文件的格式收集整理如下：
流式音频：Windows Media Audio(WMA)
WMA就是Windows Media Audio的缩写，是微软自己开发的Windows Midea Audio技术。它和Windows Midea Video一样，经历了几代改良后，变得非常出色。比起老掉牙的MP3压缩技术，WMA无论从技术性能(支持音频流)还是压缩率(比MP3高一倍)都远远把MP3抛在后面了。据微软声称，用它来制作接近CD品质的音频文件，其体积仅相当于MP3的1/3。在48Kbps的传送速率下即可得到接近CD品质(Near－CD Quality)的音频数据流，在64Kbps的传送速率下可以得到与CD相同品质的音乐，而当连接速率超过96Kbps后则可以得到超过CD的品质。
流式音频：RealMedia(RA/RM/RAM)
RealMedia采用的是RealNetworks公司自己开发的Real G2 Codec，它具有很多先进的设计，例如，SVT(Scalable Video Technology)，该技术可以让速度较慢的电脑不需要解开所有的原始图像数据也能流畅观看节目；双向编码(Two－Encoding)技术类似于VBR，它可通过预先扫描整个影片，根据带宽的限制选择最优化压缩码率。RealMedia音频部分采用的是RealAudio，它具有21种编码方式，可实现声音在单声道、立体声音乐不同速率下的压缩。
流式音频：QuickTime(MOV)
QuickTimeApple的QuickTime是最早的视频工业标准，在1999年发布的QuickTime 4．0版本后开始支持真正的实时播放，其格式为“．mov”。它的视频压缩部分采用Sorenson Video技术，该技术支持VBR(Variable Bit Rate)，也就是我们常说的动态码率，它可以动态地分配带宽以尽可能小的文件获得最好的播放效果，并能使在解压缩时获得平滑流畅的画面。音频部分QuickTime采用一种名为QDesiglMusic的技术，据说是一种比MP3更好的音频流技术。
VQF
VQF即TwinVQ（Transform－domain Weighted Interleave Vector Quantization），是由NTT（Nippon Telegraph and Telephone）与Yamaha共同开发的一种音频压缩技术。VQF的音频压缩率比标准的MPEG音频压缩率高出近一倍，可以达到18:1左右甚至更高。也就是说把一首4分钟的歌曲（WAV文件）压成MP3，大约需要4MB左右的硬盘空间，而同一首歌曲，如果使用VQF音频压缩技术的话，那只需要2MB左右的硬盘空间。因此，在音频压缩率方面，MP3和RA都不是VQF的对手。
如此之高的压缩率是否会影响音质呢？实际聆听的结果告诉我们——不会。当VQF以44KHz、80kbit/s的音频采样率压缩音乐时，它的音质优于44KHz、128kbit/s的MP3，当VQF以44KHz、96kbit/s的频率压缩时，它的音质几乎等于44KHz、256kbit/s的MP3！经SoundVQ压缩后的音频文件在进行回放效果试听时，几乎没有人能听出它与原音频文件的差异。
AIFF(AIF/AIFF)
AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写，是Apple公司开发的一种声音文件格式，被Macintosh平台及其应用程序所支持，Netscape Navigator浏览器中的LiveAudio也支持AIFF格式，SGI及其它专业音频软件包也同样支持AIFF格式。AIFF支持ACE2、ACE8、MAC3和MAC6压缩，支持16位441kHz立体声。
Audio(AU)
Audio文件是Sun微系统公司推出的一种经过压缩的数字声音格式。AU文件原先是UNIX *** 作系统下的数字声音文件。由于早期Internet上的Web服务器主要是基于UNIX的，所以AU格式的文件在如今的Internet中也是常用的声音文件格式，Netscape Navigator浏览器中的LiveAudio也支持Audio格式的声音文件。
Voice(VOC)
Voice文件是新加坡著名的多媒体公司Creative Labs开发的声音文件格式，多用于保存Creative Sound Blaster系列声卡所采集的声音数据，被Windows平台和DOS平台所支持，支持CCITTA Law和CCITTμLaw等压缩算法。在DOS程序和游戏中常会遇到这种文件，它是随声卡一起产生的数字声音文件，它与WAV文件的结构相似，可以通过一些工具软件方便地互相转换。
Module(MOD、S3M、XM、MTM、FAR、KAR、IT)
模块(Module)格式同时具有MIDI与数字音频的共同特性——既包括如何演奏乐器的指令，又保存了数字声音信号的采样数据。因此，其声音回放质量对音频硬件的依赖性较小，也就是说，在不同的机器上可以获得基本相似的声音回放质量。模块文件根据不同的编码方法有MOD、S3M、XM、MTM、FAR、KAR、IT等多种不同格式。
MIDI(MID/CMF/RMI)
MIDI是乐器数字接口(Musical Instrument Digital Interface)的英文缩写，是数字音乐/电子合成乐器的统一国际标准。MIDI规范由美、日几家著名电子乐器厂商于1983年共同制定，目的是解决各种电子乐器间存在的兼容性问题。MIDI规范不仅定义了电脑音乐程序、音乐合成器及其它电子音乐设备交换音乐信号的方式，而且还规定了不同厂家的电子乐器与电脑连接的电缆和硬件及设备间数据传输的协议，可用于为不同乐器创建数字声音，能很容易地模拟钢琴、小提琴等传统乐器的声音。MIDI本身并不能发出声音，它是一个协议，只包含用于产生特定声音的指令，而这些指令则包括调用何种MIDI设备的音色、声音的强弱及持续的时间等。电脑把这些指令交由声卡去合成相应的声音（如依指令发出钢琴声或小提琴声等）。最初，因为不同MIDI设备的乐器音色排列方法不一，所以会造成同一MIDI文件在不同的设备上会出现完全不同的放音效果（比如一个钢琴音色的MIDI文件，在不同设备上播放时会变成小提琴或者小号的音色）。为避免出现这种混乱情况，GM(General MIDI，通用MIDI)标准被提出并得到了Windows *** 作系统的支持，得到了相当广泛的应用。它规定了前128种常用乐器音色的编排方式，例如1号是钢琴、66号是萨克斯管等等。GM标准还描述了成为GM兼容格式的硬件设备应具有的其它特征，如GM标准音源同时发音数不少于24，MIDI通道为16，第10通道为打击乐声部等等，它实际上是对MIDI规范的补充。
Roland公司提出的GS标准在兼容GM标准的基础上，对其进行了发展，增强了音乐的表现力——它提供比GM标准数量更多的打击乐器组和更多的特殊音效。GS标准具有广泛的软硬件适应性，包括声卡、音乐爱好者的娱乐乐器到专业音乐器材等。后来，Yamaha公司又提出了基于GM标准的XG标准。相对于保存真实采样数据的声音文件，MIDI文件显得更加紧凑，其文件的大小要比WAV文件小得多——一分钟的WAV文件约要占用10MB的硬盘空间，而一分钟的MIDI却只有区区的34KB。现在，MIDI已经成为电脑音乐的代名词。
电脑播放MIDI文件时, 有两种方法合成声音: FM合成和波表合成。FM合成是通过多个频率的声音混合来模拟乐器的声音;波表合成是将乐器的声音样本存储在声卡波形表中，播放时从波形表中取出来产生声音。采用波表合成技术可以产生更逼真的声音。
MIDI文件有几个变通的格式，其中CMF文件是随声卡一起使用的音乐文件，与MIDI文件非常相似，只是文件头略有差别；另一种MIDI文件是Windows使用的RIFF文件的一种子格式，称为RMID，扩展名为RMI。
声音波形文件(WAV)
由Microsoft公司开发的一种WAV声音文件格式，是如今电脑上最为常见的声音文件格式，它符合RIFF(Resource Interchange File Format)文件规范，用于保存Windows平台的音频信息资源，被Windows平台及其应用程序所广泛支持。Wave格式支持MSADPCM、CCITTALaw、CCITT μ Law和其它压缩算法，支持多种音频位数、采样频率和声道，但其缺点是文件体积较大（一分钟44kHZ、16bit Stereo的WAV文件约要占用10MB左右的硬盘空间），所以不适合长时间记录。
MPEC音频文件（MP1/MP2/MP3）
MPEG(Moving Picture Experts Group，活动图像专家组)代表的是MPEG活动影音压缩标准，MPEG音频文件指的是MPEG标准中的声音部分，即MPEG音频层(MPEG Audio Layer)。MPEG音频文件根据压缩质量和编码复杂程度的不同可分为三层(MPEG Audio Layer 1/2/3)，分别与MP1、MP2和MP3这三种声音文件相对应。MPEG音频编码具有很高的压缩率，MP1和MP2的压缩率分别为4∶1和6∶1～8∶1，而MP3的压缩率则高达10∶1～12∶1，也就是说一分钟CD音质的音乐，未经压缩需要10MB存储空间，而经过MP3压缩编码后只有1MB左右，同时其音质基本保持不失真。因此，目前Internet上的音乐格式以MP3最为常见。
MP3为降低声音失真采取了名为“感官编码技术”的编码算法：编码时先对音频文件进行频谱分析，然后用过滤器滤掉噪音电平，接着通过量化的方式将剩下的每一位打散排列，最后形成具有较高压缩比的MP3文件，并使压缩后的文件在回放时能够达到比较接近原音源的声音效果。虽然它是一种有损压缩，但是它的最大优势是以极小的声音失真换来了较高的压缩比。
MP4
MP3问世不久，就凭着较高的压缩比（12：1）和较好的音质创造了一个全新的音乐领域。然而，MP3的开放性却最终不可避免地导致了版权之争。在这样的背景下，文件更小、音质更佳，同时还能有效保护版权的MP4就应运而生了。
MP4与MP3之间其实并没有必然的联系。首先，MP3是一种音频压缩的国际技术标准，而MP4却是一个商标的名称。其次，它采用的音频压缩技术也迥然不同，MP4采用的是美国电话电报公司（AT＆T）所研发的、以“知觉编码”为关键技术的a2b音乐压缩技术（
），可将压缩比成功地提高到15：1（最大可达到20：1）而不影响音乐的实际听感。同时，MP4在加密和授权方面也做了特别的设计。它有如下特点：
（1）每首MP4乐曲就是一个扩展名为exe的可执行文件，在Windows里直接双击就可以运行播放，十分方便。MP4的这个优点同时又是它的先天缺陷---容易感染电脑病毒！
（2）更小的体积！更好的音质？相对先进的a2b音频压缩技术的采用，使MP4文件大小仅为MP3的3/4左右，从这个角度来看，MP4更适合在Internet上传播，而且据说音质也更胜一筹，但我怎么也没听出它比MP3的音质更为优越。
（3）独特的数字水印。MP4乐曲采用了名为“Solana”技术的数字水印，可方便地追踪和发现盗版发行行为。而且，任何针对MP4的非法解压行为，都可能导致MP4原文件的损毁。
（4）支持版权保护。MP4乐曲还内置了包括与作者、版权持有者相关的文字、图像等版权说明，既可声明版权，又表示了对作者和演唱者的尊重。
（5）比较完善的功能。MP4可独立调节左右声道音量控制；内置波形/分频动态音频显示和音乐管理器，可支持多种彩色图像、网站链接及无限制的滚动显示文本。

现代多媒体会议室已成为现代新型办公建筑越来越重要的设计范畴，随着时间的发展，对音视频高质量和网络化集成设计都提出了全新的概念。在参加了近年来较有影响的工程设计后，对一些高级别会议系统的要求有了以下认识。现代会议系统功能设计包括：大屏幕显示功能、综合会议信号处理功能、发言及表决功能、扩声及音响功能、视频会议功能、会议设备集控功能、会议室门禁及预定功能。
一显示子系统功能设计
会议显示子系统一般采用大屏幕超高亮度投影、DLP和桌面LCD液晶屏显示相结合的方式。同步显示与会议相关的图像、图形、、文字及语音信息资料。显示系统可以支持视频信号、各种制式的AV信号、TV射频信号、各种分辨率的VGA信号，同时也支持的播放形式。会议显示系统支持“会议设备集控系统”进行本地的集中控制和网络化分布式遥控 *** 作。
视频系统的预期指标
序号系统设计内容预期指标
1图像显示参考标准
11 画面照度标准会议室750勒克斯标准
12 环境照度参考标准会议室标准（30勒克斯）
13 环境对比度参考标准 1024x768 全彩和视频标准（20:1）
根据最近视像距离等于图像高度15倍，最远视像距离等于图像高度5倍（数据）7倍（视频）的原则，来设计正面投影方式满足会场所有方位的视像要求。
由于部分发言人是无法看到图像的，所以我们领导专门配置了预留等离子显示器接口，放在他们的对面的中部。在主席台2侧配置适当的等离子显示器，用于他们对信号的观看和下面观众的多画面观看需要。
画面照度的预期指标：
为了兼顾各种一般用场合对环境照度的不同需求，环境照度定义为会议室环境：即最低单位照度为30勒克斯，对比度比值为1024×768全彩视频标准（20），根据正面投影机亮度=屏幕因素314图像面积×环境照度×对比度比值×屏幕增益的倒数的公式，可以得知：
投影机亮度=314N米×30勒克斯×20×（1/25）=7536N ANSI流明
考虑到会议室的实际照度和需要，必须提高亮度至2500-3000ANSI左右
投影角度分析：
由于正面投影屏幕对投影光线不具备控制视角的作用，本系统对主席台投影角度无特殊的要求，为了保证屏幕亮度最大的均匀性，建议采用0%在轴投影方式，分布在正对投影幕布的地方，距离为7米左右，全部采用电动吊架隐藏安装，与装潢相配合。
视频信号的带宽计算：信号在没有产生严重扭曲或损失传输时，需要的频率总范围。常用单位是KHz或MHz，如右图是模拟音频信号的频响范围 20Hz~20KHz，通过计算可以得出模拟音频信号的带宽至少是1998KHz。但是在音响行业一般会以“频率响一般范围”来描述，比如说某某功放的频率响一般范围是20Hz~20KHz@±1dB。
复合视频信号根据制式的不同，信号的带宽也有一点差异，见下表：
PAL B/G/H PAL I PAL D PAL N PAL M NTSC SECAM
每帧线数 625线 625线 625线 625线 525线 525线 625线
行频范围KHz 15625 15625 15625 15625 15750 15734 15625
场频范围Hz 50 50 50 50 60 60 50
彩色副载波MHz 443 443 443 358 358 358 440
信号带宽MHz 55 60 65 45 45 45 65
我们设计复合视频矩阵的带宽为150MHz（-3dB，满负载）。
计算机视频信号的带宽没有统一的国际标准，根据美国TVONE公司的推荐经验，可以通过如下公式进行简易计算：
视频带宽=（像素点×场频）/2×3
比如：已知XGA的像素点约786万（1024×768），场频是60Hz，代入公式可以得到：（1024×768×60）/2×3≈708MHz
多媒体信息接入：结合现代建筑艺术的高速发展和要求，对于流动或固定的信号输入端口，我们在主席台的台口方位，使用主席台上多媒体信息输入接口。
我们通过音视频矩阵可以同时地路由任意输入到任意或全部输出。
二综合会议信号处理子系统功能设计
1、会议综合信号处理子系统一般采用计算机监控管理与音视频矩阵相结合的方式。综合会议信号处理功能，可以实现会议图像、图形、和文字及语音信号的选择、调用、切换、传送(包括网络传送)、录制，以及会议音像资料的后期制作。处理信号的类型包括：DVD、VCD、CATV、CCTV、计算机信号、远程视频会议音像信号。会议综合信号处理子系统支持“会议设备集控系统”进行本地的集中控制和网络化分布式的遥控 *** 作。
2、一会议信息管理中心
会议室音视频信息的集中管理、存储和传输
视频点播的在线服务能力。
网络广播直播的服务能力。
光盘刻录和本地存储。
视频、音频、文档同步显示和保存。
根据会议室的实际面积和现场布局，配备一套多功能光盘直录系统，主机安放于会议记录秘书 *** 作台内，同时，通过网络在计算机主机房可进行远程管理；这样的优势在于节省人力；由于直录系统 *** 作简单、方便，每次会议只要会议记录秘书打开电源、启动录像即可。同时，当会议记录秘书将会议前的会议提案由通过网络传送到中心服务器时，服务器开始同步录像。这样可以双管齐下，共同享用此系统，增加了系统的使用
三重中之重的发言表决扩声子系统功能设计：
会议发言及表决子系统，具有优秀还原音质的话筒发言和讨论的功能，会议及表决子系统同步支持大屏幕及桌面LCD液晶屏显示会议相关资料，可同步联动视频会议子系统、表决器，以及会议发言者影像自动跟踪子系统。优秀的会议扩声及音响子系统可以满足会议扩声、录像带、DVD光盘播放扩声扩声和舞台剧场对不同音响效果的需求。音响子系统支持数字化语音的传送，及具有紧急广播、背景音乐和分区广播的功能。
（1）网络化音频集中管理
通过成熟的以太网技术，凭借先进技术和设备。我们对各会议室、多功能厅音频实施的是网络化集中管理。
（2）网络音频协议：CobraNet
一条100Mbit 连接线可以在每个方向传输64路音频信号，等于一条六类线可以传输128路音频信号，1000 MBase连接可以再增加更多路传输。
提供一个共通传输给控制协议，因为CobraNet是基于以太网网络，所以不同的协议可以在这个环境一起使用，CobraNet是一种工业标准的网络技术，它通过标准以太网硬件和媒介为未经压缩的数字音频提供可靠传输。当集成到媒体矩阵后，CobraNet允许设计者创建大型结构来实现数以千路计的数字音频信号在以太网上的传输。通过远程或本地多种方式的访问，CobraNet使用简单的窗口界面可以轻松地任意位置的音频信号在网络上传输。
通过CobraNet网络音频拓扑，可以把每层的会议室音频进行集中处理，再用过以太网将各楼层主机相连，实现整个大楼会议室多功能室甚至广播系统的集中处理。
随着无线局域网络WLAN的普及，管理者只需携带笔记本电脑，就能随处进行大楼音频广播的管理！
（3）高级别会议系统----优秀的音质是关键
在参与大型会议系统设计时，筹建领导领导班子会对会议系统倾入百分的热情与关注。因为会议系统是整个工程项目的“点睛之作”，是“面子工程”，“一把手工程”“书记工程”。因为会议中心几乎涵盖了所有的外事接待，新闻发布，领导会议等重要的交流沟通活动，所以任何项目中的会议系统的成败，关系到整个系统工程的成败。会议系统的完美也是整个工程和整个筹建领导班子的“光荣与梦想”，它已经超出了技术的范畴，是技术与美的艺术创作，当然这样也就衍生出了对我们电声系统严格而且挑剔的要求。
会议最重要的是声音的可靠性和音质！
随着时代的发展，人们越来越追求高层次高品质，过去音响系统中的听清听懂已经不能满足要求，高保真还原才是当今的追求！
心理声学告诉我们:人们对声音的感受与欣赏有着一个从低级到高级，从感性到理性的发展过程，聆听者在感知音响效果的思维过程中逐步建立了声音的外层形象和内在形象，这些形象的感知在不知不觉中影响着人们的思维和对声音的判断，表层形象给聆听者以刺激，内在感受给人以情感的变化”这是心理学的内涵
一套电声系统，对于音乐或者节目源或者艺术家来说要做到的就是还原！电声系统要像一面透明度很好的光学镜，只有放大，没有音染和失真，尊重发言者的声音。
音色，音调和响度被称为声音的三要素。为了说明心理声学在现代高级别会议系统中的运用我们强调:声音的响度是人耳对声音大小的感受，声波的振幅决定着响度的大小基波的频率决定着音调的高低音色则取决于谐波的结构以上的的三要素是决定会议室发言者声音是否优秀的标准。
我们先从选择传声器的频响特性来入手:
电容传声器的频响特性是中性的(指客观真实)，干净，没有失真，灵敏度较高。而动圈式的传声器频响特性是具有深厚，温暖感，但缺少中性(真是感)的特点，他拾取的声音不干净中频容易染色，适合拾取音乐，所以会议系统一般采用高品质的电容会议话筒。
人声音主要靠声带震动产生，语言的特点是间断的，瞬变的，而它的音高和音色是由语言本身的基频和各次谐波共同作用决定的，汉语的声能密度一般集中分布在 200Hz-700Hz之间，男生声带较长较厚(即声源本身的构造)，发音频率较低，平均基本频率(基音-男高男低音平均)约为230Hz(男低音歌唱家基频可以低到60Kz女高音基频可以高到1000 Hz左右)而语言发声时产生的谐波频率可达6000Hz以上，声压级为60-70dB，动态80dB
汉语的特点，声调抑扬顿挫，波浪起伏，逻辑重音变化较大，往往一首好的诗律总是朗朗上口，韵律悠扬，铿锵有力，节奏鲜明汉语的句子，重音语气，韵律，要分析发言者的发音特点，还要分析频率，用高低的频率调整语音，获得最佳听感汉语的声音，由于音带不同，男人和女人差距较大，男人和男人之间，女人和女人之间又有不同，汉语的发音能量都集中在200Hz-700Hz，属中低频，所以对男声要注意厚度，对女声要注意力度，做到低频不混，中频不硬，高频不尖，给人以丰满明亮自然的感觉。
经分析得知，低频段明显的高峰和高频段较小的峰可产生甜润，亲切和温暖的受，低频段的下降和高频段的减少则会唤起声音的响度，距离和穿透力，这些论证是心理学对现代声频技术的映射
1973年，美国人汉姆提出了当音乐的二次谐波比基波高八度时能使音色更加丰富的新论点
就语言而言，每个人频谱各峰的位置，相位，强度及峰的数目与演讲人的语言音色有着十分密切的关系，如果语言的频谱的峰的数目多，而且各峰的位置排列有序，那么这种声音在主观听觉上就会格外动听我们需要对每一个重要的发言者的音色都做出修正和补偿，这样使所有与会者的声音都优美动听，温暖亲切，使男声和女声的，声音大的和声音小的都做出合适的调整，这样不至于会议时每个人发言的大小都不同，使人感觉不舒适
所以，要想做出一个理想的会议听音环境，每只拾音器必须可以单独调节音量和音色，这一点至关重要!
这里我们还必须强调的一点---合适的拾音距离
我们知道人类的心理安全临界距离是50cm，任何物体进入50 cm以内，人会有压迫感，长时间心理紧张、烦闷，不适。发言者发言时，一般手拉手的会议系统，发言者距话筒的距离大约15—30cm之间。由于灵敏度的技术缺陷，话筒拾音在发言者的安全心理距离以内，必须长时间使人保持一个发言姿势凑近话筒，极易疲劳，造成心理紧张、烦闷、感觉较差。所以高级别会议系统的拾音距离不宜过近，一般不考虑手拉手系统。
由于声源的直达声强度会随拾音距离增加而减弱(如果声源的声波是理想的球面波时，则拾音点的直达声压会与拾音距离成反比—距离加倍时声压减一倍)，而混响声强度则到处差不多(当房间能达到理想扩散时，室内各处混响声是相同的)，因此，当拾音距离不同时，拾音点的声音信号的声能比也不同如果是近距离拾音，则拾取的几乎都是直达声，听音评价高频多而声音呆板，如果加大拾音距离，直达声/混响声的比例逐渐降低，清晰度也会降低。当拾音距离增大到一定程度在继续扩大，则混响声强度相对逐渐增大，声音的可懂度和清晰度有较大程度的降低。在这里我们引用混响半径的概念判断拾音点声能比的情况，拾音点到声源的等效中心距离小于混响半径时，拾音点的声能比将大于1，这点的声音信号中直达声占主要成分，反之，拾音点的声能比小于1，则混响声占主要成分当拾音传声器小于等效混响半径时，传声器电信号直达声比混响声能量大，当声源停止发声后，其输出电信号直达声立即消失，这时信号强度会突然跌落到混响声强度上(只剩下混响声信号)，然后信号再按混响声规律逐渐衰减下去，这种包络状的信号再经过重放，不论重放声级多高，都会给人以一种声源亲切实在的感觉当拾音传声器大于等效混响半径时，传声器电信号直达声比混响声能量大，其输出电信号直达声变弱，传声器输出电信号跌落不明显或完全消失，这种包络状的信号再经过重放会给人以一种模糊空旷的感觉。

多媒体知识全接触教程第一篇多媒体基本概念
1多媒体的定义
“多媒体”一词译自英文“Multimedia”，而该词又是由mutiple和media复合而成的。媒体（medium）原有两重含义，一是指存储信息的实体，如磁盘、光盘、磁带、半导体存储器等，中文常译作媒质；二是指传递信息的载体，如数字、文字、声音、图形等，中文译作媒介。所以与多媒体对应的一词是单媒体（Monomedia），从字面上看，多媒体就是由单媒体复合而成的啦。
多媒体技术从不同的角度有着不同的定义。比如有人定义“多媒体计算机是一组硬件和软件设备；结合了各种视觉和听觉媒体，能够产生令人印象深刻的视听效果。在视觉媒体上，包括图形、动画、图像和文字等媒体，在听觉媒体上,则包括语言、立体声响和音乐等媒体。用户可以从多媒体计算机同时接触到各种各样的媒体来源”。还有人定义多媒体是“传统的计算媒体----文字、图形、图像以及逻辑分析方法等与视频、音频以及为了知识创建和表达的交互式应用的结合体”。概括起来就是:多媒体技术，即是计算机交互式综合处理多媒体信息----文本、图形、图像和声音，使多种信息建立逻辑连接，集成为一个系统并具有交互性。简言之，多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术（这句话的三性可是精髓哦！）。多媒体在我国也有自己的定义，一般认为多媒体技术指的就是能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。
2多媒体的关键技术
由于多媒体系统需要将不同的媒体数据表示成统一的结构码流，然后对其进行变换、重组和分析处理，以进行进一步的存储、传送、输出和交互控制。所以，多媒体的传统关键技术主要集中在以下四类中：数据压缩技术、大规模集成电路（VLSI）制造技术、大容量的光盘存储器（CD-ROM）、实时多任务 *** 作系统。因为这些技术取得了突破性的进展，多媒体技术才得以迅速的发展，而成为像今天这样具有强大的处理声音、文字、图像等媒体信息的能力的高科技技术。
但说到当前要用于互联网络的多媒体关键技术，有些专家却认为可以按层次分为媒体处理与编码技术、多媒体系统技术、多媒体信息组织与管理技术、多媒体通信网络技术、多媒体人机接口与虚拟现实技术，以及多媒体应用技术这六个方面。而且还应该包括多媒体同步技术、多媒体 *** 作系统技术、多媒体中间件技术、多媒体交换技术、多媒体数据库技术、超媒体技术、基于内容检索技术、多媒体通信中的QoS管理技术、多媒体会议系统技术、多媒体视频点播与交互电视技术、虚拟实景空间技术等等。
3一般多媒体系统的组成部分
一般的多媒体系统由如下四个部分的内容组成:
多媒体硬件系统、多媒体 *** 作系统、媒体处理系统工具和用户应用软件。
★ 多媒体硬件系统：包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。其中，最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片和板卡、光盘驱动器等。
★ 多媒体 *** 作系统：或称为多媒体核心系统（Multimedia kernel system），具有实时任务调度、多媒体数据转换和同步控制对多媒体设备的驱动和控制，以及图形用户界面管理等。
★ 媒体处理系统工具：或称为多媒体系统开发工具软件，是多媒体系统重要组成部分。
★ 用户应用软件：根据多媒体系统终端用户要求而定制的应用软件或面向某一领域的用户应用软件系统，它是面向大规模用户的系统产品。
第二篇多媒体计算机的组成
1多媒体个人机的解释
在多媒体计算机之前，传统的微机或个人机处理的信息往往仅限于文字和数字，只能算是计算机应用的初级阶段，同时，由于人机之间的交互只能通过键盘和显示器，故交流信息的途径缺乏多样性。为了改换人机交互的接口，使计算机能够集声、文、图、像处理于一体，人类发明了有多媒体处理能力的计算机。我们这里重点谈谈个人机（就是现在说的PC啦）。所以现在你该明白，所谓多媒体个人机（Multimedia Personal Computer, MPC）无非就是具有了多媒体处理功能的个人计算机（如早期的586机型），它的硬件结构与一般所用的个人机并无太大的差别，只不过是多了一些软硬件配置而已。一般用户如果要拥有MPC大概有两种途径：一是直接够买具有多媒体功能的PC机；二是在基本的PC机上增加多媒体套件而构成MPC。到奔Ⅱ横行的今天，对计算机厂商和开发人员来说，MPC已经成为一种必须具有的技术规范。
2多媒体计算机的基本配置（及可选配置）
一般来说，多媒体个人计算机（MPC）的基本硬件结构可以归纳为七部分：
★ 至少一个功能强大、速度快的中央处理器（CPU）；
★ 可管理、控制各种接口与设备的配置；
★ 具有一定容量（尽可能大）的存储空间；
★ 高分辨率显示接口与设备；
★ 可处理音响的接口与设备；
★ 可处理图像的接口设备；
★ 可存放大量数据的配置等；
这样提供的配置是最基本MPC的硬件基础，它们构成MPC的主机。除此以外，MPC能扩充的配置还可能包括如下几个方面：
★ 光盘驱动器：包括可重写光盘驱动器（CD-R)、WORM光盘驱动器和CD-ROM驱动器。其中CD-ROM驱动器为MPC带来了价格便宜的650M存储设备，存有图形、动画、图像、声音、文本、数字音频、程序等资源的CD-ROM早已广泛使用，因此现在光驱对广大用户来说已经是必须配置的了。而可重写光盘、WORM光盘价格较贵，目前还不是非常普及。另外，DVD出现在市场上也有些时日了，它的存储量更大，双面可达17GB，是升级换代的理想产品。
★ 音频卡：在音频卡上连接的音频输入输出设备包括话筒、音频播放设备、MIDI合成器、耳机、扬声器等。数字音频处理的支持是多媒体计算机的重要方面，音频卡具有A/D和D/A音频信号的转换功能，可以合成音乐、混合多种声源，还可以外接MIDI电子音乐设备。
★ 图形加速卡：图文并茂的多媒体表现需要分辨率高，而且同屏显示色彩丰富的显示卡的
支持，同时还要求具有Windows的显示驱动程序，并在Windows下的像素运算速度要快。所以现在带有图形用户接口GUI加速的局部总线显示适配器使得Windows的显示速度大大加快。
★ 视频卡：可细分为视频捕捉卡、视频处理卡、视频播放卡以及TV编码器等专用卡，其功能是连接摄像机、VCR影碟机、TV等设备，以便获取、处理和表现各种动画和数字化视频媒体。
★ 扫描卡：它是用来连接各种图形扫描仪的，是常用的静态照片、文字、工程图输入设备。
★ 打印机接口：用来连接各种打印机，包括普通打印机、激光打印机、彩色打印机等，打印机现在已经是最常用的多媒体输出设备之一了。
★ 交互控制接口：它是用来连接触摸屏、鼠标、光笔等人机交互设备的，这些设备将大大方便用户对MPC的使用。
★ 网络接口：是实现多媒体通信的重要MPC扩充部件。计算机和通信技术相结合的时代已经来临，这就需要专门的多媒体外部设备将数据量庞大的多媒体信息传送出去或接收进来，通过网络接口相接的设备包括视频电话机、传真机、LAN和ISDN等。
3媒体播放器在WEB中的应用
我们知道，由于声音点播和影视点播应用还没有完全直接集成到现在的Web浏览器中，这就需要一个单独的应用程序来帮助，通常我们使用媒体播放器(Media player)来播放声音和影视。典型的媒体播放器要执行好几个功能，包括解压缩、消除抖动、错误纠正和用户播放等功能。现在可以使用像插件这种技术把媒体播放器的用户接口放在Web客户机的用户界面上，浏览器在当前Web页面上保留屏幕空间，并且由媒体播放器来管理。目前，大多数客户机使用如下几种方法来读取声音和影视文件：
★ 通过Web浏览器把声音/影视从Web服务器传送给媒体播放器；
★ 直接把声音/影视从Web服务器传送给媒体播放器
★ 直接把声音/影视从多媒体流放服务器传送给媒体播放器；
在这个过程中，媒体播放器的主要功能表现在如下四个方面：
★ 解压缩：几乎所有的声音和电视图象都是经过压缩之后存放在存储器中的，因此无论播放来自于存储器或者来自网络上的声音和影视都要解压缩。
★ 去抖动：由于到达接收端的每个声音信息包和电视图象信息包的时延不是一个固定的数值，如果不加任何措施就原原本本地把数据送到媒体播放器播放，听起来就会有抖动的感觉，甚至对声音和电视图象所表达的信息无法理解。在媒体播放器中，限制这种抖动的简单方法是使用缓存技术，就是把声音或者电视图象数据先存放在缓冲存储器中，经过一段延时之后再播放。
★ 错误处理：由于在因特网上往往会出现让人不能接收的交通拥挤，信息包中的部分信息在传输过程中就可能会丢失。如果连续丢失的信息包太多，用户接收的声音和图象质量就不能容忍。采取的办法往往是重传。
★ 用户可控制的接口：这是用户直接控制媒体播放器播放媒体的实际接口。媒体播放器为用户提供的控制功能通常包括声音的音量大小、暂停/重新开始和跳转等等。
第三篇图像和图形
1有关色彩的基本常识
我们知道，只要是彩色都可用亮度、色调和饱和度来描述，人眼中看到的任一彩色光都是这三个特征的综合效果。那么亮度、色调和饱和度分别指的是什么呢？
★ 亮度：是光作用于人眼时所引起的明亮程度的感觉，它与被观察物体的发光强度有关；★ 色调：是当人眼看到一种或多种波长的光时所产生的彩色感觉，它反映颜色的种类，是决定颜色的基本特性，如红色、棕色就是指色调；
★ 饱和度：指的是颜色的纯度，即掺入白光的程度，或者说是指颜色的深浅程度，对于同一色调的彩色光，饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。现在你该明白了，亮度是用来表示某彩色光的明亮程度，而色度则表示颜色的类别与深浅程度。除此之外，自然界常见的各种颜色光，都可由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成；同样绝大多数颜色光也可以分解成红、绿、蓝三种色光，这就形成了色度学中最基本的原理----三原色原理(RGB)。
2目前常见的图形（图像）格式
一般来说，目前的图形（图像）格式大致可以分为两大类：一类为位图；另一类称为描绘类、矢量类或面向对象的图形（图像）。前者是以点阵形式描述图形（图像）的，后者是以数学方法描述的一种由几何元素组成的图形（图像）。一般说来，后者对图像的表达细致、真实，缩放后图形（图像）的分辨率不变，在专业级的图形（图像）处理中运用较多。
在介绍图形（图像）格式前，我们实在有必要先了解一下图形（图像）的一些相关技术指标:分辨率、色彩数、图形灰度。
★ 分辨率：分为屏幕分辨率和输出分辨率两种，前者用每英寸行数表示，数值越大图形（图像）质量越好；后者衡量输出设备的精度，以每英寸的像素点数表示；
★ 色彩数和图形灰度：用位（bit）表示，一般写成2的n次方，n代表位数。当图形（图像）达到24位时，可表现1677万种颜色，即真彩。灰度的表示法类似；
下面我们就通过图形文件的特征后缀名（就是如图bmp这样的）来逐一认识当前常见的图形文件格式：BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。
★ BMP（bit map picture）:PC机上最常用的位图格式，有压缩和不压缩两种形式，该格式可表现从2位到24位的色彩，分辨率也可从480x320至1024x768。该格式在Windows环境下相当稳定，在文件大小没有限制的场合中运用极为广泛。
★ DIB(device independent bitmap）:描述图像的能力基本与BMP相同，并且能运行于多种硬件平台，只是文件较大。
★ PCP（PC paintbrush）:由Zsoft公司创建的一种经过压缩且节约磁盘空间的PC位图格式，它最高可表现24位图形（图像）。过去有一定市场，但随着JPEG的兴起，其地位已逐渐日落终天了。
★ DIF（drawing interchange formar）:AutoCAD中的图形文件，它以ASCII方式存储图形，表现图形在尺寸大小方面十分精确，可以被CorelDraw，3DS等大型软件调用编辑。
★ WMF（Windows metafile format）:Microsoft Windows图元文件，具有文件短小、图案造型化的特点。该类图形比较粗糙，并只能在Microsoft Office中调用编辑。
★ GIF（graphics interchange format）:在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式。缺点是存储色彩最高只能达到256种。
★ JPG（joint photographics expert group）:可以大幅度地压缩图形文件的一种图形格式。对于同一幅画面，JPG格式存储的文件是其他类型图形文件的1/10到1/20，而且色彩数最高可达到24位，所以它被广泛应用于Internet上的homepage或internet上的库。
★ TIF（tagged image file format）:文件体积庞大，但存储信息量亦巨大，细微层次的信息较多，有利于原稿阶调与色彩的复制。该格式有压缩和非压缩两种形式，最高支持的色彩数可达16M。
★ EPS（encapsulated PostScript）:用PostScript语言描述的ASCII图形文件，在PostScript图形打印机上能打印出高品质的图形（图像），最高能表示32位图形（图像）。该格式分为Photoshop EPS格式adobeillustrator EPS和标准EPS格式，其中后者又可以分为图形格式和图像格式。
★ PSD（photoshop standard）:Photoshop中的标准文件格式，专门为Photoshop而优化的格式。
★ CDR（coreldraw）:CorelDraw的文件格式。另外，CDX是所有CorelDraw应用程序均能使用的图形（图像）文件，是发展成熟的CDR文件。
★ IFF（image file format）:用于大型超级图形处理平台，比如AMIGA机，好莱坞的特技大片多采用该图形格式处理。图形（图像）效果，包括色彩纹理等逼真再现原景。当然，该格式耗用的内存外存等的计算机资源也十分巨大。
★ TGA（tagged graphic）:是True vision公司为其显示卡开发的图形文件格式，创建时期较早，最高色彩数可达32位。VDA，PIX，WIN，BPX，ICB等均属其旁系。
★ PCD（Photo CD）:由KODAK公司开发，其它软件系统对其只能读取。
★ MPT（macintosh paintbrush）或MAC:Macintosh机所使用的灰度图形（图像）模式，在macintosh paintbrush中使用，其分辨率只能是720x567。
除此之外，Macintosh机专用的图形（图像）格式还有PNT、PICT、PICT2等。
第四篇声音（音频）
1多媒体中的音频处理技术
多媒体涉及到多方面的音频处理技术，如:音频采集、语音编码/解码、文一－语转换、音乐合成、语音识别与理解、音频数据传输、音频一－视频同步、音频效果与编辑等。其中数字音频是个关键的概念，它指的是一个用来表示声音强弱的数据序列，它是由模拟声音经抽样（即每隔一个时间间隔在模拟声音波形上取一个幅度值）量化和编码（即把声音数据写成计算机的数据格式）后得到的。计算机数字CD、数字磁带（DAT）中存储的都是数字声音。模拟一－数字转换器把模拟声音变成数字声音；数字一－模拟转换器可以恢复出模拟来的声音。
一般来讲，实现计算机语音输出有两种方法:一是录音/重放，二是文一－语转换。第二种方法是基于声音合成技术的一种声音产生技术，它可用于语音合成和音乐合成。而第一种方法是最简单的音乐合成方法，曾相继产生了应用调频（FM）音乐合成技术和波形表（wavetable）音乐合成技术。
2乐器数字接口MIDI的概念
现在我们用的最多的音频名词之一MIDI（musical instrument digital interface）是作为“乐器数字接口”的缩写出现的，并用它来泛指数字音乐的国际标准。由于它定义了计算机音乐程序、合成器及其他电子设备交换信息和电子信号的方式，所以可以解决不同电子乐器之间不兼容的问题。另外，标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件，利用MIDI文件演奏音乐，所需的存储量最少。
至于MIDI文件，是指存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键通道号、音长、音量和力度（击键时，键达到最低位置的速度）。由于MDDI文件是一系列指令，而不是波形，它需要的磁盘空间非常少；并且现装载MIDI文件比波形文件容易的多。这样，在设计多媒体节目时，我们可以指定什么时候播放音乐，将有很大的灵活性。在以下几种情况下，使用MIDI文件比使用波形音频更合适:需要播放长时间高质量音乐，如想在硬盘上存储的音乐大于4分钟，而硬盘又没有足够的存储容量；需要以音乐作背景音响效果，同时从CD-ROM中装载其它数据，如图像、文字的显示；需要以音乐作背景音响效果，同时播放波形音频或实现文一语转换，以实现音乐和语音的同时输出。
3常见的声音文件格式
再接下来我们介绍七种目前最为流行的多媒体声音文件效果让你认识认识:
★ WAVE，扩展名为WAV：该格式记录声音的波形，故只要采样率高、采样字节长、机器速度快，利用该格式记录的声音文件能够和原声基本一致，质量非常高，但这样做的代价就是文件太大。
★ MOD，扩展名MOD、ST3、XT、S3M、FAR、669等：该格式的文件里存放乐谱和乐曲使用的各种音色样本，具有回放效果明确，音色种类无限等优点。但它也有一些致命弱点，以至于现在已经逐渐淘汰，目前只有MOD迷及一些游戏程序中尚在使用。
★ MPEG-3，扩展名MP3：现在最流行的声音文件格式，因其压缩率大，在网络可视电话通信方面应用广泛，但和CD唱片相比，音质不能令人非常满意。
★ Real Audio，扩展名RA：这种格式真可谓是网络的灵魂，强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同，它也是为了解决网络传输带宽资源而设计的，因此主要目标是压缩比和容错性，其次才是音质。
★ Creative Musical Format，扩展名CMF：Creative公司的专用音乐格式，和MIDI差不多，只是音色、效果上有些特色，专用于FM声卡，但其兼容性也很差。
★ CD Audio音乐CD，扩展名CDA：唱片采用的格式，又叫“红皮书”格式，记录的是波形流，绝对的纯正、HIFI。但缺点是无法编辑，文件长度太大。
★ MIDI，扩展名MID：目前最成熟的音乐格式，实际上已经成为一种产业标准，其科学性、兼容性、复杂程度等各方面当然远远超过本文前面介绍的所有标准（除交响乐CD、Unplug CD外，其它CD往往都是利用MIDI制作出来的），它的General MIDI就是最常见的通行标准。作为音乐工业的数据通信标准，MIDI能指挥各音乐设备的运转，而且具有统一的标准格式，能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果，而且文件的长度非常小。
总之，如果有专业的音源设备，那么要听同一首曲子的HIFI程度依次是:
原声乐器演奏〉 MIDI 〉 CD唱片〉 MOD 〉所谓声卡上的MIDI 〉 CMF，而MP3及RA要看它的节目源是采用MIDI、CD还是MOD了。
另外，在多媒体材料中，存储声音信息的文件格式也是需要认识的，共有：
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干种。
★ WAV文件：Microsoft公司的音频文件格式，它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点，以不同的量化位数（8位或16位）把这些采样点的值转换成二进制数，然后存入磁盘，这就产生了声音的WAV文件，即波形文件。Microsoft Sound System软件Sound Finder可以转换AIF SND和VOD文件到WAV格式。
★ VOC文件：Creative公司波形音频文件格式，也是声霸卡（sound blaster）使用的音频文件格式。每个VOC文件由文件头块（header block）和音频数据块（data block）组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块。如声音数据静音标识ASCII码文件重复的结果重复以及终止标志，扩展块等。
★ MIDI文件：Musical Instrument Digital Interface（乐器数字接口）的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准，以规定计算机音乐程序电子合成器和其它电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符定时和多达16个通道的乐器定义，每个音符包括键通道号持续时间音量和力度等信息。所以MIDI文件记录的不是乐曲本身，而是一些描述乐曲演奏过程中的指令。
★ RMI文件：Microsoft公司的MIDI文件格式，它可以包括标记和文本。
★ PCM文件：模拟音频信号经模数转换（A/D变换）直接形成的二进制序列，该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中，可以利用VOC-HDR程序，为PCM格式的音频文件加上文件头，而形成VOC格式。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。
★ AIF文件：Apple计算机的音频文件格式。Windows的Convert工具同样可以把AIF格式的文件换成Microsoft的WAV格式的文件。
第五篇视频（动画）
1动态图像的组成
动态图像，包括动画和视频信息，是连续渐变的静态图像或图形序列，沿时间轴顺次更换显示，从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时，我们常称作动画；当序列中每帧图像是通过实时摄取自然景象或活动对象时，我们常成为影像视频，或简称为视频。动态图像演示常常与声音媒体配合进行，二者的共同基础是时间连续性。一般意义上谈到视频时，往往也包含声音媒体。但在这里，视频（动画）特制不包含声音媒体的动态图像。
2动画的定义
什么是动画？所谓动画，就是通过以每秒15到20帧的速度(相当接近于全运动视频帧速)顺序地播放静止图像帧以产生运动的错觉。因为眼睛能足够长时间地保留图像以允许大脑以连续的序列把帧连接起来，所以能够产生运动的错觉。我们可以通过在显示时改变图像来生成简单的动画。最简单的方法是在两个不同帧之间的反复。这种方法对于指示“是”或“不是”的情况来说是很好的解决方法。另一种制作动画的方法是以循环的形式播放几个图像帧以生成旋转的效果，并且可以依靠计算时间来获得较好的回放，或用记时器来控制动画。
3常见的视频文件格式
视频信息在计算机中存放的格式有很多，目前最流行的两种格式是：
苹果公司的Quicktime和微软的AVI。
★ Quicktime：是苹果公司采用的面向最终用户桌面系统的低成本、全运动视频的方式，现在在软件压缩和解压缩中也开始采用这种方式了。其向量量化是Quicktime软件的压缩技术之一，它在最高为30帧/秒下提供的视频分辨率是320x240，其压缩率能从25到200。
★ AVI：类似于Quicktime，是微软公司采用的音频视频交错格式，也是一种桌面系统上的低成本、低分辨率的视频格式。AVI可在160x120的视窗中以15帧/秒回放视频，并可带有8位的声音，也可以在VGA或超级VGA监视器上回放。AVI很重要的一个特点是可伸缩性，使用AVI算法时的性能依赖于与它一起使用的基础硬件。
第六篇多媒体数据压缩和编码技术标准
目前，被国际社会广泛认可和应用的通用压缩编码标准大致有如下四种：
H261、JPEG、 MPEG和DVI。
★ H261：由CCITT（国际电报电话咨询委员会）通过的用于音频视频服务的视频编码解码器（也称Px64标准），它使用两种类型的压缩:一帧中的有损压缩（基于DCT）和用于帧间压缩的无损编码，并在此基础上使编码器采用带有运动估计的DCT和DPCM（差分脉冲编码调制）的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性，但关键区别是它是为动态使用设计的，并提供完全包含的组织和高水平的交互控制。
★ JPEG：全称是Joint Photogragh Coding Experts Group（联合照片专家组），是一种基于DCT的静止图像压缩和解压缩算法，它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定，并在1992年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像去掉，甚至可以减小到原图像的百分之一（压缩比100:1）。但是在这个级别上，图像的质量并不好；压缩比为20:1时，能看到图像稍微有点变化；当压缩比大于20:1时，一般来说图像质量开始变坏。
★ MPEG：是Moving Pictures Experts Group（动态图像专家组）的英文缩写，实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法，它提供的压缩比可以高达200:1，同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高（最高可达200:1)、数据失真小。
★ DVI：其视频图像的压缩算法的性能与MPEG-1相当，即图像质量可达到VHS的水平，压缩后的图像数据率约为15Mb/s。为了扩大DVI技术的应用，Intel公司最近又推出了DVI算法的软件解码算法，称为Indeo技术，它能将为压缩的数字视频文

极品钢琴娱乐性可以，专业性不足。d音乐时有些太快的音块它会隐藏起来，在隐藏音块到后该键上方会出现一小截黄线，然后系统帮你自动d响，但是不会加分，（不是和弦，跟和弦是两码事），除非你对准了。你可以通过设置关闭这个设定。但是键盘模式带几个d不响的键就有点那个了，而且现在还断更了，服务器也登不上。里面还有些功能不完善，点了会闪退。
完美钢琴专业性比较强，功能比较全面，但娱乐性略逊于极品钢琴。支持用户自己上传文件。键盘模式它先给你单排键盘，你可以自己选择单排模式、双排模式、和弦模式和对d模式，还可以随意设置展示6到52个白键（展示的黑键数量也会随之改变），非常的人性化！而且还可以随意拖动展示的键盘在全键盘（全键盘52个白键和36个黑键，总共88个琴键）中的任意位置，而极品钢琴只能拖整个八度！
而且完美钢琴还有多种管弦乐器的音色可供你下载和使用，虽然还是使用钢琴键盘，但是其音色已经变成别的乐器了！而极品钢琴没有这个功能。
除此之外，完美钢琴还可以从本地导入midi音乐文件（文件格式为mid），这种格式比较特殊，获取方式比较复杂，通常的格式转换器和音乐制作软件无法转换和制作出这种格式的文件！只有专业的midi格式转换器和制作软件才能转换和制作出来！你可以通过完美钢琴录制出来（注：录制midi并不会受到任何外界和其他软件声音的干扰），也可以通过网络获取。而极品钢琴除了服务器还能连上的时候可以上传当头像之外，无法上传其他东西。
而且完美钢琴还能看五线谱，这点极品钢琴也没有！
我承认，我接触极品钢琴的时间相对来说比较早，而且比较长。后来极品钢琴断更了，我还坚持等待更新，直到我登不上服务器，我才去寻找其他钢琴软件。一下子就发现了完美钢琴这个软件，一开始还不以为然，用了几天，发现其功能的强大后果断卸载了陪伴我将近5年的极品钢琴！
最后，这么跟你说吧，如果你只是单纯的想玩游戏，那么极品钢琴还是挺不错的！
而如果你想学会看五线谱，或者想自己d奏自己想d的音乐，又或者你对midi文件感兴趣，那么我就强烈推荐完美钢琴！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/zz/10341020.html

关于音频视频格式的问题

发表评论

评论列表（0条）