
说起来Windows工作界面下的文件名简直是随心所欲,比如:某编辑部的2000年工作计划。文件名即可用中文直接表达,而且长度最长可达256个字符,让人看起来真是一目了然。然而在Windows环境中,安装的软件中却大量存在着类似CALENDAR.EXE、GAMES.GRP等等的文件名,这又是为什么呢?原来这些文件名都是根据DOS环境的文件名命名规则而定的。
DOS环境下的文件名
在DOS下,文件名采用8+3结构,即:最长8位的文件名,由小数点分隔后再跟上最长3位的后缀名,如:READ.ME、SETUP.EXE,一般情况下文件名不允许使用汉字,只能由字母、数字和一些符号组成。如READ.ME用中文理解就是“读我”,即提示用户在使用软件前先看看这个文件的内容,以获取更多的提示信息。而更重要的是,DOS下规定用后缀名来区分各种不同的文件。
在DOS下最容易遇到的首先是可执行文件,后缀名有两类:*.exe、*.com(此处的*表示文件名任意),它们是由汇编语言或其它高级语言编出的程序经过编译后直接在DOS下运行的文件。有时由于软件功能多、内存偏小,不能一次性全部调入内存还可能有同文件名的ovl文件,如ws.exe、ws.ovl。另外还有一种文件可以直接运行,*.bat,即批处理文件,其中有许多命令或可执行文件名,主要用于提高工作效率,其中最有用的是Autoexec.bat,这个文件在开机时会被自动执行(自动执行在英文中就是Automatically execute)。而另外一种可以加载但不能直接运行的文件即是系统扩展管理文件*.sys(sys即系统system),它主要提供某些非标准设备如鼠标、扩充内存等的驱动程序,如mouse.sys、himem.sys。为了统一管理还专门规定了一个config.sys的文本文件来一次性地在开机时自动调入这些必需的设备驱动程序,这些文件一旦被误删或换名或被病毒侵袭则将直接导致系统工作不正常。
DOS下字处理产生的文件原本是可以不用后缀的,但人们常用*.txt表示(txt即文本text)。被所有的平台和所有应用程序支持。而为了管理方便,人们也可以用自己的名字做后缀来表示是自己建的文本文件,如我输入的很多文章即为*.mcj,为了便于用户在意外删掉原文件的情况下能尽快恢复原文件,许多字处理系统都提供了一种自动备份的功能,如我第二次编辑JIHUA.MCJ时(JIHUA:计划的汉语拼音),系统会先拷贝一份原文件为JIHUA.BAK。使用具有特殊格式功能的字处理软件,如求伯君先生早年推出的WPS,就会规定其后缀为.wps,用以标识是用WPS生成的文本文件。当使用字处理软件编辑高级语言程序时,后缀通常为相应语言的前三个字母(如:*.BAS即BASIC语言源程序,*.PAS为PASCAL语言程序,*.FOR为Fortran语言程序,*.C即为C语言,*.ASM即为汇编语言程序)。 伴随着可执行文件常附有以下几类文件:*.HLP即帮助文件(help)、*.CFG即配置文件(config)、*.DAT即数据文件(data)、*.LOG即日志文件(log)、*.TMP为临时文件(temporal)。
Windows环境下的文件名
绝大多数DOS文件名后缀在Windows下继续有效,但Windows本身也引出了许多种崭新的后缀名,如:*.drv为设备驱动程序(Driver)、*.fon和*.fot都是字库文件、*.grp为分组文件(Group)、*.ini为初始化信息文件 (Initiation)、*.pif为DOS环境下的可执行文件在Windows下执行时所需要的文件格式、*.crd即卡片文件(Card)、*.rec即记录器宏文件(Record)、*.wri即文本文件(Write),它是字处理write.exe生成的文件、*.doc和*.rtf也是文本文件(Document),它们是Word产生的文件、*.cal为日历文件、*.clp是剪贴板中的文件格式、*.htm和 *.html即主页文件、*.par为交换文件、*.pwl为口令文件(Password)等等。
图像文件名后缀进入多媒体世界后,大家会看到各种各样精彩的图片,会发现许多种后缀名。的确,由于各个公司在开发图形有关的软件时都自制标准,导致今日在图形方面有太多的格式,以下就是常见的几种格式:
首先是一种位图文件格式,它是一组点(像素)组成的图像,它们由图像程序生成或在扫描图像时创建。主要有Windows位图(.BMP):由Microsoft公司开发,它被Windows和Windows NT平台及许多应用程序支持。支持32位颜色,用于为Windows界面创建图标的资源文件格式,光标(.CUR、.DLL、.EXE):资源文件格式,用于创建Windows界面的光标。OS/2位图(.BMP):Microsoft公司和IBM开发的位图文件格式。它为各种 *** 作系统和应用程序所支持。支持压缩,最大的图像像素为64000×64000。画笔(.PCX):由Zsoft公司推出,它对图像数据也进行了压缩,可由PCX生伞S糜赪indows的画笔。支持24位颜色,最大图像像素是64000×64000。支持压缩。图形交换格式(.GIF): ( Graphics Interchage Format):由Compu Serve创建,它能以任意大小支持图画,通过压缩可节省存储空间,还能将多幅图画存在一个文件中。支持256色,最大图像像素是64000×64000。
Kodak Photo CD(.PCD):Eastman Kodak所开发的位图文件格式,被所有的平台所支持,PCD支持24位颜色,最大的图像像素是2048×3072,用于在CD-ROM上保存照片。
Adobe Photoshop(.PSD):Adobe Photoshop的位图文件格式,被Macintosh和MS Windows平台所支持,最大的图像像素是30000×30000,支持压缩,广泛用于商业艺术。
Macintosh绘画(.MAC):Apple公司所开发的位图文件格式。被Macintosh平台所支持,仅支持单色原图,最大图像像素是576×720。支持压缩,主要用于在Macintosh图形应用程序中保存黑白图形和剪贴画片。
动画文件的后缀名
动画文件格式用于保存包含动画框架中的图形信息。主要有:Autodesk FLIC(.FLC):即.FLI,Autodesk Animator和AnimatorPro的动画文件格式。支持256色,最大的图像像素是64000×64000,支持压缩。广泛用于动画图形中的动画序列、计算机辅助设计和计算机游戏应用程序。不大适合制作真实世界图像动画。
MacPICTS(.PCS,.PIC):Macromedia开发的动画文件格式,为Macintosh应用程序使用。支持256色,支持压缩,用于保存动画数据,是Quick Time的前身。
Microsoft资源互换文件格式,TIFF(.AVD):Microsoft公司开发的动画文件格式,被Windows、Windows NT平台和OS/2多媒体应用程序所支持,支持256色和压缩,用于在多媒体应用程序中保存音频、视频和图形信息。
MPEG(.MPEG):国际标准化组织的运动图像专家小组开发的动画文件格式。被所有平台和Xing Technologies MPEG播放器及其它应用程序所支持,支持压缩,最大图像像素是4095×4094×30帧/每秒。用于编码音频、视频、文本和图形数据。
Quick Time(.QTM):Apple计算机公司开发的动画文件格式。被Apple Macintosh和Microsoft Windows平台所支持,支持25位颜色,最大图像像素是64000×64000,支持压缩,用于保存音频和运动视频信息。
声音文件的后缀名
声音文件格式是用于保存数字音频信息的。它们主要有:
AIFF(.AIF):这是Apple计算机公司开发的声音文件格式,被Macintosh平台和应用程序所支持。支持压缩。
Amiga声音(.SVX):Commodore所开发的声音文件格式,被Amiga平台和应用程序所支持,不支持压缩。
MAC声音(.SND):Apple计算机公司开发的声音文件格式,被Macintosh平台和多种Macintosh应用程序所支持,支持某些压缩。
MIDI(.MID):国际MIDI协会开发的声音文件格式,被Windows平台和许多应用程序所支持,用于为乐器创建数字声音。
声霸(.VOC):Creative Labs公司开发的声音文件格式,被Windows和DOS平台所支持,支持压缩。
WAVE(.WAV):微软公司用作Windows平台上保存音频信息的资源格式。
压缩文件的后缀名
为了提高存储效率,许多公司都推出了压缩数据的方法和相应的软件,这类文件的使用主要通过压包和解包软件来进行,主要的后缀有:?arj、*.rar、*.lzh、*.jar。还有一些专用的压缩文件,如:*.ex_、*.dl_、*.d3_、*.cab等。
数据库类文件的后缀名
在Dbase、FoxBase、Foxpro系列软件的环境下有以下几类后缀:
.dbf 数据库文件(databasefile) .prg 命令文件(即程序Program)
.fxp 编译后的程序 .scx和.sct 屏幕文件
.fpt 备注字段文件 .frx和.frt 报表文件
.cbx和.pjt 标签文件 .mnx 和.mnt 菜单文件
.pjx和.pjt 工程文件 .app 应用文件
.cdx和.idx 索引文件 .qpr和.qpx SQL查询文件
.fp 配置文件 .ap 生成应用
.err 编译错误文件 .men 内存应用
.fky 键宏文件 .win 窗口文件
.pcb 库文件 .tmp 临时文件
.tbk 临时数据库文件
后记
用户要注意在不同的 *** 作系统下,后缀名的约定会有所不同,如在Unix下,*.p代表Pascal语言程序,*.z代表压缩文件,*.tar代表归档文件。另外,针对极特殊的设备,其驱动程序也会有特殊的后缀,如3DS显示卡的驱动程序是*.exp。还有某些公司针对自己的产品也规定了文件名后缀,如方正公司的图像排版文件规定用*.grh(即Graph)。
文件名的后缀代表着某一种类型的文件,一般会由某一种特定的软件产生和处理。只有对这些后缀名的知识有一定的了解,才能在上机的过程中知道其所以然。这儿带着大家看到了常见的一些后缀类型,实际上还有很多类型,不可能全部讲完。常言说,师傅领进门,修行在个人,以后大家在计算机世界中自己转着看吧。
多媒体知识全接触 教程第一篇 多媒体基本概念1.多媒体的定义
“多媒体”一词译自英文“Multimedia”,而该词又是由mutiple和media复合而成的。媒体(medium)原有两重含义,一是指存储信息的实体,如磁盘、光盘、磁带、半导体存储器等,中文常译作媒质;二是指传递信息的载体,如数字、文字、声音、图形等,中文译作媒介。所以与多媒体对应的一词是单媒体(Monomedia),从字面上看,多媒体就是由单媒体复合而成的啦。
多媒体技术从不同的角度有着不同的定义。比如有人定义“多媒体计算机是一组硬件和软件设备;结合了各种视觉和听觉媒体,能够产生令人印象深刻的视听效果。在视觉媒体上,包括图形、动画、图像和文字等媒体,在听觉媒体上,则包括语言、立体声响和音乐等媒体。用户可以从多媒体计算机同时接触到各种各样的媒体来源”。还有人定义多媒体是“传统的计算媒体----文字、图形、图像以及逻辑分析方法等与视频、音频以及为了知识创建和表达的交互式应用的结合体”。概括起来就是:多媒体技术,即是计算机交互式综合处理多媒体信息----文本、图形、图像和声音,使多种信息建立逻辑连接,集成为一个系统并具有交互性。简言之,多媒体技术就是具有集成性、实时性和交互性的计算机综合处理声文图信息的技术(这句话的三性可是精髓哦!)。多媒体在我国也有自己的定义,一般认为多媒体技术指的就是能对多种载体(媒介)上的信息和多种存储体(媒介)上的信息进行处理的技术。
2.多媒体的关键技术
由于多媒体系统需要将不同的媒体数据表示成统一的结构码流,然后对其进行变换、重组和分析处理,以进行进一步的存储、传送、输出和交互控制。所以,多媒体的传统关键技术主要集中在以下四类中:数据压缩技术、大规模集成电路(VLSI)制造技术、大容量的光盘存储器(CD-ROM)、实时多任务 *** 作系统。因为这些技术取得了突破性的进展,多媒体技术才得以迅速的发展,而成为像今天这样具有强大的处理声音、文字、图像等媒体信息的能力的高科技技术。
但说到当前要用于互联网络的多媒体关键技术,有些专家却认为可以按层次分为媒体处 理与编码技术、多媒体系统技术、多媒体信息组织与管理技术、多媒体通信网络技术、多媒 体人机接口与虚拟现实技术,以及多媒体应用技术这六个方面。而且还应该包括多媒体同步 技术、多媒体 *** 作系统技术、多媒体中间件技术、多媒体交换技术、多媒体数据库技术、超 媒体技术、基于内容检索技术、多媒体通信中的QoS管理技术、多媒体会议系统技术、多媒 体视频点播与交互电视技术、虚拟实景空间技术等等。
3.一般多媒体系统的组成部分
一般的多媒体系统由如下四个部分的内容组成:
多媒体硬件系统、多媒体 *** 作系统、媒体处理系统工具和用户应用软件。
★ 多媒体硬件系统:包括计算机硬件、声音/视频处理器、多种媒体输入/输出设备及信号转换装置、通信传输设备及接口装置等。其中,最重要的是根据多媒体技术标准而研制生成的多媒体信息处理芯片和板卡、光盘驱动器等。
★ 多媒体 *** 作系统:或称为多媒体核心系统(Multimedia kernel system),具有实时任务调度、多媒体数据转换和同步控制对多媒体设备的驱动和控制,以及图形用户界面管理等。
★ 媒体处理系统工具:或称为多媒体系统开发工具软件,是多媒体系统重要组成部分。
★ 用户应用软件:根据多媒体系统终端用户要求而定制的应用软件或面向某一领域的用户应用软件系统,它是面向大规模用户的系统产品。
第二篇 多媒体计算机的组成
1.多媒体个人机的解释
在多媒体计算机之前,传统的微机或个人机处理的信息往往仅限于文字和数字,只能算是计算机应用的初级阶段,同时,由于人机之间的交互只能通过键盘和显示器,故交流信息的途径缺乏多样性。为了改换人机交互的接口,使计算机能够集声、文、图、像处理于一体,人类发明了有多媒体处理能力的计算机。我们这里重点谈谈个人机(就是现在说的PC啦)。所以现在你该明白,所谓多媒体个人机(Multimedia Personal Computer, MPC)无非就是具有了多媒体处理功能的个人计算机(如早期的586机型),它的硬件结构与一般所用的个人机并无太大的差别,只不过是多了一些软硬件配置而已。一般用户如果要拥有MPC大概有两种途径:一是直接够买具有多媒体功能的PC机;二是在基本的PC机上增加多媒体套件而构成MPC。到奔Ⅱ横行的今天,对计算机厂商和开发人员来说,MPC已经成为一种必须具有的技术规范。
2.多媒体计算机的基本配置(及可选配置)
一般来说,多媒体个人计算机(MPC)的基本硬件结构可以归纳为七部分:
★ 至少一个功能强大、速度快的中央处理器(CPU);
★ 可管理、控制各种接口与设备的配置;
★ 具有一定容量(尽可能大)的存储空间;
★ 高分辨率显示接口与设备;
★ 可处理音响的接口与设备;
★ 可处理图像的接口设备;
★ 可存放大量数据的配置等;
这样提供的配置是最基本MPC的硬件基础,它们构成MPC的主机。除此以外,MPC能扩充的配置还可能包括如下几个方面:
★ 光盘驱动器:包括可重写光盘驱动器(CD-R)、WORM光盘驱动器和CD-ROM驱动器。其中CD-ROM驱动器为MPC带来了价格便宜的650M存储设备,存有图形、动画、图像、声音、文本、数字音频、程序等资源的CD-ROM早已广泛使用,因此现在光驱对广大用户来说已经是必须配置的了。而可重写光盘、WORM光盘价格较贵,目前还不是非常普及。另外,DVD出现在市场上也有些时日了,它的存储量更大,双面可达17GB,是升级换代的理想产品。
★ 音频卡:在音频卡上连接的音频输入输出设备包括话筒、音频播放设备、MIDI合成器、耳机、扬声器等。数字音频处理的支持是多媒体计算机的重要方面,音频卡具有A/D和D/A音频信号的转换功能,可以合成音乐、混合多种声源,还可以外接MIDI电子音乐设备。
★ 图形加速卡:图文并茂的多媒体表现需要分辨率高,而且同屏显示色彩丰富的显示卡的
支持,同时还要求具有Windows的显示驱动程序,并在Windows下的像素运算速度要快。所以现在带有图形用户接口GUI加速的局部总线显示适配器使得Windows的显示速度大大加快。
★ 视频卡:可细分为视频捕捉卡、视频处理卡、视频播放卡以及TV编码器等专用卡,其功能是连接摄像机、VCR影碟机、TV等设备,以便获取、处理和表现各种动画和数字化视频媒体。
★ 扫描卡:它是用来连接各种图形扫描仪的,是常用的静态照片、文字、工程图输入设备。
★ 打印机接口:用来连接各种打印机,包括普通打印机、激光打印机、彩色打印机等,打印机现在已经是最常用的多媒体输出设备之一了。
★ 交互控制接口:它是用来连接触摸屏、鼠标、光笔等人机交互设备的,这些设备将大大方便用户对MPC的使用。
★ 网络接口:是实现多媒体通信的重要MPC扩充部件。计算机和通信技术相结合的时代已经来临,这就需要专门的多媒体外部设备将数据量庞大的多媒体信息传送出去或接收进来,通过网络接口相接的设备包括视频电话机、传真机、LAN和ISDN等。
3.媒体播放器在WEB中的应用
我们知道,由于声音点播和影视点播应用还没有完全直接集成到现在的Web浏览器中,这就需要一个单独的应用程序来帮助,通常我们使用媒体播放器(Media player)来播放声音和影视。典型的媒体播放器要执行好几个功能,包括解压缩、消除抖动、错误纠正和用户播放等功能。现在可以使用像插件这种技术把媒体播放器的用户接口放在Web客户机的用户界面上,浏览器在当前Web页面上保留屏幕空间,并且由媒体播放器来管理。目前,大多数客户机使用如下几种方法来读取声音和影视文件:
★ 通过Web浏览器把声音/影视从Web服务器传送给媒体播放器;
★ 直接把声音/影视从Web服务器传送给媒体播放器
★ 直接把声音/影视从多媒体流放服务器传送给媒体播放器;
在这个过程中,媒体播放器的主要功能表现在如下四个方面:
★ 解压缩:几乎所有的声音和电视图象都是经过压缩之后存放在存储器中的,因此无论播放来自于存储器或者来自网络上的声音和影视都要解压缩。
★ 去抖动:由于到达接收端的每个声音信息包和电视图象信息包的时延不是一个固定的数值,如果不加任何措施就原原本本地把数据送到媒体播放器播放,听起来就会有抖动的感觉,甚至对声音和电视图象所表达的信息无法理解。在媒体播放器中,限制这种抖动的简单方法是使用缓存技术,就是把声音或者电视图象数据先存放在缓冲存储器中,经过一段延时之后再播放。
★ 错误处理:由于在因特网上往往会出现让人不能接收的交通拥挤,信息包中的部分信息在传输过程中就可能会丢失。如果连续丢失的信息包太多,用户接收的声音和图象质量就不能容忍。采取的办法往往是重传。
★ 用户可控制的接口:这是用户直接控制媒体播放器播放媒体的实际接口。媒体播放器为用户提供的控制功能通常包括声音的音量大小、暂停/重新开始和跳转等等。
第三篇 图像和图形
1.有关色彩的基本常识
我们知道,只要是彩色都可用亮度、色调和饱和度来描述,人眼中看到的任一彩色光都是这三个特征的综合效果。那么亮度、色调和饱和度分别指的是什么呢?
★ 亮度:是光作用于人眼时所引起的明亮程度的感觉,它与被观察物体的发光强度有关;★ 色调:是当人眼看到一种或多种波长的光时所产生的彩色感觉,它反映颜色的种类,是决定颜色的基本特性,如红色、棕色就是指色调;
★ 饱和度:指的是颜色的纯度,即掺入白光的程度,或者说是指颜色的深浅程度,对于同一色调的彩色光,饱和度越深颜色越鲜明或说越纯。通常我们把色调和饱和度通称为色度。 现在你该明白了,亮度是用来表示某彩色光的明亮程度,而色度则表示颜色的类别与深浅程度。除此之外,自然界常见的各种颜色光,都可由红(R)、绿(G)、蓝(B)三种颜色光按不同比例相配而成;同样绝大多数颜色光也可以分解成红、绿、蓝三种色光,这就形成了色度学中最基本的原理----三原色原理(RGB)。
2.目前常见的图形(图像)格式
一般来说,目前的图形(图像)格式大致可以分为两大类:一类为位图;另一类称为描绘类、矢量类或面向对象的图形(图像)。前者是以点阵形式描述图形(图像)的,后者是以数学方法描述的一种由几何元素组成的图形(图像)。一般说来,后者对图像的表达细致、真实,缩放后图形(图像)的分辨率不变,在专业级的图形(图像)处理中运用较多。
在介绍图形(图像)格式前,我们实在有必要先了解一下图形(图像)的一些相关技术指标:分辨率、色彩数、图形灰度。
★ 分辨率:分为屏幕分辨率和输出分辨率两种,前者用每英寸行数表示,数值越大图形(图像)质量越好;后者衡量输出设备的精度,以每英寸的像素点数表示;
★ 色彩数和图形灰度:用位(bit)表示,一般写成2的n次方,n代表位数。当图形(图像)达到24位时,可表现1677万种颜色,即真彩。灰度的表示法类似;
下面我们就通过图形文件的特征后缀名(就是如图.bmp这样的)来逐一认识当前常见的图形文件格式:BMP、DIB、PCP、DIF、WMF、GIF、JPG、TIF、EPS、PSD、CDR、IFF、TGA、PCD、MPT。
★ BMP(bit map picture):PC机上最常用的位图格式,有压缩和不压缩两种形式,该格式可表现从2位到24位的色彩,分辨率也可从480x320至1024x768。该格式在Windows环境下相当稳定,在文件大小没有限制的场合中运用极为广泛。
★ DIB(device independent bitmap):描述图像的能力基本与BMP相同,并且能运行于多种硬件平台,只是文件较大。
★ PCP(PC paintbrush):由Zsoft公司创建的一种经过压缩且节约磁盘空间的PC位图格式,它最高可表现24位图形(图像)。过去有一定市场,但随着JPEG的兴起,其地位已逐渐日落终天了。
★ DIF(drawing interchange formar):AutoCAD中的图形文件,它以ASCII方式存储图形,表现图形在尺寸大小方面十分精确,可以被CorelDraw,3DS等大型软件调用编辑。
★ WMF(Windows metafile format):Microsoft Windows图元文件,具有文件短小、图案造型化的特点。该类图形比较粗糙,并只能在Microsoft Office中调用编辑。
★ GIF(graphics interchange format):在各种平台的各种图形处理软件上均可处理的经过压缩的图形格式。缺点是存储色彩最高只能达到256种。
★ JPG(joint photographics expert group):可以大幅度地压缩图形文件的一种图形格式。对于同一幅画面,JPG格式存储的文件是其他类型图形文件的1/10到1/20,而且色彩数最高可达到24位,所以它被广泛应用于Internet上的homepage或internet上的图片库。
★ TIF(tagged image file format):文件体积庞大,但存储信息量亦巨大,细微层次的信息较多,有利于原稿阶调与色彩的复制。该格式有压缩和非压缩两种形式,最高支持的色彩数可达16M。
★ EPS(encapsulated PostScript):用PostScript语言描述的ASCII图形文件,在PostScript图形打印机上能打印出高品质的图形(图像),最高能表示32位图形(图像)。该格式分为Photoshop EPS格式adobeillustrator EPS和标准EPS格式,其中后者又可以分为图形格式和图像格式。
★ PSD(photoshop standard):Photoshop中的标准文件格式,专门为Photoshop而优化的格式。
★ CDR(coreldraw):CorelDraw的文件格式。另外,CDX是所有CorelDraw应用程序均能使用的图形(图像)文件,是发展成熟的CDR文件。
★ IFF(image file format):用于大型超级图形处理平台,比如AMIGA机,好莱坞的特技大片多采用该图形格式处理。图形(图像)效果,包括色彩纹理等逼真再现原景。当然,该格式耗用的内存外存等的计算机资源也十分巨大。
★ TGA(tagged graphic):是True vision公司为其显示卡开发的图形文件格式,创建时期较早,最高色彩数可达32位。VDA,PIX,WIN,BPX,ICB等均属其旁系。
★ PCD(Photo CD):由KODAK公司开发,其它软件系统对其只能读取。
★ MPT(macintosh paintbrush)或MAC:Macintosh机所使用的灰度图形(图像)模式,在macintosh paintbrush中使用,其分辨率只能是720x567。
除此之外,Macintosh机专用的图形(图像)格式还有PNT、PICT、PICT2等。
第四篇 声音(音频)
1.多媒体中的音频处理技术
多媒体涉及到多方面的音频处理技术,如:音频采集、语音编码/解码、文一-语转换、音乐合成、语音识别与理解、音频数据传输、音频一-视频同步、音频效果与编辑等。其中数字音频是个关键的概念,它指的是一个用来表示声音强弱的数据序列,它是由模拟声音经抽样(即每隔一个时间间隔在模拟声音波形上取一个幅度值)量化和编码(即把声音数据写成计算机的数据格式)后得到的。计算机数字CD、数字磁带(DAT)中存储的都是数字声音。模拟一-数字转换器把模拟声音变成数字声音;数字一-模拟转换器可以恢复出模拟来的声音。
一般来讲,实现计算机语音输出有两种方法:一是录音/重放,二是文一-语转换。第二种方法是基于声音合成技术的一种声音产生技术,它可用于语音合成和音乐合成。而第一种方法是最简单的音乐合成方法,曾相继产生了应用调频(FM)音乐合成技术和波形表(wavetable)音乐合成技术。
2.乐器数字接口MIDI的概念
现在我们用的最多的音频名词之一MIDI(musical instrument digital interface)是作为“乐器数字接口”的缩写出现的,并用它来泛指数字音乐的国际标准。由于它定义了计算机音乐程序、合成器及其他电子设备交换信息和电子信号的方式,所以可以解决不同电子乐器之间不兼容的问题。另外,标准的多媒体PC平台能够通过内部合成器或连接到计算机MIDI端口的外部合成器播放MIDI文件,利用MIDI文件演奏音乐,所需的存储量最少。
至于MIDI文件,是指存放MIDI信息的标准文件格式。MIDI文件中包含音符、定时和多达16个通道的演奏定义。文件包括每个通道的演奏音符信息:键通道号、音长、音量和力度(击键时,键达到最低位置的速度)。由于MDDI文件是一系列指令,而不是波形,它需要的磁盘空间非常少;并且现装载MIDI文件比波形文件容易的多。这样,在设计多媒体节目时,我们可以指定什么时候播放音乐,将有很大的灵活性。在以下几种情况下,使用MIDI文件比使用波形音频更合适:需要播放长时间高质量音乐,如想在硬盘上存储的音乐大于4分钟,而硬盘又没有足够的存储容量;需要以音乐作背景音响效果,同时从CD-ROM中装载其它数据,如图像、文字的显示;需要以音乐作背景音响效果,同时播放波形音频或实现文一语转换,以实现音乐和语音的同时输出。
3.常见的声音文件格式
再接下来我们介绍七种目前最为流行的多媒体声音文件效果让你认识认识:
★ WAVE,扩展名为WAV:该格式记录声音的波形,故只要采样率高、采样字节长、机器速度快,利用该格式记录的声音文件能够和原声基本一致,质量非常高,但这样做的代价就是文件太大。
★ MOD,扩展名MOD、ST3、XT、S3M、FAR、669等:该格式的文件里存放乐谱和乐曲使用的各种音色样本,具有回放效果明确,音色种类无限等优点。但它也有一些致命弱点,以至于现在已经逐渐淘汰,目前只有MOD迷及一些游戏程序中尚在使用。
★ MPEG-3,扩展名MP3:现在最流行的声音文件格式,因其压缩率大,在网络可视电话通信方面应用广泛,但和CD唱片相比,音质不能令人非常满意。
★ Real Audio,扩展名RA:这种格式真可谓是网络的灵魂,强大的压缩量和极小的失真使其在众多格式中脱颖而出。和MP3相同,它也是为了解决网络传输带宽资源而设计的,因此主要目标是压缩比和容错性,其次才是音质。
★ Creative Musical Format,扩展名CMF:Creative公司的专用音乐格式,和MIDI差不多,只是音色、效果上有些特色,专用于FM声卡,但其兼容性也很差。
★ CD Audio音乐CD,扩展名CDA:唱片采用的格式,又叫“红皮书”格式,记录的是波形流,绝对的纯正、HIFI。但缺点是无法编辑,文件长度太大。
★ MIDI,扩展名MID:目前最成熟的音乐格式,实际上已经成为一种产业标准,其科学性、兼容性、复杂程度等各方面当然远远超过本文前面介绍的所有标准(除交响乐CD、Unplug CD外,其它CD往往都是利用MIDI制作出来的),它的General MIDI就是最常见的通行标准。作为音乐工业的数据通信标准,MIDI能指挥各音乐设备的运转,而且具有统一的标准格式,能够模仿原始乐器的各种演奏技巧甚至无法演奏的效果,而且文件的长度非常小。
总之,如果有专业的音源设备,那么要听同一首曲子的HIFI程度依次是:
原声乐器演奏 〉 MIDI 〉 CD唱片 〉 MOD 〉 所谓声卡上的MIDI 〉 CMF,而MP3及RA要看它的节目源是采用MIDI、CD还是MOD了。
另外,在多媒体材料中,存储声音信息的文件格式也是需要认识的,共有:
WAV文件、VOC文件、MIDI文件、RMI文件、PCM文件以及AIF文件等若干种。
★ WAV文件:Microsoft公司的音频文件格式,它来源于对声音模拟波形的采样。用不同的采样频率对声音的模拟波形进行采样可以得到一系列离散的采样点,以不同的量化位数(8位或16位)把这些采样点的值转换成二进制数,然后存入磁盘,这就产生了声音的WAV文件,即波形文件。Microsoft Sound System软件Sound Finder可以转换AIF SND和VOD文件到WAV格式。
★ VOC文件:Creative公司波形音频文件格式,也是声霸卡(sound blaster)使用的音频文件格式。每个VOC文件由文件头块(header block)和音频数据块(data block)组成。文件头包含一个标识版本号和一个指向数据块起始的指针。数据块分成各种类型的子块。如声音数据静音标识ASCII码文件重复的结果重复以及终止标志,扩展块等。
★ MIDI文件:Musical Instrument Digital Interface(乐器数字接口)的缩写。它是由世界上主要电子乐器制造厂商建立起来的一个通信标准,以规定计算机音乐程序 电子合成器和其它电子设备之间交换信息与控制信号的方法。MIDI文件中包含音符定时和多达16个通道的乐器定义,每个音符包括键通道号持续时间音量和力度等信息。所以MIDI文件记录的不是乐曲本身,而是一些描述乐曲演奏过程中的指令。
★ RMI文件:Microsoft公司的MIDI文件格式,它可以包括图片标记和文本。
★ PCM文件:模拟音频信号经模数转换(A/D变换)直接形成的二进制序列,该文件没有附加的文件头和文件结束标志。在声霸卡提供的软件中,可以利用VOC-HDR程序,为PCM格式的音频文件加上文件头,而形成VOC格式。Windows的Convert工具可以把PCM音频格式的文件转换成Microsoft的WAV格式的文件。
★ AIF文件:Apple计算机的音频文件格式。Windows的Convert工具同样可以把AIF格式的文件换成Microsoft的WAV格式的文件。
第五篇 视频(动画)
1.动态图像的组成
动态图像,包括动画和视频信息,是连续渐变的静态图像或图形序列,沿时间轴顺次更换显示,从而构成运动视感的媒体。当序列中每帧图像是由人工或计算机产生的图像时,我们常称作动画;当序列中每帧图像是通过实时摄取自然景象或活动对象时,我们常成为影像视频,或简称为视频。动态图像演示常常与声音媒体配合进行,二者的共同基础是时间连续性。一般意义上谈到视频时,往往也包含声音媒体。但在这里,视频(动画)特制不包含声音媒体的动态图像。
2.动画的定义
什么是动画?所谓动画,就是通过以每秒15到20帧的速度(相当接近于全运动视频帧速)顺序地播放静止图像帧以产生运动的错觉。因为眼睛能足够长时间地保留图像以允许大脑以连续的序列把帧连接起来,所以能够产生运动的错觉。我们可以通过在显示时改变图像来生成简单的动画。最简单的方法是在两个不同帧之间的反复。这种方法对于指示“是”或“不是”的情况来说是很好的解决方法。另一种制作动画的方法是以循环的形式播放几个图像帧以生成旋转的效果,并且可以依靠计算时间来获得较好的回放,或用记时器来控制动画。
3.常见的视频文件格式
视频信息在计算机中存放的格式有很多,目前最流行的两种格式是:
苹果公司的Quicktime和微软的AVI。
★ Quicktime:是苹果公司采用的面向最终用户桌面系统的低成本、全运动视频的方式,现在在软件压缩和解压缩中也开始采用这种方式了。其向量量化是Quicktime软件的压缩技术之一,它在最高为30帧/秒下提供的视频分辨率是320x240,其压缩率能从25到200。
★ AVI:类似于Quicktime,是微软公司采用的音频视频交错格式,也是一种桌面系统上的低成本、低分辨率的视频格式。AVI可在160x120的视窗中以15帧/秒回放视频,并可带有8位的声音,也可以在VGA或超级VGA监视器上回放。AVI很重要的一个特点是可伸缩性,使用AVI算法时的性能依赖于与它一起使用的基础硬件。
第六篇 多媒体数据压缩和编码技术标准
目前,被国际社会广泛认可和应用的通用压缩编码标准大致有如下四种:
H.261、JPEG、 MPEG和DVI。
★ H.261:由CCITT(国际电报电话咨询委员会)通过的用于音频视频服务的视频编码解码器(也称Px64标准),它使用两种类型的压缩:一帧中的有损压缩(基于DCT)和用于帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的DCT和DPCM(差分脉冲编码调制)的混合方式。这种标准与JPEG及MPEG标准间有明显的相似性,但关键区别是它是为动态使用设计的,并提供完全包含的组织和高水平的交互控制。
★ JPEG:全称是Joint Photogragh Coding Experts Group(联合照片专家组),是一种基于DCT的静止图像压缩和解压缩算法,它由ISO(国际标准化组织)和CCITT(国际电报电话咨询委员会)共同制定,并在1992年后被广泛采纳后成为国际标准。它是把冗长的图像信号和其它类型的静止图像去掉,甚至可以减小到原图像的百分之一(压缩比100:1)。但是在这个级别上,图像的质量并不好;压缩比为20:1时,能看到图像稍微有点变化;当压缩比大于20:1时,一般来说图像质量开始变坏。
★ MPEG:是Moving Pictures Experts Group(动态图像专家组)的英文缩写,实际上是指一组由ITU和ISO制定发布的视频、音频、数据的压缩标准。它采用的是一种减少图像冗余信息的压缩算法,它提供的压缩比可以高达200:1,同时图像和音响的质量也非常高。现在通常有三个版本:MPEG-1、MPEG-2、MPEG-4以适用于不同带宽和数字影像质量的要求。它的三个最显著优点就是兼容性好、压缩比高(最高可达200:1)、数据失真小。
★ DVI:其视频图像的压缩算法的性能与MPEG-1相当,即图像质量可达到VHS的水平,压缩后的图像数据率约为1.5Mb/s。为了扩大DVI技术的应用,Intel公司最近又推出了DVI算法的软件解码算法,称为Indeo技术,它能将为压缩的数字视频文
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)