
A 对象代码库文件
AAM Authorware shocked文件
AAS Authorware shocked包
ABF Adobe二进制屏幕字体
ABK CorelDRAW自动备份文件
ABS 该类文件有时用于指示一个摘要(就像在一篇有关科学方面的文章的一个摘要或概要,取自abstract)
ACE Ace压缩档案格式
ACL CorelDRAW 6键盘快捷键文件
ACM Windows系统目录文件
ACP Microsoft office助手预览文件
ACR 美国放射医学大学文件格式
ACT Microsoft office助手文件
ACV OS/2的驱动程序,用于压缩或解压缩音频数据
AD After Dark屏幕保护程序
ADA Ada源文件(非-GNAT)
ADB Ada源文件主体(GNAT);HP100LX组织者的约定数据库
ADD OS/2用于引导过程的适配器驱动程序
ADF Amiga磁盘文件
ADI AutoCAD设备无关二进制绘图仪格式
ADM After Dark多模块屏幕保护;Windows NT策略模板
ADP FaxWork用于传真调制解调器的交互安装文件;Astound Dynamite文件
ADR After Dark随机屏幕保护;Smart Address的地址簿
ADS Ada源文件说明书(GNAT)
AFM Adobe的字体尺度
AF2,AF3 ABC的FlowChat文件
AI Adobe Illustrator格式图形
AIF,AIFF 音频互交换文件,Silicon Graphic and Macintosh应用程序的声音格式
AIFC 压缩AIF
AIM AOL即时信息传送
AIS ACDSee图形序列文件;Velvet Studio设备文件
AKW RoboHELP的帮助工程中所有A-关键词
ALAW 欧洲电话音频格式
ALB JASC Image Commander相册
ALL 艺术与书信库
AMS Velvet Studio音乐模块(MOD)文件;Extreme的Tracker模块文件
ANC Canon Computer的调色板文件,包含一系列可选的颜色板
ANI Windows系统中的动画光标
ANS ANSI文本文件
ANT SimAnt For Windows中保存的游戏文件
API Adobe Acrobat使用的应用程序设计接口文件
APR Lotus Approach 97文件
常用文件扩展名及含义(B开头)
BIN 二进制文件
BK,BK$ 有时用于代表备份版本
BKS IBM BookManager Read书架文件
BMK 书签文件
BMP Windows或OS/2位图文件
BMI Apogee BioMenace数据文件
BOOK Adobe FrameMaker Book文件
BOX Lotus Notes的邮箱文件
BPL Borlard Delph 4打包库
BQY BrioQuery文件
BRX 用于查看多媒体对象目录的文件
BSC MS Developer Studio浏览器信息文件
BSP Quake图形文件
BS1 Apogee Blake Stone数据文件
BS_ Microsoft Bookshelf Find菜单外壳扩展名
BTM Norton 应用程序使用的批处理文件
BUD Quicken的备份磁盘
BUN CakeWalk 声音捆绑文件(一种MIDI程序)
BW SGI黑白图像文件
BWV 商业波形文件
BYU BYU的电影文件格式
B4 Helix Nuts and Bolts文件
常用扩展名及含义(C开头)
C C代码文件
C0l 台风波形文件
CAB Microsoft压缩档案文件
CAD Softdek的Drafix CAD文件
CAL CALS压缩位图;日历计划表数据
CAM Casio照相机格式
CAP 压缩音乐文件格式
CAS 逗号分开的ASCⅡ文件
CAT Quicken使用 的IntellCharge分类文件
CB Microsoft干净引导文件
CBI 二进制卷格式文件(用于IBM大型机系统)
CC Visual dBASE用户自定义类文件
CCA cc:邮件文件
CCB Visual Basic动态按钮配置文件
CCF 多媒体查看器配置文件,用于OS/2
CCH Corel图表文件
CCM Lotus cc:邮箱(例如“INBOX.CCM”)
CCO CyberChat数据文件
CCT Macromedia Director Shockwave投影
CDA CD音频轨道
CDF Microsoft频道定义格式文件
CDI Philip的高密盘交互格式
CDM Visual dBASE自定义数据模块文件
CDR CorelDRAW绘图文件;原始音频CD数据文件
CDT CorelDRAW模板
CDX CorelDRAW压缩绘图文件;Microsoft Visual FoxPro索引文件
CEL CIMFast事件语言文件
CER 证书文件(MIME x-x509-ca-cert)
CFB Compton的多媒文件
CFG 配置文件
CFM CotdFusion模板文件;Visual dBASE Windows用户定制表单
CGI 公共网关接口脚本文件
CGM 计算机图形元文件
CH OS/2配置文件
CHK 由Windows磁盘碎片整理器或磁盘扫描保存的文件碎片
CHM 编译过的HTML文件
CHR 字符集(字体文件)
CHP Ventura Publisher章节文件
CHT ChartViem文件;Harvard Graphics矢量文件
CIF Adaptec CD 创建器 CD映像文件
CIL Clip Gallery下载包
CIM SimCity 2000文件
CIN OS/2改变控制文件用于跟踪INI文件中的变化
CK1 iD/Apogee Commander Keen 1数据文件
CK2 iD/Apogee Commander Keen 2数据文件
CK3 iD/Apogee Commander Keen 3数据文件
CK4 iD /Apogee Commander Keen 4数据文件
CK5 iD /Apogee Commander Keen 5数据文件
CK6 iD /Apogee Commander Keen 6数据文件
CLASS Java类文件
CLL Crick Software Clicker文件
CLP Windows 剪贴板文件
CLS Visual Basic类文件
CMD Windows NT,OS/2的命令文件;DOS CD/M命令文件;dBASEⅡ程序文件
CMF Corel元文件
CMG Chessmaster保存的游戏文件
CMP JPEG位图文件;地址文档
CMV Corel Move动画文件
CMX Corel Presentation Exchange图像
CNF Telnet,Windows和其他其内格式会发生改变的应用程序使用的配置文件
CNM Windows应用程序菜单选项和安装文件
CNQ Compuworks Design Shop文件
CNT Windows(或其他)系统用于帮助索引或其他目的内容文件
COB TrueSpace 2对象文件
COD Microsoft C编译器产生的可显示机器码/汇编代码文件,其中附有源C代码作为注释
COM 命令文件(程序)
CPD,CPE 传真覆盖文档
CPI Microsoft MS-DOS代码页信息文件
CPL 控制面板扩展名,Corel颜色板
CPO Corel打印存储文件
CPP C++代码文件
CPR Corel提供说明书文件
CPT Corel 照片-绘画图像
CPX Corel Presentation Exchange压缩图形文件
CRD Windows Cardfile文件
CRP Corel 提供的运行时介绍文件;Visual dBASE自定义报表文件
CRT 认证文件
CSC Corel脚本文件
CSP PC Emcee On_Screen图像
CSS 瀑布式表格文件
CST Macromedia Director Cast文件
CSV 逗号分隔的值文件
CT Scitex CT位图文件;Paint Shop Pro Grapic编辑器文件
CTL 通常用于表示一个包含控件信息的文件;FaxWork用它来保持有关每个传真收到或发出的信息
CUE Microsoft提示牌数据文件
CUR Windows光标文件
CUT Dr Halo位图文件
CV Corel版本的档案文件;Microsoft CodeView信息屏幕文件
CWK ClarisWorks数据文件.
CWS ClarisWorks模块
CXT Macromedia Director受保护的(不可编辑的)投影文件
CXX C++源代码文件
常用扩展名及含义(D开头)
DAT 数据文件;WrodPerfect合并数据文件;用于一些MPEG格式的文件
DB Borland的Paradox 7表
DBC Microsoft Visual FoxPro数据库容器文件
DBF dBASE文件,一种由Ashton-Tate创建的格式,可以被ACT!、Lipper、FoxPro、Arago、Wordtech、Xbase和类似数据库或与数据库有关产品识别;可用数据文件(能被Excel 97打开);Oracle 8.1.x表格空间文件
DBX DataBearn图像;Microsoft Visual FoxPro表格文件
DCM DCM模块格式文件
DCR 冲击波文件
DCS 桌面颜色分隔文件
DCT Microsoft Visual FoxPro数据库容器
DCU Delphi编译单元文件
DCX Microsoft Visual FoxPro数据库容器;基于PCX的传真图像;宏
DC5 DataCAD绘图文件
DDF Btrieve或Xtrieve数据定义文件,它包含用于描述Btrieve或Xtrieve文件的元数据
DDIF Digital Equipment或 Compaq格式,用于保存他们图像与字处理文档
DEF SmartWareⅡ数据文件;C++模块定义文件
DEFI Oracle 7 卸载脚本文件
DEM 用于表示数字高度模型的USGS基准的文件
DER 认证文件
DEWF Macintosh Sound Cap/Sound Edit录音设备格式
DGN Macintosh 95 CAD绘图文件
DIB 设备无关位图
DIC 目录
DIF 可进行数据互换的电子表格
DIG DigiLink格式;Sound DesignerⅠ音频文件
DIR MacromediaDirector文件
DIZ 描述文件
DLG C++对话框脚本文件
DLL 动态链接库
DLS 可下载声音文件
DMD Visual dBASE数据模块文件
DMF X-Trakker音乐模块(MOD)文件
DOC FrameMaker或FrameBuilder文档;Word Star文档、Word Perfect文档、Microsoft Word文档;DisplayWrite文档
DOT Microsoft Word文档模板
DPL Borland Delph3压缩库
DPR Borland Delphi工程头文件
DRAW Acorn的基于对象的矢量图像文件
DRV 驱动程序
DRW Micrografx Designer/Draw;Pro/E绘画文件
DSF Micrografx Designer VFX文件
DSG DOOM保存的文件
DSM Dynamic Studio音乐模块(MOD)文件
DSP Microsoft Developer Studio工程文件
DSQ Corel QUERY(查询)文件
DST 刺绣机图形文件
DSW Microsoft Developer Studio工作区文件
DTA Word Bank(世界银行)的STARS数据文件
DTD SGML文档类型定义(DTD)文件
DTED 地面高度数字数据(图形的数据格式)文件
DTF Symantec Q&A相关的数据库数据文件
DTM DigiTrakker模块文件
DUN Microsoft拔号网络导出文件
DV 数字视频文件(MIME)
DWD DiamondWare数字化文件
DWG AutoCAD工程图文件;AutoCAD或Generic CADD老版本的绘图格式
DXF 可进行互交换的绘图文件格式,二进制的DWG格式的文本表示;数据交换文件
DXR Macromedia Director受保护(不可编辑)电影文件
D64 Commodore的64位模拟磁盘图像文件
常用扩展名及含义(E开头)
EDA Ensoniq ASR磁盘映像
EDD 元素定义文档(FrameMaker+SGML文档)
EDE Ensoniq EPS磁盘映像
EDK Ensoniq KT磁盘映像
EDQ Ensoniq SQ1/SQ2/Ks32磁盘映像
EDS Ensoniq SQ80磁盘映像
EDV Ensoniq VFX-SD磁盘映像
EFA Ensoniq ASR文件
EFE Ensoniq EPS文件
EFK Ensoniq KT文件
EFQ Ensoniq SQ1/SQ2/Ks32文件
EFS Ensoniq SQ80文件
EFV Ensoniq VFX-SD文件
EMD ABT扩展模块
EMF Windows增强元文件
EML Microsoft Outlook Express邮件消息(MIME RTC822)文件
ENC 重演文件
ENFF 中性文件格式扩展名
EPHTML Perl解释增强HTML文件
EPS 压缩的PostScript图像
EPSF 压缩的PostScript文件
ERI ERWin文件
ERR 当RobooHELP帮助编译器企图编译一个帮助系统源文件时用来存储错误消息的文件
EPX ERWin文件
ESPS ESPS音频文件
EUI Ensoniq ESP家族的压缩磁盘映像
EVY 特使文档
EWL Microsoft Encarta文档
EXC Microsoft Word禁止字字典
EXE 可执行文件(程序)
常用扩展名及含义(F开头)
F FORTRAN文件
F2R Farandoyle线性模块格式
F3R Farandoyle分块线性模块格式
F77 FORTRAN文件
F90 FORTRAN文件
FAR Fradole Composer音乐模块(MOD)文件
FAV Microsoft Outlook导航条
FAX 传真类型图像
FBK Navison 金融备份
FCD 虚拟CD-ROM
FDB Navison 金融数据库
FDF Adobe Acrobat表单文档文件
FEM CADRE有限元素网络文件
FFA,FFL,FFO,FFK Microsoft快速查找文件
FFF GUS PnP银行文件格式
FH3 Aldus Freehand 3绘图文件
FIF Fractal图像文件
FIG REND386/AVRIL使用的文件格式
FITS CCD照相机图像;灵活图像传输系统
FLA Macromedia Flash电影
FLC Autodesk FLIC动画文件
FLF Corel Paradox产生的格式:Navison Financials许可文件;OS/2驱动程序文件
PLI Autodesk FLIC动画
FLT StarTrekker音乐模块(MOD)文件;MultiGen Inc的Open Flight使用的文件格式;Corel过滤器文件
FM Adobe FrameMaker文档
FMB Oracle4.0版或以后版本表单的二进制源代码文件
FML 文件镜象列表(GetRight)
FMT Oracle 4.0版或以后版本表单的文本格式;Microsoft Schedule+ 打印文件
FMX Oracle 4.0版或以后版本可执行表单
FND Microsoft Explorer保存的搜索文件(Find applet)
FNG 字体组文件(字体导航器,Font Navigator)
FNK Funk Tracker模块格式
FOG Fontographer模块字体
FON 系统字体
FOR FORTRAN文件
FOT 字体相关文件
FP FileMaker Pro文件
FP1 Flying Pigs for Windows数据文件
FP3 FileMaker Pro文件
FPT FileMaker Pro文件;Microsoft Fox Pro备注字体文件
FPX FlashPix位图
FRM 表单;Frame Maker或Frame Builder文档;Oracle可执行表(3.0版或早期版本);Visual Basic表单;WordPerfect Merge表单;DataCAD标志报表文件
FRT Microsoft FoxPro报表文件
FRX Visual Basic表单文本;Microsoft FoxPro报表文件
FSF fPrint Audit Tool文件格式
FSL Borland的Paradox 7表单;Corel Paradox保存的表单
FSM Parandoyle示例格式
FT Lotus Notes全文本索引
FTG 全文本搜索组文件,由Windows帮助系统查找时产生——可以删除,并在需要时重建起来
FTS 全文本搜索引文件,由Windows帮助系统查找时产生
FW2 Framework Ⅱ文件
FW3 Framework Ⅲ文件
FW4 Framework Ⅳ文件
FXP 经Microsoft FoxPro编译的源文件
FZB Casio FZ-1银行转储
FZF Casio FZ-1完全转储
FZV Casio FZ-1声音转储
常用扩展名及含义(G开头)
G721 Raw CCITT G.721 $bit ADPCM格式数据
G723 Raw CCITT G.723 3或5bit ADPCM格式数据
GAL Corel多媒体管理器相集
GCD Generic CADD绘画文件(后续版本)
GCP Ground Control Point(地面控制点)文件,用于远景数据形成图像过程,经常用于生成图工程—CHIPS(copenhagen image processing system)使用这些文件
GDB InterBase数据库文件
GDM 铃声、口哨声和声音板模块格式
GED GEDCOM 系谱数据文件,用于记录和交换系谱数据的流行格式;图形环境文档绘画
GEM GEM元文件
GEN Ventura产生的文本文件
GetRight GetRight未完成的下载文件
GFC Patton&Patton FlowCharting 4 flowchart文件
GFI,GFX Genigraphics图形链接表示文件
GHO Norton 克隆磁盘映像
GID Windows 95全局索引文件(包括帮助状态)
GIF CompuServe位图文件
GIM,GIX Genigraphics图形链接介绍文件
GKH Ensoniq EPS家簇磁盘映像文件
GNA Genigraphics图形链接介绍文件
GNT 生成代码,Micro Focus属性格式里的可执行代码
GNX Genigraphics图形链接介绍文件
GRA Microsoft Graph文件
GRD 用于远程视景数据产生地图过程的格式文件,通常应用于形成地图工程—CHIPS(copenhagen image processing system)使用这些文件
GRF Grapher(Golden Software公司)图形文件
GRP 程序管理组
GSM Raw GSM 6.10音频流;Raw“byte aligned(比特对齐的)” GSM 6.10音频流;US Robotics语音调制解调器
GTK Graoumftracker(老)音乐模块(MOD)文件
GT2 Graoumftracker(新)音乐模块(MOD)文件
GWX,GWZ Cenigraphis图形链接介绍文件
GZ UNIX gzip压缩文件
常用扩展名及含义(H开头)
H C程序头文件
HCM IBM HCM配置文件
HCOM 声音工具HCOM格式
HCR IBM HCD/HCM产品配置文件
HDF 高级计算机应用程序本地中心(NCSA) geospatial Hierarchial数据格式文件
HED HighEdit文档
HEL Microsoft Hellbender格式保存的游戏文件
HEX Macintosh BinHex2.0文件
HGL HP图形语言绘图文件
HH 映射文件,包括一些话题ID和在帮助文件系统中话题的映射数字—允许运行中应用程序发送给用户合适的上下文帮助话题
HLP 帮助文件;Date CAD Windows帮助文件
HOG Lucas Arts的Dark Forces WAD文件
HPJ Visual Basic帮助工程
HPP C++程序头文件
HQX Macintosh BinHex 4.0文件
HST 历史文件
HT HyperTerminal(超级终端)
HTM,HTML 超文本文档
HTT Microsoft超文本模板
HTX 扩展HTML模板
HXM Descent2 HAM文件扩展
常用扩展名及含义(I开头)
ICA Citrix文件
ICB Targa位图文件
ICC Kodak打印机格式文件
ICL 图标库文件
ICM 图形颜色匹配配置文件
ICO Windows图标
IDB MSDev中间层文件
IDD MIDI设备定义
IDF MIDI设备定义(Windows 95需要的文件)
IDQ Internet数据查询文件
IDX Microsoft FoxPro相关数据库索引文件;Symantec Q&A相关数据库索引文件;Microsoft Outlook Express文件
IFF 交换格式文件;Amiga ILBM
IGES 初始图形交换说明文件
IGF 插入系统元文件
IIF QuickBooks for Windows交换文件
ILBM 位图图形文件
IMA WinImage磁盘映像文件
IMG GEM映像
IMZ WinImage压缩磁盘映像文件
INC 汇编语言或动态服务器包含文件
INF 信息文件
INI 初始化文件;MWave DSP Synth的“nwsynth.ini” GMS安装;Cravis Ultrasound bank安装
INP Oracle 3.0版或早期版本的表单源代码
INRS INRS远程通信声频
INS InstallShield安装脚本;X-Internet签字文件;Ensoniq EPS字簇设备;Cell/ⅡMAC/PC抽样设备
INT 中间代码,当一个源程序经过语法检查后编译产生一个可执行代码
IOF Findit文档
IQY Microsoft Internet查询文件
ISO 根据ISD 9660有关CD-ROM文件系统标准列出CD-ROM上的文件
ISP X-Internet签字文件
IST 数字跟踪设备文件
ISU InstallShield卸装脚本
IT 脉冲跟踪系统音乐模块(MOD)文件
ITI 脉冲跟踪系统设备
ITS 脉冲跟踪系统抽样,Internet文档位置
IV Open Inventor中使用的文件格式
IVD 超过20/20微观数据维数或变量等级文件
IVP 超过20/20的用户子集配置文件
IVT 超过20/20表或集合数据文件
IVX 超过20/20微数据目录文件
IW Idlewild屏幕保护程序
IWC Install Watch文档
常用扩展名及含义(J开头)
J62 Ricoh照相机格式
JAR Java档案文件(一种用于applet和相关文件的压缩文件)
JAVA Java源文件
JBF Paint Shop Pro图像浏览文件
JFF,JFIF,JIF JPEG文件
JMP SAS的JMPDiscovery表格统计文件
JN1 Epic MegaGames的Jill of the Jungle数据文件
JPE,JPEG,JPG JPEG图形文件
JS javascript源文件
JSP HTML网页,其中包含有对一个Java servlet的参考
JTF JPEG位图文件
常用扩展名及含义(K开头)
K25 Kurzweil 2500抽样文件
KAR 卡拉OK MIDI文件(文本+MIDI)
KDC Kodak光增强器
KEY DataCAD图标工具条文件
KFX KoFak Group 4图像文件
KIZ Kodak数字明信片文件
KKW RoboHELP帮助工程索引设计器中与主题无关的K开头的所有关键字
KMP Korg Trinity KeyMap文件
KQP Konica照相机本地文件
KR1 Kurzweil 2000抽样(多软驱)文件
KRZ Kurzweil 2000抽样文件
KSF Korg Trinity抽样文件
KYE Kye游戏数据
常用扩展名及含义(L开头)
LAB Visual dBASE标签文件
LBM Deluxe Paint位图文件
LBT,LBX Microsoft FoxPro标签文件
LDB Microsoft Access加锁文件
LDL Corel Paradox分发库
LEG Legacy文档
LES Logitech娱乐系统游戏配置文件(与REC文件一样)
LFT 3D Studio(DOS)放样文件
LHA LZH更换文件后缀
LIB 库文件
LIN DataCAD线型文件
LIS 结构化查询报告(SQR)程序产生的输出文件
LLX Laplink交换代理
LNK Windows快捷方式文件
LOG 日志文件
LPD Helix Nut和Bolt文件
LRC Intel可视电话文件
LSL Corel Paradox保存的库文件
LSP AutoLISP、CommonLISP和其他LISP语言文件
LST 列表文件
LU ThoughtWing库单元文件
LVL Parallax Software的 Miner Descent/D2 Level扩展
LWLO Lightwave分层对象文件
LWOB Lightwave对象文件
LWP Lotus WordPro 96/97文件
LWSC Lightwave视景文件
LYR DataCAD层文件
LZH LH ARC压缩档案
LZS Skyroads数据文件
常用扩展名及含义(M开头)
M1V MPEG相关文件(MIME“mpeg”类型)
M3D Corel Motion 3D动画文件
M3U MPEG URL(MIME声音文件)
MAC MacPaint图像文件
MAD Microsoft Access模块文件
MAF Microsoft Access表单文件
MAG 在一些日本文件中发现的图形文件格式
MAGIC 魔力邮件监视器配置文件
MAK Visual Basil或Microsoft Visual C++工程文件
MAM Microsoft Access宏
MAN UNIX手册页输出
MAP 映射文件;Duke Nukem 3D WAD游戏文件
MAQ Microsoft Access查询文件
MAR Microsoft Access报表文件
MAS Lotus Freelance Graphics Smart Master文件
MAT Microsoft Access表;3D Studio MAX材料库
MAUD MAUD抽样格式
MAX Kinetx的3DStudio MAX文件;该格式用于一个3D场景文件;Paperport文件;OrCAD设计文件
MAZ Hover迷路数据;Division的dVS/dVISE使用的文件格式
MB1 Apogee Monster Bash数据文件
MBOX Berkeley Unix邮箱格式
MBX Microsoft Outlook保存email格式;Eudora邮箱
MCC Dailerl0呼叫卡
MCP Metrowerks CodeWarrior工程文件
MCR DataCAD键盘宏文件
MCW Microsoft Word的Macintosh文档
MDA Microsoft Access内抽入器;Microsoft Access 2.0版及其后续版本的工作组事件
MDB Microsoft Access数据库
MDE Microsoft Access MDE文件
MDL 数字跟踪器音乐模块(MOD)文件;Quake模 块文件
MDN Microsoft Access空数据库模板
MDW Microsoft Access工作组文件
MDZ Microsoft Access向导模板文件
MED 音乐编辑器,OctaMED音乐模块(MOD)文件
MER 电子表格/数据库数据交换格式;FileMaker、Excel及其他软件能识别
MET 表示管理器元文件
MFG Pro/ENGINEER制造文件
MGF 在材料与几何学里的文件格式
MHTM,MHTML MHTML文档(MIME)
MI 杂项
MIC Microsoft Image Composer文件
MID MIDI音乐
MIF Adobe FramMaker交换格式
MIFF 与机器无关格式文件
MIM,MIME,MME Internet邮件扩展格式的多用途文件,经常作为发送e-mail时在AOL里附件而创建的文件;在一个多区MIM文件里的文件能用WinZip或其他类似程序打开
MLI 3D Studio的材料库格式文件
MMF Meal Master格式;一个处方类格式;Microsoft邮件文件
MMG 超过20/20表或集会数据文件
MMM Microsoft多媒体电影
MMP Mindmapor Mind Manager文件
MN2 Descent2任务文件
MND,MNI Mandelbort for Windows
MNG 多映像网络图形
MNT,MNX Microsoft FoxPro菜单文件
MNU Visual dBASE菜单文件;Intertel Systems Interact菜单文件
MOD Fast Tracker、Star Trekker、Noise Tracker(等等)音乐模块文件;Microsoft多计划电子表格;Amiga/PC磁道文件
MOV QuickTime for Windows电影
MP2 第二层MPEG音频文件
MP3 第三层MPEG音频文件
MPA MPEG相关文件,MIME“mpeg类型”
MPE,MPEG,MPG MPEG动画文件
MPP Microsoft工程文件;CAD绘图文件格式
MPR Microsoft FoxPro菜单(已编译)
MRI MRI扫描文件
MSA 魔术阴影档案
MSDL Manchester的场景描述语言
MSG Microsoft邮件消息
MSI Windows 安装器包
MSN Microsoft网络文档;Descent Mission文件
MSP Microsoft Paint(画图)位图文件;Windows Installer路径文件
MST Windows 安装器传输文件
MTM Multi 跟踪器音乐模块(MOD)文件
MUL Ultima在线
MUS 音乐
MUS10 Mus10声音
MVB Microsoft多媒体查看器文件
MWP Lotus WordPro 97 Smart Master文件
常用扩展名及含义(N开头)
NAP NAP元文件
NCB Microsoft Developer Studio文件
NCD Norton改变目录
NCF NetWare命令文件;Lotus Notes内部剪切板
NDO 3D 低多边形建模器,Nendo
netCDF 网络公用数据表单
NFF 中性文件格式
NFT NetObject Fusion模板文件
NIL Norton光标库文件(EasyIcons-兼容)
NIST NIST Sphere声音
NLB Oracle 7数据
NLM NetWare可装载模块
NLS 用于本地化的国家语言支持文件(例如,Uniscape)
NLU Norton Live Update e-mail 触发器文件
NOD NetObject Fusion文件
NSF Lotus Notes数据库
NSO NetObject Fusion文档文件 t多媒体查看器文件
MWP Lotus WordPro 97 Smart Master文件
NST Noise Tracker音乐模块(MOD)文件
NS2 Lotus Notes数据库(第二版)
NTF Lotus Notes数据库模板
NTX CA-Clipper索引文件
NWC Noteworthy Composer歌曲文件
NWS Microsoft Outlook Express新闻消息(MIME RFC822)
常用扩展名及含义(O开头)
O01 台风声音文件
OBD Microsoft Office活页夹
OBJ 对象文件
OBZ Microsoft Office活页夹向导
OCX Microsoft对象链接与嵌入定制控件
ODS Microsoft Outlook Express邮箱文件
OFF 3D 网状物对象文件格式
OKT Oktalyzer音乐模块(MOD)文件
OLB OLE对象库
OLE OLE对象
OOGL 面向对象图形库
OPL 组织者编程语言源文件——Psion/Symbian
OPO OPL输出可执行文件
OPT Microsoft Developer Studio文件
OPX OPL扩展DLL(动态链接库)
ORA Oracle 7 配置文件
ORC Oracle 7脚本文件
ORG Lotus Organ
利用互联网预测cDNA蛋白质产物的结构和功能3王涤平综述 童坦君审校
(北京大学医学部生物化学与分子生物学系 北京100083)
摘要 人类基因组计划预计近两三年内即可完成,我们将会得到许多序列已知但未知功能的cDNA。本文简单介绍利用互联网上信息资源分析cDNA序列和预测它所编码的蛋白质的结构和功能的方法和常用工具。
关键词 互联网,cDNA,蛋白质,结构和功能预测
The protein product of cDNA:Predicting its structure and function using internet
W ANG Di2Ping,T ONG T an2Jun
(The H ealth Science Center,Peking Univer sity,Beijing100083,P.R.China)
Abstract The Human G ene Project will be completed in tw o or three years,biologist will obtain many cDNA sequences which functions are unknown.This article introduces s ome methods and tools in internet,by which we can analysis cDNA sequences and predict the structure and function of the proteins that are coded by them.
K ey w ords internet,cDNA,protein,structural and functional prediction
人类基因组计划(Human G ene Project,HG P)进展非常迅速。1999年11月人类第22条染色体的测序全部完成,这是第一条完整测序的染色体[1]。2000年5月人类第21条染色体的测序也宣布完成[2]。到1999年底约有1P3的基因组序列已经测出,目前保守估计不迟于2003年底将全部完成,人类即将步入后基因组时代。(编者注:本文发排时HG P已全部完成)。然而HG P只是一个以测序为主的结构基因组学的研究,该计划完成之后的任务更加艰巨,要阐明整个基因组基因的功能可能是21世纪整个生物学界的中心任务。为了阐述新基因的功能,科学家已经提出了功能基因组学(functional genomics)、转录子组学(transcriptomics)、蛋白质组学(proteomics)的概念。但是目前由于各方面技术的限制其速度远远跟不上潮水般涌现的新基因的步伐。近年来cDNA 克隆和测序工作进展也很快,一方面短序列片段(EST)在数据库中大量涌现,另一方面越来越多的全长cDNA得以克隆和测序,许多新型cDNA文库也被大量构建,极大地扩展了cDNA文库的应用。这样,分子生物学工作者经常会遇到一个问题:在获取一条cDNA部分或全长序列后如何判断它是属于已知或未知的某个基因、如何知道它所编码的蛋白质的结构和功能。随着计算机网络技术和生物信息学的飞速发展,利用互联网上生物信息资源对cDNA序列及其蛋白质产物的结构和功能进行分析和预测已经成为一个快速、简单可行的方法。1 常用序列数据库
G enBank由NC BI(美国国立卫生研究院生物技术中心)创建并管理,是NC BI众多数据库中最重要的一个,能提供超过55000种不同生物的所有已知的核酸及蛋白质序列和相关文献及生物学注释[3]。它与E M BL P E BI(欧洲分子生物学实验室P欧洲生物信息学研究所)的E M BL数据库及日本国立遗传学研究所的DDB J数据库是最主要的3家DNA和蛋白质序列数据库。它们分别收集各自所在区域的序列信息,每天交换各自数据库新建立的记录,每隔两三个月完整地更新一次数据库信息,这样就保证了它们几乎包括了所有已知的核酸及蛋白质序列。dbEST数据库是G enBank的一部分,它包含了cDNA片段或EST的序列数据和其它相关信息。为了管理重复的EST数据和便于信息的提取,NC BI创建了Unigene系统,它能自动地将G enBank中包括EST序列在内的DNA序列进行系统分析,形成无重复的同一基因起源的序列簇(gene2oriented clusters),每一个簇代表一个基因。NC BI现有人类、大鼠和小鼠三个Unigene库。至1999年末在人类的Unigene库中包含有超过150万个EST所形成的约83000个序列簇[4]。G S DB(G enome Sequence Database)是由NCG R(Na2 tional Center for G enome Res ources)创建管理的基因组数据库。从1999年秋开始G S DB不再接受个人实验室递交的数据,数据库的所有权转交给了G enBank。目前G S DB仍然能够提供
3国家自然科学基金重点项目(项目号39930170)与国家重点基础研究发展规划(项目号G2000057001)资助课题
・
7
4
1
・
生物技术通讯
LETTERS I N BI OTECH NO LOGY V ol.12 N o.2 May2001
© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.
序列分析和查询服务。G DB (G enome Database )是约翰・霍普金斯大学医学院的人类基因组数据库,它包括人类基因组各方面的信息如基因、克隆、断裂位点(breakpoints )、细胞遗传学标志、脆弱位点、EST 、重复序列和重叠群,另外还有人类基因组图谱、基因组突变多型性以及等位基因组频率数据的信息。
PIR (Protein In formation Res ource )和SWISS 2PROT 因收录全
面、注释详尽、重复率低和与相关数据库的广泛连接等特点而成为最常用的蛋白质序列信息综合数据库。SWISS 2PROT 创建于1987年,现在由E M BL 和SI B (瑞士生物信息学研究所)联合管理,到1999年11月SWISS 2PROT 已有约81000条序列。在SWISS 2PROT 中每个序列条目下都有参考文献、分类数据和相关注释的信息,这些信息主要包括蛋白质的功能、翻译后修饰、结构域和位点、二级和四级结构、与其它蛋白质的同源性、相关疾病及序列变异等方面的信息。由于核酸序列爆炸性的增加而数据库的注释速度有限,E M BL 和
SI B 在1996年推出了SWISS 2PROT 的补充数据库T rE BM L ,T rE BM L 是由计算机将E M BL 数据库中除了编码SWISS 2PROT
中已有序列以外的所有编码序列(C DS )翻译并注释而形成的,所以其注释的准确性比SWISS 2PROT 低
[5]
。
现在互联网上生物信息数据库种类繁多,可谓五花八门,除上述的大的综合性数据库外还有许多专业方向特异的数据库如RNA 、酶、载体、转录因子、翻译信号及各种物种的数据库等等。由于生物信息学数据库的急剧增多,专门收集生物信息学数据库目录的数据库也应运而生。Dbcat (http :P P
w w w.in fobiogen.fr P services P dbcat )有500个按不同领域(DNA 、RNA 、蛋白质、文献等)分类的生物学数据库以供检索。E BI P E M BL 新推出的SRS (Sequence Retrieval System )5.1版中也增
添了DAT ABANK S 数据库,其中含有约1300个生物学数据库,用户进入SRS 的主页(http :P P w w w.ebi.ac.uk P )选择“SRS
W orld Wide ”后即可检索DAT ABANK S
[6]
。
2 全长cDNA 的获取
在进行序列分析和结构功能预测时最好能利用全长
cDNA 序列。若只有部分cDNA 序列或EST 片段,传统方法
是通过RACE 法或重新筛选新的cDNA 文库。简单快捷的方法是通过硅片克隆(sililo cloning )的方法拼接出cDNA 全长。基本过程如下:从EST 开始利用同源性比较工具(BLAST 、
FAST A 等)在公共EST 数据库(如dbEST )中找出高度同源的EST ,通过EST 拼接,形成重叠群(contig ),然后将重叠群再次
进行BLAST 拼接直到没有新的重叠群发现即得到了完整的编码框。进入Unigene 数据库中只要输入EST 登录号就可以得到属于同一转录起始位点的其它序列。欲直接得到EST 簇及其重叠群可以登录T igem 网站(http :P P gcy.tigem.it P cgi 2
bin P uniestass.pl )的EST assembly machine ,利用EST 拼接程序(EST assembly program )即可。同样的程序还有ESTblast ,它更
为复杂和完善,该程序在HG MP 2RC (human genome mapping
project )服务器(http :P P w w w.hgmp.mrc.ac.uk P ESTblast P )上可以
提供。将含重叠群的EST 与数据库反复比较延伸就可能获得cDNA 全长。利用它就可以进一步进行序列分析和结构与功能预测。在得到cDNA 全长后就可以将其序列或数据库位名输入相应数据库或服务器进行检索、查询相关注释和预测其编码的蛋白质的结构和功能。在ESTblast 输出结果的界面上有与这些数据库和程序的超级链接,使用极为方便[7]。
3 网上序列分析和基因定位的工具
当得到一个完整的cDNA 序列后首先要进行对序列数据库的类似性检索,以鉴定是否为新基因及对基因的结构、定位及其编码的蛋白质的结构、功能进行研究。NC BI 的
BLAST 是目前广泛应用的同源性比较工具。BLAST 有5个
应用程序:Blastp 、Blastn 、Blastx 、tBlastn 、tBlastx ,应依照所需检索的和所检索的数据库是核酸或氨基酸序列及阅读框架的不同而使用,具体见表1。值得一提的是尽管许多服务器能把核酸与氨基酸序列互相转换,但是若已知氨基酸序列最好用氨基酸序列进行分析。因为DNA 序列存在阅读框架和非编码区等问题,而且氨基酸种类多,特异性识别容易。
BLAST 能对十几种指定的数据库(包括nr 、dbSTS 、dbEST 、PDB
等)进行比较。BLAST 的新版本有G apped BLAST 、PSI 2BLAST
(P osition S pecific Iterated BLAST )、BLAST 2sequences 、PHI 2BLAST (Pattern Hit Initiated BLAST )。与传统的BLAST 比较,G apped BLAST 允许在序列对排(alignment )中有部分插入或缺失,有
利于得到较大的同源片段,同时运行速度也提高了。PSI 2
BLAST 首先进行一次传统的BLAST 搜索产生序列对排从而
构建一个位置特异的轮廊(profile ),然后用此轮廓的矩阵
(matrix )代替起初的序列进行同源性搜索。PSI 2BLAST 大大
提高同源性搜索的敏感性,有助于发现蛋白质家族中的变异成员和确定新基因的功能[8]。BLAST 2sequences 通过产生一个代表序列对排的点状图(dot 2plot )来显示两个DNA 或肽序列之间的相似性。PHI 2BLAST 要求将所需查询的氨基酸序列和相应的模体一起输入,能够获得序列和结构都相对应的序列对排。另外,FAST A 和SSE ARCH 也是相似性比较程序,与BLAST 相比运行速度慢一些但效果更好。
Locus Link (http :P P w w w.ncbi.nlm.nih.g ov P Locus Link P )和RefSeq (http :P P w w w.ncbi.nlm.nih.g ov P Locus Link P reseq.html )是NC BI 新提供的方便快速的获取基因及其产物的详细信息及
基因定位的服务器。用户可以通过多种途径(基因的名称、缩写及序列等)搜索数据库就可以得到相应基因的LocusI D
(数据库位名)、简述及染色体定位。点击LocusI D 即能得到
关于该基因的更为详尽的说明,更方便的是每个基因都与P
(PubMed )、O (OMI M )、R (Refseq )、G (G enBank )、U (UniG ene )、V (dbS NP )数据库相连接,以利进一步查询和分析。其中Refseq
能提供该基因的名称、G enBank 中的I D 、详细的说明和所编码蛋白质的信息,并与相应的蛋白质数据库相链接[10]。
・
841・生物技术通讯
LETTERS I N BI OTECH NO LOGY V ol.12 N o.2 May 2001
表1 BLAST的5种程序[9]
程序查询序列数据库比较用 途
blastn blastp blastx tblastn tblastx DNA
蛋白质
DNA
蛋白质
DNA
DNA
蛋白质
蛋白质
DNA
DNA
DNA水平
蛋白质水平
蛋白质水平
蛋白质水平
蛋白质水平
寻找同源DNA序列和剪接模式
发现同源蛋白质
分析新DNA以寻找同源基因和蛋白质
在未注释的DNA中寻找基因
发现基因结构
4 蛋白质结构分析和同源性模建
PDB(Protein Data Bank)是由BN L(Brookhaven National Lab2 oratories)建立的蛋白质结构数据库,1998年10月管理权移交给了RCS B(Research C ollaboratory for S tructure Bioin formatics)。现在PDB除收集蛋白质和多肽的三维结构外,还收集酶、病毒、碳水化合物和核酸的晶体结构数据。新的PDBsum内容更加广泛,是几乎所有核酸和蛋白质结构数据的总集[11]。虽然Marcotte和Enright分别提出通过综合进化相关、表达类型、代谢途径以及复合物结构之间的联系和结构域融合的方法来分析和预测蛋白质功能的新方法[12,13],网上常用蛋白质结构和功能分析方法的基础仍然是依据氨基酸序列的相似性,通过结构域和模体的比较进行分析。PROSITE、P fam、BLOCK S、PRI NTS是常用的结构域或模体数据库。PROSITE 收集的是有生物学意义的蛋白质模型和序列对排。P fam收录了一系列的多重序列对排和H M M(Hidden Markov M odel)模型。BLOCK S存储的是模体和profiles。PRI NTS是收集蛋白质家族指纹(fingerprint)的数据库,指纹是指一群模体的线性整合,运用它来比较、运算比单个模体更准确有效[14]。C ATH 也是一个蛋白质分类数据库,它把蛋白质按不同等级水平分成Class、Architecture、T opology、H om olog ous(C ATH)超家族。SC OP(S tructural Classification of Proteins database)按照家族、超家族、普通折叠和类分层次地组织蛋白质结构数据。SC OP BLAST2sequences现在可以通过以下途径检索:其一是通过浏览SC OP的树状分类结构;其二是利用氨基酸序列检索;其三是关键词检索;其四是通过PDB identifier,最后也可以通过PDB收录或出版的日期检索[15]。
从结构数据库中检索得到的只是原子坐标数据,必须用图像显示软件才能将三维结构呈现出来。RAS M O L是常用的显示蛋白质三维结构的软件之一,利用它可以显示各种不同的图像,包括棍棒、空间填充、α2碳原子骨架折叠和带型等等,各部分可以单独或组合显示,原子、亚基、残基可以着色,图像可以旋转,结果可以存盘。2000年8月最新推出的Pro2 tein Explorer(PE)是从RAS M O L的基础上发展而来,功能更加强大、使用起来更加方便、图像更加形象直观、具有更多的解释说明。两者均可以从RAS M O L主页免费下载后安装在用户的计算机上使用。其它如M AGE和NC BI的C D3n也是很好的三维结构显示软件,也可以从相应的站点下载。了解蛋白质的四级结构对于完整地理解蛋白质的结构和功能是十分必要的,蛋白质四级结构预测服务器PQS能提供PDB中所有蛋白质可能的四级结构的信息[16]。ExPASy服务器是瑞士日内瓦大学开发的专家蛋白分析系统。它可以进行几乎所有的蛋白质序列分析作业,包括理化特性分析、氨基酸组成和分子量分析、序列统计学分析、序列类似性检索、双重和多重序列对排、模式和位点分析、二级结构预测及跨膜区和蛋白质定向的预测。
S wiss2M odel是一个能自动进行蛋白质模型构建的服务器,它能把用户输入的氨基酸序列根据序列同源性模拟构建成蛋白质模型。由于运算系统仍然有许多难以克服的缺陷,并不是所有模建都能得到完美的结果,特别是在靶蛋白质与模板序列之间的相同率较低的区域。事实上,当相同率低于40%时预测的准确率很低。因此,S wiss2M odel提供了两种模式供用户选择。First Approach m ode界面简单,只有当靶蛋白质与模板序列之间的相同率大于25%时自动模建过程才能进行,否则结果将完全不可靠。这时就应选择Optimise m ode,它能修正和优化第一种模式的结果。模建过程一般需要15~60分钟,模建结果(包括最后模型的原子坐标及3D2 profiles)将通过电子邮件发送给用户。需要提醒的是任何一种模建方法的结果都是非实验性的,与该蛋白质的真实结构可能会有出入[17]。
网上各种数据库数据来源不同、丰度不一、数据分类处理方法各异,服务器计算方法也不尽相同,它们各具优缺点,同一序列通过不同数据库或服务器往往会得到不尽相同的结果[18]。因此最好先根据所需信息的类型选择合适的数据库和程序,另外尽量多用几个不同数据库和程序以获取最准确的信息。表2是一些常用的生物学数据库和服务器的网址。虽然生物信息学的方法能预测基因及其蛋白质产物的结构、功能和定位,但是所有预测在未被实验证实以前都是不可靠的。因此必须把二者有机地结合起来,在生物信息学方法提供的信息的基础上指导实验设计,实验所得结果才是最准确的。
・
9
4
1
・
王涤平等:利用互联网预测cDNA蛋白质产物的结构和功能
表2 常用的生物学数据库和服务器的网址
数据库或服务器
网址
G enBank http :P P w w w.ncbi.nlm.nih.g ov P W eb P G enbank P E M BL http :P P w w w.ebi.ac.uk P DDB J http :P P w w w.nig.ac.jp P
G S DB http :P P w w w.ncgr.org P tdb P tdb.html Unigene http :P P w w w.ncbi.nlm.nih.g ov P Unigene P G DB http :P P w w w.gdb.org
PIR
http :P P w w w.gdb.nbrf.georgetown.edu P pri P SWISS 2PROT P T rE M BL http :P P w w w.expasy.ch P sprot PDB http :P P w w w.rcsb.org P pdb P
PDBsum http :P P w w w.biochem.ucl.ac.uk P bsml P pdbsum P PROSITE http :P P w w w.expasy.ch P prosite P P fam http :P P w w w.sanger.ac.uk P s oftware P P fam P BLOCK S http :P P w w w.blocks.fhcrc.org
PRINTS http :P P w w w.biochem.ucl.ac.uk P bsm P dbbrower P PRINTS P printscontents.html SCOP http :P P w w w.mrc 2lmb.cam.ac.uk P scop P CATH http :P P w w w.biochem.ucl.ac.uk P bsm P cath P BLAST http :P P w w w.ncbi.nlm.nih.g ov P BLAST P FAST A http :P P w w w2.ebi.ac.uk P fasta3P SSE ARCH http :P P sss.stan ford.edu P sss P
RAMS O L http :P P w w w.umass.edu P microbio P rasm ol P
SWISS 2M ODE L http :w w w.expasy.ch P swissm od P SWISS 2M ODE L.html ExPaSy http :P P expasy.hcuge.ch P PQS
http :P P w w w.pqs.ebi.ac.uk P
参考文献
1 Dunham I ,Shimizu N ,P oe BA et al .The DNA sequence of human
chrom os ome 22.Nature ,1999,402:489
2 H ottori M ,Fujiyama A ,T aylor T D et al .The DNA sequence of human
chrom os ome 21.Nature ,2000,405:311
3 Bens on DA ,K arsch 2M izrachi L ,Ostell J et al .Nucleic Acids Res ,
2000,28:15
4 Wheeler D L ,Chsppey C ,Lash AE et al .Nucleic Acids Res ,2000,28:
10
5 Bairoch A ,Apweiler R.The SWISS 2PROT protein sequence database
and its supplement T rE M BL in 2000.Nucleic Acids Res ,2000,28:456 K reil DP ,E tzx old T.DAT ABANK S 2a catalogue database of m olecular
biology databases.T rends Biochem S ic ,1999,24:155
7 Banti S ,G u ffaniti A ,Borsani G.H ow to get the best of dbEST.T rends
G enetic ,14:81
8 Altschul SF ,K oonin E V.Iterated profile searches with PSI 2BLAST 2a
tool for discovery in protein databases.T rends Biochem Sci ,1998,23:358
9 Brenner SE.Practical database searching.T rends G uide to Bioin format 2
ics (T rends suppl ),1998,910 Puitt K D ,K atz K S ,S icotte H et al .Introducing Refseq and Locuslink :
curated human genome res ources at the NC BI.T rends G enetic ,2000,16:44
11 Puitt K D ,K atz K S ,S icotte H et al .Introducing Refseq and Locuslink :
curated human genome res ources at the NC BI.T rends G enetic ,2000,16:44
12 M arcotte E M ,Pellegrinim M ,Thom ps on M J et al .A combines alg o 2
rithm for genome 2wide prediction of protein function.Nature ,1999,402:83
13 Enright A J ,Illopoulos I ,K yrpides NC et al .Protein interaction maps
for com plete genomes based on gene fusion events.Nature ,1999,402:86
14 Attw ood TK,Croning M DR ,Flower DR et al .PRINTS 2S :the database
formerly known as PRINTS.Nucleic Acids Res ,2000,28:22515 C onte LC ,Ailey B ,Hubbard T JP et al .SCOP :a structural classifica 2
tion of proteins database.Nucleic Acids Res ,2000,28:257
16 Henrick K Thornton JM.PQS :a protein quaternary structure file server.
T rends Biochem ,Sci ,1998,23:358
17 G uex N ,Diemand A ,Peitsch MC.Protein m odeling for all.T rends
Biochem Sci ,1999,24:364
18 Bouck J ,W ei Y u ,G ibbs R et al .C om paris on of gene indexing databas 2
es.T rends G enetic ,1999,15:159
(2000209225收稿)
・
051・生物技术通讯LETTERS I N BI OTECH NO LOGY V ol.12 N o.2 May 2001
¥
5.9
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
利用互联网预测cDNA蛋白质产物的结构和功能
利用互联网预测cDNA蛋白质产物的结构和功能3
王涤平综述 童坦君审校
(北京大学医学部生物化学与分子生物学系 北京100083)
摘要 人类基因组计划预计近两三年内即可完成,我们将会得到许多序列已知但未知功能的cDNA。本文简单介绍利用互联网上信息资源分析cDNA序列和预测它所编码的蛋白质的结构和功能的方法和常用工具。
关键词 互联网,cDNA,蛋白质,结构和功能预测
第 1 页
The protein product of cDNA:Predicting its structure and function using internet
W ANG Di2Ping,T ONG T an2Jun
(The H ealth Science Center,Peking Univer sity,Beijing100083,P.R.China)
Abstract The Human G ene Project will be completed in tw o or three years,biologist will obtain many cDNA sequences which functions are unknown.This article introduces s ome methods and tools in internet,by which can analysis cDNA sequences and predict the structure and function of the proteins that are coded by them.
展开全文
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)