
模糊聚类是采用模糊数学方法,依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事物进行分类的一门多元技术。
其算法主要有传递闭包法、动态直接聚类法和最大树法等,其中动态直接聚类法计算量最少。
在实际应用中必须经过数据预处理、特别是归一化等处理步骤,选取合适的模糊关系建立模糊相似矩阵,然后进行聚类和模式识别。
糊聚类分析在学生素质评定中的应用
学生素质的评定工作,对学校的发展具有重要的作用。
本文就学生素质从德、智、体、能、劳5个方面作出评价。
首先,对得到的数据进行规格化;接着,构造模糊相似矩阵;最后,利用编网法对学生素质的评定进行聚类分析,该方法简单易懂且计算量小达到了预期的效果。
模糊数学在畜禽血液蛋白多态性聚类分析中的应用
我国动植叨蛋白多态性的研究进展迅速,国内外有关这方面的报道越来越多.但这一研究已有近百年的历史,真正发展是近=十年的事.我国起步较晚,近年的研究和应用较快,现已推向地,县级阶段,可见这一研究和应用的普及在我国为时不远1.西南民族学院2.西昌农业专科学校3.面昌市畜牧局了信老咐..本研究表明我国畜牧兽医工作进入了分子水平阶段.由于蛋白多态性的研究和方法简便,节时省钱,基层单位均可应用.但此法的关键问题是聚类分析.聚类分析的方法很多,如遗传距离聚类分析中的最短遗传距离聚类分析,类平均法聚类分析再如遗传相似系数分析中我们见有矩阵法,但在畜禽蛋白多态性聚类分析上,均无统一的具体分析方法.为此,我们根据模糊数学 *** 论的原理,对遗传相似系数进行聚类分析,现介绍出来,供同行们应用时参考.模糊数含山学是研究和处理一些模糊现象的数学.但不是把数学变成模糊的东酉,而是在许多控制过程中,用模糊的手段达到精确的目的.在畜禽蛋白多态性研究中,遗传相似系数也是聚类分析中常用的分析指标.
模糊数学聚类分析在鲤鱼杂交种后代性状研究中的应用
杂交鲤与亲本相似,用数学语言来说是存在模糊性问题。
采用模糊数学聚类分析法,首先建立模糊相似矩阵,得到鲤鱼生长性状聚类分类图谱,最后得到三杂交鲤、荷元鲤等F1代与母本相似比父本大的结论。
这在鱼类杂交选育理论与生滑纯产上有一定意义
热心网友聚类分析的概念主要是来自多元统计分析,例如,考虑二维坐标系上有散落的许多点,这时,需要对散点进行合理的分类,就需要聚类方面的知识。模糊聚类分析方法主要针对的是这样的问题:对于样本空间P中的元素含有多个属性,要求对其中的元素进行合理的分类。最终可以以聚类图的形式加以呈现,而聚类图可以以手式和自动生成两种方式进行,这里采用自动生成方式,亦是本文的程序实现过程中拿茄的一个关键环节。
这里所实现的基本的模糊聚类的主要过程是一些成文的方法,在此简述如下:
对于待分类的一个样本集U=,设其中的每个元素有m项指标,则可以用m维向量描述样本,即:ui=(i=1,2,...,n)。则其相应的模糊聚类按下列步骤进行:1)
标准化处理消首察,将数据压缩至芹锋(0-1)区间上,这部分内容相对简单,介绍略。(参[1])2)
建立模糊关系:这里比较重要的环节之一,首先是根据“距离”或其它进行比较的观点及方法建立模糊相似矩阵,主要的“距离”有:Hamming
距离:
d(i,j)=sum(abs(x(i,k)-x(j,k)))
|
k
from
1
to
m
(|
k
from
1
to
m表示求和式中的系数k由1增至m,下同)Euclid
距离:
d(i,j)=sum((x(i,k)-x(j,k))^2)
|
k
from
1
to
m
非距离方法中,最经典的就是一个夹角余弦法:
最终进
模糊聚类分析方法在实际中应用很广泛,目前已在选矿、气象、地质、地震、环境科学等方面取得成效,在石油工业的地质学、勘探决策等方面也有应用。
在现实世界中,一组事物根据其亲疏程度和相似性是否形成一个类群,或一个事物是否属于一个类别,其界限往往是不分明的,具有很大程度的模糊性。模糊集合论正是刻画和解决这类聚类问题的数学方法。模糊聚类分析是依据客观事物间的特征、亲疏程度和相似性,通过建立模糊相似关系对客观事物进行分类的数学方法。用模糊聚类分析方法处理带有模糊性的聚类问题要更为客观、灵活、直观和计算更加简洁。
本书将模糊聚类分析方法应用到水平井的开发指标预测上,采用模糊聚类的方法,以胜利油田已经大量投产的水平井的数据为基础,将同类油藏中已投产水平井进行分类,然后根据新设计井的有关参数将其归到相应类中,根据同类中已投产井的有关开发指标对新设计水平井的指标进行预测,取得了较好效果。
模糊聚类分析的一般步骤为:①原始数据标准化②构造模糊相似矩阵③水平井模糊聚类④新井归类评价。
下面以胜利油区断块油藏永8断块为例,分析模糊聚类分析方法在水平井产能中的应用。
表4-11为胜利油区永安油田复杂断块油藏已投产14口水平井的有关数据,我们选取除永8平8井外的13口井参与聚类,参与聚类的指标为表4-11中的前6项,可采储量及初始日产液量、日产油量为新井预测对比指标。
表4-11 永安油田已投产水平井指标统计表
1.原始数据标准化
对于表4-11所示复杂断块油藏水平井的数据,由于各参数量纲不同,需要将其标准化。
原始数据标准化的目的就是排除原始数据中不同变量间量纲的影响,并使原始数据分布在相同的区间内,以相同的量级参与分类,即把除去量纲影响的原始数据都压缩在[0,1]闭区间禅老内。
假设有N口水平井参与分类,每口水平井有K个参考油藏参数,构成如下矩阵:
实用水驱油藏开发评价方法
对上述原始矩阵进行标准化常用的方法有标准差标准化、极差标准化等。在本文的研究中,对不同性质的指标,采用了不同的方法。
对于水平井渗透率、垂直渗透率、控制储量等的“趋大”(值越大越好)指标,本文采用如下的数据标准化方法:
实用水驱油藏开发评价方法
对于原油黏度、密度等的“趋小”(值越小越好)指标,采用了如下标准化方法:
实用水驱油藏开发评价方法
对于油层厚度、水平段长度等的“趋中”(值以靠近某一标准值为好)指标,采用的标准化方法为
当
当
式中:i=1,2,…,Nj=1,2,…,KXjmin,Ximax,Xjavg分别为在第j个参考参数中的最小值、最大值及最优值(或指定最优值)。
2.构造模糊相似矩阵
根据标准化数据,计算各水平井之间的相似程度,又称标定。标定的方法很多,如距离法包括切比雪夫距离法、海明距离法、欧氏距离法、闵可夫斯基距离法等,相似系数法包括夹角余弦法、相关系数法、指数相似系数法等,贴近度法包括最大最小法、算术平均最小法等。本文采用夹角余弦法来计算相似系数得到模糊相似矩阵:
实用水驱油藏开发评价方法
如果rij=0,说明两口井完全不相关,如果rij=1,说明两口井完全相似或相同。
选取断块油藏中已投产水平井的水平段实钻长度、原油地下黏度、有效厚度、水平与垂直渗透率比值等的6个参数作为模糊聚类分析的参考指标(即N=13,K=6),根据前面所述方法得到的模糊相似矩阵如下所示。
实用水驱油藏开发评价方法
3.水平井模糊聚类
人们在实践中总结了多种模糊聚类方法,就理论上讲大致可分为三类:一类是基于模糊等价关系的传递闭包法,另一类是基于模糊相似关系的直接聚类法,再一类是基于软分类空间的模糊聚类法。用传递闭包法进行分类,当矩阵的阶数较高时计算量很大。考虑到以后研究中随粗配投产水平井的增加,矩阵阶数会很大,因此这里采用了直接聚类法。
直接聚类法为乃指直接利用相似矩阵进行聚类的方法,常用的有最大树法和表格法。两种岩袭指方法若手工完成,效率很低,本文编程序实现了利用最大树法的聚类过程,输入水平阈值λ∈[0,1],分类一次完成,非常方便。输入不同的阈值,可得到不同的分类。
得到相似矩阵以后,便可以进行聚类了,对不同的阈值λ∈[0,1],可得到不同的分类,取阈值λ=0.9,13口井被分成了6类,如表4-12所示。
表4-12 永安油田已投产水平井模糊聚类结果
4.新设计水平井归类评价
(1)新井归类计算
在已知水平井分类后,对于新设计水平井类别的划分,本书主要根据新水平井与已知水平井之间的相似程度来确定其归属。通过分别计算新井与已知井的相似系数,找出与新井相似系数最大的已知井类别作为新井的类别。
(2)新井指标预测
在确定新井类别后,将同类中已投产水平井的有关开发指标的平均值及产能变化规律作为新井的预测指标。
现假设永8平8井为新设计未投产井,通过归类计算,将其归到第二类中,那么就可以根据第二类中三口已投产水平井的有关指标来对该井进行指标预测。表4-13为第二类中已投产三口井指标的平均值与永8平8井的指标对比表。从表中可以看出,三口井指标平均值预测永8平8井的可采储量为5.05×104t,初始日产液为32.6t/d,初始日产油量27.0t/d,与永8平8井实际指标的相对误差均在10%以内,能够满足工程设计的要求。那么我们就可以根据三口井的可采储量、初产油量等指标以及产量变化规律来对永8平8井的开发指标进行预测。
表4-13 新井归类指标对比表
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)