如何查找数据库中的重复数据？_sql

实现方式如下：

Dim cnn As Object, rs As Object, SQL$, i&, s$

Set cnn = CreateObject("ADODB.Connection")

cnn.Open "Provider=Microsoft.Jet.Oledb.4.0data Source=" & ThisWorkbook.Path & "\排课数据.mdb"

SQL = "Select 星期&节&班级,count(星期&节&班级) from 排课 where 星期 is not null group by 星期&节&班级 having count(星期&节&班级)>1"

Set rs = CreateObject("ADODB.Recordset")

rs.Open SQL, cnn, 1, 3

If rs.RecordCount Then

For i = 1 To rs.RecordCount

s = s & vbCrLf & "星期" & rs.Fields(0) & "班，重复次数：" & rs.Fields(1)

rs.MoveNext

MsgBox "有" & rs.RecordCount & "条记录重复：" & s

Else

MsgBox "没有发现重复记录"

End If

rs.Close

cnn.Close

Set rs = Nothing

Set cnn = Nothing

End Sub

1。删除全部重复记录（慎用）

Delete表Where重复字段In(Select重复字段From表GroupBy重复字段HavingCount(*)>1)

2。保留一条（这个应该是大多数人所需要的^_^）

DeleteHZTWhereIDNotIn(SelectMax(ID)FromHZTGroupByTitle)

注：此处保留ID最大一条记录

3、查找表中多余的重复记录（多个字段）

select*fromvitaea

where(a.peopleId,a.seq)in(selectpeopleId,seqfromvitaegroupbypeopleId,seqhavingcount(*)>1)

4、删除表中多余的重复记录（多个字段），只留有rowid最小的记录

deletefromvitaea

where(a.peopleId,a.seq)in(selectpeopleId,seqfromvitaegroupbypeopleId,seqhavingcount(*)>1)

androwidnotin(selectmin(rowid)fromvitaegroupbypeopleId,seqhavingcount(*)>1)

你好，首先要明白一点：加入Set里面的元素必须定义equals()方法以确保对象的唯一性。

第一个问题：

TreeSet的底层实现是采用红-黑树的数据结构，采用这种结构可以从Set中获取有序的序列，但是前提条件是：元素必须实现Comparable接口，该接口中只用一个方法，就是compareTo()方法。当往Set中插入一个新的元素的时候，首先会遍历Set中已经存在的元素（当然不是采用顺序遍历，具体采用什么方法，建议自己去看看源码），并调用compareTo()方法，根据返回的结果，决定插入位置。进而也就保证了元素的顺序。

第二个问题：

上面已经说过，加入Set里面的元素必须定义自己的equals()方法，但是对于良好的设计风格，最好在覆盖equals()方法的同时，也覆盖hashCode()方法，当然，对于TreeSet而言不用覆盖hashCode()方法也可。请记住：覆盖hashCode()方法的目的，只有一个原因就是提高效率。

在往Set中插入新的对象时，首先会用该对象的hashCode()与已经存在对象的hashCode()做比较，如果相等，那就不能插入，如果不等，才会调用equals()方法，如果equals结果为true，说明已经存在，就不能再插入，如果为false，可以插入。

注：如果没有覆盖hashCode()方法，那就是只比较equals().对两个对象equals运算，是判断两个对象是否相等的关键。

第三个问题：

2）HashSet与TreeSet区别:

1、TreeSet 是二差树实现的,Treeset中的数据是自动排好序的，不允许放入null值

2、HashSet 是哈希表实现的,HashSet中的数据是无序的，可以放入null，但只能放入一个null，两者中的值都不能重复，就如数据库中唯一约束

3、HashSet要求放入的对象必须实现HashCode()方法，放入的对象，是以hashcode码作为标识的，而具有相同内容的String对象，hashcode是一样，所以放入的内容不能重复。但是同一个类的对象可以放入不同的实例

1、查找表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断

select * from peoplewhere peopleId in (select peopleId from people group by peopleId having count (peopleId) >1)

2、删除表中多余的重复记录，重复记录是根据单个字段（peopleId）来判断，只留有rowid最小的记录

delete from people where peopleId in (select peopleId from people group by peopleId having count (peopleId) >1)and rowid not in (select min(rowid) from people group by peopleId having count(peopleId )>1)

3、查找表中多余的重复记录（多个字段）

select * from vitae awhere (a.peopleId,a.seq) in (select peopleId,seq from vitae group by peopleId,seq having

扩展资料

FROM子句指定SELECT语句查询及与查询相关的表或视图。在FROM子句中最多可指定256个表或视图，它们之间用逗号分隔。

在FROM子句同时指定多个表或视图时，如果选择列表中存在同名列，这时应使用对象名限定这些列所属的表或视图。

例如在usertable和citytable表中同时存在cityid列，在查询两个表中的cityid时应使用下面语句格式加以限定：

SELECTusername,citytable.cityid

FROMusertable,citytable

WHEREusertable.cityid=citytable.cityid

在FROM子句中可用以下两种格式为表或视图指定别名：

表名 as 别名

表名别名

参考资料：百度百科 SELECT语句

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/sjk/10076659.html

如何查找数据库中的重复数据？

发表评论

评论列表（0条）