sqlserver中正则表达式和分组查询

sqlserver中正则表达式和分组查询,第1张

使用vbscript 或者是frameword程序集向SqlServer数据库中添加一个正则表达式函数,就可以满足你的需求了嘛。

vbscript 函数(需要SqlServer运行环境中vbscript 库)

CREATE function [dbo][RegexMatchFirst]

(

@source ntext, --原字符

@regexp varchar(1000), --正则表达式

@global bit = 1, --是否是全局替换

@ignoreCase bit = 0 --是否忽略大小写

)

returnS varchar(1000) AS

begin

declare @hr integer

declare @objRegExp integer

declare @objMatch INT

declare @matchcount INT

declare @command varchar(50)

declare @result varchar(5000)

exec @hr = sp_OACreate 'VBScriptRegExp', @objRegExp OUTPUT

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'Pattern', @regexp

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'Global', @global

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'IgnoreCase', @ignoreCase

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OAMethod @objRegExp, 'execute', @objmatch OUTPUT, @source

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

EXEC @hr= sp_OAGetProperty @objmatch, 'count', @matchcount OUT

IF @hr <> 0 or @objmatch = 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

set @command = 'item(0)Value'

EXEC @hr= sp_OAGetProperty @objmatch, @command, @result OUT

exec @hr = sp_OADestroy @objRegExp

IF @hr <> 0 begin

return null

end

return @result

end

framework运行时程序集:

打开 Microsoft Visual Studio,创建一个sqlserver 数据库数据库项目,在项目中按照SqlServer方式创建一个正则表达式匹配函数,然后编译部署到你的SqlServer数据库中。

这个时候刷新数据库的可编程性-->函数 --> 标量值函数就会看到你在Microsoft Visual Studio中创建的自定义函数了。

<main role="main" class="App-main" style="padding-bottom: 46px;">

首发于 Python办公自动化

无障碍 写文章

登录

<article class="Post-Main Post-NormalMain" tabindex="-1" style="box-sizing: border-box; outline: none;">

<header class="Post-Header" style="margin: 0px auto; width: 690px;">

第一小乔乔

进一步,是一步。一起工作进步,厨艺精进,生活美满。

22 人赞同了该文章

</header>

[上传失败(image-f7fc00-1650193970962)]

match()和search()都只匹配出一个符合条件的字符串,若想要所有,可以使用refindall()

# 用[]{}判断密码是否符合要求 :密码是由数字和字母组成,并且位数是6-16位

##用split按-或者空白格分割字段

结果:['ahsb1sssa8', 'jjhd7nhs', '90nsjhf3', '4hh', 'h7', '8kjj', 'sfav']

#用sub替换符合条件的关键词, 试试马赛克脏话(想起农药不能痛骂队友的愤怒)

##练练转义

## findall返回符合表达式的子串

一、正则表达式语法

正则表达式是用匹配或者描述字符串的工具。

用处:

a判断字符串是否满足某个条件---判断输入的字符串是否是邮箱/手机号码。是否是ip地址

b提取满足条件的字符串

c字符串替换

Python中通过re模块中相应的方法来支持正则表达式的匹配、查找和替换等功能

fullmatch(正则表达式字符串, 字符串) ---> 判断正则表达式和字符串是否完全匹配

正则表达式字符串: 就是一个字符串,字符串中是正则表达式语法。r'正则表达式'

正则表达式中包含两个部分,一个是正则语法对应的字符,二个是普通字符

1 (点)(匹配任意字符)

一个只匹配一个任意字符

2 \w(匹配字母数字下划线)

一个\w匹配一个字符

3 \s(匹配任意空白字符)

空白字符: 空格、制表符(\t)、回车(换行\n)等,都输入空白字符

一个\s匹配一个空白字符

4 \d(匹配数字字符)

一个\b不会去匹配一个字符,而是单纯的检测\b出现的位置是否是单词边界

单词边界: 字符串开始和结尾、空格、换行、标点符号等,可以将两个单词隔开的字符都单词边界

6 ^(检测是否是字符串开头)

re_str = r'^\d\d\d' # 判断一个字符串是否是三个数字开头

7 $(检测是否是字符串结尾)

8 \W(匹配非字母、数字下划线)

9 \S(匹配非空白字符)

10 \D(匹配非数字字符)

11 \B(检测是否不是单词边界)

12 [] (匹配中括号中出现的任意一个字符)

一个[]匹配一个字符

[字符集] --> 匹配一个字符,这字符是字符集中的任意一个字符

例如:[abc], [\d+]

[字符1-字符2] --> 匹配一个字符,这个字符是Unicode编码值在字符1到字符2中的任意一个字符;要求字符1的编码值要小于字符2

例如:[1-9] --> 数字1到9 [a-z] --> 小写字母 [A-Z] --> 大写字母

[\u0031-\u0039] --> 数字1到9

[\u4E00-\u9fa5] --> 匹配所有的汉字

注意:-在中括号中,如果放在两个字符之间表示范围。

13 [^字符集] (匹配一个不在字符集中的任意字符)

注意:^必须放在中括号中的最前面才有效

二、正则表达式次数相关符号

from re import fullmatch

1 (匹配0次或者多次)

字符 --> 字符出现0次或者多次

2 +(匹配一次或者多次)

3 (匹配0次或者1一次)

练习:写一个正则表达式,匹配所有的整数(123, -2334, +9可以匹配的,012, -023,+0122不能匹配)

{N} --> 匹配N次

{M,N} --> 匹配M到N次

{M,} --> 至少匹配M次

{,N} --> 最多匹配N次

三、分之和分组

import re

1 |(分之)

条件1|条件2 --> 先用条件1去匹配,如果匹配成功就匹配成功。如果条件1匹配失败,用条件2去匹配。

注意:如果条件1匹配成功就不会用条件2再去匹配

能匹配成功时abc,d和aaa

'abc'+W/H/Y

2 ()(分组)

a组合(将括号中的内容作为一个整体进行 *** 作)

b捕获 -- 使用带括号的正则表达式匹配成功后,只获取括号中的内容

c重复 -- 在正则表达式中可以通过\数字来重复前面()中匹配到的结果。数字代表前第几个分组

a组合

匹配一个字符串,以数字字母的组合出现3次

b捕获

c重复

3转义符号

正则表达式中可以通过在特殊的符号前加\,来让特殊的符号没有意义

--> 任意字符 --> 字符

注意:在中括号有特殊功能的符号,只代表符号本身

\不管在哪儿都需要转义

-在[]外面没有特殊功能,在[]中要表示-本身,就不要放在两个字符之间

()需要转义

四、re模块中的函数

import re

1 compile

compile(正则表达式字符串) --> 将正则表达式字符串转换成正则表达式对象

2 fullmatch和match

fullmatch(正则表达式字符串, 字符串)

--> 用正则表达式去完全匹配字符串(匹配整个字符串),返回匹配对象(SRE_Match)或者None

match(正则表达式字符串, 字符串)

--> 匹配字符串开头,返回匹配对象或者None

1span(group=0) --> 获取匹配成功的区间(左闭右开区间)

print(resultspan(0))

print(resultstart(1)) # 获取匹配到的开始下标

print(resultend(1)) # 获取匹配到的结束下标后的下标

2group(group = 0) --> 获取匹配结果

group()/group(0) --> 获取正则表达式完全匹配的结果

group(index>0) --> 获取正则表达式中第group个分组匹配到的结果

3string --> 获取被匹配的原字符串

3search

search(正则表达式, 字符串)

--> 查找字符串中满足正则表达式的第一个字符串。返回值是匹配对象或者None

练习:使用search匹配出一个字符串中所有的数字字符串'abc34jshd8923jkshd9lkkk890k' --> 34,8923,9,890

4findall

findall(正则表达式, 字符串) --> 获取字符串中满足正则表达式的所有的子串,返回一个列表

注意:如果正在表达式中有分组,取值的时候只取分组中匹配到的结果;

如果有多个分组,会将每个分组匹配到的结果作为一个元祖的元素

5finditer

finditer(正则表达式, 字符串)

--> 查找所有满足正则条件的子串,返回值是迭代器,迭代器中的元素是匹配对象

6 split

split(正则表达式,字符串) --> 将字符串按照满足正则表达式条件的子串进行分割

"""

str1 = 'ahsb1sssa8-jjhd7nhs+90nsjhf3-4hhh7+8kjj-'

result = resplit(r'[-+]', str1)

print(result)

7sub

sub(正则表达式,repl,字符串) --> 将字符串中满足正则表达式条件的子串替换成repl。返回替换后的字符串

作业

1 写一个正则表达式判断一个字符串是否是ip地址

规则:一个ip地址由4个数字组成,每个数字之间用连接。每个数字的大小是0-255 例如:2551891037 正确 256189899 错误

2 计算一个字符串中所有的数字的和

例如:字符串是:‘hello90abc 78sjh125’ 结果是90+78+125 = 1805

3 验证输入的内容只能是汉字

4 电话号码的验证

二、不定项选择题

编辑于 2020-12-21 17:02

Python

正则表达式

赞同 22

3 条评论

分享

</article>

[上传失败(image-b1d3-1650193970960)]

懒人必备

[[上传失败(image-645a0f-1650193970961)]

裸睡的猪发表于猪哥的Py]( >

一直以来,使用正则表达式的机会不少,经常用来做一些字符串处理工作,还是比较方便的,不过对于断言和贪婪懒惰模式的认识一直比较模糊。最近我们后端组在协作开发一个对外的后台项目,前端的接口文档是用word写了(汗-_-||,很难用啊,还是markdown比较好)里面有一个接口列表的表格,这里的接口列表需要提取出来,形成一个权限链路做权限控制,减少ajax的RBAC权限配置的臃肿。这里我用了正则表达式来完成,做完之后我对正则表达式的理解和使用也算是小成了,下面我就说一下正则表达式几种常见用法我的理解。

网上有 《正则表达式30分钟入门教程》 珠玉在前,基础知识我就不多说了,大家自己去看。

1、对于一些有一定模式或者以一定规律出现的字符串,我们想要匹配并且捕获到它们;

2、这些字符串我们不但要匹配捕获到它们,还要向后引用进行例如替换之类的处理;

正则表达式中分组的单位用(exp)小括号来区分,里面exp就是要匹配的内容。

匹配ip地址xxxxxxxxxxxx可以写成以下形式

匹配少数民族的真实姓名

(此处贴个毕加索的全名。。。 [巴勃罗·迭戈·荷瑟·山迪亚哥·弗朗西斯科·德·保拉·居安·尼波莫切诺·克瑞斯皮尼亚诺·德·罗斯·瑞米迪欧斯·西波瑞亚诺·德·拉·山迪西玛·特立尼达·玛利亚·帕里西奥·克里托·瑞兹·布拉斯科·毕加索] )

而正则表达式中默认第0个分组是匹配到整条正则表达式的字符串

我们还可以给分组进行命名,方便区分

匹配到exp的内容就会捕获到一个命名为name的分组里面,不影响原来的索引分组情况,也可以写成

在向后引用中,我们可以使用 \n 或者 $n 来引用匹配到的分组内容,即第n个出现的小括号。

在正则表达式中,我们可以选择关闭对不需要的内容的捕获,就是不捕获,以此来提高正则表达式的执行速度和节约内存使用。

语法是:

零宽,顾名思义,就是没有宽度,匹配到的字符串不会被捕获。

断言,就是true or false。

下面是4种断言的说明:

ps:千万傻傻别去的记名称,理解用法最重要

零宽断言只是用来判断是否符合继续匹配的条件,并不会找到真正需要的字符串,本身并不会匹配字符

例如,在爬虫中我们可能需要匹配某些url,我们就可以用断言来获取url。

正则表达式中默认的行为是在整个表达式能够匹配的前提下,匹配 尽可能多 的字符,这称之为贪婪模式。

不过有时候,我们还在整个表达式匹配的前提下尽可能少的匹配字符,这就需要用到懒惰模式了。

懒惰模式的语法也简单,只需要在你所需匹配的字符后面再加一个?即可。

解释:懒惰模式就是在你设想字符可能出现的次数中,尽可能匹配少的次数。

以上就是正则表达式的分组,零宽断言和贪婪懒惰模式的讲解,下期再见。

>>> import re

>>> s='aabb'  

>>> [match[0] for match in refindall(r'((\w)\2)', s)] 

['aa', 'bb']

>>>

举例:正则 (>

以上就是关于sqlserver中正则表达式和分组查询全部的内容,包括:sqlserver中正则表达式和分组查询、正则表达式、正则分组,零宽断言和贪婪懒惰模式等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!

欢迎分享,转载请注明来源:内存溢出

原文地址:https://54852.com/web/9449062.html

(0)
打赏 微信扫一扫微信扫一扫 支付宝扫一扫支付宝扫一扫
上一篇 2023-04-28
下一篇2023-04-28

发表评论

登录后才能评论

评论列表(0条)

    保存