
使用vbscript 或者是frameword程序集向SqlServer数据库中添加一个正则表达式函数,就可以满足你的需求了嘛。
vbscript 函数(需要SqlServer运行环境中vbscript 库)
CREATE function [dbo][RegexMatchFirst]
(
@source ntext, --原字符串
@regexp varchar(1000), --正则表达式
@global bit = 1, --是否是全局替换
@ignoreCase bit = 0 --是否忽略大小写
)
returnS varchar(1000) AS
begin
declare @hr integer
declare @objRegExp integer
declare @objMatch INT
declare @matchcount INT
declare @command varchar(50)
declare @result varchar(5000)
exec @hr = sp_OACreate 'VBScriptRegExp', @objRegExp OUTPUT
IF @hr <> 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
exec @hr = sp_OASetProperty @objRegExp, 'Pattern', @regexp
IF @hr <> 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
exec @hr = sp_OASetProperty @objRegExp, 'Global', @global
IF @hr <> 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
exec @hr = sp_OASetProperty @objRegExp, 'IgnoreCase', @ignoreCase
IF @hr <> 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
exec @hr = sp_OAMethod @objRegExp, 'execute', @objmatch OUTPUT, @source
IF @hr <> 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
EXEC @hr= sp_OAGetProperty @objmatch, 'count', @matchcount OUT
IF @hr <> 0 or @objmatch = 0 begin
exec @hr = sp_OADestroy @objRegExp
return null
end
set @command = 'item(0)Value'
EXEC @hr= sp_OAGetProperty @objmatch, @command, @result OUT
exec @hr = sp_OADestroy @objRegExp
IF @hr <> 0 begin
return null
end
return @result
end
framework运行时程序集:
打开 Microsoft Visual Studio,创建一个sqlserver 数据库数据库项目,在项目中按照SqlServer方式创建一个正则表达式匹配函数,然后编译部署到你的SqlServer数据库中。
这个时候刷新数据库的可编程性-->函数 --> 标量值函数就会看到你在Microsoft Visual Studio中创建的自定义函数了。
<main role="main" class="App-main" style="padding-bottom: 46px;">
首发于 Python办公自动化
无障碍 写文章
登录
<article class="Post-Main Post-NormalMain" tabindex="-1" style="box-sizing: border-box; outline: none;">
<header class="Post-Header" style="margin: 0px auto; width: 690px;">
第一小乔乔
进一步,是一步。一起工作进步,厨艺精进,生活美满。
22 人赞同了该文章
</header>
[上传失败(image-f7fc00-1650193970962)]
match()和search()都只匹配出一个符合条件的字符串,若想要所有,可以使用refindall()
# 用[]{}判断密码是否符合要求 :密码是由数字和字母组成,并且位数是6-16位
##用split按-或者空白格分割字段
结果:['ahsb1sssa8', 'jjhd7nhs', '90nsjhf3', '4hh', 'h7', '8kjj', 'sfav']
#用sub替换符合条件的关键词, 试试马赛克脏话(想起农药不能痛骂队友的愤怒)
##练练转义
## findall返回符合表达式的子串
一、正则表达式语法
正则表达式是用匹配或者描述字符串的工具。
用处:
a判断字符串是否满足某个条件---判断输入的字符串是否是邮箱/手机号码。是否是ip地址
b提取满足条件的字符串
c字符串替换
Python中通过re模块中相应的方法来支持正则表达式的匹配、查找和替换等功能
fullmatch(正则表达式字符串, 字符串) ---> 判断正则表达式和字符串是否完全匹配
正则表达式字符串: 就是一个字符串,字符串中是正则表达式语法。r'正则表达式'
正则表达式中包含两个部分,一个是正则语法对应的字符,二个是普通字符
1 (点)(匹配任意字符)
一个只匹配一个任意字符
2 \w(匹配字母数字下划线)
一个\w匹配一个字符
3 \s(匹配任意空白字符)
空白字符: 空格、制表符(\t)、回车(换行\n)等,都输入空白字符
一个\s匹配一个空白字符
4 \d(匹配数字字符)
一个\b不会去匹配一个字符,而是单纯的检测\b出现的位置是否是单词边界
单词边界: 字符串开始和结尾、空格、换行、标点符号等,可以将两个单词隔开的字符都单词边界
6 ^(检测是否是字符串开头)
re_str = r'^\d\d\d' # 判断一个字符串是否是三个数字开头
7 $(检测是否是字符串结尾)
8 \W(匹配非字母、数字下划线)
9 \S(匹配非空白字符)
10 \D(匹配非数字字符)
11 \B(检测是否不是单词边界)
12 [] (匹配中括号中出现的任意一个字符)
一个[]匹配一个字符
[字符集] --> 匹配一个字符,这字符是字符集中的任意一个字符
例如:[abc], [\d+]
[字符1-字符2] --> 匹配一个字符,这个字符是Unicode编码值在字符1到字符2中的任意一个字符;要求字符1的编码值要小于字符2
例如:[1-9] --> 数字1到9 [a-z] --> 小写字母 [A-Z] --> 大写字母
[\u0031-\u0039] --> 数字1到9
[\u4E00-\u9fa5] --> 匹配所有的汉字
注意:-在中括号中,如果放在两个字符之间表示范围。
13 [^字符集] (匹配一个不在字符集中的任意字符)
注意:^必须放在中括号中的最前面才有效
二、正则表达式次数相关符号
from re import fullmatch
1 (匹配0次或者多次)
字符 --> 字符出现0次或者多次
2 +(匹配一次或者多次)
3 (匹配0次或者1一次)
练习:写一个正则表达式,匹配所有的整数(123, -2334, +9可以匹配的,012, -023,+0122不能匹配)
{N} --> 匹配N次
{M,N} --> 匹配M到N次
{M,} --> 至少匹配M次
{,N} --> 最多匹配N次
三、分之和分组
import re
1 |(分之)
条件1|条件2 --> 先用条件1去匹配,如果匹配成功就匹配成功。如果条件1匹配失败,用条件2去匹配。
注意:如果条件1匹配成功就不会用条件2再去匹配
能匹配成功时abc,d和aaa
'abc'+W/H/Y
2 ()(分组)
a组合(将括号中的内容作为一个整体进行 *** 作)
b捕获 -- 使用带括号的正则表达式匹配成功后,只获取括号中的内容
c重复 -- 在正则表达式中可以通过\数字来重复前面()中匹配到的结果。数字代表前第几个分组
a组合
匹配一个字符串,以数字字母的组合出现3次
b捕获
c重复
3转义符号
正则表达式中可以通过在特殊的符号前加\,来让特殊的符号没有意义
--> 任意字符 --> 字符
注意:在中括号有特殊功能的符号,只代表符号本身
\不管在哪儿都需要转义
-在[]外面没有特殊功能,在[]中要表示-本身,就不要放在两个字符之间
()需要转义
四、re模块中的函数
import re
1 compile
compile(正则表达式字符串) --> 将正则表达式字符串转换成正则表达式对象
2 fullmatch和match
fullmatch(正则表达式字符串, 字符串)
--> 用正则表达式去完全匹配字符串(匹配整个字符串),返回匹配对象(SRE_Match)或者None
match(正则表达式字符串, 字符串)
--> 匹配字符串开头,返回匹配对象或者None
1span(group=0) --> 获取匹配成功的区间(左闭右开区间)
print(resultspan(0))
print(resultstart(1)) # 获取匹配到的开始下标
print(resultend(1)) # 获取匹配到的结束下标后的下标
2group(group = 0) --> 获取匹配结果
group()/group(0) --> 获取正则表达式完全匹配的结果
group(index>0) --> 获取正则表达式中第group个分组匹配到的结果
3string --> 获取被匹配的原字符串
3search
search(正则表达式, 字符串)
--> 查找字符串中满足正则表达式的第一个字符串。返回值是匹配对象或者None
练习:使用search匹配出一个字符串中所有的数字字符串'abc34jshd8923jkshd9lkkk890k' --> 34,8923,9,890
4findall
findall(正则表达式, 字符串) --> 获取字符串中满足正则表达式的所有的子串,返回一个列表
注意:如果正在表达式中有分组,取值的时候只取分组中匹配到的结果;
如果有多个分组,会将每个分组匹配到的结果作为一个元祖的元素
5finditer
finditer(正则表达式, 字符串)
--> 查找所有满足正则条件的子串,返回值是迭代器,迭代器中的元素是匹配对象
6 split
split(正则表达式,字符串) --> 将字符串按照满足正则表达式条件的子串进行分割
"""
str1 = 'ahsb1sssa8-jjhd7nhs+90nsjhf3-4hhh7+8kjj-'
result = resplit(r'[-+]', str1)
print(result)
7sub
sub(正则表达式,repl,字符串) --> 将字符串中满足正则表达式条件的子串替换成repl。返回替换后的字符串
作业
1 写一个正则表达式判断一个字符串是否是ip地址
规则:一个ip地址由4个数字组成,每个数字之间用连接。每个数字的大小是0-255 例如:2551891037 正确 256189899 错误
2 计算一个字符串中所有的数字的和
例如:字符串是:‘hello90abc 78sjh125’ 结果是90+78+125 = 1805
3 验证输入的内容只能是汉字
4 电话号码的验证
二、不定项选择题
编辑于 2020-12-21 17:02
Python
正则表达式
赞同 22
3 条评论
分享
</article>
[上传失败(image-b1d3-1650193970960)]
懒人必备
[[上传失败(image-645a0f-1650193970961)]
裸睡的猪发表于猪哥的Py]( >
一直以来,使用正则表达式的机会不少,经常用来做一些字符串处理工作,还是比较方便的,不过对于断言和贪婪懒惰模式的认识一直比较模糊。最近我们后端组在协作开发一个对外的后台项目,前端的接口文档是用word写了(汗-_-||,很难用啊,还是markdown比较好)里面有一个接口列表的表格,这里的接口列表需要提取出来,形成一个权限链路做权限控制,减少ajax的RBAC权限配置的臃肿。这里我用了正则表达式来完成,做完之后我对正则表达式的理解和使用也算是小成了,下面我就说一下正则表达式几种常见用法我的理解。
网上有 《正则表达式30分钟入门教程》 珠玉在前,基础知识我就不多说了,大家自己去看。
1、对于一些有一定模式或者以一定规律出现的字符串,我们想要匹配并且捕获到它们;
2、这些字符串我们不但要匹配捕获到它们,还要向后引用进行例如替换之类的处理;
正则表达式中分组的单位用(exp)小括号来区分,里面exp就是要匹配的内容。
匹配ip地址xxxxxxxxxxxx可以写成以下形式
匹配少数民族的真实姓名
(此处贴个毕加索的全名。。。 [巴勃罗·迭戈·荷瑟·山迪亚哥·弗朗西斯科·德·保拉·居安·尼波莫切诺·克瑞斯皮尼亚诺·德·罗斯·瑞米迪欧斯·西波瑞亚诺·德·拉·山迪西玛·特立尼达·玛利亚·帕里西奥·克里托·瑞兹·布拉斯科·毕加索] )
而正则表达式中默认第0个分组是匹配到整条正则表达式的字符串
我们还可以给分组进行命名,方便区分
匹配到exp的内容就会捕获到一个命名为name的分组里面,不影响原来的索引分组情况,也可以写成
在向后引用中,我们可以使用 \n 或者 $n 来引用匹配到的分组内容,即第n个出现的小括号。
在正则表达式中,我们可以选择关闭对不需要的内容的捕获,就是不捕获,以此来提高正则表达式的执行速度和节约内存使用。
语法是:
零宽,顾名思义,就是没有宽度,匹配到的字符串不会被捕获。
断言,就是true or false。
下面是4种断言的说明:
ps:千万傻傻别去的记名称,理解用法最重要
零宽断言只是用来判断是否符合继续匹配的条件,并不会找到真正需要的字符串,本身并不会匹配字符
例如,在爬虫中我们可能需要匹配某些url,我们就可以用断言来获取url。
正则表达式中默认的行为是在整个表达式能够匹配的前提下,匹配 尽可能多 的字符,这称之为贪婪模式。
不过有时候,我们还在整个表达式匹配的前提下尽可能少的匹配字符,这就需要用到懒惰模式了。
懒惰模式的语法也简单,只需要在你所需匹配的字符后面再加一个?即可。
解释:懒惰模式就是在你设想字符可能出现的次数中,尽可能匹配少的次数。
以上就是正则表达式的分组,零宽断言和贪婪懒惰模式的讲解,下期再见。
>>> import re
>>> s='aabb'
>>> [match[0] for match in refindall(r'((\w)\2)', s)]
['aa', 'bb']
>>>
举例:正则 (>
以上就是关于sqlserver中正则表达式和分组查询全部的内容,包括:sqlserver中正则表达式和分组查询、正则表达式、正则分组,零宽断言和贪婪懒惰模式等相关内容解答,如果想了解更多相关内容,可以关注我们,你们的支持是我们更新的动力!
欢迎分享,转载请注明来源:内存溢出
微信扫一扫
支付宝扫一扫
评论列表(0条)