sqlserver中正则表达式和分组查询

仿真食品模型•2023-4-28•框架•阅读25

使用vbscript 或者是frameword程序集向SqlServer数据库中添加一个正则表达式函数，就可以满足你的需求了嘛。

vbscript 函数(需要SqlServer运行环境中vbscript 库)

CREATE function [dbo][RegexMatchFirst]

(

@source ntext, --原字符串

@regexp varchar(1000), --正则表达式

@global bit = 1, --是否是全局替换

@ignoreCase bit = 0 --是否忽略大小写

)

returnS varchar(1000) AS

begin

declare @hr integer

declare @objRegExp integer

declare @objMatch INT

declare @matchcount INT

declare @command varchar(50)

declare @result varchar(5000)

exec @hr = sp_OACreate 'VBScriptRegExp', @objRegExp OUTPUT

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'Pattern', @regexp

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'Global', @global

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OASetProperty @objRegExp, 'IgnoreCase', @ignoreCase

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

exec @hr = sp_OAMethod @objRegExp, 'execute', @objmatch OUTPUT, @source

IF @hr <> 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

EXEC @hr= sp_OAGetProperty @objmatch, 'count', @matchcount OUT

IF @hr <> 0 or @objmatch = 0 begin

exec @hr = sp_OADestroy @objRegExp

return null

end

set @command = 'item(0)Value'

EXEC @hr= sp_OAGetProperty @objmatch, @command, @result OUT

exec @hr = sp_OADestroy @objRegExp

IF @hr <> 0 begin

return null

end

return @result

end

framework运行时程序集：

打开 Microsoft Visual Studio，创建一个sqlserver 数据库数据库项目，在项目中按照SqlServer方式创建一个正则表达式匹配函数，然后编译部署到你的SqlServer数据库中。

这个时候刷新数据库的可编程性-->函数 --> 标量值函数就会看到你在Microsoft Visual Studio中创建的自定义函数了。

<main role="main" class="App-main" style="padding-bottom: 46px;">

首发于 Python办公自动化

无障碍写文章

登录

<article class="Post-Main Post-NormalMain" tabindex="-1" style="box-sizing: border-box; outline: none;">

<header class="Post-Header" style="margin: 0px auto; width: 690px;">

第一小乔乔

进一步，是一步。一起工作进步，厨艺精进，生活美满。

22 人赞同了该文章

</header>

[上传失败(image-f7fc00-1650193970962)]

match()和search()都只匹配出一个符合条件的字符串，若想要所有，可以使用refindall()

# 用[]{}判断密码是否符合要求 ：密码是由数字和字母组成，并且位数是6-16位

##用split按-或者空白格分割字段

结果：['ahsb1sssa8', 'jjhd7nhs', '90nsjhf3', '4hh', 'h7', '8kjj', 'sfav']

#用sub替换符合条件的关键词， 试试马赛克脏话（想起农药不能痛骂队友的愤怒）

##练练转义

## findall返回符合表达式的子串

一、正则表达式语法

正则表达式是用匹配或者描述字符串的工具。

用处：

a判断字符串是否满足某个条件---判断输入的字符串是否是邮箱/手机号码。是否是ip地址

b提取满足条件的字符串

c字符串替换

Python中通过re模块中相应的方法来支持正则表达式的匹配、查找和替换等功能

fullmatch(正则表达式字符串, 字符串) ---> 判断正则表达式和字符串是否完全匹配

正则表达式字符串: 就是一个字符串，字符串中是正则表达式语法。r'正则表达式'

正则表达式中包含两个部分，一个是正则语法对应的字符，二个是普通字符

1 (点)(匹配任意字符)

一个只匹配一个任意字符

2 \w(匹配字母数字下划线)

一个\w匹配一个字符

3 \s(匹配任意空白字符)

空白字符: 空格、制表符(\t)、回车(换行\n)等，都输入空白字符

一个\s匹配一个空白字符

4 \d(匹配数字字符)

一个\b不会去匹配一个字符，而是单纯的检测\b出现的位置是否是单词边界

单词边界: 字符串开始和结尾、空格、换行、标点符号等，可以将两个单词隔开的字符都单词边界

6 ^(检测是否是字符串开头)

re_str = r'^\d\d\d' # 判断一个字符串是否是三个数字开头

7 $(检测是否是字符串结尾)

8 \W(匹配非字母、数字下划线)

9 \S(匹配非空白字符)

10 \D(匹配非数字字符)

11 \B(检测是否不是单词边界)

12 [] (匹配中括号中出现的任意一个字符)

一个[]匹配一个字符

[字符集] --> 匹配一个字符，这字符是字符集中的任意一个字符

例如：[abc], [\d+]

[字符1-字符2] --> 匹配一个字符，这个字符是Unicode编码值在字符1到字符2中的任意一个字符;要求字符1的编码值要小于字符2

例如：[1-9] --> 数字1到9 [a-z] --> 小写字母 [A-Z] --> 大写字母

[\u0031-\u0039] --> 数字1到9

[\u4E00-\u9fa5] --> 匹配所有的汉字

注意：-在中括号中，如果放在两个字符之间表示范围。

13 [^字符集] (匹配一个不在字符集中的任意字符)

注意：^必须放在中括号中的最前面才有效

二、正则表达式次数相关符号

from re import fullmatch

1 (匹配0次或者多次)

字符 --> 字符出现0次或者多次

2 +(匹配一次或者多次)

3 (匹配0次或者1一次)

练习：写一个正则表达式，匹配所有的整数（123, -2334, +9可以匹配的，012， -023，+0122不能匹配）

{N} --> 匹配N次

{M,N} --> 匹配M到N次

{M,} --> 至少匹配M次

{,N} --> 最多匹配N次

三、分之和分组

import re

1 |(分之)

条件1|条件2 --> 先用条件1去匹配，如果匹配成功就匹配成功。如果条件1匹配失败，用条件2去匹配。

注意：如果条件1匹配成功就不会用条件2再去匹配

能匹配成功时abc，d和aaa

'abc'+W/H/Y

2 ()(分组)

a组合(将括号中的内容作为一个整体进行 *** 作)

b捕获 -- 使用带括号的正则表达式匹配成功后，只获取括号中的内容

c重复 -- 在正则表达式中可以通过\数字来重复前面()中匹配到的结果。数字代表前第几个分组

a组合

匹配一个字符串，以数字字母的组合出现3次

b捕获

c重复

3转义符号

正则表达式中可以通过在特殊的符号前加\，来让特殊的符号没有意义

--> 任意字符 --> 字符

注意：在中括号有特殊功能的符号，只代表符号本身

\不管在哪儿都需要转义

-在[]外面没有特殊功能,在[]中要表示-本身，就不要放在两个字符之间

()需要转义

四、re模块中的函数

import re

1 compile

compile(正则表达式字符串) --> 将正则表达式字符串转换成正则表达式对象

2 fullmatch和match

fullmatch(正则表达式字符串, 字符串)

--> 用正则表达式去完全匹配字符串(匹配整个字符串)，返回匹配对象(SRE_Match)或者None

match(正则表达式字符串, 字符串)

--> 匹配字符串开头,返回匹配对象或者None

1span(group=0) --> 获取匹配成功的区间(左闭右开区间)

print(resultspan(0))

print(resultstart(1)) # 获取匹配到的开始下标

print(resultend(1)) # 获取匹配到的结束下标后的下标

2group(group = 0) --> 获取匹配结果

group()/group(0) --> 获取正则表达式完全匹配的结果

group(index>0) --> 获取正则表达式中第group个分组匹配到的结果

3string --> 获取被匹配的原字符串

3search

search(正则表达式, 字符串)

--> 查找字符串中满足正则表达式的第一个字符串。返回值是匹配对象或者None

练习：使用search匹配出一个字符串中所有的数字字符串'abc34jshd8923jkshd9lkkk890k' --> 34，8923，9，890

4findall

findall(正则表达式, 字符串) --> 获取字符串中满足正则表达式的所有的子串，返回一个列表

注意：如果正在表达式中有分组，取值的时候只取分组中匹配到的结果;

如果有多个分组，会将每个分组匹配到的结果作为一个元祖的元素

5finditer

finditer(正则表达式, 字符串)

--> 查找所有满足正则条件的子串，返回值是迭代器，迭代器中的元素是匹配对象

6 split

split(正则表达式,字符串) --> 将字符串按照满足正则表达式条件的子串进行分割

"""

str1 = 'ahsb1sssa8-jjhd7nhs+90nsjhf3-4hhh7+8kjj-'

result = resplit(r'[-+]', str1)

print(result)

7sub

sub(正则表达式,repl,字符串) --> 将字符串中满足正则表达式条件的子串替换成repl。返回替换后的字符串

作业

1 写一个正则表达式判断一个字符串是否是ip地址

规则：一个ip地址由4个数字组成，每个数字之间用连接。每个数字的大小是0-255 例如：2551891037 正确 256189899 错误

2 计算一个字符串中所有的数字的和

例如：字符串是：‘hello90abc 78sjh125’ 结果是90+78+125 = 1805

3 验证输入的内容只能是汉字

4 电话号码的验证

二、不定项选择题

编辑于 2020-12-21 17:02

Python

正则表达式

赞同 22

3 条评论

分享

</article>

[上传失败(image-b1d3-1650193970960)]

懒人必备

[[上传失败(image-645a0f-1650193970961)]

裸睡的猪发表于猪哥的Py]( >

一直以来，使用正则表达式的机会不少，经常用来做一些字符串处理工作，还是比较方便的，不过对于断言和贪婪懒惰模式的认识一直比较模糊。最近我们后端组在协作开发一个对外的后台项目，前端的接口文档是用word写了（汗-_-||，很难用啊，还是markdown比较好）里面有一个接口列表的表格，这里的接口列表需要提取出来，形成一个权限链路做权限控制，减少ajax的RBAC权限配置的臃肿。这里我用了正则表达式来完成，做完之后我对正则表达式的理解和使用也算是小成了，下面我就说一下正则表达式几种常见用法我的理解。

网上有 《正则表达式30分钟入门教程》 珠玉在前，基础知识我就不多说了，大家自己去看。

1、对于一些有一定模式或者以一定规律出现的字符串，我们想要匹配并且捕获到它们；

2、这些字符串我们不但要匹配捕获到它们，还要向后引用进行例如替换之类的处理；

正则表达式中分组的单位用(exp)小括号来区分，里面exp就是要匹配的内容。

匹配ip地址xxxxxxxxxxxx可以写成以下形式

匹配少数民族的真实姓名

（此处贴个毕加索的全名。。。 [巴勃罗·迭戈·荷瑟·山迪亚哥·弗朗西斯科·德·保拉·居安·尼波莫切诺·克瑞斯皮尼亚诺·德·罗斯·瑞米迪欧斯·西波瑞亚诺·德·拉·山迪西玛·特立尼达·玛利亚·帕里西奥·克里托·瑞兹·布拉斯科·毕加索] ）

而正则表达式中默认第0个分组是匹配到整条正则表达式的字符串

我们还可以给分组进行命名，方便区分

匹配到exp的内容就会捕获到一个命名为name的分组里面，不影响原来的索引分组情况，也可以写成

在向后引用中，我们可以使用 \n 或者 $n 来引用匹配到的分组内容，即第n个出现的小括号。

在正则表达式中，我们可以选择关闭对不需要的内容的捕获，就是不捕获，以此来提高正则表达式的执行速度和节约内存使用。

语法是：

零宽，顾名思义，就是没有宽度，匹配到的字符串不会被捕获。

断言，就是true or false。

下面是4种断言的说明：

ps：千万傻傻别去的记名称，理解用法最重要

零宽断言只是用来判断是否符合继续匹配的条件，并不会找到真正需要的字符串，本身并不会匹配字符

例如，在爬虫中我们可能需要匹配某些url，我们就可以用断言来获取url。

正则表达式中默认的行为是在整个表达式能够匹配的前提下，匹配 尽可能多 的字符，这称之为贪婪模式。

不过有时候，我们还在整个表达式匹配的前提下尽可能少的匹配字符，这就需要用到懒惰模式了。

懒惰模式的语法也简单，只需要在你所需匹配的字符后面再加一个？即可。

解释：懒惰模式就是在你设想字符可能出现的次数中，尽可能匹配少的次数。

以上就是正则表达式的分组，零宽断言和贪婪懒惰模式的讲解，下期再见。

>>> import re

>>> s='aabb'

>>> [match[0] for match in refindall(r'((\w)\2)', s)]

['aa', 'bb']

>>>

举例：正则 (>

以上就是关于sqlserver中正则表达式和分组查询全部的内容，包括:sqlserver中正则表达式和分组查询、正则表达式、正则分组，零宽断言和贪婪懒惰模式等相关内容解答，如果想了解更多相关内容，可以关注我们，你们的支持是我们更新的动力！

欢迎分享，转载请注明来源：内存溢出

原文地址:https://54852.com/web/9449062.html

字符串字符正则表达式数字括号

打赏

微信扫一扫

支付宝扫一扫

仿真食品模型一级用户组

ASP.NET(C#)中GridView怎么获得当前行的信息

上一篇 2023-04-28

利用oracle存储过程计算时长并剔除18:00-8:30之间的非工作时间

下一篇2023-04-28

发表评论

登录后才能评论

评论列表（0条）