当前位置:首页 » 编程语言 » sql正则表达式用法
扩展阅读
webinf下怎么引入js 2023-08-31 21:54:13
堡垒机怎么打开web 2023-08-31 21:54:11

sql正则表达式用法

发布时间: 2022-04-23 06:38:08

❶ 在ms sql中如何使用正则表达式,请给出简单示例,注释越详细越好!感激不尽

MSSQL不支持正则表达式,可以用CLR实现。

1、新建一个MSSQL的数据库项目,配置到你的数据库中

2、在数据库项目中新建一个函数库,编写如下代码:

///<summary>

///验证是否符合正则表达式

///</summary>

[SqlFunction]

(stringinput,stringregex)

{

returnnewSqlBoolean(Regex.IsMatch(input,regex,RegexOptions.IgnoreCase));

}

然后在数据库项目上点击“右键”,选择“部署”

PS:此功能需要MSSQL2005或者以上版本支持

如果你使用的是.NET3.5版本的话,需要在数据库服务器上安装.netframework3.5

目前SQLSERVERCLR不支持.NET4.0,所以如果你使用VS2010开发的话需要把项目版本修改成为.NET2.0/3.5

使用方法:

SELECT*FROM[table]WHEREdbo.RegexIsMatch([ID],'^d+$')=1

❷ sql 实现正则表达式

没有正则表达式LIKE

确定给定的字符串是否与指定的模式匹配。模式可以包含常规字符和通配符字符。模式匹配过程中,常规字符必须与字符串中指定的字符完全匹配。然而,可使用字符串的任意片段匹配通配符。与使用 = 和 != 字符串比较运算符相比,使用通配符可使 LIKE 运算符更加灵活。如果任何参数都不属于字符串数据类型,Microsoft® SQL Server™ 会将其转换成字符串数据类型(如果可能)。

语法
match_expression [ NOT ] LIKE pattern [ ESCAPE escape_character ]

参数
match_expression 任何字符串数据类型的有效 SQL Server 表达式。
patternmatch_expression 中的搜索模式,可以包含下列有效 SQL Server 通配符

1 % 包含零个或更多字符的任意字符串
示例:WHERE title LIKE '%computer% ' 将查找处于书名任意位置的包含单词 computer 的所有书名。

2 _(下划线) 任何单个字符
示例:WHERE au_fname LIKE '_ean ' 将查找以 ean 结尾的所有 4 个字母的名字(Dean、Sean 等)。

3 [] 指定范围中的任何单个字符
示例:WHERE au_lname LIKE '[C-P]arsen ' 将查找以arsen 结尾且以介于 C 与 P 之间的任何单个字符开始的 作者姓氏,例如,Carsen、Larsen、Karsen 等

4 [^] 不属于指定范围中的任何单个字符,与 [] 相反
示例:WHERE au_lname LIKE 'de[^l]% ' 将查找以 de 开始且其后的字母不为 l 的所有作者的姓氏。

一 使用 like 的模式匹配:
在搜索Datetime类型时,建议使用like .
LIKE 支持 ASCII 模式匹配和 Unicode 模式匹配。当所有参数,包括 match_expression、pattern 和 escape_character(如果有)都是 ASCII 字符数据类型时,将执行 ASCII 模式匹配。如果其中任何参数属于 Unicode 数据类型,则所有参数将被转换为 Unicode 并执行 Unicode 模式匹配。当对 Unicode 数据(nchar 或 nvarchar 数据类型)使用 LIKE 时,尾随空格是有意义的。但是对于非 Unicode 数据,尾随空格没有意义。Unicode LIKE 与 SQL-92 标准兼容。ASCII LIKE 与 SQL Server 的早期版本兼容

二 使用 % 通配符

例如,此查询将显示数据库中所有的系统表,因为它们都以字母 sys 开始:
SELECT TABLE_NAME
FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME LIKE 'sys% '
若要查阅非系统表的所有对象,请使用 NOT LIKE 'sys% '。如果共有 32 个对象且 LIKE 找到 13 个与模式匹配的名称,则 NOT LIKE 将找到 19 个与 LIKE 模式不匹配的对象

三 使用escape字句的模式匹配

可搜索包含一个或多个特殊通配符的字符串。例如,customers 数据库中的 discounts 表可能存储含百分号 (%) 的折扣值。若要搜索作为字符而不是通配符的百分号,必须提供 ESCAPE 关键字和转义符。例如,一个样本数据库包含名为 comment 的列,该列含文本 30%。若要搜索在 comment 列中的任何位置包含字符串 30% 的任何行,请指定由 WHERE comment LIKE '%30!%% ' ESCAPE '! ' 组成的 WHERE 子句。如果不指定 ESCAPE 和转义符,SQL Server 将返回所有含字符串 30 的行。

下例使用 ESCAPE 子句和转义符查找 mytbl2 表的 c1 列中的精确字符串 10-15%

USE pubs
GO
IF EXISTS(SELECT TABLE_NAME FROM INFORMATION_SCHEMA.TABLES
WHERE TABLE_NAME = 'mytbl2 ')
DROP TABLE mytbl2
GO
USE pubs
GO
CREATE TABLE mytbl2
(
c1 sysname
)
GO
INSERT mytbl2 VALUES ( 'Discount is 10-15% off ')
INSERT mytbl2 VALUES ( 'Discount is .10-.15 off ')
GO
SELECT c1
FROM mytbl2
WHERE c1 LIKE '%10-15!% off% ' ESCAPE '! '
GO

四 使用 [] 通配符

下例查找姓为 Carson、Carsen、Karson 或 Karsen 的作者所在的行。
USE pubs
SELECT au_lname, au_fname, phone
FROM authors
WHERE au_lname LIKE '[CK]ars[eo]n '
ORDER BY au_lname ASC, au_fname ASC

❸ oracle SQL 正则表达式

正则表达式已经在很多软件中得到广泛的应用,包括*nix(Linux, Unix等),HP等操作系统,PHP,C#,Java等开发环境。
本文主要介绍了关于Oracle中正则表达式的使用方法,下面话不多说了,来一起看看详细的介绍。
Oracle使用正则表达式离不开这4个函数:regexp_like、regexp_substr、regexp_instr、regexp_replace。
1、regexp_like
该函数只能用于条件表达式,和 like 类似,但是使用的正则表达式进行匹配
2、regexp_substr
该函数和 substr 类似,用于拾取合符正则表达式描述的字符子串
3、regexp_instr
该函数和 instr 类似,用于标定符合正则表达式的字符子串的开始位置
4、regexp_replace
该函数和 replace 类似,用于替换符合正则表达式的字符串

❹ sql 正则表达式匹配

  • 当我们要进行一些简单的糊涂查询时用百分号(%),通配符(_)就可以了.其中%表达任意长度的字符串,_表示任意的某一个字符.

比如

select*fromempwhereenamelike's%'orenamelike's_';

但如果在一些复杂的查询中关用这两个符号sql语句就会非常复杂,而且也不一定能实现.从Oracle 10g开始引入了在其他程序语言中普通使用的正则表达式.

主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数.

  • 正则表达式中的元字符:

元字符 意思 例子

说明要匹配的字符是一个特殊字符、常量或者后者引用。(后引用重复上一次的匹配)

匹配换行符
\ 匹配
匹配(匹配 )


^ 匹配字符串的开头位置 ^a匹配arwen.但不匹配barwen.

$ 匹配字符串的末尾位置 en$匹配arwen.但不匹配arwenb.

* 匹配前面的字符0次或多次 a*rwen可以匹配rwen或aaarwen.

+ 匹配前面的字符1次或多次 a+rwen可以匹配arwen或aarwen.但不能匹配rwen.

? 匹配前面的字符0次或1次 a?rwen可以匹配arwen或rwen.但不能匹配aarwen.

{n} 匹配前面的字符恰好是n次,其中n是整数 ar{2}wen可以匹配arrwen.但不能匹配arwen或arrrwen.

{n,m} 匹配前面的字符至少是n次,最多是m次.如果写成{n,} 表示最少匹配n次.没有上限.

ar{1,2}wen可以匹配arwen,arrwen.但不匹配awen或arrrwen.


. 点号,匹配除null,换行以外的任意单个字符 arw.n.可以匹配arwen,arwin.但不能匹配arween或arwn.

(pattern) 括号中pattern是一个子正则表达式,匹配指定pattern模式的一个子表达式。 其实括号就像一般语言表达式中的括号.有时多加些括号可增强可读性.另外的用处见下面关于 的描述.

x|y 匹配“或” x|y可以匹配x或者y

[abc] 可以匹配abc中的任何单个字符 hello[abc]可以匹配helloa,hellob,helloc

[a-z] 可以匹配指定范围内的任何单个字符 hell[a-z]可以匹配hello或者hellz

[::] 指定一个字符类,可以匹配该类中的任何字符 [:alphanum:]可以匹配字符0-9、A-Z、a-z
[:alpha:]可以匹配字符A-Z、a-z
[:blank:]可以匹配空格或tab键
[:digit:]可以匹配数字0-9
[:graph:]可以匹配非空字符
[:lower:]可以匹配小写字母a-z
[:print:]与[:graph:]类似,不同之处在于[:print:]包括空格字符
[:punct:]可以匹配标点符号.,""等等
[:space:]可以匹配所有的空字符
[:upper:]可以匹配大写字母A-Z
[:xdigit:]可以匹配十六进制数字0-9、A-F、a-f

这是对前一次匹配命中的一个后引用,其中n是一个正整数 arw(en)1可以匹配arwenen.注意1前面必须是个加括号的子表达式.

  1. regexp_like:

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:
‘c’ 说明在进行匹配时区分大小写(缺省值);
'i' 说明在进行匹配时不区分大小写;
'n'(.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行.
'm' 字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置.

示例:select * from emp where regexp_like(ename,'^a[a-z]*n$');可以查找ename中以a开头以n结尾的行.例如ename为arwen或arwin或anden.但Arwen不能被匹配.因为默认是区分大小写.如果是select * from emp where regexp_like(ename,'^a[a-z]*n$','i')则可以查找ename为Arwen的行记录.

2. regexp_instr:

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关:
'start' 开始查找的位置;
'occurrence' 说明应该返回第几次出现pattern的位置;
'return_option' 说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后 的字符的位置;
'match_option' 修改默认的匹配设置.与regexp_like里面的相同.

示例:

DECLARE

V_RESULTINTEGER;

BEGIN

SELECT REGEXP_INSTR('hello world','o',1,1,0)INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为5.即字母o第一个次出现的位置

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数.比如1,3.则结果为6.表示第一次出现字母o的后面一个字符的位置.

如果regexp_instr('hello world','o',1,2,0)则结果为9.表示第二次出现字母o的位置.

3. regexp_replace:

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数

示例:

DECLARE

V_RESULT varchar2(90);

BEGIN

SELECT REGEXP_REPLACE('hello world','o','x',1,1)INTO V_RESULT

  1. FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为hellx world.

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.

如果 REGEXP_REPLACE('hello w


orld','o','x',1,2)则结果为hello wxrld.

4.regexp_substr:

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.

例如:

DECLARE

V_RESULT VARCHAR2(255);

BEGIN

SELECTREGEXP_SUBSTR('hello world','l{2}')INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为ll

查询到匹配的字符串才返回匹配的字符.没查到就返回空.

❺ SQL Server 2008 R2如何使用正则表达式搜索

使用正则表达式进行查找若要在“快速查找”、“在文件中查找”、“快速替换”或“在文件中替换” 操作过程中,在“查找内容”字段启用正则表达式,请在“查找选项”下选中“使用”,再选择“正则表达式”。“查找内容”字段旁边的“引用列表”三角形按钮将变为可用状态。单击此按钮可显示一组最常用的正则表达式。如果选择了表达式生成器中的某个项,则可将该项插入“查找内容”字符串。注意“查找内容”字符串中使用的正则表达式与 Microsoft .NET Framework 编程中的有效正则表达式相比,语法上存在差异。例如,在“查找和替换”对话框中,大括号 {} 用于表示带标记的表达式。所以,表达式“zo{1}”将匹配所有“zo”后带标记 1 的匹配项,如“Alonzo1”和“Gonzo1”。但在 .NET Framework 中,{} 符号用于表示量词。因此,表达式“zo{1}”将匹配所有“z”后跟一个“o”的匹配项,如匹配“zone”,但不匹配“zoo”。下表对“引用列表”中提供的正则表达式进行了说明。 表达式语法说明任何单个字符.匹配除换行符外的所有单一字符。零个或更多*匹配零或更多前导表达式的匹配项,执行所有可能的匹配。一个或更多+匹配至少一个前导表达式的匹配项。行首^仅匹配行首位置的字符串。行尾$仅匹配行尾位置的字符串。字首<仅匹配文本中以此开头的字。字尾>仅匹配文本中以此结尾的字。分行符\n匹配与平台无关的换行符。在替换表达式中,插入一个换行符。在集合中的任何一个字符[]匹配[] 中的任何一个字符。若要指定字符范围,请列出起始字符和结束字符,并用短划线 (-) 分隔,如 [a-z]。不在集合中的任何一个字符[^...]匹配不在 ^ 之后的字符集中的任何一个字符。或|匹配“或”符号 (|) 两旁的任一表达式。常用于组中。例如,(sponge|mud) bath 可以匹配“sponge bath”和“mud bath”。Escape\将反斜杠 (\) 后的字符作为文字匹配。此表达式允许您搜索正则表达式标记中使用的符号,如 { 和 ^。例如, \^ 可用于查找字符 ^。标记表达式{}匹配用括起来的表达式内的文本。C/C++ 标识符:i匹配表达式 ([a-zA-Z_$][a-zA-Z0-9_$]*)。用引号括起来的字符串:q匹配表达式 (("[^"]*")|('[^']*'))。空格或制表符:b匹配空格或制表符。整数:z匹配表达式 ([0-9]+)。“引用列表”中只列出了部分可在“查找和替换”操作中使用的正则表达式。还可以将下列任一正则表达式插入“查找内容”字符串: 表达式语法说明最少- 零个或更多@匹配零个或更多前导表达式的匹配项,匹配尽可能少的字符。最少- 一个或更多#匹配一个或更多前导表达式的匹配项,匹配尽可能少的字符。重复n 次^n匹配前导表达式的 n 个匹配项。例如,[0-9]^4 匹配所有四位数序列。分组()将子表达式分组第n 个标记文本\n在“查找或替换”表达式中,指示匹配第 n 个标记表达式的文本,其中 n 为 1 到 9 之间的数字。在“替换”表达式中,\0 将插入完整的匹配文本。右对齐字段\(w,n)在“替换”表达式中,在宽度至少为 w 个字符的字段中,右对齐第 n 个标记表达式。左对齐字段\(-w,n)在“替换”表达式中,在宽度至少为 w 个字符的字段中,左对齐第 n 个标记表达式。阻止匹配~(X)如果在表达式的此处出现 X,则阻止匹配。例如,real~(ity) 匹配“realty”和“really”中的“real”,但不匹配“reality”中的“real”。字母数字字符:a匹配表达式 ([a-zA-Z0-9])。字母字符:c匹配表达式 ([a-zA-Z])。十进制数字:d匹配表达式 ([0-9])。十六进制数:h匹配表达式 ([0-9a-fA-F]+)。有理数:n匹配表达式 (([0-9]+.[0-9]*)|([0-9]*.[0-9]+)|([0-9]+))。字母字符串:w匹配表达式 ([a-zA-Z]+)。Escape\eUnicode U+001B。响铃\gUnicode U+0007。Backspace\hUnicode U+0008。制表符\t匹配制表符,Unicode U+0009。Unicode 字符\x#### 或 \u####匹配由 Unicode 值确定的字符,其中 #### 为十六进制数字。可以使用 ISO 10646 码位或给出代理项对值的两个 Unicode 码位,指定基本多语言面(即代理项)以外的字符。下表列出了按标准 Unicode 字符属性匹配时的语法。双字母缩写和 Unicode 字符属性数据库中列出的缩写相同。可以将这些缩写指定为字符集的一部分。例如,表达式 [:Nd:Nl:No] 匹配任何数字。 表达式语法说明大写字母:Lu匹配任何单个大写字母。例如,:Luhe 匹配“The”,但不匹配“the”。小写字母:Ll匹配任何单个小写字母。例如,:Llhe 匹配“the”,但不匹配“The”。标题大写字母:Lt匹配一个大写字母后跟一个小写字母的字符,例如 Nj 和 Dz。修饰字母:Lm匹配字母或标点符号(如逗号、交叉重音符和秒号),这些字母或标点符号是用于修饰前导字母的。其他字母:Lo匹配其他字母,如歌特字母 ahsa。十进制数字:Nd匹配十进制数字(如 0-9)及其全角对等数字。字母数字:Nl匹配字母数字,如罗马数字和零的表意数字。其他数字:No匹配其他数字,如旧斜体数字一。左标点:Ps匹配左标点,如左小括号和左大括号。右标点:Pe匹配右标点,如右小括号和右大括号。左引号:Pi匹配左双引号。右引号:Pf匹配单引号和右双引号。划线号:Pd匹配划线号。连接号:Pc匹配下划线符号。其他标点:Po匹配(,)、?、"、!、@、#、%、&、*、\、(:)、(;)、' 和 /。空格分隔符:Zs匹配空格。行分隔符:Zl匹配Unicode 字符 U+2028。段落分隔符:Zp匹配Unicode 字符 U+2029。不占位标记:Mn匹配不占位标记。合并标记:Mc匹配合并标记。封闭标记:Me匹配封闭标记。数学符号:Sm匹配+、=、~、|、< 和 >。货币符号:Sc匹配$ 和其他货币符号。修饰符号:Sk匹配修饰符号,如抑扬符、重音符和长音符。其他符号:So匹配其他符号,如版权符号、段落标记和度数符号。其他控制:Cc匹配行尾。其他格式:Cf格式化控制字符,如双向控制字符。代理项:Cs匹配代理项对的一半。其他专门用途:Co匹配任何专用区域的字符。其他未分配字符:Cn匹配未映射到 Unicode 字符的字符。除了标准的 Unicode 字符属性以外,还可以将下列附加属性指定为字符集的一部分。 表达式语法说明字母:Al匹配任何单字符。例如,:Alhe 匹配“The”、“then” 和“reached”之类的字。Numeric:Nu匹配任何数字。标点:Pu匹配任意一个标点符号,如 ?、@、' 等等。空格:Wh匹配任何类型的空格,包括印刷空格和表意空格。双向:Bi匹配自右至左书写的字符,如阿拉伯语和希伯莱语字符。朝鲜文字:Ha匹配朝鲜文字字母和组合字母。平假名:Hi匹配平假名字符。片假名:Ka匹配片假名字符。象形/汉字/日文汉字:Id匹配象形字符,如汉字和日文汉字。用于查找文本的正则表达式Expression Studio 4.0 其他版本 此主题尚未评级 - 评价此主题 通过使用正则表达式,可以在 Microsoft Expression Web 中执行繁复的查找和替换操作。如果您不知道所要查找的确切文本或代码,或者要查找文本或代码字符串的多个匹配项,则可以使用正表达式。正则表达式是一种文本模式,它可以描述所要查找的文本的一种或多种变体。正则表达式由特定字符(如字母“a”到“z”)和描述文本模式的特殊字符(如星号“*”)组成。例如,要在网站中查找“page”的所有变体,可以搜索“page*”。这样,Expression Web 将在网站中查找“page”、“pages”、“pager”以及以“page”开头的任何其他单词的所有实例。在搜索中使用正则表达式时,特定的规则将控制哪些字符组合将执行特定的匹配操作。每种正则表达式(或正则表达式的组合)都称为“语法”。可以在一个语法中使用多个正则表达式以精确匹配要搜索的目标。若要使用正则表达式,请参阅使用查找和替换编辑多个网页。正则表达式语法 语法表达式说明.任意字符 用作换行符 (\n) 以外的任何单个打印或非打印字符的通配符。例如,正则表达式 c.t 可匹配 cat、c t、cot 等字符串,但不能匹配 cost。在本例中,句点 (.) 是一个代表单个字符的通配符。它出现在字母“c”和“t”之间,因此字符“c”和“t”之间的任何单个字符都与表达式匹配 - 即使是空格也一样。*最大为零或更多 用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能多的字符相匹配。正则表达式 .* 用于匹配某个出现零次或更多次的字符。例如,正则表达式 b.*k 可匹配 book、back、black、blank 和 buck。在本例中,将句点 (.) 和星号 (*) 组合成一个语法。句号 (.) 紧挨在星号 (*) 表达式之前。星号 (*) 可匹配“b”和“k”之间任意出现零次或更多次的字符。句点 (.) 用作“b”和“k”之间字符的通配符。在本例中,它表示“b”和“k”之间的任意字符都可以反复出现。+最大为一或更多 用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能多的字符相匹配。正则表达式 .+ 用于匹配某个出现一次或更多次的字符。例如,正则表达式 bo+. 可匹配 bob、book 和 boot。在本例中,将句点 (.) 和加号 (+) 组合成一个语法。句号 (.) 紧挨在加号 (+) 表达式之后。加号 (+) 可与出现一次或更多次的字母“o”相匹配。句点 (.) 用作每个单词的最后一个字符的通配符。在本例中,该字符为“b”、“k”和“t”。@最小为零或更多 用于匹配在此表达式之前出现零次或更多次的某个字符,可与尽可能少的字符相匹配。正则表达式 .@ 用于匹配某个出现零次或更多次的字符。例如,正则表达式 a.@x 可匹配“abxbxb”中的“abx”和“acxcxc”中的“acx”。在本例中,将句号 (.) 和 @ 符号组合成一个语法。句点 (.) 紧挨在 @ 符号表达式之前。@ 符号可与“a”和“x”之间出现零次或更多次的任意字符相匹配。在本例中,句点 (.) 用作字符“a”和“x”之间的字符“b”和“c”的通配符。#最小为一或更多 用于匹配在此表达式之前出现一次或更多次的某个字符,可与尽可能少的字符相匹配。例如,正则表达式 si.#er 可匹配“sicker”或“silkier”。在本例中,将句号 (.) 和井号 (#) 组合成一个语法。句点 (.) 紧挨在井号 (#) 表达式之前。井号 (#) 可与“si”和“er”之间出现一次或更多次的任意字符相匹配。句点 (.) 用作单词 sicker 中字符“c”和“k”的通配符,以及单词 silkier 中“l”、“k”和“i”的通配符。[ ]字符集 用于匹配括号 ([ ]) 内的任意一个字符。可以使用连字符 (-) 指定字符的范围,例如 [a-z]。例如:正则表达式 c[aou]t 可以匹配 cat、cot 和 cut,但不能匹配 cet 或 cit。正则表达式 [0-9] 表示匹配任意一个数字。也可以指定多个字母范围。正则表达式 [A-Za-z] 表示匹配所有大写和小写字母。^行首 定位于行首匹配。例如,正则表达式 ^When in 匹配以“When in”开头且出现于行首的任意字符串,例如“When in the course of human events”或“When in town, call me”。然而,此正则表达式不匹配出现于行首的“What and when in the course of human events”。$行尾 定位于行尾匹配。例如,正则表达式 professional$ 可匹配字符串“He is a professional”,但不能匹配字符串“They are a group of professionals”。^^文件开头 定位于文件开头匹配。仅适用于在源代码或文本文件中搜索文本。例如,若要匹配文件开头的第一个 HTML 标记,请使用此正则表达式:^^$$文件末尾 定位于文件末尾匹配。仅适用于在源代码或文本文件中搜索文本。例如,若要匹配文件末尾的最后一个 HTML 标记(标记后没有空格),可使用此正则表达式:$$|或 表示在两项之间进行选择,即匹配“或”符号 (|) 前面或后面的表达式。例如,正则表达式 (him|her) 匹配下列各项:“it belongs to him”或者“it belongs to her”但不匹配行“it belongs to them”。\转义特殊字符 用于匹配反斜线 (\) 后面的字符。这样,就可以查找正则表达式语法中使用的字符(如左大括号 ({) 或脱字号 (^))或其他一些特殊字符。例如,使用 \$ 可匹配美元符号 ($) 字符,而不是执行用于“定位于行尾”的正则表达式。同样,使用 \. 可匹配句号 (.) 字符,而不是像句号 (.) 正则表达式一样匹配任意一个字符。{}标记表达式 对与括号内表达式匹配的文本加标记。可以使用 \N 在“查找”表达式中匹配出现在另一处的标记文本或者将标记文本插入“替换”表达式。例如,假设要查找连续出现两次的单词。若要搜索,请使用此表达式:{.#} \1假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 (\) 之间添加一个空格。在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。在此表达式中,.# 表示任何连续的字符。因为这部分表达式位于大括号 ({}) 内,所以连续的字符将被加上标记,并被引用为 \1。此表达式将查找后跟空格以及字符与其完全相同的任意连续字符。\N第N 个标记表达式 在“查找”表达式中,\N 匹配由第 N 个标记表达式指定的文本,其中 N 是 1 到 9 的数字。在“替换”表达式中,\N 插入由第 N 个标记表达式匹配的文本,其中 N 是 1 到 9 之间的数字。\0 插入整个“查找”表达式指定的文本。例如,假设要查找连续出现两次的单词,并使用一个单词替换它们。若要搜索,请使用此表达式:.#} \l假设连续出现的单词由一个空格隔开,则需要在右大括号 (}) 与反斜线 (\) 之间添加一个空格。在本例中,将井号 (#)、句号 (.) 和大括号 ({}) 组合成一个语法。若要替换,请使用下列表达式:\l\1 表示在查找字符串中的第一对大括号内找到的内容。通过在替换操作中使用 \1,实际上是将连续出现两次的单词替换为一个单词。( )组表达式 标记子表达式的开始和结束。子表达式指括在 ( ) 中的正则表达式,例如表达式:(ha)+。在本例中,将加号 (+) 与括号 ( ) 组表达式组合成一个语法。子表达式是 (ha),因为它括在括号 ( ) 内。添加加号 (+) 后,该表达式可查找重复的字母对。加号 (+) 表示“ha”出现一次或更多次。此表达式可匹配下列各项:“haha”和“hahaha”。~x防止匹配 当x 出现在表达式中的此位置时会防止匹配。例如,正则表达式 real~(ity) 可匹配“realty”和“really”中的“real”,但不能匹配“reality”中的“real”。\n换行符 用于匹配“代码”视图中的新行,或“设计”视图中的 <br>。语法(\n) 是匹配所有换行符的简便方法。\t制表符 用于匹配单个制表符。例如,如果要查找所有位于行首的制表符,可使用此正则表达式:^\t+在本例中,将脱字号 (^)、加号 (+) 和制表符 (\t) 组合成一个语法。脱字号 (^) 位于单个制表符表达式之前,用于匹配位于行首的所有制表符。加号 (+) 表示匹配一个或多个制表符。[^]任何一个不属于该集合的字符 用于匹配不包含在脱字号 (^) 之后的字符集内的任何字符。例如,若要匹配范围之外的任何字符,可使用脱字号 (^) 作为左括号后面的第一个字符。表达式 [^269A-Z] 匹配除 2、6、9 以及任何大写字母之外的所有字符。n重复表达式 用于匹配脱字号 (^) 之前出现 n 次的表达式。例如,若 n 为 4,表达式 [0-9]^4 匹配任何 4 位数序列。在本例中,将字符集 ([ ]) 语法与重复 (^n) 语法组合,以展示正则表达式的更实用的方法。:a字母数字字符 用于匹配表达式 [a-zA-Z0-9]。可以使用表达式 [a-zA-Z0-9] 匹配出现一次的字母(大写或小写)或数字。也称为“字母数字匹配项”。可使用简写表达式 :a 来代替 [a-zA-Z0-9]。:b空格 用于匹配代码或文本中的任何空格。例如,若要匹配行首的单个空格字符,请使用此正则表达式:^:b:c字母字符 用于匹配表达式 [a-zA-Z]。使用此表达式时,可以匹配所有大写或小写字母。可以使用简写表达式 :c 来代替所有 [a-zA-Z]。:d十进制数 用于匹配表达式 [0-9]。利用此表达式可以匹配任何数字。例如,假设要在文本文件中查找美国的社会福利号。美国的社会福利号的格式为 999-99-9999。:d^3-:d^2-:d^4 或 [0-9]^3-[0-9]^2-[0-9]^4(使用 [0-9] 表示)可返回相同的结果。可使用简写表达式 :d 来代替所有 [0-9]。:h十六进制数 用于匹配表达式 [0-9a-fA-F]+使用此表达式可匹配由“A”和“F”之间的大写或小写字母和任意数字组成的十六进制数。例如,假设网站中的网页使用了多种不同的背景色,而您要将这些网页的颜色改为黑色(即 000000)。但是,您不知道现有颜色的十六进制值。使用此正则表达式可查找所有的现有十六进制值:\#:h可以使用 [0-9a-fA-F] 进行搜索,但在本例中,将反斜线 (\)、井号 (#) 和十六进制数字 (:h) 语法组合在一起。\# 匹配非表达式的井号 (#),而 :h 匹配任何十六进制字符序列。若要替换现有十六进制数值,可键入所需背景颜色的十六进制数值: 000000:i标识符 用于匹配表达式 [a-zA-Z_$][a-zA-Z0-9_$]*处理代码时,如果需要匹配所有程序标识符,可使用简写表达式 :i,而无需键入上述冗长的表达式。:n有理数 用于匹配表达式 ([0-9]+\.[0-9]*)|([0-9]*\.[0-9]+)|([0-9]+)如果需要匹配带小数点的整个数值,可使用简写表达式 :n,而无需键入上述冗长的表达式。:q带引号的字符串 用于匹配表达式 ("[~"]*")|('[~']*')如果需要匹配加引号的所有引号,可使用简写表达式 :q,而无需键入上述冗长的表达式。:w字母字符串 用于匹配表达式 [a-zA-Z]+此语法是一种可匹配一个或多个大写或小写字母字符的简便方法。:z整数 用于匹配表达式 [0-9]+此语法是一种可匹配任何整数的简便方法。

❻ 如何在sql server中使用正则表达式

大致步骤是:
1.下载他提供的那个压缩包,里面有源代码和安装脚本
2.将DLL复制到SQL
Server规定的目录
3.运行INSTALL.sql这个脚本
大致使用的效果如下
SELECT
master.dbo.fn_pcre_match('[email protected]','^\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,3}$')
这句脚本的意思是,根据后面的正则表达式(一个email的规则)匹配前面的字符串.
如果返回1的话,表示匹配到了,否则返回0.

❼ 怎么用正则表达式解析sql语句

先看要解析的样例SQL语句:

select * from al
SELECT * frOm al
Select C1,c2 From tb
select c1,c2 from tb
select count(*) from t1
select c1,c2,c3 from t1 where condi1=1
Select c1,c2,c3 From t1 Where condi1=1
select c1,c2,c3 from t1,t2 where condi3=3 or condi4=5 order by o1,o2
Select c1,c2,c3 from t1,t2 Where condi3=3 or condi4=5 Order by o1,o2
select c1,c2,c3 from t1,t2,t3 where condi1=5 and condi6=6 or condi7=7 group by g1,g2
Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2
Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2,g3 order by g2,g3

解析效果之一(isSingleLine=false):

原SQL为select * from al
解析后的SQL为
select
*
from
al

原SQL为SELECT * frOm al
解析后的SQL为
select
*
from
al

原SQL为Select C1,c2 From tb
解析后的SQL为
select
C1,c2
from
tb

原SQL为select c1,c2 from tb
解析后的SQL为
select
c1,c2
from
tb

原SQL为select count(*) from t1
解析后的SQL为
select
count(*)
from
t1

原SQL为select c1,c2,c3 from t1 where condi1=1
解析后的SQL为
select
c1,c2,c3
from
t1
where
condi1=1

原SQL为Select c1,c2,c3 From t1 Where condi1=1
解析后的SQL为
select
c1,c2,c3
from
t1
where
condi1=1

原SQL为select c1,c2,c3 from t1,t2 where condi3=3 or condi4=5 order by o1,o2
解析后的SQL为
select
c1,c2,c3
from
t1,t2
where
condi3=3 or condi4=5
order by
o1,o2

原SQL为Select c1,c2,c3 from t1,t2 Where condi3=3 or condi4=5 Order by o1,o2
解析后的SQL为
select
c1,c2,c3
from
t1,t2
where
condi3=3 or condi4=5
order by
o1,o2

原SQL为select c1,c2,c3 from t1,t2,t3 where condi1=5 and condi6=6 or condi7=7 group by g1,g2
解析后的SQL为
select
c1,c2,c3
from
t1,t2,t3
where
condi1=5 and condi6=6 or condi7=7
group by
g1,g2

原SQL为Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2
解析后的SQL为
select
c1,c2,c3
from
t1,t2,t3
where
condi1=5 and condi6=6 or condi7=7
group by
g1,g2

原SQL为Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2,g3 order by g2,g3
解析后的SQL为
select
c1,c2,c3
from
t1,t2,t3
where
condi1=5 and condi6=6 or condi7=7
group by
g1,g2,g3
order by
g2,g3

解析效果之二(isSingleLine=true):

原SQL为select * from al
解析后的SQL为
select
*
from
al

原SQL为SELECT * frOm al
解析后的SQL为
select
*
from
al

原SQL为Select C1,c2 From tb
解析后的SQL为
select
C1,
c2
from
tb

原SQL为select c1,c2 from tb
解析后的SQL为
select
c1,
c2
from
tb

原SQL为select count(*) from t1
解析后的SQL为
select
count(*)
from
t1

原SQL为select c1,c2,c3 from t1 where condi1=1
解析后的SQL为
select
c1,
c2,
c3
from
t1
where
condi1=1

原SQL为Select c1,c2,c3 From t1 Where condi1=1
解析后的SQL为
select
c1,
c2,
c3
from
t1
where
condi1=1

原SQL为select c1,c2,c3 from t1,t2 where condi3=3 or condi4=5 order by o1,o2
解析后的SQL为
select
c1,
c2,
c3
from
t1,
t2
where
condi3=3 or
condi4=5
order by
o1,
o2

原SQL为Select c1,c2,c3 from t1,t2 Where condi3=3 or condi4=5 Order by o1,o2
解析后的SQL为
select
c1,
c2,
c3
from
t1,
t2
where
condi3=3 or
condi4=5
order by
o1,
o2

原SQL为select c1,c2,c3 from t1,t2,t3 wher www.hnne.com e condi1=5 and condi6=6 or condi7=7 group by g1,g2
解析后的SQL为
select
c1,
c2,
c3
from
t1,
t2,
t3
where
condi1=5 and
condi6=6 or
condi7=7
group by
g1,
g2

原SQL为Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2
解析后的SQL为
select
c1,
c2,
c3
from
t1,
t2,
t3
where
condi1=5 and
condi6=6 or
condi7=7
group by
g1,
g2

原SQL为Select c1,c2,c3 From t1,t2,t3 Where condi1=5 and condi6=6 or condi7=7 Group by g1,g2,g3 order by g2,g3
解析后的SQL为
select
c1,
c2,
c3
from
t1,
t2,
t3
where
condi1=5 and
condi6=6 or
condi7=7
group by
g1,
g2,
g3
order by
g2,
g3

使用的类SqlParser,你可以拷贝下来使用之:

package com.sitinspring.common.sqlFormatter;

import java.util.ArrayList;
import java.util.List;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/**
* SQL语句解析器类
* @author: sitinspring([email protected])
* @date: 2008-3-12
*/
public class SqlParser{
/**
* 逗号
*/
private static final String Comma = ",";

/**
* 四个空格
*/
private static final String FourSpace = " ";

/**
* 是否单行显示字段,表,条件的标识量
*/
private static boolean isSingleLine=true;

/**
* 待解析的SQL语句
*/
private String sql;

/**
* SQL中选择的列
*/
private String cols;

/**
* SQL中查找的表
*/
private String tables;

/**
* 查找条件
*/
private String conditions;

/**
* Group By的字段
*/
private String groupCols;

/**
* Order by的字段
*/
private String orderCols;

/**
* 构造函数
* 功能:传入构造函数,解析成字段,表,条件等
* @param sql:传入的SQL语句
*/
public SqlParser(String sql){
this.sql=sql.trim();

❽ 如何在sql语句中使用正则表达式

sqlserver中,主要有regexp_like,regexp_replace,regexp_substr,regexp_instr四个正则表达式函数。

1、regexp_like:

regexp_like(x,pattern[,match_option]),查看x是否与pattern相匹配,该函数还可以提供一个可选的参数match_option字符串说明默认的匹配选项。match_option的取值如下:

'c' 说明在进行匹配时区分大小写(缺省值);

'i' 说明在进行匹配时不区分大小写;

'n' (.)点号能表示所有单个字符,包括换行(俺还不知道什么地方有用到换行.只知道sql里面可以用chr(10)表示换行、

'm' 字符串存在换行的时候当作多行处理.这样$就可匹配每行的结尾.不然的话$只匹配字符串最后的位置、

示例:

select * from emp where regexp_like(ename,'^a[a-z]*n$');

可以查找ename中以a开头以n结尾的行.例如ename为arwen或arwin或anden.但Arwen不能被匹配.因为默认是区分大小写.如果是

select * from emp where regexp_like(ename,'^a[a-z]*n$','i')

则可以查找ename为Arwen的行记录。

2、regexp_instr:

REGEXP_INSTR(x,pattern[,start[,occurrence[,return_option[, match_option]]]])用于在x中查找pattern。返回pattern在x中出现的位置。匹配位置从1开始。可以参考字符串函数 INSTR(),参数相关:

'start' 开始查找的位置;

'occurrence' 说明应该返回第几次出现pattern的位置;

'return_option' 说明应该返回什么整数。若该参数为0,则说明要返回的整数是x中的一个字符的位置;若该参数为非0的整数,则说明要返回的整数为x中出现在pattern之后 的字符的位置;

'match_option' 修改默认的匹配设置.与regexp_like里面的相同.

示例:

DECLARE

V_RESULT INTEGER ;

BEGIN

SELECT REGEXP_INSTR('hello world','o',1,1,0) INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为5,即字母o第一个次出现的位置。

如果regexp_instr('hello world','o',1,1,n)其中n为除0之外的整数。比如1,3。则结果为6.表示第一次出现字母o的后面一个字符的位置。

如果regexp_instr('hello world','o',1,2,0)则结果为9.表示第二次出现字母o的位置.

3、regexp_replace:

REGEXP_REPLACE(x,pattern[,replace_string[,start[,occurrence[, match_option]]]])用于在x中查找pattern,并将其替换为replae_string。可以参考字符串函数 REPLACE(),参数同REGEXP_INSTR函数

示例:

DECLARE

V_RESULT varchar2(90);

BEGIN

SELECT REGEXP_REPLACE('hello world','o','x',1,1) INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END;

结果为hellx world.

如果REGEXP_REPLACE('hello world','o','x'),则结果为hellx wxrld.

如果 REGEXP_REPLACE('hello world','o','x',1,2)则结果为hello wxrld.

4、regexp_substr:

REGEXP_SUBSTR(x,pattern[,start[,occurrence[, match_option]]])用于在x中查找pattern并返回。可以参考字符串函数 SUBSTR(),参数同REGEXP_INSTR函数.

例如:

DECLARE

V_RESULT VARCHAR2(255);

BEGIN

SELECT REGEXP_SUBSTR('hello world','l{2}') INTO V_RESULT

FROM DUAL;

DBMS_OUTPUT.PUT_LINE(V_RESULT);

END ;

结果为ll

查询到匹配的字符串才返回匹配的字符.没查到就返回空。

❾ java程序中Sql语句中用正则表达式的使用

标准SQL不支持正则表达式查询吧。

你这种情况,只能是:
select * from {table} where name like 'ZHANG%' OR 'zhang%' 来搜

放入另一个表的话

insert into target_table_name
select select * from src_table_name where name like 'ZHANG%' OR 'zhang%'

目前:Oracle10g支持了正则表达式,用法:

SELECT * FROM table_name WHERE REGEXP_LIKE(TO_CHAR(start_date, 'YYYY'), '^199[5-8]$');

regexp_like函数的基本构成是:
regexp_like(x,pattern[,match_option])
其基本功能是在x中查找pattern,如果能找到返回true否则返回false,这里的可选参数match_option可以有如下几种形式:

‘c’ 表明进行匹配时区分大小写(这也是默认选项)。
‘i’ 表明在匹配时不区分大小写。
‘n’ 表明允许使用匹配任何字符串的元数据,即’.'。
‘m’将x作为一个包含多行的字符串。
以下是两个关于regexp_like的例子:
这个例子是寻找员工中的80后的员工。
select * from emp where regexp_like(to_char(birthdate,’yyyy’),’^198[0-9]$’);
这个例子是寻找名字是以’M'或者’m'打头的那些员工的名字
select * from emp where regexp_like(ename,’^j’,'i’)

❿ Db2 中的sql 怎样实现正则表达式的功能

尽管上面的函数按照预期的方式工作,但还可以改进它以获得更佳的性能。注:函数内部的执行完成得越快,DB2 处理整个 SQL 语句的速度也就越快。
SQL 旨在处理多组行,这意味着通常会针对一个模式匹配多个行。在大多数情况下,模式本身对于整个 SQL 语句都是不变的;即,它不会随行的更改而更改。 清单 5 中的 C 代码展示了对每一行都调用函数 pcre_compile() ,该函数将给定模式转换成内部表示法。

DB2 通过使用所谓的“高速暂存(scratchpad)”提供了在 UDF 调用之间传递信息的机制。此外,您可以标识特定调用“类型”;即它是对该 UDF 的第一次调用、普通调用还是最后一次(最终)调用。使用高速暂存和调用类型,有可能只对模式编译一次,然后将该已编译模式的内部表示法重用于对该 UDF 的所有后续调用。在最后一次调用时,释放在处理期间分配的资源。

如 清单 6所示,对 CREATE FUNCTION 语句进行修改,告诉 DB2 向外部 C 代码提供高速暂存和调用类型:

清单 6. 将高速暂存和调用类型添加到 CREATE FUNCTION 语句

CREATE FUNCTION regex2(pattern VARCHAR(2048), string CLOB(10M))
RETURNS INTEGER
SPECIFIC regexPerf
EXTERNAL NAME 'regexUdf!regexpPerf'
LANGUAGE C
PARAMETER STYLE DB2SQL
DETERMINISTIC
NOT FENCED
RETURNS NULL ON NULL INPUT
NO SQL
NO EXTERNAL ACTION

SCRATCHPAD 50
FINAL CALL

ALLOW PARALLEL;

UDF 入口点看起来很不一样,因为必须改写函数内部的逻辑。参数方面唯一的更改是使用 SQLUDF_TRAIL_ARGS_ALL 代替了 SQLUDF_TRAIL_ARGS ,如 清单 7所示。

清单 7. regex2 的 C UDF 入口点

#include <pcre.h>
#include <sqludf.h>
// data structure mapped on the scratchpad for easier use and access
// to the objects
// the size of the scratchpad defined in the CREATE FUNCTION statement
// must be at least as large as sizeof(scratchPadMapping)
struct scratchPadMapping {
pcre *re;
pcre_extra *extra;
const char *error;
int errOffset;
};
void regexpPerf(
// input parameters
SQLUDF_VARCHAR *pattern, SQLUDF_CLOB *str,
// output
SQLUDF_INTEGER *match,
// null indicators
SQLUDF_NULLIND *pattern_ind, SQLUDF_NULLIND *str_ind,
SQLUDF_NULLIND *match_ind,
SQLUDF_TRAIL_ARGS_ALL) // SQLUDF_SCRAT & SQLUDF_CALLT
{
int rc = 0;
struct scratchPadMapping *scratch = NULL;
// map the buffer of the scratchpad and assume successful return
scratch = (struct scratchPadMapping *)SQLUDF_SCRAT->data;
*match_ind = 0;
switch (SQLUDF_CALLT) {
case SQLUDF_FIRST_CALL:
// initialize data on the scratchpad
scratch->re = NULL;
scratch->extra = NULL;
scratch->error = NULL;
scratch->errOffset = 0;
// compile the pattern (only in the FIRST call
scratch->re = pcre_compile(pattern, 0 /* default options */,
&scratch->error, &scratch->errOffset, NULL);
if (scratch->re == NULL) {
snprintf(SQLUDF_MSGTX, 70, "Regexp compilation failed at "
"offset %d: %s\\n", scratch->errOffset, scratch->error);
strcpy(SQLUDF_STATE, "38900");
rc = -1;
break;
}
// further analyze the pattern (might return NULL)
scratch->extra = pcre_study(scratch->re,
0 /* default options */, &scratch->error);
/* fall through to NORMAL call because DB2 expects a result
already in the FIRST call */
case SQLUDF_NORMAL_CALL:
// match the current string
rc = pcre_exec(scratch->re, scratch->extra, str->data,
str->length, 0, 0 /* default options */, NULL, 0);
switch (rc) {
case PCRE_ERROR_NOMATCH:
*match = 0;
rc = 0;
break;
case PCRE_ERROR_BADOPTION:
snprintf(SQLUDF_MSGTX, 70, "An unrecognized bit was set "
"in the options argument");
strcpy(SQLUDF_STATE, "38901");
rc = -1;
break;
case PCRE_ERROR_NOMEMORY:
snprintf(SQLUDF_MSGTX, 70, "Not enough memory available.");
strcpy(SQLUDF_STATE, "38902");
rc = -1;
break;
default:
if (rc < 0) {
snprintf(SQLUDF_MSGTX, 70, "A regexp match error "
"occured: %d", rc);
strcpy(SQLUDF_STATE, "38903");
rc = -1;
}
else {
*match = 1;
rc = 0;
}
break;
}
break;
}
// cleanup in FINAL call, or if we encountered an error in
// the FIRST call (DB2 will make a FINAL call if we encounter
// an error in any NORMAL call)
if (SQLUDF_CALLT == SQLUDF_FINAL_CALL ||
(SQLUDF_CALLT == SQLUDF_FIRST_CALL && rc < 0)) {
(*pcre_free)(scratch->re);
(*pcre_free)(scratch->extra);
}
return;
}

为了进一步改进该函数的性能,我添加了对函数 pcre_study() 的调用,该函数是由模式匹配引擎提供的。该函数进一步分析了该模式,并将额外的信息存储在独立的结构中。然后,在实际的匹配期间使用这些额外的信息来加快处理速度。通过使用一个非常简单的模式和大约 4000 行的表,我获得了 5% 的执行时间的改善。当然,模式越复杂,差异将越显着。

我先前提到该实现假定模式在处理期间不会随行的不同而更改。当然,如果模式确实更改了,您可以进行少量的改写以再次编译一个模式。要这样做,有必要跟踪当前(已编译的)模式并在每次调用中将它与所提供的模式进行比较。也可以在高速暂存中维护当前模式。但必须将它复制到独立的缓冲区,并且不能通过指针模式直接引用它,因为这个指针或它所引用的数据可能会更改或变为无效。至于相应的代码更改,就当作练习留给读者了。

返回匹配子串

大多数模式匹配引擎提供了一种方法,返回与指定模式或其一部分相匹配的子串。如果想在 SQL 中使用这种能力,则必须使用不同的方法来实现匹配函数。给定的字符串可能包含不止一个匹配的子串。例如,当解析类似“abc = 123;”或“def = 'some text';”这样的字符串时,用户可能会希望检索由等号分隔的两个子串。您可以使用模式“\\w+\\s*=\\s*(\\d+|'[\\w\\s] *');”来表示适用于该字符串的语法规则。Perl 兼容的正则表达式允许您捕获等号两边的子串。最后,必须将要捕获的子串用括号括起来。我已经用该方式编写了第二个子串,但第一个子串不是这样编写的。用于该用途的最终模式是这样的:

(\\w+)\\s*=\\s*(\\d+|'[\\w\\s]*');

当把这个模式应用于字符串“abc= 123;”或“def = 'some text';”时,“abc”或“def”分别与“(\\w+)”匹配,空格和等号是通过“\\s*=\\s*”查找的,并用另外的“(\\d+|'[\ \w\\s*]')”涵盖了余下的子串。在“(\\d+|'[\\w\\s*]')”中,第一个选项与任何至少由一个数字“\\d+”组成的数匹配,而第二个选项解析任何由字母和空格组成的由单引号括起的字符串“'[\\w\\s]*'”。

在 DB2 中做到这一点的需求可以描述成:为一次 UDF 调用返回多个结果。换句话说,就是返回针对模式进行匹配的单个字符串的多个子串。DB2 的表函数是完成这一任务的完美工具。

实现表 UDF

和以前一样,必须在数据库中创建该函数。 清单 8中的下列语句正是用于这一任务的:

清单 8. 注册名为 regex3 的表 UDF

CREATE FUNCTION regex3(pattern VARCHAR(2048), string CLOB(10M))
RETURNS TABLE ( position INTEGER, substring VARCHAR(2048) )
SPECIFIC regexSubstr
EXTERNAL NAME 'regexUdf!regexpSubstr'
LANGUAGE C
PARAMETER STYLE DB2SQL
DETERMINISTIC
NOT FENCED
RETURNS NULL ON NULL INPUT
NO SQL
NO EXTERNAL ACTION
SCRATCHPAD 50
NO FINAL CALL
DISALLOW PARALLEL;

实现该函数的实际逻辑的 C 代码与 清单 7中的代码非常相似,但根据表函数所必须满足的特殊需求对它进行了改编,如 清单 9所示
你还是看一下这个网站
http://news.weixiuwang.com/server/2006-6/2006E6Y2;1057E89818855_1.htm