RegEx'i SQL Server'da kullanma


94

Aşağıdaki RegEx ayarlarına / parametrelerine göre RegEx kullanarak metni nasıl değiştireceğime / kodlayacağıma bakıyorum:

RegEx.IgnoreCase = True     
RegEx.Global = True     
RegEx.Pattern = "[^a-z\d\s.]+"   

RegEx'te bazı örnekler gördüm, ancak SQL Server'da aynı şekilde nasıl uygulanacağı konusunda kafam karıştı. Herhangi bir öneri yardımcı olacaktır. Teşekkür ederim.


1
Merhaba şu makaleye bir göz atın: codeproject.com/Articles/42764/…
Mohsen

Ayrıca Robyn Page ve Phil Factor'da Windows 2000'den beri her Windows sürümünde gönderilen VBScript.RegExp sınıfına dayanan iyi bir TSQL + Windows API çözümü var .
Julio Nobre

TSQL aracılığıyla kesinlikle olumlu bir şekilde RegEx'e ihtiyacınız varsa SQL Server 2016 ve üzeri için bir seçenek R hizmetlerini kullanmaktır .
Dave Mason

Yanıtlar:


105

LIKE'ı kullanabileceğiniz için yönetilen kodla etkileşim kurmanıza gerek yoktur :

CREATE TABLE #Sample(Field varchar(50), Result varchar(50))
GO
INSERT INTO #Sample (Field, Result) VALUES ('ABC123 ', 'Do not match')
INSERT INTO #Sample (Field, Result) VALUES ('ABC123.', 'Do not match')
INSERT INTO #Sample (Field, Result) VALUES ('ABC123&', 'Match')
SELECT * FROM #Sample WHERE Field LIKE '%[^a-z0-9 .]%'
GO
DROP TABLE #Sample

İfaden biterken +gidebilirsin'%[^a-z0-9 .][^a-z0-9 .]%'

DÜZENLEME : netleştirmek için: SQL Server, yönetilen kod olmadan normal ifadeleri desteklemez. Duruma bağlı olarak, LIKEoperatör bir seçenek olabilir, ancak normal ifadelerin sağladığı esneklikten yoksundur.


8
@MikeYoung, haklısın. Bu cevap, +nicelik belirleyiciyi yanlış bir şekilde {1,2}, onu ne zaman alması gerektiği şeklinde ele alır {1, }. Şaşırtıcı bir şekilde, bu OP için işe yaradı.
Rubens Farias

2
Bu, normal ifadeyi desteklemediği için sql sunucusunda çalışmaz.
VVN

10
@VVN, LIKEnormal ifade değildir (bu daha sınırlı bir kalıp eşleştirme sözdizimi), dolayısıyla normal ifade desteğinin olmaması bunun işe yaramayacağı anlamına gelmez.
Charles Duffy

@RubensFarias, @ mike-young'dan gelen yorumlar ışığında cevabı güncellemek güzel olmaz mıydı?
Sudhanshu Mishra

8

Julio'nun cevabının biraz değiştirilmiş hali .

-- MS SQL using VBScript Regex
-- select dbo.RegexReplace('aa bb cc','($1) ($2) ($3)','([^\s]*)\s*([^\s]*)\s*([^\s]*)')
-- $$ dollar sign, $1 - $9 back references, $& whole match

CREATE FUNCTION [dbo].[RegexReplace]
(   -- these match exactly the parameters of RegExp
    @searchstring varchar(4000),
    @replacestring varchar(4000),
    @pattern varchar(4000)
)
RETURNS varchar(4000)
AS
BEGIN
    declare @objRegexExp int, 
        @objErrorObj int,
        @strErrorMessage varchar(255),
        @res int,
        @result varchar(4000)

    if( @searchstring is null or len(ltrim(rtrim(@searchstring))) = 0) return null
    set @result=''
    exec @res=sp_OACreate 'VBScript.RegExp', @objRegexExp out
    if( @res <> 0) return '..VBScript did not initialize'
    exec @res=sp_OASetProperty @objRegexExp, 'Pattern', @pattern
    if( @res <> 0) return '..Pattern property set failed'
    exec @res=sp_OASetProperty @objRegexExp, 'IgnoreCase', 0
    if( @res <> 0) return '..IgnoreCase option failed'
    exec @res=sp_OAMethod @objRegexExp, 'Replace', @result OUT,
         @searchstring, @replacestring
    if( @res <> 0) return '..Bad search string'
    exec @res=sp_OADestroy @objRegexExp
    return @result
END

SQL'de Ole Otomasyon Prosedürlerinin açık olması gerekir:

exec sp_configure 'show advanced options',1; 
go
reconfigure; 
go
sp_configure 'Ole Automation Procedures', 1; 
go
reconfigure; 
go
sp_configure 'show advanced options',0; 
go
reconfigure;
go

2
BTW, regex nesnesini yok etmek ve yeniden oluşturmak, önbelleğe almak ve yeniden kullanmaktan çok daha hızlıdır. Nesneyi yeniden kullanarak çok daha yüksek sayılarla 10.000 karşılaştırma yaptık.
Zachary Scott

8

Bu makalede gösterildiği gibi, normal ifade işlevselliği sağlayan bir CLR yordamı oluşturmanız gerekecektir .

Örnek işlevleri VB.NET kullanır:

Imports System
Imports System.Data.Sql
Imports Microsoft.SqlServer.Server
Imports System.Data.SqlTypes
Imports System.Runtime.InteropServices
Imports System.Text.RegularExpressions
Imports System.Collections 'the IEnumerable interface is here  


Namespace SimpleTalk.Phil.Factor
    Public Class RegularExpressionFunctions
        'RegExIsMatch function
        <SqlFunction(IsDeterministic:=True, IsPrecise:=True)> _
        Public Shared Function RegExIsMatch( _
                                            ByVal pattern As SqlString, _
                                            ByVal input As SqlString, _
                                            ByVal Options As SqlInt32) As SqlBoolean
            If (input.IsNull OrElse pattern.IsNull) Then
                Return SqlBoolean.False
            End If
            Dim RegExOption As New System.Text.RegularExpressions.RegExOptions
            RegExOption = Options
            Return RegEx.IsMatch(input.Value, pattern.Value, RegExOption)
        End Function
    End Class      ' 
End Namespace

... ve aşağıdaki SQL kullanılarak SQL Server'a yüklenir ('%' - sınırlandırılmış değişkenler gerçek eşdeğerleriyle değiştirilir:

sp_configure 'clr enabled', 1
RECONFIGURE WITH OVERRIDE

IF EXISTS ( SELECT   1
            FROM     sys.objects
            WHERE    object_id = OBJECT_ID(N'dbo.RegExIsMatch') ) 
   DROP FUNCTION dbo.RegExIsMatch
go

IF EXISTS ( SELECT   1
            FROM     sys.assemblies asms
            WHERE    asms.name = N'RegExFunction ' ) 
   DROP ASSEMBLY [RegExFunction]

CREATE ASSEMBLY RegExFunction 
           FROM '%FILE%'
GO

CREATE FUNCTION RegExIsMatch
   (
    @Pattern NVARCHAR(4000),
    @Input NVARCHAR(MAX),
    @Options int
   )
RETURNS BIT
AS EXTERNAL NAME 
   RegExFunction.[SimpleTalk.Phil.Factor.RegularExpressionFunctions].RegExIsMatch
GO

--a few tests
---Is this card a valid credit card?
SELECT dbo.RegExIsMatch ('^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6(?:011|5[0-9][0-9])[0-9]{12}|3[47][0-9]{13}|3(?:0[0-5]|[68][0-9])[0-9]{11}|(?:2131|1800|35\d{3})\d{11})$','4241825283987487',1)
--is there a number in this string
SELECT dbo.RegExIsMatch( '\d','there is 1 thing I hate',1)
--Verifies number Returns 1
DECLARE @pattern VARCHAR(255)
SELECT @pattern ='[a-zA-Z0-9]\d{2}[a-zA-Z0-9](-\d{3}){2}[A-Za-z0-9]'
SELECT  dbo.RegExIsMatch (@pattern, '1298-673-4192',1),
        dbo.RegExIsMatch (@pattern,'A08Z-931-468A',1),
        dbo.RegExIsMatch (@pattern,'[A90-123-129X',1),
        dbo.RegExIsMatch (@pattern,'12345-KKA-1230',1),
        dbo.RegExIsMatch (@pattern,'0919-2893-1256',1)

Bu Klasik ASP'de, destekliyor mu? CLR'nin yalnızca .NET işlevleri için olduğunu düşünüyorum, değil mi?
Control Freak

4
CLR yordamları, SQL Server ortamına yüklenir ve diğer tüm saklı yordamlar veya kullanıcı tanımlı işlevler gibi çağrılabilir; bu nedenle, Klasik ASP bir saklı yordamı veya kullanıcı tanımlı işlevi çağırabilirse, bir CLR yordamını çağırabilir.
mwigdahl

1
Bu bağlantı soruyu cevaplayabilirken, cevabın temel kısımlarını buraya eklemek ve referans için bağlantıyı sağlamak daha iyidir. Bağlantılı sayfa değişirse yalnızca bağlantı yanıtları geçersiz hale gelebilir. - Yorumdan
Federico klez Culloca

Teşekkürler @FedericoklezCulloca. Bu eski bir cevaptı ve buna göre güncelledim.
mwigdahl

@mwigdahl bunun için teşekkürler. Eski olduğunu görüyorum, ancak bir inceleme sırasında ortaya çıktı :)
Federico klez Culloca

7

SQL Server Veritabanları Uygulama Kullanımında Normal İfadeler

Normal İfade - Açıklama
. Herhangi bir karakteri eşleştir
* Herhangi bir karakteri eşleştir
+ İfadenin en az bir örneğini
eşleştir ^ Satırın başında başla
$ Satırın sonunda ara
< Yalnızca sözcük bu noktada başlıyorsa eşleştir
> Yalnızca sözcük bu noktada
duruyorsa eşleştir \ n Satır sonuyla eşleştir
[] Parantez içindeki herhangi bir karakterle eşleşir
[^ ...] ^
[ABQ]% 'den sonra listelenmeyen herhangi bir karakterle eşleşir Dize, A, B veya Q harfleriyle başlamalıdır ve herhangi bir uzunlukta olabilir
[AB] [CD]% Dizinin uzunluğu iki veya daha fazla olmalı ve A veya B ile başlamalı ve ikinci karakter olarak C veya D olmalıdır
[AZ]% Dize herhangi bir uzunlukta olabilir ve A'dan Z'ye
[A kadar herhangi bir harfle başlamalıdır -Z0-9]% Dize herhangi bir uzunlukta olabilir ve A'dan Z'ye herhangi bir harfle veya 0'dan 9'a kadar bir rakamla başlamalıdır
[^ AC]% Dize herhangi bir uzunlukta olabilir ancak A'dan C'ye kadar olan harflerle başlayamaz
% [AZ] Dize herhangi bir uzunlukta olabilir ve A'dan Z'ye herhangi bir harfle bitmelidir
% [% $ # @]% Dize herhangi bir uzunlukta olabilir ve içindeki özel karakterlerden en az birini içermelidir dirsek


5
SELECT * from SOME_TABLE where NAME like '%[^A-Z]%'

Veya AZ yerine başka bir ifade


1

@ Mwigdahl'ın cevabına benzer bir yaklaşımla, C #'da bir .NET CLR uygulayabilirsiniz.

using System.Data.SqlTypes;
using RX = System.Text.RegularExpressions;

public partial class UserDefinedFunctions
{
 [Microsoft.SqlServer.Server.SqlFunction]
 public static SqlString Regex(string input, string regex)
 {
  var match = RX.Regex.Match(input, regex).Groups[1].Value;
  return new SqlString (match);
 }
}

Kurulum talimatları burada bulunabilir

Sitemizi kullandığınızda şunları okuyup anladığınızı kabul etmiş olursunuz: Çerez Politikası ve Gizlilik Politikası.
Licensed under cc by-sa 3.0 with attribution required.