Expressions régulières

Icône du lien vers le conceptS'applique à

Les expressions régulières utilisées par SELECTOR sont dérivées de la notation utilisée en théorie des automates pour décrire en langage formel et les machines d'états.

Les expressions régulières sont formées de caractères : Opérandes comme "a", "O" et "," et de métacaractères (opérateurs) comme "+", "|" et "[". Une expression régulière, qui est similaire aux expressions arithmétiques familières, peut être soit une expression simple, soit une expression complexe formée par des opérateurs appliqués à plusieurs expressions simples.

Les métacaractères pour les expressions et leurs utilisations, sont les suivants :

Opérateur

Utilisation

\

Utilisé dans les séquences d'échappement pour spécifier les caractères n'ayant pas de représentation (similaire à ceux utilisés en langage C).

\b

Retour arrière.

\t

Tabulation horizontale.

\n

Nouvelle ligne ou saut de ligne.

\f

Nouvelle page ou saut de page.

\r

Retour chariot.

\ddd

Valeur octale.

\c

c représente n'importe quelle chaîne de caractères qui doit être prise littéralement.

^

Le caractère chapeau identifie le début d'une chaîne de caractères. Par exemple, "^abc" fera la correspondance avec toutes les chaînes qui commencent par "abc". Si utilisé comme 1er caractère d'une classe de caractères, il dénote une classe en négation.

$

Le signe dollar identifie la fin d'une chaîne. Par exemple, "$z" fera la correspondance avec toutes les chaînes ayant "z" comme dernier caractère.

.

Le point signifie n'importe quel caractère simple. Il faut être prudent avec ".*" qui fera la correspondance avec tout.

[

Le crochet ouvrant identifie le début d'une classe de caractères.

]

Le crochet fermant identifie la fin d'une classe de caractères.

|

La barre verticale est l'opérateur OU, "a|b" signifie soit "a", soit "b".

()

Les parenthèses sont utilisées pour grouper des expressions de la même façon que dans les expressions arithmétiques.

*

L'astérisque signifie 0 ou plusieurs instances de la chaîne spécifiée.

+

Le signe plus indique une fermeture positive et signifie 1 ou plus instances de l'expression spécifiée. Par exemple "+z" signifie une chaîne de 1 ou plus de "z"s.

?

Le point d'interrogation signifie 0 ou 1 instance de l'expression spécifiée. Par exemple "?9" signifie soit une chaîne vide, soit "9".

Classes de caractères

Les classes de caractères sont des raccourcis pour faire correspondre un ou plusieurs caractères.

Par exemple [AaBb] est égal à (A|a|B|b) et fera la correspondance avec les chaînes "A", "a", "B", et "b".

Il y a également les plages de valeurs, comme [A-Z] qui identifiera tous les caractères en majuscules.

Les classes de caractères négatifs spécifient des caractères qui ne devront pas être mis en correspondance. Par exemple, [^A-Z] signifie tout excepté les caractères alphanumériques en majuscules.

Exemples d'expressions régulières

Tous les noms de variables ayant "System" comme premier segment branche :

^System

Tous les noms de variables dont la fin est un nombre :

[0-9]$

Tous les noms de variables :

.*