Do que trata o artigo

O artigo trata de expressões regulares, demonstrando o seu surgimento, seus conceitos básicos, principais meta-caracteres e sua utilização na prática, onde é utilizado o Delphi XE para a reprodução de exemplos simples de expressões.


Para que serve

As expressões regulares servem para criar padrões de validações de dados específicos unindo a flexibilidade com elegância. Utilizando-as é possível criar cadeias ou padrões de caracteres e/ou palavras possibilitando uma validação de informação mais “inteligente”.


Em que situação o tema é útil

Observando os princípios básicos de expressões regulares pode-se analisar e validar sequências. Além disto, permite um ganho de produtividade e uma melhor qualidade de informações analisadas, poupando bastante trabalho principalmente na avaliação, pesquisa e substituição de textos. Um exemplo muito comum é a validação de e-mails.

Resumo do DevMan

Neste artigo será abordado um pouco da história das expressões regulares desde o seu surgimento à sua aplicação cotidiana. Conheceremos os principais conceitos e operadores utilizados para criar e entender expressões regulares, e veremos a aplicabilidade do tema na nova versão do Delphi XE, recentemente lançando pela Embarcadero e que possui um suporte nativo para a utilização das expressões regulares.

Expressões Regulares

As expressões regulares surgiram em meados de 1943, quando dois neurologistas, MacCulloc e Pitts, publicaram um estudo teórico indicando o funcionamento dos neurônios, onde sua teoria estava centrada em autômatos finitos e em teorias de linguagens formais. Já na década de 1950, um matemático chamado Stephen Kleene realizou um estudo utilizando tais modelos usando uma notação matemática que ele chamou de grupos regulares, posteriormente formando a álgebra de Kleene. Mas somente em meados de 1968 ocorreu o encontro com a computação, quando Ken Thompson utilizou a notação da álgebra em um algoritmo de busca utilizando um editor de textos chamado “qed”, que posteriormente se transformou em “Ed”, editor de textos padrão de sistemas Unix. Neste editor de textos era possível realizar buscas utilizando expressões regulares através de um comando “g” e um comando de impressão chamado de “p”, representando algo semelhante a Global Regular Expression Print, como evolução, dando origem ao aplicativo “grep”. Em 1986 surgiu um conjunto de bibliotecas pioneiras escritas na linguagem de programação C chamadas de regex que descrevia o tratamento de expressões regulares para aplicativos.

Neste aspecto, realizando um comparativo a edição de um texto, para expressar as ideias de um determinado assunto, ele pode ser escrito de forma diferente por autores distintos, ou seja, cada autor terá sua maneira de expor seus argumentos relacionados ao tema indicado. Apesar disso, o texto possuirá regras básicas relacionadas à forma como ele será redigido. Seguirá uma sequência lógica de raciocínio, onde apresentará uma introdução, também chamada de início, um desenvolvimento, apresentando as ideias básicas do assunto e suas argumentações teóricas e o final representado pelas conclusões.

De maneira semelhante, uma expressão regular pode ser analisada, na qual ela poderá conter um início, meio e fim, respeitando determinados critérios de criação que serão observados na avaliação da expressão que será informada. Uma expressão regular é representada por um conjunto de caracteres, podendo conter números e símbolos agrupados em determinada ordem pré-definida representando uma expressão de validação de uma regra, onde uma entrada de dados será analisada nessa expressão, indicando se é um valor que satisfaz suas condições, ou seja, um valor válido para a expressão.

As expressões regulares são planejadas e escritas a partir de pequenos blocos de código. Cada bloco individual é bastante simples, possuindo uma sequência lógica distinta. Os blocos podem se agrupar de diversas maneiras para atingir um objetivo específico.

Elas podem ser utilizadas com diversos propósitos, para manipular um conjunto de fluxo de dados de entrada, realizando testes condicionais, observando as regras definidas, para produzir o resultado final desejado ou, então, informarão que a análise não foi válida, pois o fluxo de dados estava em um formato incorreto.

É um método poderoso e flexível para utilizar um determinado padrão de texto, ou seja, a partir da composição de símbolos, da utilização de caracteres com funções especiais (meta-caracteres) e caracteres literais, compondo uma expressão, que será interpretada como regra para validação dos dados informados. As expressões regulares são projetadas e otimizadas para a manipulação de texto, são compostas por dois tipos básicos: caracteres de texto literal e caracteres especiais, onde a adição dos dois tipos permite às expressões regulares grande capacidade de processamento e análise de textos.

...
Quer ler esse conteúdo completo? Tenha acesso completo