Einführung in Python Regex

Python ist heutzutage das Schlagwort in der Technologiebranche. Es ist eine Sprache, die schnell an Popularität gewinnt. Es ist eine sehr dynamische Sprache und kann zum Erstellen von Webanwendungen für Algorithmen zum maschinellen Lernen verwendet werden. In diesem Artikel erfahren Sie, wie Regex in Python verwendet wird. Ein Regex ist eine Kurzform des regulären Ausdrucks und im Grunde eine Folge von Zeichen, die als Muster verwendet werden können. Das Gute ist, dass Python ein eigenes Regex-Paket namens re hat.

Syntax:

Wir werden die Syntax anhand eines Beispiels verstehen. Im Beispiel hierfür können wir eine Zeichenfolge durchsuchen, um festzustellen, ob sie mit "Er" beginnt und mit "Smart" endet.

import reword = "He is very smart"
x =re.search("^He.*smart$", word)
print(x)

Wenn Sie sich die Syntax ansehen, ist es sehr einfach, zuerst das regex-Paket zu importieren, das re ist, und dann eine der Funktionen des importierten Pakets gemäß Ihren Anforderungen zu verwenden. Wenn wir den obigen Beispielcode in Jupyter ausführen, erhalten wir das folgende Ergebnis.

Regex-Funktionen in Python

Es gibt viele reguläre Ausdrücke, mit denen wir einen String nach einer Übereinstimmung durchsuchen können. Vorher lernen wir zunächst die Zeichen kennen, die wir normalerweise in einer Regex-Funktion sehen.

()

Es repräsentiert eine Reihe von Zeichen.

.

Es steht für ein beliebiges Zeichen mit Ausnahme einer Newline.

*

Es repräsentiert null oder mehr Vorkommen.

+

Es repräsentiert ein oder mehrere Vorkommen.

^

Es repräsentiert das Startzeichen

$

Es repräsentiert das Endzeichen.

|

Es steht entweder-oder.

()

Es steht für Capture und Group.

\

Es wird im Allgemeinen verwendet, um Sonderzeichen zu maskieren

Regex hat auch einige spezielle Sequenzen, die nützlich sein werden, um zum Beispiel zu wissen:

\ w

Es wird eine Übereinstimmung angezeigt, wenn die Zeichenfolge Wortzeichen von (0-9), AZ oder az und einen Unterstrich enthält.

\ W

Es wird eine Übereinstimmung zurückgegeben, wenn die Zeichenfolge keine Wortzeichen enthält.

\ d

Diese Rückgaben stimmen überein, wenn die Zeichenfolge Ziffern enthält.

\ D

Es ist das Gegenteil des vorherigen, da es eine Übereinstimmung zurückgibt, wenn die Zeichenfolge keine Ziffern enthält.

\ s

Es wird verwendet, um in einer Zeichenfolge nach Leerzeichen zu suchen. Es wird eine Übereinstimmung zurückgegeben, wenn Leerzeichen vorhanden sind.

\ S

Es wird eine Übereinstimmung zurückgegeben, wenn die Zeichenfolge keine Leerzeichen enthält.

Funktionen, die für Regex-Operationen verwendet werden

Lassen Sie uns verschiedene Funktionen des re-Moduls sehen, die für reguläre Ausdrücke in Python verwendet werden können.

1. findall () -Funktion: Diese Funktion ist im re-Modul vorhanden. Es wird eine Liste aller Übereinstimmungen in der Zeichenfolge zurückgegeben. Es durchläuft die Zeichenfolge von links nach rechts. Die Übereinstimmungen werden auch in genau derselben Suchreihenfolge zurückgegeben. Wir werden ein Beispiel dafür durchgehen. Angenommen, wir möchten alle in einer Zeichenfolge vorhandenen Ziffern finden. Dazu verwenden wir die Funktion findall (), in der wir alle in der Zeichenfolge vorhandenen Ziffern finden. Sehen wir uns jetzt den Code dafür an:

Code:

import re
word = "Raju is 22 years old and his mobile number last three-digit is 789"
rgex ='\d+'
x =re.findall(rgex, word)
print(x)

Wenn wir den Code durchgehen, wird dem variablen Wort im Grunde eine Zeichenfolge mit Ziffern zugewiesen, und dann wird das entsprechende Regex-Symbol für Ziffern zusammen mit dem variablen Wort als Argument in der Funktion findall () übergeben

Lassen Sie uns nun die Ausgabe sehen.

Wie Sie sehen, erhalten wir als Ergebnis eine Liste mit Zahlen.

2. search () -Funktion: Die Suchfunktion wird verwendet, um Muster in einer Zeichenfolge zu suchen. Wenn eine Übereinstimmung gefunden wird, wird das Objekt zurückgegeben. Hier müssen wir uns daran erinnern, dass es nur das erste Vorkommen gibt, wenn es mehr als eine Übereinstimmung gibt. Wenn keine Übereinstimmung gefunden wird, wird keine zurückgegeben. Wir werden ein Beispiel dafür sehen, wenn wir die Zeichenkette finden wollen, die mit einem bestimmten Wort beginnt. Wir werden sowohl positive als auch negative Übereinstimmungsfälle testen. Lassen Sie uns den Code für das gleiche sehen.

Code:

import re
word = "Raju is 22 years old"
rgex ='^Raju'
x =re.search(rgex, word)
print(x)
regex1= '^Mohan'
x1 = re.search(regex1, word)
print(x1)

Hier wird die Variable "Regex" in einem positiven Szenario und die Variable "Regex1" für ein negatives Szenario verwendet. Nun sehen Sie bitte die Ausgabe.

Im ersten Fall wird das Übereinstimmungsobjekt zurückgegeben, während im zweiten Fall "Keine" zurückgegeben wird.

3. Funktion split (): Diese Funktion teilt die Zeichenkette nach jedem Treffer auf, dh sobald eine Übereinstimmung in der Zeichenkette vorliegt, teilt diese Funktion die Zeichenkette von dort auf. Wenn es also drei Übereinstimmungen gibt, gibt es drei Teilungen. Wir werden ein Beispiel sehen. Angenommen, wir möchten nach jedem Leerzeichen eine Zeichenfolge aufteilen. Daher können wir diese Split-Funktion in dieser Situation gut nutzen.

Code:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.split(rgex, word)
print(x)

Hier stehen die Muster für Leerzeichen. Nun sehen wir uns die Ausgabe an.

Wie Sie in der Ausgabe sehen können, wird der String nach jedem Leerzeichen aufgeteilt.

4. sub () -Funktion: Diese Funktion ersetzt die Übereinstimmungen durch die Zeichenfolge oder das Zeichen der Benutzerwahl. Grundsätzlich bedeutet dies, dass bei einer Übereinstimmung in der Zeichenfolge das übereinstimmende Zeichen oder die übereinstimmende Zeichenfolge durch die Zeichenfolge oder das Zeichen ersetzt und die geänderte Zeichenfolge zurückgegeben wird. Es braucht drei Argumente. Zum Beispiel ersetzen wir einfach den Leerraum durch '&' in unserer Zeichenkette.

Code:

import re
word = "Raju is 22 years old"
rgex ='\s'
x =re.sub(rgex, '&', word)
print(x)

Betrachten wir nun die Ausgabe für den obigen Code.

Wie Sie sehen, wurden alle Leerzeichen durch '&' ersetzt.

Fazit

In diesem Artikel haben wir uns mit dem Regex-Modul und seinen verschiedenen integrierten Python-Funktionen befasst. Regex ist sehr wichtig und wird häufig in verschiedenen Programmiersprachen verwendet.

Empfohlene Artikel

Dies ist eine Anleitung zu Python Regex. Hier diskutieren wir die Einführung in Python Regex und einige wichtige Regex-Funktionen zusammen mit einem Beispiel. Sie können auch unsere anderen Artikelvorschläge durchgehen, um mehr zu erfahren.

  1. While-Schleife in Python
  2. Reverse Number in Python
  3. Python-Schlüsselwörter
  4. Python-Sets
  5. PHP-Schlüsselwörter
  6. C ++ - Schlüsselwörter