Komponenten einer URL

URL (Uniform Resource Locator) ist eine bestimmte Art von URI (Universal Resource Identifier). URL lokalisiert normalerweise eine vorhandene Ressource im Internet. URL wird verwendet, wenn ein Webclient eine Ressource von einem Server anfordert.

Dieses Thema ist eine Zusammenfassung von URLs und URIs. Wenn Sie mehr wissen möchten, finden Sie die Definitionen der Begriffe URI und URL im Request for Comments-Dokument RFC 2396, Uniform Resource Identifiers (URI): Generic Syntaxhttps://www.ietf.org/rfc/rfc2396.txt ), das von der Internet Society und der IETF (Internet Engineering Task Force) herausgegeben wurde.

Kurz gesagt, ein URI ist definiert als eine beliebige Zeichenfolge, die eine Ressource identifiziert. URL ist definiert als diejenigen URIs, die eine Ressource durch ihren Standort oder die für den Zugriff verwendeten Mittel identifizieren, und nicht durch einen Namen oder ein anderes Attribut der Ressource.

Eine neuere Form der Ressourcenkennung, die IRI (Internationalized Resource Identifier), erlaubt die Verwendung von Zeichen und Formaten, die für andere Landessprachen als Englisch geeignet sind. Ein IRI kann anstelle eines URI oder URL verwendet werden, wenn die an der Anfrage und Antwort beteiligten Anwendungen IRIs unterstützen. Weitere Informationen über IRIs finden Sie unter Internationalized Resource Identifiers (IRIs).

URL für HTTP (oder HTTPS ) besteht normalerweise aus drei oder vier Komponenten:
  1. Ein Schema. Das Schema gibt das Protokoll an, das für den Zugriff auf die Ressource im Internet verwendet werden soll. Es kann HTTP (ohne SSL) oder HTTPS (mit SSL) sein.
  2. Ein Hostname. Der Hostname identifiziert den Host, auf dem sich die Ressource befindet. Zum Beispiel: www.example.com. Ein Server bietet Dienste im Namen des Hosts an, aber Hosts und Server haben keine Eins-zu-eins-Zuordnung. Siehe Hostnamen.

    Hostnamen können auch von einer Portnummer gefolgt werden. Siehe Anschlussnummern. Standardisierte Portnummern für einen Service werden in der URL normalerweise nicht angegeben. Die meisten Server verwenden die bekannten Portnummern für HTTP und HTTPS. Daher wird die Portnummer bei den meisten HTTP URLs weggelassen.

  3. Ein Pfad. Der Pfad identifiziert die spezifische Ressource im Host, auf die der Webclient zugreifen möchte. Zum Beispiel: /software/htp/cics/index.html.
  4. Eine Abfragezeichenfolge. Wird ein Query-String verwendet, so folgt er der Pfadkomponente und enthält eine Zeichenkette mit Informationen, die die Ressource für einen bestimmten Zweck verwenden kann (z. B. als Parameter für eine Suche oder als zu verarbeitende Daten). Die Abfragezeichenfolge ist in der Regel eine Folge von Namens- und Wertepaaren, z. B. term=bluebird. Namens- und Wertepaare werden durch ein kaufmännisches Und-Zeichen (&) voneinander getrennt, zum Beispiel term=bluebird&source=browser-search.
Die Schema- und Host-Komponenten URL sind nicht als case-sensitive definiert, aber der Pfad und die Abfragezeichenfolge sind case-sensitive. Normalerweise wird die gesamte URL in Kleinbuchstaben angegeben.
Die Bestandteile URL werden wie folgt kombiniert und voneinander abgegrenzt:
scheme://hostname:port/path?query
  • Auf das Schema folgen ein Doppelpunkt und zwei Schrägstriche.
  • Wenn eine Portnummer angegeben wird, folgt diese Nummer durch einen Doppelpunkt getrennt auf den Hostnamen.
  • Der Pfadname beginnt mit einem einfachen Schrägstrich.
  • Wenn eine Abfragezeichenfolge angegeben wird, wird ihr ein Fragezeichen vorangestellt.
Abb. 1. Syntax einer HTTP URL
Syntaxdiagramm lesenVisuelles Syntaxdiagramm überspringenhttp:// HostnameIP-Adresse :80:Port/Pfadkomponente?Abfragezeichenfolge
Hier ist ein Beispiel für eine HTTP URL :
http://www.example.com/software/index.html
Mit einer angegebenen Portnummer lautet URL :
http://www.example.com:1030/software/index.html

URL kann ein Fragment-Identifier folgen. Das Trennzeichen zwischen URL und dem Fragmentbezeichner ist das Zeichen #. Ein Fragment-Identifikator wird verwendet, um einen Webbrowser auf einen Verweis oder eine Funktion in dem Element zu verweisen, das er gerade abgerufen hat. Wenn URL beispielsweise eine HTML-Seite identifiziert, kann ein Fragment-Identifier verwendet werden, um einen Unterabschnitt innerhalb der Seite anzugeben, wobei die ID des Unterabschnitts verwendet wird. In diesem Fall zeigt der Webbrowser dem Benutzer die Seite normalerweise so an, dass der Unterabschnitt sichtbar ist. Die Aktion, die der Webbrowser für einen Fragmentbezeichner ausführt, hängt vom Medientyp des Elements und der für diesen Medientyp definierten Bedeutung des Fragmentbezeichners ab.

Andere Protokolle, wie das File Transfer Protocol (FTP) oder Gopher, verwenden ebenfalls URLs. Die von diesen Protokollen verwendeten URLs können eine andere Syntax haben als die für HTTP verwendete.