Les composantes d'un URL

Un URL (Uniform Resource Locator) est un type spécifique d'URI (Universal Resource Identifier). Un site URL localise normalement une ressource existante sur Internet. Une adresse URL est utilisée lorsqu'un client web demande une ressource à un serveur.

Cette rubrique est un récapitulatif des URL et des URI. Pour en savoir plus, les concepts d'URI et de URL sont définis dans le document RFC 2396 de l'Internet Society et de l'IETF (Internet Engineering Task Force) Request for Comments, Uniform Resource Identifiers (URI) : Generic Syntax ( https://www.ietf.org/rfc/rfc2396.txt ).

En bref, un URI est défini comme n'importe quelle chaîne de caractères qui identifie une ressource. Un URL est défini comme les URI qui identifient une ressource par son emplacement ou par les moyens utilisés pour y accéder, plutôt que par un nom ou un autre attribut de la ressource.

Une nouvelle forme d'identificateur de ressource, l'IRI (Internationalized Resource Identifier), permet l'utilisation de caractères et de formats adaptés aux langues nationales autres que l'anglais. Un IRI peut être utilisé à la place d'un URI ou de URL lorsque les applications impliquées dans la demande et la réponse prennent en charge les IRI. Pour plus d'informations sur les IRI, voir Identificateurs de ressource internationalisés (IRI).

Un site URL pour HTTP (ou HTTPS ) est normalement composé de trois ou quatre éléments :

Schéma. Le schéma identifie le protocole à utiliser pour accéder à la ressource sur Internet. Il peut s'agir de HTTP (sans SSL ) ou de HTTPS (avec SSL ).
Hôte. Le nom d'hôte identifie l'hôte qui contient la ressource. Par exemple, www.example.com. Un serveur fournit des services dans le nom de l'hôte, mais les hôtes et les serveurs n'ont pas de mappage un à un. Voir Noms d'hôte.
Les noms d'hôte peuvent également être suivis d'un numéro de port. Voir Numéros de port. Les numéros de port bien connus d'un service sont normalement omis de l'adresse URL. La plupart des serveurs utilisent les numéros de port bien connus pour HTTP et HTTPS, de sorte que la plupart des URL HTTP omettent le numéro de port.
Un chemin. Le chemin identifie la ressource spécifique de l'hôte à laquelle le client Web souhaite accéder. Par exemple, /software/htp/cics/index.html.
Une chaîne de requête. Si une chaîne de requête est utilisée, elle suit le composant de chemin et fournit une chaîne d'informations que la ressource peut utiliser à des fins (par exemple, en tant que paramètres d'une recherche ou en tant que données à traiter). La chaîne de requête est généralement une chaîne de paires nom / valeur ; par exemple, term=bluebird. Les paires nom-valeur sont séparées les unes des autres par une perluète (&) ; par exemple, term=bluebird&source=browser-search.

Les composants "scheme" et "host" d'un site URL ne sont pas définis comme sensibles à la casse, mais le chemin d'accès et la chaîne de requête le sont. Généralement, l'ensemble du site URL est spécifié en minuscules.

Les éléments du site URL sont combinés et délimités comme suit :

scheme://host:port/path?query

Le schéma est suivi d'un signe deux-points et de deux barres obliques.
Si un numéro de port est spécifié, ce numéro suit le nom d'hôte, séparé par le signe deux-points.
Le nom de chemin commence par une barre oblique unique.
Si une chaîne de requête est spécifiée, elle est précédée d'un point d'interrogation.

Lire le diagramme de syntaxe — Figure 1 : Syntaxe d'un HTTP URL

Ignorer le diagramme de syntaxe graphique — Figure 1 : Syntaxe d'un HTTP URL

Voici un exemple de HTTP URL :

http://www.example.com/software/index.html

Si un numéro de port est spécifié, l'adresse URL est la suivante :

http://www.example.com:1030/software/index.html

Un URL peut être suivi d'un identifiant de fragment. Le séparateur utilisé entre URL et l'identifiant du fragment est le caractère #. Un identificateur de fragment est utilisé pour pointer un navigateur Web vers une référence ou une fonction dans l'élément qu'il vient d'extraire. Par exemple, si le site URL identifie une page HTML, un identifiant de fragment peut être utilisé pour indiquer une sous-section de la page, en utilisant l'identifiant de la sous-section. Dans ce cas, le navigateur Web affiche généralement la page à l'utilisateur afin que la sous-section soit visible. L'action effectuée par le navigateur Web pour un identificateur de fragment varie en fonction du type de support de l'élément et de la signification définie de l'identificateur de fragment pour ce type de support.

D'autres protocoles, tels que FTP (File Transfer Protocol) ou Gopher, utilisent également des URL. Les URL utilisés par ces protocoles peuvent avoir une syntaxe différente de celle utilisée pour HTTP.