virli/tutorial/docker-internals/registry.md

\newpage

Registres
=========

**Outils nécessaires :** `curl`, `gunzip`, `jq`, `tar`.

* * * * *

Nous allons appréhender le fonctionnement d'un registre OCI,
et préparer le *rootfs* d'une image de base (Debian, Ubuntu, hello, ...) : en
nous préoccupant simplement de la couche la plus basse (qui ne contient pas de
modification ou de suppression : chaque fichier est normal).


## Authentification

L'authentification est facultative et est laissée à l'appréciation du
fournisseur de service. Étant donné que nous allons utiliser le [Docker
Hub](https://hub.docker.com/), le registre par défaut de `docker`, nous allons
devoir nous plier à leur mécanisme d'authentification : chaque requête au
registre doit être effectuée avec un jeton, que l'on obtient en s'authentifiant
auprès d'un service dédié. Ce service peut délivrer un jeton sans authentifier
l'interlocuteur, en restant anonyme ; dans ce cas, on ne pourra accéder qu'aux
images publiques. Ça tombe bien, c'est ce qui nous intéresse aujourd'hui !

Il n'en reste pas moins que le jeton est forgé pour un service donné (ici
`registry.docker.io`) et avec un objectif bien cerné (pour nous, on souhaite
récupérer le contenu du dépôt[^quiddepot] `hello-world` : <span
lang="en-US">`repository:hello-world:pull`</span>). Ce qui nous donne :

[^quiddepot]: Dans un registre, les fichiers qui composent l'image forment un
    dépôt (*repository*).

<div lang="en-US">
```bash
42sh$ curl "https://auth.docker.io/token?service=registry.docker.io&"\
  "scope=repository:library/hello-world:pull" | jq .
```
```json
{
  "token": "lUWXBCZzg2TGNUdmMy...daVZxGTj0eh",
  "access_token": "eyJhbGciOiJSUzI1NiIsI...N5q469M3ZkL_HA",
  "expires_in": 300,
  "issued_at": "2012-12-12T12:12:12.123456789Z"
}
```
</div>

C'est le `token` qu'il faudra fournir lors de nos prochaines requêtes au
registre.

Avec `jq`, on peut l'extraire grâce à :

<div lang="en-US">
```bash
| jq -r .token
```
</div>

::::: {.warning}

Le token expire ! Pensez à le renouveler régulièrement.

:::::

En cas d'erreur inexplicable, vous pouvez ajouter un `-v` à la ligne de
commande `curl`, afin d'afficher les en-têtes. Prêtez une attention toute
particulière à `Www-Authenticate`.


## Lecture de l'index d'images

Une fois en possession de notre jeton, nous pouvons maintenant demander l'index
d'images à notre registre :

<div lang="en-US">
```bash
curl -s \
  -H "Authorization: Bearer ${TOKEN}" \
  -H "Accept: application/vnd.docker.distribution.manifest.list.v2+json" \
  "https://registry-1.docker.io/v2/library/hello-world/manifests/latest" | jq .
```
</div>

Dans la liste des manifests retournés, nous devons récupérer son `digest`. Dans
tout l'écosystème OCI, les `digest` servent à la fois de chemin d'accès et de
somme de contrôle.


## Lecture du manifest

Demandons maintenant le manifest correspondant à notre matériel et à notre
système d'exploitation :

<div lang="en-US">
```bash
curl -s \
  -H "Authorization: Bearer ${TOKEN}" \
  -H "Accept: ${MEDIATYPE}" \
  "https://registry-1.docker.io/v2/library/hello-world/manifests/${MNFST_DGST}"
```
</div>

Nous voici donc maintenant avec le manifest de notre image. Nous pouvons
constater qu'il n'a bien qu'une seule couche, ouf !


## Récupération de la configuration et de la première couche

Les deux éléments que l'on cherche à récupérer vont se trouver dans le
répertoire `blobs`, il ne s'agit en effet plus de manifest. Si les manifests
sont toujours stockés par le registre lui-même, les blobs peuvent être délégués
à un autre service, par exemple dans le cloud, chez Amazon S3, un CDN, etc.

Pour récupérer la configuration de l'image :

<div lang="en-US">
```bash
curl -s --location \
  -H "Authorization: Bearer ${TOKEN}" \
  "https://registry-1.docker.io/v2/library/hello-world/blobs/${CONFIG_DIGEST}"
```
</div>


Enfin, armé du `digest` de notre couche, il ne nous reste plus qu'à la demander gentiment :

<div lang="en-US">
```bash
wget --header "Authorization: Bearer ${TOKEN}" \
  "https://registry-1.docker.io/v2/library/hello-world/blobs/${LAYER_DIGEST}"
```
</div>


## Extraction

Le type indiqué par le manifest pour cette couche était :

    application/vnd.docker.image.rootfs.diff.tar.gzip

Il s'agit donc d'une tarball compressée au format gzip :

<div lang="en-US">
```bash
mkdir rootfs
tar xzf ${DL_LAYER} -C rootfs
```
</div>

Et voilà, nous avons extrait notre première image, nous devrions pouvoir :

<div lang="en-US">
```bash
42sh# chroot rootfs /hello
Hello from Docker!
[...]
```
</div>


## Exercice  {-}

Réalisez un script pour automatiser l'ensemble de ces étapes :

<div lang="en-US">
```bash
42sh$ cd $(mktemp)

42sh$ ~/workspace/registry_play.sh library/hello-world:latest

42sh$ find
.
./rootfs
./rootfs/hello

42sh# chroot rootfs /hello
Hello from Docker!
[...]
```
</div>

Pensez également à tester avec d'autres images, comme par exemple
`nemunaire/youp0m`. Il vous faudra alors extraire plusieurs couches.

Pour gérer les différentes couches, vous pouvez utiliser une stratégie
similaire au driver `vfs` : en extrayant chaque tarball l'une au dessus de
l'autre, en essayant de gérer les *whiteout files*. Ou bien en suivant le
driver `overlayfs`, en montant un système de fichier à chaque couche (dans ce
cas, votre script devra être lancé en `root`).
-done

											
										
										
											2020-09-14 13:46:13 +00:00
+								\newpage
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								Registres
 								=========
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								**Outils nécessaires :** `curl`, `gunzip`, `jq`, `tar`.
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								* * * * *
-												New tuto 3 done

											
										
										
											2020-10-28 22:16:34 +00:00
+								Nous allons appréhender le fonctionnement d'un registre OCI,
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								et préparer le *rootfs* d'une image de base (Debian, Ubuntu, hello, ...) : en
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								nous préoccupant simplement de la couche la plus basse (qui ne contient pas de
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								modification ou de suppression : chaque fichier est normal).
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								## Authentification
 								L'authentification est facultative et est laissée à l'appréciation du
 								fournisseur de service. Étant donné que nous allons utiliser le [Docker
 								Hub](https://hub.docker.com/), le registre par défaut de `docker`, nous allons
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								devoir nous plier à leur mécanisme d'authentification : chaque requête au
-done

											
										
										
											2020-09-14 13:46:13 +00:00
+								registre doit être effectuée avec un jeton, que l'on obtient en s'authentifiant
 								auprès d'un service dédié. Ce service peut délivrer un jeton sans authentifier
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								l'interlocuteur, en restant anonyme ; dans ce cas, on ne pourra accéder qu'aux
 								images publiques. Ça tombe bien, c'est ce qui nous intéresse aujourd'hui !
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								Il n'en reste pas moins que le jeton est forgé pour un service donné (ici
 								`registry.docker.io`) et avec un objectif bien cerné (pour nous, on souhaite
 								récupérer le contenu du dépôt[^quiddepot] `hello-world` : <span
 								lang="en-US">`repository:hello-world:pull`</span>). Ce qui nous donne :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								[^quiddepot]: Dans un registre, les fichiers qui composent l'image forment un
 								    dépôt (*repository*).
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 sh$ curl "https://auth.docker.io/token?service=registry.docker.io&"\
-done

											
										
										
											2020-09-14 13:46:13 +00:00
+								  "scope=repository:library/hello-world:pull" | jq .
-												docker-internals: tuto ready

											
										
										
											2018-11-15 22:38:25 +00:00
+								```
 								```json
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								{
 								  "token": "lUWXBCZzg2TGNUdmMy...daVZxGTj0eh",
 								  "access_token": "eyJhbGciOiJSUzI1NiIsI...N5q469M3ZkL_HA",
 								  "expires_in": 300,
 								  "issued_at": "2012-12-12T12:12:12.123456789Z"
 								}
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
 								C'est le `token` qu'il faudra fournir lors de nos prochaines requêtes au
 								registre.
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								Avec `jq`, on peut l'extraire grâce à :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								| jq -r .token
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								::::: {.warning}
 								Le token expire ! Pensez à le renouveler régulièrement.
 								:::::
-done

											
										
										
											2020-09-14 13:46:13 +00:00
 								En cas d'erreur inexplicable, vous pouvez ajouter un `-v` à la ligne de
 								commande `curl`, afin d'afficher les en-têtes. Prêtez une attention toute
 								particulière à `Www-Authenticate`.
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								## Lecture de l'index d'images
 								Une fois en possession de notre jeton, nous pouvons maintenant demander l'index
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								d'images à notre registre :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								curl -s \
 								  -H "Authorization: Bearer ${TOKEN}" \
 								  -H "Accept: application/vnd.docker.distribution.manifest.list.v2+json" \
 								  "https://registry-1.docker.io/v2/library/hello-world/manifests/latest" | jq .
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
 								Dans la liste des manifests retournés, nous devons récupérer son `digest`. Dans
 								tout l'écosystème OCI, les `digest` servent à la fois de chemin d'accès et de
 								somme de contrôle.
 								## Lecture du manifest
 								Demandons maintenant le manifest correspondant à notre matériel et à notre
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								système d'exploitation :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								curl -s \
 								  -H "Authorization: Bearer ${TOKEN}" \
 								  -H "Accept: ${MEDIATYPE}" \
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								  "https://registry-1.docker.io/v2/library/hello-world/manifests/${MNFST_DGST}"
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
 								Nous voici donc maintenant avec le manifest de notre image. Nous pouvons
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								constater qu'il n'a bien qu'une seule couche, ouf !
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								## Récupération de la configuration et de la première couche
 								Les deux éléments que l'on cherche à récupérer vont se trouver dans le
-done

											
										
										
											2020-09-14 13:46:13 +00:00
+								répertoire `blobs`, il ne s'agit en effet plus de manifest. Si les manifests
 								sont toujours stockés par le registre lui-même, les blobs peuvent être délégués
 								à un autre service, par exemple dans le cloud, chez Amazon S3, un CDN, etc.
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								Pour récupérer la configuration de l'image :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								curl -s --location \
 								  -H "Authorization: Bearer ${TOKEN}" \
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								  "https://registry-1.docker.io/v2/library/hello-world/blobs/${CONFIG_DIGEST}"
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								Enfin, armé du `digest` de notre couche, il ne nous reste plus qu'à la demander gentiment :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								wget --header "Authorization: Bearer ${TOKEN}" \
 								  "https://registry-1.docker.io/v2/library/hello-world/blobs/${LAYER_DIGEST}"
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
 								## Extraction
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								Le type indiqué par le manifest pour cette couche était :
 								    application/vnd.docker.image.rootfs.diff.tar.gzip
 								Il s'agit donc d'une tarball compressée au format gzip :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 								mkdir rootfs
 								tar xzf ${DL_LAYER} -C rootfs
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								Et voilà, nous avons extrait notre première image, nous devrions pouvoir :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 sh# chroot rootfs /hello
 								Hello from Docker!
 								[...]
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								## Exercice  {-}
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
-												Update tuto2

											
										
										
											2021-09-23 00:55:18 +00:00
+								Réalisez un script pour automatiser l'ensemble de ces étapes :
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
 								<div lang="en-US">
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+								```bash
 sh$ cd $(mktemp)
-												docker-internals: tuto ready

											
										
										
											2018-11-15 22:38:25 +00:00
-done

											
										
										
											2020-09-14 13:46:13 +00:00
+sh$ ~/workspace/registry_play.sh library/hello-world:latest
-												docker-internals: tuto ready

											
										
										
											2018-11-15 22:38:25 +00:00
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+sh$ find
 								.
 								./rootfs
 								./rootfs/hello
-												docker-internals: tuto ready

											
										
										
											2018-11-15 22:38:25 +00:00
-												tutorials: improve theme + use pandoc 2

											
										
										
											2018-11-16 01:38:41 +00:00
+sh# chroot rootfs /hello
 								Hello from Docker!
 								[...]
-												docker-internals: oci and registry parts done

											
										
										
											2018-11-14 09:11:43 +00:00
+								```
 								</div>
-done

											
										
										
											2020-09-14 13:46:13 +00:00
 								Pensez également à tester avec d'autres images, comme par exemple
 								`nemunaire/youp0m`. Il vous faudra alors extraire plusieurs couches.
-												tuto 2022 5, 6

											
										
										
											2021-11-19 23:00:30 +00:00
 								Pour gérer les différentes couches, vous pouvez utiliser une stratégie
-												Save tuto corrections

											
										
										
											2022-02-24 19:43:43 +00:00
+								similaire au driver `vfs` : en extrayant chaque tarball l'une au dessus de
-												tuto 2022 5, 6

											
										
										
											2021-11-19 23:00:30 +00:00
+								l'autre, en essayant de gérer les *whiteout files*. Ou bien en suivant le
 								driver `overlayfs`, en montant un système de fichier à chaque couche (dans ce
 								cas, votre script devra être lancé en `root`).