Un Talos européen de qualité - Part IV - Infra stockage

part-04

Objectif 🎯

À la fin de la section précédente, nous sommes arrivés à un kube pleinement opérationnel. Il nous reste cependant à mettre en place une réelle solution de stockage distribuée. Il existe les solutions simples telles que local-path-provisioner , nfs-subdir-external-provisioner, ou encore hetznercloud/csi-driver. Mais ce ne sont pas des solutions réellement viables en production pour des raisons évidentes telles que la résilience, la haute disponibilité, la sauvegarde/restauration, etc.

Les 3 solutions de stockage distribuées les plus connues sont :

Dans le cadre de ce guide, nous partirons sur Longhorn, qui me semble le plus équilibré au regard des capacités en ressources des VPS Hetzner et de la taille de notre cluster.

Longhorn

1
locals {
2
  cluster_name    = "ohmytalos-dev"
3
  internal_domain = "dev.ohmytalos.com"
4
  s3_endpoint     = "https://s3.gra.io.cloud.ovh.net"
5
  s3_region       = "gra"
6
}

1
module "kube_storage" {
2
  source = "../../modules/kube/storage"
3

4
  internal_domain = local.internal_domain
5

6
  longhorn_crypto_key_value             = var.longhorn_crypto_key
7
  longhorn_backup_s3_endpoint           = "https://${local.s3_endpoint}"
8
  longhorn_backup_s3_access_key         = var.longhorn_backup_s3_username
9
  longhorn_backup_s3_secret_key         = var.longhorn_backup_s3_password
10
  longhorn_backup_s3_region             = local.s3_region
11
  longhorn_backup_s3_bucket             = local.cluster_name
12
  longhorn_default_local_replica_count  = 2
13
  longhorn_default_volume_replica_count = 2
14
  longhorn_default_taint_tolerations = [
15
    "node-role.kubernetes.io/storage:NoSchedule"
16
  ]
17
}

Explanation

Bien que tous les volumes physiques de base soient déjà chiffrés au niveau OS, nous utiliserons également des volumes chiffrés côté longhorn. Cela ne coûte pas bien plus cher en ressource et permet de notamment de chiffrer les backups, ces derniers étant effectués en mode block.

Configurer les accès S3 pour le stockage des backups. Nous utiliserons OVH, mais n’importe quel fournisseur compatible S3 fera l’affaire. Prenez le même bucket déjà dédié à ce cluster ohmytalos-dev.

La définition du nombre de réplicas selon le niveau de résilience des données est importante. Dans notre configuration actuelle du cluster, nous définissons :

2 réplicas par défaut pour les volumes locaux, qui vivent à travers l’ensemble du cluster. Mettre à 3 si besoin pour plus de résilience.
2 réplicas pour les volumes externes, requis car nous sommes limités à 2 disques externes (un dans chaque nœud) dans la définition du pool de storage de l’étape 2.

La définition des teintes est importantes pour s’assurer que les composants longhorn (manager et engine) soient bien programmés sur tous les nœuds workers.

1
// ...
2

3
variable "longhorn_backup_s3_username" {
4
  type = string
5
}
6

7
variable "longhorn_backup_s3_password" {
8
  type      = string
9
  sensitive = true
10
}
11

12
variable "longhorn_crypto_key" {
13
  type      = string
14
  sensitive = true
15
}

# ...

export TF_VAR_longhorn_backup_s3_username=$(bw_field username longhorn_backup_s3)
export TF_VAR_longhorn_backup_s3_password=$(bw_field password longhorn_backup_s3)
export TF_VAR_longhorn_crypto_key=$(bw_field password longhorn_crypto_key)

1
variable "internal_domain" {
2
  description = "The internal domain name to use for the private network"
3
  type        = string
4
}
5

6
variable "longhorn_backup_s3_endpoint" {
7
  description = "The endpoint of the S3 compatible storage"
8
  type        = string
9
}
10

11
variable "longhorn_backup_s3_access_key" {
12
  description = "The access key for the S3 compatible storage"
13
  type        = string
14
}
15

16
variable "longhorn_backup_s3_secret_key" {
17
  description = "The secret key for the S3 compatible storage"
18
  type        = string
19
  sensitive   = true
20
}
21

22
variable "longhorn_backup_s3_region" {
23
  description = "The region of the S3 compatible storage"
24
  type        = string
25
}
26

27
variable "longhorn_backup_s3_bucket" {
28
  description = "The bucket of the S3 compatible storage"
29
  type        = string
30
}
31

32
variable "longhorn_default_local_replica_count" {
33
  description = "The default replica count for the local longhorn storage class and UI"
34
  type        = number
35
  default     = 3
36
}
37

38
variable "longhorn_default_volume_replica_count" {
39
  description = "The default replica count for the volume longhorn storage class and UI"
40
  type        = number
41
  default     = 3
42
}
43

44
variable "longhorn_default_taint_tolerations" {
45
  description = "The default taint tolerations for the longhorn components"
46
  type        = list(string)
47
}
48

49
variable "longhorn_crypto_key_value" {
50
  description = "The encryption key value for Longhorn volumes"
51
  type        = string
52
  sensitive   = true
53
}

1
resource "kubernetes_namespace_v1" "longhorn" {
2
  metadata {
3
    name = "longhorn-system"
4
    labels = {
5
      "pod-security.kubernetes.io/enforce" = "privileged"
6
    }
7
  }
8
}
9

10
resource "kubernetes_secret_v1" "backup_target_credential" {
11
  metadata {
12
    name      = "backup-target-credential"
13
    namespace = kubernetes_namespace_v1.longhorn.metadata[0].name
14
  }
15
  data = {
16
    AWS_ENDPOINTS         = var.longhorn_backup_s3_endpoint
17
    AWS_ACCESS_KEY_ID     = var.longhorn_backup_s3_access_key
18
    AWS_SECRET_ACCESS_KEY = var.longhorn_backup_s3_secret_key
19
    AWS_REGION            = var.longhorn_backup_s3_region
20
  }
21
  lifecycle {
22
    ignore_changes = [metadata[0].annotations]
23
  }
24
}
25

26
resource "kubernetes_secret_v1" "longhorn_crypto" {
27
  metadata {
28
    name      = "longhorn-crypto"
29
    namespace = kubernetes_namespace_v1.longhorn.metadata[0].name
30
  }
31
  data = {
32
    CRYPTO_KEY_VALUE : var.longhorn_crypto_key_value
33
    CRYPTO_KEY_PROVIDER : "secret"
34
    CRYPTO_KEY_CIPHER : "aes-xts-plain64"
35
    CRYPTO_KEY_HASH : "sha256"
36
    CRYPTO_KEY_SIZE : "256"
37
    CRYPTO_PBKDF : "argon2i"
38
  }
39
}
40

41
resource "helm_release" "longhorn" {
42
  repository = "https://charts.longhorn.io"
43
  chart      = "longhorn"
44
  version    = "1.11.0"
45

46
  name        = "longhorn"
47
  namespace   = kubernetes_namespace_v1.longhorn.metadata[0].name
48
  max_history = 2
49

50
  set = concat(
51
    [
52
      {
53
        name  = "metrics.serviceMonitor.enabled"
54
        value = "true"
55
      },
56
      {
57
        name  = "defaultBackupStore.backupTargetCredentialSecret"
58
        value = kubernetes_secret_v1.backup_target_credential.metadata[0].name
59
      },
60
      {
61
        name  = "defaultBackupStore.backupTarget"
62
        value = "s3://${var.longhorn_backup_s3_bucket}@${var.longhorn_backup_s3_region}/longhorn/"
63
      },
64
      {
65
        name  = "defaultSettings.createDefaultDiskLabeledNodes"
66
        value = "true"
67
      },
68
      {
69
        name  = "defaultSettings.defaultLonghornStaticStorageClass"
70
        value = kubernetes_storage_class_v1.longhorn_crypto.metadata[0].name
71
      },
72
      {
73
        name  = "defaultSettings.taintToleration"
74
        value = join(";", var.longhorn_default_taint_tolerations)
75
      }
76
    ],
77
    [
78
      for i, toleration in var.longhorn_default_taint_tolerations : {
79
        name  = "longhornManager.tolerations[${i}].key"
80
        value = split(":", toleration)[0]
81
      }
82
    ],
83
    [
84
      for i, toleration in var.longhorn_default_taint_tolerations : {
85
        name  = "longhornManager.tolerations[${i}].effect"
86
        value = split(":", toleration)[1]
87
      }
88
    ]
89
  )
90
}
91

92
resource "kubernetes_manifest" "traefik_ingress_route_longhorn" {
93
  manifest = {
94
    apiVersion = "traefik.io/v1alpha1"
95
    kind       = "IngressRoute"
96
    metadata = {
97
      name      = "longhorn"
98
      namespace = kubernetes_namespace_v1.longhorn.metadata[0].name
99
    }
100
    spec = {
101
      entryPoints = ["internal"]
102
      routes = [
103
        {
104
          match = "Host(`longhorn.${var.internal_domain}`)"
105
          kind  = "Rule"
106
          middlewares = [
107
            {
108
              name      = "internal-basic-auth"
109
              namespace = "traefik"
110
            }
111
          ]
112
          services = [
113
            {
114
              name = "longhorn-frontend"
115
              port = "http"
116
            }
117
          ]
118
        }
119
      ]
120
    }
121
  }
122
}
123

124
resource "kubernetes_storage_class_v1" "longhorn_crypto" {
125
  metadata {
126
    name = "longhorn-crypto"
127
  }
128
  storage_provisioner = "driver.longhorn.io"
129
  parameters = merge(
130
    {
131
      dataEngine       = "v1"
132
      dataLocality     = "best-effort"
133
      fsType           = "ext4"
134
      numberOfReplicas = var.longhorn_default_local_replica_count
135
      diskSelector     = "local"
136
      encrypted        = "true"
137
    },
138
    merge(
139
      [
140
        for type in [
141
          "provisioner",
142
          "node-publish",
143
          "node-stage",
144
          "node-expand"
145
        ] :
146
        {
147
          "csi.storage.k8s.io/${type}-secret-name"      = kubernetes_secret_v1.longhorn_crypto.metadata[0].name
148
          "csi.storage.k8s.io/${type}-secret-namespace" = kubernetes_secret_v1.longhorn_crypto.metadata[0].namespace
149
        }
150
      ]...
151
    )
152
  )
153
}
154

155
resource "kubernetes_storage_class_v1" "longhorn_crypto_local" {
156
  metadata {
157
    name = "longhorn-crypto-local"
158
  }
159
  storage_provisioner = "driver.longhorn.io"
160
  parameters = merge(
161
    kubernetes_storage_class_v1.longhorn_crypto.parameters,
162
    {
163
      dataLocality     = "strict-local"
164
      numberOfReplicas = "1"
165
    }
166
  )
167
}
168

169
resource "kubernetes_storage_class_v1" "longhorn_crypto_volume" {
170
  metadata {
171
    name = "longhorn-crypto-volume"
172
  }
173
  storage_provisioner = "driver.longhorn.io"
174
  parameters = merge(
175
    kubernetes_storage_class_v1.longhorn_crypto.parameters,
176
    {
177
      numberOfReplicas = var.longhorn_default_volume_replica_count
178
      diskSelector     = "volume"
179
    },
180
  )
181
}

Explanation

Nous créons un namespace longhorn-system avec le niveau de sécurité privileged requis par Longhorn.

Nous créons un secret Kubernetes pour stocker les informations d’accès au stockage S3, qui sera utilisé par Longhorn pour stocker les backups, puis un autre pour stocker la clé et paramètres de chiffrement des volumes Longhorn.

Nous déployons Longhorn via Helm avec les configurations suivantes :

Activation du service monitor pour Prometheus.
Configuration du stockage de backup avec les informations S3.
Via defaultSettings.createDefaultDiskLabeledNodes, on s’assure d’utiliser la configuration indiquée par worker pool à l’étape 2 pour la création des disques par défaut. Le répertoire de point de montage utilisés sur les disques locaux sera /var/lib/longhorn, et /var/mnt/longhorn pour les disques externes.
Application des teintes pour que les composants systèmes Longhorn ET Longhorn Manager soient également programmés sur les nœuds de stockage.

Comme d’habitude on définit un IngressRoute Traefik pour exposer l’interface web de Longhorn en interne, toujours protégée par un middleware BasicAuth.

Enfin, dernier point essentiel, nous créons 3 StorageClass :

longhorn-crypto : stockage distribué chiffré, prenant en paramètre le nombre de réplicas par défaut, dédié aux workloads standards. Sera le StorageClass par défaut lors de la création des pv depuis l’interface UI.
longhorn-crypto-local : stockage local chiffré, avec 1 réplica uniquement du fait du strict-local, dédié aux workloads nécessitant de haute performance en I/O, typiquement les bases de données. Étant ici limité à un seul réplica, ce sera à la partie applicative de gérer la réplication des données, généralement en mode cluster via un StatefulSet.
longhorn-crypto-volume : stockage distribué chiffré, avec 2 réplicas, pour les workloads nécessitant un stockage persistant de grande taille.

Plus qu’à lancer un terraform apply pour déployer Longhorn, et tout devrait automatiquement se mettre en place.

Longhorn UI

Sans attendre d’avoir un ingress fonctionnel, vous pouvez déjà vérifier que tout est en ordre en accédant à l’interface web de Longhorn via un kpf -n longhorn-system svc/longhorn-frontend 8000:http et en vous rendant sur http://localhost:8000.

Note

Partie importante en rouge, vous devriez avoir 5 nœuds schedulables.

Longhorn Dashboard

Longhorn Nodes & Disks

Note

Selon la configuration faite à l’étape 2 via les annotations node.longhorn.io/default-disks-config et node.longhorn.io/default-node-tags, chaque nœud doit être correctement étiqueté et avoir un disque local monté sur /var/lib/longhorn, tandis que les nœuds du pool storage doivent avoir en plus un disque externe monté sur /var/mnt/longhorn.

Longhorn Nodes

Longhorn Backup

Note

Assurez-vous que le backup target ait bien un statut Available, afin de valider l’accès au S3.

Longhorn Backup

Nous définirons les backups plus tard dans une prochaine section dédiée du guide.

CloudNativePG

Nous allons maintenant nous pencher sur le déploiement de l’opérateur CloudNativePG, qui nous permettra de monter et gérer des clusters de bases de données PostgreSQL, avec réplication, sauvegarde et restauration automatisées.

1
resource "kubernetes_namespace_v1" "cnpg" {
2
  metadata {
3
    name = "cnpg-system"
4
  }
5
}
6

7
resource "helm_release" "cnpg" {
8
  repository = "https://cloudnative-pg.github.io/charts"
9
  chart      = "cloudnative-pg"
10
  version    = "0.27.1"
11

12
  name        = "cnpg"
13
  namespace   = kubernetes_namespace_v1.cnpg.metadata[0].name
14
  max_history = 2
15

16
  set = [
17
    {
18
      name  = "monitoring.podMonitorEnabled"
19
      value = "true"
20
    },
21
    {
22
      name  = "monitoring.grafanaDashboard.create"
23
      value = "true"
24
    }
25
  ]
26
}
27

28
resource "helm_release" "cnpg_barman_plugin" {
29
  repository = "https://cloudnative-pg.github.io/charts"
30
  chart      = "plugin-barman-cloud"
31
  version    = "0.5.0"
32

33
  name        = "plugin-barman-cloud"
34
  namespace   = kubernetes_namespace_v1.cnpg.metadata[0].name
35
  max_history = 2
36

37
  depends_on = [
38
    helm_release.cnpg
39
  ]
40
}

Explanation

En plus de cnpg, nous installons également l’opérateur plugin-barman-cloud, l’outil de prédilection pour la sauvegarde et restauration de PostgreSQL, avec support du PITR. Il s’intègre parfaitement avec CloudNativePG pour gérer les sauvegardes hors cluster.

Le mode plugin est la nouvelle façon recommandée d’utiliser barman cloud sur les dernières versions de cnpg. De fait, nous utiliserons donc les nouvelles images standard de PostgreSQL fournies par cnpg et dénuées du binaire barman cloud. En mode plugin, le barman cloud s’exécute dans un sidecar séparé, ce qui est plus propre et plus flexible. L’explication ici.

L’activation de monitoring.grafanaDashboard.create permet d’exposer des dashboards Grafana pour les clusters PostgreSQL, que l’on utilisera plus tard dans la section dédiée au monitoring.

Un petit coup de terraform apply et voilà, l’opérateur CloudNativePG est prêt à être utilisé pour la création de clusters PostgreSQL. Nous verrons cela plus tard dans une section dédiée aux bases de données.

Conclusion

Les principaux composants critiques réseaux, CSI et opérateurs de stockage sont désormais en place. Assurez-vous d’avoir un terraform apply propre avant de continuer sur la prochaine partie. Il est enfin temps d’accéder à notre cluster depuis l’extérieur. Suite à la prochaine section pour l’installation de la partie ingress.