Un Talos européen de qualité - Part VI - Base de données et sauvegardes

part-06

Objectif 🎯

À la fin de la section précédente, nous en avions terminé avec l’ingress. Il s’agirait maintenant d’avoir un vrai service de base de données pour nos applications ainsi des backups chiffrés avec une bonne stratégie. Pour tout cela, nous allons nous appuyer sur les opérateurs déjà installés à la section 4.

Backups

Il y a plusieurs éléments à prendre en compte :

Backup de l’etcd, cerveau du cluster.
Backup des volumes persistants critiques, en mode block et/ou en mode fichiers.
Backup des bases de données en temps réel.

Etcd

Il peut être utile de faire des sauvegardes régulières de notre etcd en cas de situation extrême de devoir restaurer rapidement un cluster défectueux, notamment si un seul nœud control plane unique est envisagé.

Et ça tombe bien, Talos propose un outil taillé pour cela.

Important

La backup de l’etcd ne servira en aucun cas à la création d’un nouveau cluster :

La construction en mode GitOps rend ce processus inutile et inefficient.
Les nouvelles machines peuvent avoir des caractéristiques différentes.
Permet de renouveler tous les certificats.
Les secrets étant chiffrés à la volée par défaut via Talos, une restauration ne pourrait pas fonctionner, puisque la clé de déchiffrement lié à la nouvelle instance Talos serait nécessairement différente.

1
module "kube_database" {
2
  source = "../../modules/kube/database"
3

4
  talos_backup_cluster_name  = local.cluster_name
5
  talos_backup_public_key    = var.talos_etcd_backup_age
6
  talos_backup_s3_endpoint   = "https://${local.s3_endpoint}"
7
  talos_backup_s3_region     = local.s3_region
8
  talos_backup_s3_bucket     = local.cluster_name
9
  talos_backup_s3_access_key = var.talos_etcd_backup_s3_username
10
  talos_backup_s3_secret_key = var.talos_etcd_backup_s3_password
11
}

Explanation

Ce qui compte ici sont les accès s3, assez classiques, ainsi que la clé publique age qui servira à chiffrer les backups de l’etcd avant leur envoi vers le stockage distant.

1
// ...
2

3
variable "talos_etcd_backup_age" {
4
  type      = string
5
  sensitive = true
6
}
7

8
variable "talos_etcd_backup_s3_username" {
9
  type = string
10
}
11

12
variable "talos_etcd_backup_s3_password" {
13
  type      = string
14
  sensitive = true
15
}

# ...

export TF_VAR_talos_etcd_backup_age=$(bw_field username talos_etcd_backup_age)
export TF_VAR_talos_etcd_backup_s3_username=$(bw_field username talos_etcd_backup_s3)
export TF_VAR_talos_etcd_backup_s3_password=$(bw_field password talos_etcd_backup_s3)

1
// ...
2

3
variable "talos_backup_cluster_name" {
4
  description = "The name of the cluster"
5
  type        = string
6
}
7

8
variable "talos_backup_public_key" {
9
  description = "The age public key for encryption of the backup"
10
  type        = string
11
}
12

13
variable "talos_backup_s3_endpoint" {
14
  description = "The endpoint of the S3 compatible storage"
15
  type        = string
16
}
17

18
variable "talos_backup_s3_access_key" {
19
  description = "The access key for the S3 compatible storage"
20
  type        = string
21
}
22

23
variable "talos_backup_s3_secret_key" {
24
  description = "The secret key for the S3 compatible storage"
25
  type        = string
26
  sensitive   = true
27
}
28

29
variable "talos_backup_s3_region" {
30
  description = "The region of the S3 compatible storage"
31
  type        = string
32
}
33

34
variable "talos_backup_s3_bucket" {
35
  description = "The bucket of the S3 compatible storage"
36
  type        = string
37
}

1
resource "kubernetes_cron_job_v1" "talos_backup" {
2
  metadata {
3
    name      = "talos-backup"
4
    namespace = "kube-system"
5
  }
6

7
  spec {
8
    schedule = "@hourly"
9

10
    job_template {
11
      metadata {
12
        name = "talos-backup"
13
      }
14
      spec {
15
        template {
16
          metadata {
17
            name = "talos-backup"
18
          }
19
          spec {
20
            container {
21
              name              = "talos-backup"
22
              image             = "ghcr.io/siderolabs/talos-backup:latest"
23
              working_dir       = "/tmp"
24
              image_pull_policy = "IfNotPresent"
25

26
              env {
27
                name  = "AWS_ACCESS_KEY_ID"
28
                value = var.talos_backup_s3_access_key
29
              }
30
              env {
31
                name = "AWS_SECRET_ACCESS_KEY"
32
                value_from {
33
                  secret_key_ref {
34
                    name = kubernetes_secret_v1.talos_s3_secrets.metadata[0].name
35
                    key  = "s3_secret_key"
36
                  }
37
                }
38
              }
39
              env {
40
                name  = "AWS_REGION"
41
                value = var.talos_backup_s3_region
42
              }
43
              env {
44
                name  = "CUSTOM_S3_ENDPOINT"
45
                value = var.talos_backup_s3_endpoint
46
              }
47
              env {
48
                name  = "BUCKET"
49
                value = var.talos_backup_s3_bucket
50
              }
51
              env {
52
                name  = "CLUSTER_NAME"
53
                value = var.talos_backup_cluster_name
54
              }
55
              env {
56
                name  = "S3_PREFIX"
57
                value = "etcd"
58
              }
59
              env {
60
                name  = "AGE_X25519_PUBLIC_KEY"
61
                value = var.talos_backup_public_key
62
              }
63
              env {
64
                name  = "ENABLE_COMPRESSION"
65
                value = "true"
66
              }
67

68
              security_context {
69
                run_as_user                = 1000
70
                run_as_group               = 1000
71
                allow_privilege_escalation = false
72
                run_as_non_root            = true
73

74
                capabilities {
75
                  drop = ["ALL"]
76
                }
77
                seccomp_profile {
78
                  type = "RuntimeDefault"
79
                }
80
              }
81

82
              command = ["/talos-backup"]
83

84
              volume_mount {
85
                mount_path = "/tmp"
86
                name       = "tmp"
87
              }
88
              volume_mount {
89
                mount_path = "/.talos"
90
                name       = "talos"
91
              }
92
              volume_mount {
93
                mount_path = "/var/run/secrets/talos.dev"
94
                name       = "talos-secrets"
95
              }
96
            }
97

98
            restart_policy = "OnFailure"
99

100
            volume {
101
              name = "tmp"
102
              empty_dir {}
103
            }
104
            volume {
105
              name = "talos"
106
              empty_dir {}
107
            }
108
            volume {
109
              name = "talos-secrets"
110
              secret {
111
                secret_name = kubernetes_manifest.talos_backup_service_account.manifest.metadata.name
112
              }
113
            }
114
          }
115
        }
116
      }
117
    }
118
  }
119
}
120

121
resource "kubernetes_secret_v1" "talos_s3_secrets" {
122
  metadata {
123
    name      = "talos-s3-secrets"
124
    namespace = "kube-system"
125
  }
126
  data = {
127
    s3_secret_key = var.talos_backup_s3_secret_key
128
  }
129
}
130

131
resource "kubernetes_manifest" "talos_backup_service_account" {
132
  manifest = {
133
    apiVersion = "talos.dev/v1alpha1"
134
    kind       = "ServiceAccount"
135
    metadata = {
136
      name      = "talos-backup-secrets"
137
      namespace = "kube-system"
138
    }
139
    spec = {
140
      roles = ["os:etcd:backup"]
141
    }
142
  }
143
}

Explanation

Nous ne faisons que reprendre l’exemple officiel. Backup toutes les heures. La gestion de rétention n’est pas incluse, mais il reste toujours la possibilité de le faire via des règles de cycle de vie sur le bucket S3.

Longhorn

La backup côté stockage persistant est assurée par Longhorn, uniquement en mode block. Il suffit de créer des objets RecurringJob pour définir la fréquence et la rétention des backups.

1
resource "kubernetes_manifest" "longhorn_jobs" {
2
  for_each = {
3
    daily = {
4
      cron   = "0 0 * * *"
5
      retain = 7
6
    },
7
    weekly = {
8
      cron   = "0 3 * * 1"
9
      retain = 4
10
    }
11
    monthly = {
12
      cron   = "0 6 1 * *"
13
      retain = 3
14
    }
15
  }
16
  manifest = {
17
    apiVersion = "longhorn.io/v1beta2"
18
    kind       = "RecurringJob"
19
    metadata = {
20
      name      = each.key
21
      namespace = "longhorn-system"
22
    }
23
    spec = {
24
      concurrency = 1
25
      cron        = each.value.cron
26
      groups      = ["backup"]
27
      name        = each.key
28
      retain      = each.value.retain
29
      task        = "backup"
30
    }
31
  }
32
}

La stratégie classique de backup décrite ci-dessus est la suivante :

Backup quotidien, conservé 7 jours.
Backup hebdomadaire, conservé 4 semaines.
Backup mensuel, conservé 3 mois.

Très facile à adapter selon vos besoins. De plus, du fait de la nature même de la sauvegarde en mode block, son chiffrement est déjà assuré sur les volumes chiffrés.

Après application, vous devriez les retrouver dans l’interface web de Longhorn :

Longhorn Backup

Par défaut, seuls les volumes placés dans le groupe backup seront concernés par les jobs de backup. Ce n’est pas le cas par défaut, il faudra donc les définir explicitement dans l’onglet Volumes. Je préfère explicitement choisir quels volumes doivent être sauvegardés ou non mais libre à vous de changer votre stratégie.

Base de données

Qu’est-ce qu’un kube sans cluster de base de données ? Pour garder la maîtrise des coûts et de toute la chaîne de l’infra, nous préférerions éviter les services managés. Bien que ces derniers facilitent réellement la vie des développeurs qui n’ont pas envie de se prendre la tête avec la gestion des bases et toute ce qui va avec (réplication, backups, etc.), l’arrivée de puissants opérateurs tels que CloudNativePG facilitent grandement la mise en œuvre et gestion du cycle de vie de clusters PostgreSQL.

Dragonfly

On commence par un truc simple, Dragonfly, une base de données en mémoire performante et compatible avec le protocole Redis.

1
module "kube_database" {
2
  // ...
3

4
  dragonfly_password = var.dragonfly_password
5
}

1
// ...
2

3
variable "dragonfly_password" {
4
  type      = string
5
  sensitive = true
6
}

# ...

export TF_VAR_dragonfly_password=$(bw_field password dragonfly_password)

1
// ...
2

3
variable "dragonfly_password" {
4
  description = "The password for the dragonfly"
5
  type        = string
6
  sensitive   = true
7
}

1
resource "kubernetes_namespace_v1" "dragonfly" {
2
  metadata {
3
    name = "dragonfly"
4
  }
5
}
6

7
resource "kubernetes_secret_v1" "dragonfly_auth" {
8
  metadata {
9
    name      = "dragonfly-auth"
10
    namespace = kubernetes_namespace_v1.dragonfly.metadata[0].name
11
  }
12
  data = {
13
    dragonfly-password = var.dragonfly_password
14
  }
15
}
16

17
resource "helm_release" "dragonfly" {
18
  repository = "oci://ghcr.io/dragonflydb/dragonfly/helm"
19
  chart      = "dragonfly"
20
  version    = "v1.37.0"
21

22
  name        = "dragonfly"
23
  namespace   = kubernetes_namespace_v1.dragonfly.metadata[0].name
24
  max_history = 2
25

26
  set = [
27
    {
28
      name  = "replicaCount"
29
      value = "2"
30
    },
31
    {
32
      name  = "passwordFromSecret.enable"
33
      value = "true"
34
    },
35
    {
36
      name  = "passwordFromSecret.existingSecret.name"
37
      value = kubernetes_secret_v1.dragonfly_auth.metadata[0].name
38
    },
39
    {
40
      name  = "passwordFromSecret.existingSecret.key"
41
      value = "dragonfly-password"
42
    },
43
    {
44
      name  = "tolerations[0].key"
45
      value = "node-role.kubernetes.io/storage"
46
    },
47
    {
48
      name  = "tolerations[0].operator"
49
      value = "Exists"
50
    },
51
    {
52
      name  = "nodeSelector.node\\.kubernetes\\.io/role"
53
      value = "storage"
54
    },
55
    {
56
      name  = "storage.enabled"
57
      value = "true"
58
    },
59
    {
60
      name  = "storage.storageClassName"
61
      value = "longhorn-crypto-local"
62
    },
63
    {
64
      name  = "storage.requests"
65
      value = "2Gi"
66
    },
67
    {
68
      name  = "serviceMonitor.enabled"
69
      value = "true"
70
    }
71
  ]
72
}

Explanation

On s’assure de l’installer sur les nœuds de storage, grâce aux tolerations et nodeSelector. Le stockage persistant est assuré par un volume Longhorn chiffré. L’installation étant en mode cluster, 2 StatefulSets sont créés avec chacun leur propre volume. La réplication étant déjà assuré par Dragonfly, et pour maximiser les performances I/O, nous utilisons le StorageClass longhorn-crypto-local qui utilise des volumes Longhorn en local strict.

CloudNativePG

On s’attaque au plus gros sujet. De la même manière que pour Dragonfly, nous allons installer un cluster PostgreSQL mais construit via l’opérateur CloudNativePG. Le même principe s’applique sur les volumes Longhorn en mode local strict, pour maximiser les perfs IO.

On gérera dans le même temps les backups de la base de données via le plugin barman-cloud qui permettra de faire des backups sur notre S3.

Le schéma qui résume la stack CloudNativePG cible :

Schéma CloudNativePG

Barman operator, en plus de la politique de rétention, est donc en charge de fournir à l’opérateur principal les spécifications nécessaires à la génération du sidecar barman lors de la création d’une instance PostgreSQL.

Important

Il est essentiel d’avoir 2 modes de backups :

Backup de base quotidienne, voire hebdomadaire, via le plugin barman-cloud (mode fichier).
Backup incrémental en quasi-temps réel, via le plugin barman-cloud uniquement, par sauvegarde des fichiers WAL (Write-Ahead Logging), éléments essentiels sur lequel s’appuie le mode Point in Time recovery (PITR). Le principe est de sauvegarder en continu les fichiers WAL, qui permettent de rejouer toutes les transactions effectuées sur la base de données depuis le dernier backup full.

1
module "kube_database" {
2
  // ...
3

4
  cnpg_cluster_name  = local.cluster_name
5
  cnpg_pg_version = "18.3-standard-trixie"
6

7
  cnpg_backup_s3_endpoint   = "https://${local.s3_endpoint}"
8
  cnpg_backup_s3_access_key = var.cnpg_backup_s3_username
9
  cnpg_backup_s3_secret_key = var.cnpg_backup_s3_password
10
  cnpg_backup_s3_bucket     = local.cluster_name
11
}

Explanation

Le choix de la version est importante, choisissez le bon tag ici selon vos besoins. Ici nous prenons la dernière version stable au moment de l’écriture de ce guide, la 18, sous debian 13. Ne pas prendre les versions dépréciées system qui ne sont pas compatibles avec les plugins de backup.

Il faudra indiquer les accès S3 pour les backups, qui seront gérés par l’opérateur le plugin CNPG-I barman-cloud.

1
// ...
2

3
variable "cnpg_backup_s3_username" {
4
  type = string
5
}
6

7
variable "cnpg_backup_s3_password" {
8
  type      = string
9
  sensitive = true
10
}

# ...

export TF_VAR_cnpg_backup_s3_username=$(bw_field username cnpg_backup_s3)
export TF_VAR_cnpg_backup_s3_password=$(bw_field password cnpg_backup_s3)

1
// ...
2

3
variable "cnpg_cluster_name" {
4
  description = "The name of the cluster"
5
  type        = string
6
}
7

8
variable "cnpg_pg_version" {
9
  description = "The version of the PostgreSQL"
10
  type        = string
11
}
12

13
variable "cnpg_backup_s3_endpoint" {
14
  description = "The endpoint of the S3 compatible storage"
15
  type        = string
16
}
17

18
variable "cnpg_backup_s3_access_key" {
19
  description = "The access key for the S3 compatible storage"
20
  type        = string
21
}
22

23
variable "cnpg_backup_s3_secret_key" {
24
  description = "The secret key for the S3 compatible storage"
25
  type        = string
26
  sensitive   = true
27
}
28

29
variable "cnpg_backup_s3_bucket" {
30
  description = "The bucket of the S3 compatible storage"
31
  type        = string
32
}

1
resource "kubernetes_namespace_v1" "postgres" {
2
  metadata {
3
    name = "postgres"
4
  }
5
}
6

7
resource "kubernetes_manifest" "cnpg_cluster_default" {
8
  manifest = {
9
    apiVersion = "postgresql.cnpg.io/v1"
10
    kind       = "Cluster"
11
    metadata = {
12
      name      = var.cnpg_cluster_name
13
      namespace = kubernetes_namespace_v1.postgres.metadata[0].name
14
    }
15
    spec = {
16
      imageName   = "ghcr.io/cloudnative-pg/postgresql:${var.cnpg_pg_version}"
17
      description = "PostgreSQL dev"
18
      instances   = 2
19

20
      bootstrap = {
21
        initdb = {
22
          database = "app"
23
          owner    = "app"
24
        }
25
      }
26

27
      enableSuperuserAccess = true
28

29
      storage = {
30
        size         = "8Gi"
31
        storageClass = "longhorn-crypto-local"
32
      }
33

34
      affinity = {
35
        tolerations = [
36
          {
37
            key      = "node-role.kubernetes.io/storage"
38
            operator = "Exists"
39
          }
40
        ]
41
        nodeSelector = {
42
          "node.kubernetes.io/role" = "storage"
43
        }
44
      }
45

46
      plugins = [
47
        {
48
          name          = "barman-cloud.cloudnative-pg.io"
49
          isWALArchiver = true
50
          parameters = {
51
            serverName       = var.cnpg_cluster_name
52
            barmanObjectName = kubernetes_manifest.cnpg_object_store_backup_default.manifest.metadata.name
53
          }
54
        }
55
      ]
56
    }
57
  }
58
}
59

60
resource "kubernetes_manifest" "cnpg_pod_monitor" {
61
  manifest = {
62
    apiVersion = "monitoring.coreos.com/v1"
63
    kind       = "PodMonitor"
64
    metadata = {
65
      name      = "${var.cnpg_cluster_name}-cluster"
66
      namespace = kubernetes_namespace_v1.postgres.metadata[0].name
67
    }
68
    spec = {
69
      podMetricsEndpoints = [
70
        {
71
          port = "metrics"
72
        }
73
      ]
74
      selector = {
75
        matchLabels = {
76
          "cnpg.io/cluster" = var.cnpg_cluster_name
77
        }
78
      }
79
    }
80
  }
81
}
82

83
resource "kubernetes_secret_v1" "cnpg_backup_s3" {
84
  metadata {
85
    name      = "backup-s3"
86
    namespace = kubernetes_namespace_v1.postgres.metadata[0].name
87
  }
88
  data = {
89
    ACCESS_KEY_ID     = var.cnpg_backup_s3_access_key
90
    ACCESS_SECRET_KEY = var.cnpg_backup_s3_secret_key
91
  }
92
}
93

94
resource "kubernetes_manifest" "cnpg_object_store_backup_default" {
95
  manifest = {
96
    apiVersion = "barmancloud.cnpg.io/v1"
97
    kind       = "ObjectStore"
98
    metadata = {
99
      name      = "${var.cnpg_cluster_name}-backup"
100
      namespace = kubernetes_namespace_v1.postgres.metadata[0].name
101
    }
102
    spec = {
103
      retentionPolicy = "30d"
104
      configuration = {
105
        endpointURL     = var.cnpg_backup_s3_endpoint
106
        destinationPath = "s3://${var.cnpg_backup_s3_bucket}/cnpg/"
107
        data = {
108
          compression = "bzip2"
109
          encryption  = "AES256"
110
        }
111
        wal = {
112
          compression = "bzip2"
113
          encryption  = "AES256"
114
        }
115
        s3Credentials = {
116
          accessKeyId = {
117
            name = kubernetes_secret_v1.cnpg_backup_s3.metadata[0].name
118
            key  = "ACCESS_KEY_ID"
119
          }
120
          secretAccessKey = {
121
            name = kubernetes_secret_v1.cnpg_backup_s3.metadata[0].name
122
            key  = "ACCESS_SECRET_KEY"
123
          }
124
        }
125
      }
126
    }
127
  }
128
}
129

130
resource "kubernetes_manifest" "cnpg_scheduled_backup_barman_default" {
131
  manifest = {
132
    apiVersion = "postgresql.cnpg.io/v1"
133
    kind       = "ScheduledBackup"
134
    metadata = {
135
      name      = "${var.cnpg_cluster_name}-barman"
136
      namespace = kubernetes_namespace_v1.postgres.metadata[0].name
137
    }
138
    spec = {
139
      method               = "plugin"
140
      schedule             = "@daily"
141
      backupOwnerReference = "self"
142
      immediate            = true
143
      cluster = {
144
        name = kubernetes_manifest.cnpg_cluster_default.manifest.metadata.name
145
      }
146
      pluginConfiguration = {
147
        name = "barman-cloud.cloudnative-pg.io"
148
      }
149
    }
150
  }
151
}

Explanation

Pas de Helm ici, on utilise les CRDs natifs installés par l’opérateur cnpg. On s’assure encore une fois de l’installer sur les nœuds de storage, grâce aux tolerations et nodeSelector.

Pour la partie backup complète, cela passe par la définition d’un ScheduledBackup, utilisant la méthode barman-cloud. On l’associe avec le CRD ObjectStore spécifique à l’opérateur barman, il sera utilisé à la fois pour le backup full et pour le backup des fichiers WAL défini dans les paramètres du cluster.

Après l’habituel terraform apply, vérifier le status des pods postgres via kgp -n postgres -o wide. A un plus haut niveau, vérifier le status du cluster via k cnpg status ohmytalos-dev -n postgres pour avoir quelque chose ressemblant à ceci :

1
Cluster Summary
2
Name                 postgres/ohmytalos-dev
3
System ID:           7554694612884451350
4
PostgreSQL Image:    ghcr.io/cloudnative-pg/postgresql:18-standard-trixie
5
Primary instance:    ohmytalos-dev-1
6
Primary start time:  2025-09-27 10:10:48 +0000 UTC (uptime 150h53m23s)
7
Status:              Cluster in healthy state
8
Instances:           2
9
Ready instances:     2
10
Size:                1.1G
11
Current Write LSN:   E2/72001CB8 (Timeline: 2 - WAL File: 00000002000000E200000072)
12

13
Continuous Backup status
14
First Point of Recoverability:  2025-09-27T10:13:34Z
15
Working WAL archiving:          OK
16
WALs waiting to be archived:    0
17
Last Archived WAL:              00000002000000E200000071   @   2025-10-03T17:03:05.124893Z
18
Last Failed WAL:                00000002.history           @   2025-09-27T10:10:17.393725Z
19

20
Streaming Replication status
21
Replication Slots Enabled
22
Name         Sent LSN     Write LSN    Flush LSN    Replay LSN   Write Lag  Flush Lag  Replay Lag  State      Sync State  Sync Priority  Replication Slot
23
----         --------     ---------    ---------    ----------   ---------  ---------  ----------  -----      ----------  -------------  ----------------
24
ohmytalos-dev-2  E2/72001CB8  E2/72001CB8  E2/72001CB8  E2/72001CB8  00:00:00   00:00:00   00:00:00    streaming  async       0              active
25

26
Instances status
27
Name         Current LSN  Replication role  Status  QoS        Manager Version  Node
28
----         -----------  ----------------  ------  ---        ---------------  ----
29
ohmytalos-dev-1  E2/72001CB8  Primary           OK      Burstable  1.27.0           ohmytalos-dev-storage-wty
30
ohmytalos-dev-2  E2/72001CB8  Standby (async)   OK      Burstable  1.27.0           ohmytalos-dev-storage-vsh
31

32
Plugins status
33
Name                            Version  Status  Reported Operator Capabilities
34
----                            -------  ------  ------------------------------
35
barman-cloud.cloudnative-pg.io  0.7.0    N/A     Reconciler Hooks, Lifecycle Service

Côté backup, le mode immediate étant activé, vous devriez déjà voir une backup complète apparaître sur votre s3, ainsi que les 1ers WALs.

pgAdmin

Pour bien faire il nous faudrait un petit pgadmin pour gérer nos bases de données PostgreSQL. Rien de plus simple avec ce chart.

1
module "kube_database" {
2
  // ...
3

4
  internal_domain    = local.internal_domain
5
  pgadmin_email      = "admin@ohmytalos.io"
6
}

1
// ...
2

3
variable "internal_domain" {
4
  description = "The internal domain"
5
  type        = string
6
}
7

8
variable "pgadmin_email" {
9
  description = "The email of the admin pgAdmin user"
10
  type        = string
11
}

1
resource "kubernetes_namespace_v1" "pgadmin" {
2
  metadata {
3
    name = "pgadmin"
4
  }
5
}
6

7
resource "helm_release" "pgadmin" {
8
  repository = "https://helm.runix.net"
9
  chart      = "pgadmin4"
10
  version    = "1.59.0"
11

12
  name        = "pgadmin"
13
  namespace   = kubernetes_namespace_v1.pgadmin.metadata[0].name
14
  max_history = 2
15

16
  set = [
17
    {
18
      name  = "strategy.type"
19
      value = "Recreate"
20
    },
21
    {
22
      name  = "env.email"
23
      value = var.pgadmin_email
24
    },
25
    {
26
      name  = "persistentVolume.storageClass"
27
      value = "longhorn-crypto"
28
    }
29
  ]
30
}
31

32
resource "kubernetes_manifest" "traefik_ingress_route_pgadmin" {
33
  manifest = {
34
    apiVersion = "traefik.io/v1alpha1"
35
    kind       = "IngressRoute"
36
    metadata = {
37
      name      = "pgadmin"
38
      namespace = kubernetes_namespace_v1.pgadmin.metadata[0].name
39
    }
40
    spec = {
41
      entryPoints = ["internal"]
42
      routes = [
43
        {
44
          match = "Host(`pga.${var.internal_domain}`)"
45
          kind  = "Rule"
46
          services = [
47
            {
48
              name = "pgadmin-pgadmin4"
49
              port = "http"
50
            }
51
          ]
52
        }
53
      ]
54
    }
55
  }
56
}

Voilà simple et basique, après terraform apply, go sur https://pga.dev.ohmytalos.io et rentrer les identifiants admin@ohmytalos.io + SuperSecret, puis changer ce mot de passe par défaut (il sera stocké dans la base sqlite persisté dans le volume).

Il vous reste plus qu’à ajouter vos serveurs PostgreSQL. CloudNativePG propose 3 services d’accès, pour reprendre le nom donnée à notre cluster, nous avons :

ohmytalos-dev-rw.postgres : La base primary active, avec accès en écriture. L’opérateur s’occupe de la bascule automatique en cas de défaillance détectée en promouvant un des replicas disponibles.
ohmytalos-dev-ro.postgres : Le(s) base(s) standby, avec accès en lecture seule, dont les données sont répliquées depuis le primary. Les backups s’effectuent uniquement via ces bases pour ne pas surcharger la primary.
ohmytalos-dev-r.postgres : Tous les serveurs PostgreSQL sans distinction. Très utile dans notre cas (2 serveurs uniquement) pour les applications voulant distribuer la lecture sur toutes les bases.

Créer un accès pour la primary et un autre pour les replicas, comme suit :

pgAdmin New Server

Vous pouvez récupérer le mot de passe généré aléatoirement lors de la création du cluster via la commande kgsec -n postgres -o yaml okami-dev-superuser | yq -r .data.password | base64 -d.

pgAdmin Dashboard

Libre à vous de déclencher des backups logiques, via l’interface pgAdmin, en plus des backups automatiques déjà mis en place. Elles seront stockées dans le volume persistant de pgAdmin, d’une taille à 10 Gio par défaut.

Conclusion

Et voilà qu’on est bien. Il nous manque un dernier gros maillon critique pour un cluster de pro, la stack d’observabilité. C’est ce que nous verrons dans la section suivante.