Kubernetesでの状態管理：StatefulSet, PersistentVolume, PersistentVolumeClaim実践ガイド

はじめに：コンテナの「揮発性」を克服するKubernetesの状態管理
Kubernetesにおける状態の課題
Kubernetesの永続ストレージメカニズム
StatefulSet：状態を持つアプリケーションの管理
実践！データの永続化とバックアップ戦略
運用とベストプラクティス
まとめ：Kubernetesで「状態」を管理し、アプリケーションの可能性を広げる

はじめに：コンテナの「揮発性」を克服するKubernetesの状態管理

Kubernetesは、コンテナ化されたアプリケーションのデプロイと管理を劇的に簡素化しますが、その設計思想は基本的に「ステートレス（状態を持たない）」なアプリケーションの運用に最適化されています。しかし、データベース、メッセージキュー、分散ファイルシステムなど、多くの重要なアプリケーションは「ステートフル（状態を持つ）」であり、データの永続性と一貫性が不可欠です。

「Podが再起動したらデータが消えてしまった…」
「データベースのPodが別のノードに移動したら、IPアドレスが変わって通信できなくなった…」
「Kubernetesでデータベースを安全に運用するにはどうすればいい？」

これらの課題は、Kubernetesでステートフルアプリケーションを運用する上で避けて通れません。Kubernetesは、これらの課題を解決するために、StatefulSet、PersistentVolume (PV)、PersistentVolumeClaim (PVC)といった強力な抽象化を提供しています。

本記事では、Kubernetesにおける状態管理の基本概念から、StatefulSet、PV、PVCの役割と実践的な利用方法を徹底解説します。ストレージクラスの選定、データの永続化、バックアップ戦略、そして高可用性の実現に焦点を当て、あなたがKubernetesで堅牢なステートフルアプリケーションを自信を持って運用できるようサポートします。読み終える頃には、あなたはKubernetesの真の力を引き出し、複雑なデータ管理の課題を克服できるようになっていることでしょう。

Kubernetesにおける状態の課題

KubernetesのPodは、その性質上、一時的で揮発性です。これは、ステートレスなアプリケーションには最適ですが、ステートフルなアプリケーションには課題となります。

コンテナの揮発性: コンテナが停止または削除されると、そのコンテナ内部に書き込まれたデータは失われます。
Podのライフサイクル: Podは、ノードの障害、リソース不足、手動での削除など、様々な理由で再起動または再スケジューリングされます。その際、新しいIPアドレスが割り当てられたり、別のノードに移動したりするため、安定したネットワークIDや永続的なストレージが必要になります。
分散システムでのデータ整合性: 複数のPodが同じデータにアクセスする場合、データの整合性をどのように保つか、データ競合をどう防ぐかといった課題が生じます。

Kubernetesの永続ストレージメカニズム

Kubernetesは、コンテナの外部にデータを永続化するための抽象化レイヤーを提供します。これにより、アプリケーションはストレージの詳細を意識することなく、データを保存・利用できます。

1. PersistentVolume (PV)

PVは、Kubernetesクラスタ内で利用可能なストレージリソースを抽象化したものです。これは、クラウドプロバイダのストレージ（AWS EBS, GCP Persistent Disk, Azure Diskなど）や、オンプレミスのストレージ（NFS, Cephなど）によって提供されます。

特徴:
- クラスタ内のリソースであり、Podのライフサイクルとは独立して存在します。
- ストレージの種類、容量、アクセスモード、リクレイムポリシーなどが定義されます。
アクセスモード:
- ReadWriteOnce (RWO): 単一のノードから読み書き可能。
- ReadOnlyMany (ROX): 複数のノードから読み取り専用でマウント可能。
- ReadWriteMany (RWX): 複数のノードから読み書き可能（NFSなど）。
- ReadWriteOncePod (RWOP): 単一のPodから読み書き可能（Kubernetes 1.22+）。
リクレイムポリシー: PVが解放されたときに、基盤となるストレージをどうするかを定義します。
- Retain: 手動で削除するまでストレージを保持。
- Delete: PVと基盤となるストレージを自動的に削除。
- Recycle: データを削除し、ストレージを再利用（非推奨）。

2. PersistentVolumeClaim (PVC)

PVCは、Podがストレージを要求するための「リクエスト」です。開発者は、必要なストレージの容量、アクセスモード、ストレージクラスを指定してPVCを作成します。Kubernetesは、この要求に合致するPVを自動的に探し、PVCとバインドします。

特徴:
- Podがストレージを消費するための抽象化レイヤー。
- 開発者はストレージの具体的な実装を知る必要がない。

3. StorageClass

StorageClassは、動的なストレージプロビジョニングを可能にする抽象化レイヤーです。ストレージの種類、パフォーマンス特性、リクレイムポリシーなどを定義し、PVCが特定のStorageClassを指定することで、Kubernetesは自動的に適切なPVをプロビジョニングします。

特徴:
- 異なる種類のストレージ（SSD, HDDなど）や、異なるパフォーマンスレベルのストレージを定義できる。
- デフォルトのStorageClassを設定することで、PVCがstorageClassNameを指定しない場合でも自動的にPVがプロビジョニングされる。

StatefulSet：状態を持つアプリケーションの管理

Deploymentがステートレスなアプリケーションの管理に最適であるのに対し、StatefulSetは、データベースやメッセージキューなど、状態を持つアプリケーションをKubernetesで運用するために設計されたコントローラーです。

StatefulSetとは？

StatefulSetは、以下の特性を持つPodのセットを管理します。

安定したユニークなネットワークID: 各Podにpod-name-0, pod-name-1のようなユニークで安定したホスト名とネットワークIDを付与します。Podが再起動したり再スケジューリングされたりしても、このIDは変わりません。
順序付けられたデプロイとスケーリング: Podの作成、更新、削除が定義された順序で行われます。例えば、pod-name-0が完全に起動してからpod-name-1が起動するといった順序を保証できます。
永続的なストレージ: 各Podに専用の永続ボリュームを割り当て、Podが再起動してもデータが失われないようにします。

StatefulSetのユースケース

データベース: MySQL, PostgreSQL, MongoDB, Cassandraなど。
メッセージキュー: Kafka, RabbitMQなど。
分散ファイルシステム: GlusterFS, Cephなど。
その他の分散システム: ZooKeeper, etcdなど。

実践例: StatefulSetとPVCを用いたPostgreSQLクラスタの構築

ここでは、単一のPostgreSQLインスタンスをStatefulSetでデプロイする例を示します。これにより、Podが再起動してもデータが永続化されます。

1. PostgreSQLのパスワードをSecretとして作成

# postgres-secret.yaml
apiVersion: v1
kind: Secret
metadata:
  name: postgres-secret
type: Opaque
stringData:
  postgres_password: your_secure_password # 強固なパスワードに置き換える

2. Headless ServiceとStatefulSetの定義

# postgres-statefulset.yaml
apiVersion: v1
kind: Service
metadata:
  name: postgres-headless
  labels:
    app: postgres
spec:
  ports:
  - port: 5432
    name: postgres
  clusterIP: None # Headless Serviceとして定義
  selector:
    app: postgres
---
apiVersion: apps/v1
kind: StatefulSet
metadata:
  name: postgres
  labels:
    app: postgres
spec:
  serviceName: "postgres-headless" # Headless Serviceの名前と一致させる
  replicas: 1 # 単一インスタンスとしてデプロイ
  selector:
    matchLabels:
      app: postgres
  template:
    metadata:
      labels:
        app: postgres
    spec:
      containers:
      - name: postgres
        image: postgres:14-alpine
        ports:
        - containerPort: 5432
          name: postgres
        env:
        - name: POSTGRES_DB
          value: mydatabase
        - name: POSTGRES_USER
          value: user
        - name: POSTGRES_PASSWORD
          valueFrom:
            secretKeyRef:
              name: postgres-secret
              key: postgres_password
        volumeMounts:
        - name: postgres-persistent-storage
          mountPath: /var/lib/postgresql/data # PostgreSQLのデータディレクトリ
  volumeClaimTemplates:
  - metadata:
      name: postgres-persistent-storage
    spec:
      accessModes: [ "ReadWriteOnce" ] # 単一ノードから読み書き可能
      resources:
        requests:
          storage: 5Gi # 5GBの永続ストレージを要求
      # storageClassName: standard # 必要に応じてStorageClassを指定

デプロイ手順:

postgres-secret.yamlを適用: kubectl apply -f postgres-secret.yaml
postgres-statefulset.yamlを適用: kubectl apply -f postgres-statefulset.yaml

確認:

kubectl get pods -l app=postgres: postgres-0というPodがRunning状態であることを確認。
kubectl get pvc -l app=postgres: postgres-persistent-storage-postgres-0というPVCがBound状態であることを確認。

実践！データの永続化とバックアップ戦略

PVCとStatefulSetの連携

StatefulSetのvolumeClaimTemplatesは、各PodにユニークなPVCを自動的にプロビジョニングします。これにより、各Podは専用の永続ストレージを持ち、Podが再起動してもデータが失われることはありません。

ストレージクラスの選定

アプリケーションのI/O要件、コスト、可用性に応じて最適なStorageClassを選定することが重要です。

高I/O要件: SSDベースのストレージクラス（例: AWS gp3, GCP ssd）を選択します。
コスト効率: 頻繁にアクセスされないデータやアーカイブには、より安価なストレージクラスを選択します。
高可用性: マルチAZにまたがるストレージや、レプリケーション機能を持つストレージを選択します。

データのバックアップとリストア

ステートフルアプリケーションのデータは非常に重要であり、堅牢なバックアップとリストア戦略が不可欠です。

アプリケーションレベルのバックアップ: データベースの整合性を保つために、pg_dump (PostgreSQL), mysqldump (MySQL) など、データベース固有のバックアップツールを使用することを強く推奨します。
ボリュームスナップショット: クラウドプロバイダが提供するボリュームスナップショット機能（例: AWS EBS Snapshot, GCP Persistent Disk Snapshot）を利用して、PVのポイントインタイムコピーを作成します。
Velero: Kubernetesリソースと永続ボリュームをバックアップ・リストアするためのオープンソースツールです。クラスタ全体のバックアップ、特定の名前空間やリソースのバックアップ、異なるクラスタへの移行などに利用できます。

“`bash

Veleroのインストール例 (AWS S3へのバックアップ)

velero install \
–provider aws \
–plugins velero/velero-plugin-for-aws:v1.x.x \
–bucket \
–secret-file ./credentials-velero \
–backup-location-config region=

バックアップの作成

velero backup create my-db-backup –include-namespaces my-database-namespace

バックアップからのリストア

velero restore create –from-backup my-db-backup
“`

高可用性 (HA) と災害復旧 (DR)

マルチAZデプロイメント: 複数のアベイラビリティゾーンにPodを分散配置し、単一AZ障害時の可用性を確保します。
データベースのレプリケーション: データベースの組み込みレプリケーション機能（例: PostgreSQLのストリーミングレプリケーション）を活用し、データの冗長性とフェイルオーバー能力を高めます。
クラスタリング: データベースによっては、Kubernetes上でクラスタリングを構築し、高可用性を実現します。

運用とベストプラクティス

リソースリミットとリクエスト: Podのリソース（CPU, Memory, Storage）リミットとリクエストを適切に設定し、リソースの枯渇や過剰な消費を防ぎます。
モニタリング: ストレージ使用量、I/Oパフォーマンス、Podのヘルスチェックなどを継続的に監視し、異常を早期に検知します。Prometheus, Grafana, CloudWatchなどのツールを活用します。
セキュリティ: PV/PVCへのアクセス制御（RBAC）、データの暗号化（保存時、転送時）、Pod Security Standardsの適用など、セキュリティ対策を徹底します。
アップグレード戦略: StatefulSetのローリングアップデートは、Podの順序を保証しながら安全にアプリケーションを更新できます。ただし、データベースのメジャーバージョンアップなど、慎重な計画が必要です。
エフェメラルストレージの理解: コンテナの書き込み可能レイヤーはエフェメラル（一時的）であり、永続化にはPV/PVCを使用することを徹底します。

まとめ：Kubernetesで「状態」を管理し、アプリケーションの可能性を広げる

Kubernetesでステートフルアプリケーションを運用することは、コンテナの揮発性という特性を理解し、StatefulSet、PersistentVolume、PersistentVolumeClaimといったKubernetesの強力な抽象化を適切に活用することで実現可能です。

本記事で解説した概念、実践的なデプロイ例、そしてバックアップ・高可用性戦略を参考に、あなたは以下のメリットを享受できるでしょう。

データの永続性: Podが再起動してもデータが失われることなく、アプリケーションの状態を安全に保持。
安定した運用: 安定したネットワークIDと順序付けられた操作により、複雑なステートフルアプリケーションの管理を簡素化。
高可用性: 適切な設計とツール（Veleroなど）の活用により、障害発生時にも迅速な復旧とビジネス継続性を確保。
スケーラビリティ: データベースやメッセージキューといった基盤サービスをKubernetes上で柔軟にスケール。

Kubernetesでの状態管理は挑戦的ですが、これらの知識と実践を習得することで、あなたはより複雑で要求の厳しいアプリケーションを自信を持って構築・運用できるようになります。これは、あなたのエンジニアとしての市場価値を飛躍的に高め、クラウドネイティブ開発の最前線で活躍するための強力な武器となるでしょう。