Reboot / Upgrade / Lifecycle¶
この章は、SONiC の reboot family と upgrade lifecycle を「どれを選ぶか」「何が保持されるか」「運用時にどこを見るか」の順で読むための入口です。個別 HLD は warm reboot、fast reboot、express reboot、SWSS warm restart、secure upgrade、DPU upgrade などに分かれていますが、運用者や実装者が最初に知りたいのは、名前の違いよりも失う状態と守るべき前提です。
この章で答える質問¶
- warm reboot、fast reboot、express reboot、SWSS warm restart は何が違うのか。
- reboot 中に FDB、route、SAI object、Redis DB、container state はどこまで保持されるのか。
reboot、fast-reboot、warm-reboot、config warm_restart、sonic-installerはどの場面で使うのか。- reboot の失敗、原因履歴、LACP/BGP peer との干渉、multi-ASIC の差分はどこから確認するのか。
- OS upgrade、secure upgrade、Debian cadence、Docker image versioning、DPU independent upgrade は reboot とどう接続するのか。
読む順番¶
- Overview: reboot family の分類と、cold / fast / warm / express / service warm restart の違い。
- Architecture: warm path が状態を保持する仕組み。SAI object、view switching、idempotent libsairedis、system-wide warmboot。
- Setup: CLI と設定。
reboot系コマンド、warm restart enable、timer、blocking mode。 - Operations: 原因調査と失敗時の確認順。reboot-cause、LACP timeout、multi-ASIC、Warmboot Manager、SWSS warm restart。
- Upgrade: image lifecycle。
sonic-installer、secure upgrade、Debian cadence、versioning、DPU independent upgrade。 - 内部実装 / Internals: warm reboot で SWSS / orchagent / syncd が保持する state の構造と、SAI view switching を実装側から見る。
- 発展トピック / Advanced: express boot、multi-ASIC warmboot、SmartSwitch / DPU の独立アップグレード、他章との境界。
章内の境界¶
この章は「reboot または upgrade の実行時に、SONiC の状態をどう落とし、どう戻すか」を扱います。SmartSwitch の NPU/DPU アーキテクチャ全体、Multi-ASIC/VOQ chassis の通常運用、port/optics の bring-up は別章の主題です。ただし reboot lifecycle に直接関係する DPU reboot、DPU graceful shutdown、multi-ASIC warm reboot はこの章でも扱います。
関連ページ¶
- Warm-Reboot / Fast-Reboot 関連
- reboot / fast-reboot / warm-reboot コマンド
- config warm_restart サブコマンド
- sonic-installer コマンド
章構成と進捗¶
| ページ | 状態 | verification |
|---|---|---|
| concept | ✅ 完成 (140 行) | meta |
| setup | ✅ 完成 (176 行) | meta |
| operations | ✅ 完成 (192 行) | meta |
| internals | ✅ 完成 (121 行) | meta |
| advanced | ✅ 完成 (100 行) | meta |
次に読むべき記事¶
この章を読み進める順
- 概要: Reboot family の選び方
- アーキテクチャ: Warm path の内部構造
- 設定: Reboot / warm restart の設定
- 運用: Reboot 運用と障害調査
- 内部実装
- 発展トピック: Reboot / Upgrade の発展トピック
関連する HLD 7 件
- System-wide Warmboot(going down / up path / SAI 期待値)
- Warm Reboot 開発フェーズと OID 復元戦略(idempotent libsairedis vs syncd view comparison)
- Warmboot Manager(shutdown orchestration / reconciliation 統一)
- SONiC Disk I/O 削減(writer 分析と tmpfs 化)
- FRR 用 sysctl チューニングのデフォルト
- SONiC NOS の設定手段一覧(CLI / sonic-cfggen / config_db.json / RESTCONF / gNMI / ZTP / vtysh / redis / apply-patch)
- libsairedis API idempotence(warm restart 用 OID キャッシュと duplicate 抑止)
関連トラブルシュート 5 件
- show techsupport の出力サイズが肥大化する
- APP_DB → ASIC_DB の反映が遅延・停止する
- orchagent が CPU 100% で詰まる
- Warm Reboot が失敗 / 通信断が長引く
- 経路は RIB にあるが FIB / ASIC に降りない
関連する章¶
前提として読むべき章
派生で読むべき章
補完的に読む章