Topics で読み物として読む

この HLD は実装詳細を含みます。機能の概念・設定・運用を読み物として読みたい場合は Topics 20 章: SWSS / SAI / Redis を参照。

裏取りステータス: Code-verified

sonic-swss-common/common/zmq{client,server,producerstatetable,consumerstatetable}.{h,cpp} を確認。ZmqProducerStateTable : public ProducerStateTable と ZmqClient& メンバ、コンストラクタ既定 dbPersistence = true (Producer) / false (Consumer)、フラグに応じた DB 書き込み分岐を確認。Python は pyext/swsscommon.i L296-346 で ZmqProducerStateTable director 化と zmqWait ヘルパを確認 (verified at: 2026-05-09)。

ZMQ ProducerStateTable / ConsumerStateTable 設計¶

読み手が知りたいこと¶

Redis 版 ProducerStateTable / ConsumerStateTable と何が違うのか
なぜ ZMQ に置き換えるのか、何を犠牲にして何を得るのか
dbPersistence フラグを off にしたとき、データはどこに残るのか
既存 orchagent のループに統合する際の前提

なぜ ZMQ 版が必要か¶

通常の ProducerStateTable / ConsumerStateTable は Redis 経由でメッセージを運ぶ。永続化・観測性は得られるが 書き込みコストが Redis に縛られる。本 HLD は API シグネチャを保ったまま ZMQ をトランスポートに使う バリエーションを定義する¹:

Redis を経由せず低レイテンシで直接プロセス間メッセージング
Consumer 側で DB 更新を on/off できる（メモリ削減 / 高性能ユースケース向け）
API は ProducerStateTable / ConsumerStateTable と同形でアプリ側コードを共通化可能

全体像¶

flowchart LR
    APP1[App / orchagent] --> ZPST[ZmqProducerStateTable]
    ZPST --> ZC[ZmqClient]
    ZC -->|ZMQ socket| ZS[ZmqServer<br/>m_mqPollThread]
    ZS --> ZCST[ZmqConsumerStateTable]
    ZCST --> SEL[m_receivedQueue<br/>→ select]
    ZCST -->|optional| DBT[m_dbUpdateThread]
    DBT --> REDIS[(Redis)]
    SEL --> APP2[App pops]

要点¹:

ZmqClient は 複数の ZmqProducerStateTable から共有 可能。sendMsg() は thread safe & async
ZmqServer は m_mqPollThread 1 本で受信し、payload に含まれる DB 名 + テーブル名 で対応する ZmqConsumerStateTable に振り分け
ZmqConsumerStateTable は select 通知用 m_receivedQueue と Redis 書込み用 m_dbUpdateThread の二系統。後者は構築時フラグで on/off

Producer 側 API¶

既存 ProducerStateTable と 同形シグネチャ¹:

操作	シグネチャ
Set	`set(key, values, op = SET_COMMAND, prefix = EMPTY_PREFIX)`
Delete	`del(key, op = DEL_COMMAND, prefix = EMPTY_PREFIX)`
Batch Set	`set(vector<KeyOpFieldsValuesTuple>)`
Batch Delete	`del(vector<string>)`

内部で ZmqClient::sendMsg を叩くだけ。送信失敗時のリトライポリシー¹:

失敗ケース	対応
socket connection broken	再接続 → 再送
送信キュー満杯	後で再送
signal 割り込み	再送

リトライ後も失敗、もしくは connection が完全切断のままなら 例外を投げる。アプリ側で握りつぶす設計ではない¹。

Server 側ディスパッチ¶

(db_name, table_name) → ZmqConsumerStateTable のマップを持ち、payload から両者を取り出して該当 Consumer に投げる。Consumer は最初に Server に自分を register することでマップに載る¹。Handler 内では長時間ブロックせず、ディスパッチ後すぐ次の受信に戻る。

Consumer 側の二系統通知¶

受信メッセージは 2 か所に流れる¹:

select event 通知 — m_receivedQueue に積み、アプリは pops() で取り出す（Redis 版と同じ抽象）
DB 更新スレッド — m_DbUpdateDataQueue に積み、m_dbUpdateThread が Redis に書く。configurable で off 可

"This is a configurable feature, could turn on/off this feature in use cases requiring less memory consumption or higher performance." ¹

DB 更新を切ると Redis に痕跡が残らない。観測性は失うが Redis を完全に外せるため最速。

設定¶

ライブラリレベル API のため CONFIG_DB / CLI による直接の制御点は HLD に無い。DB 更新 on/off は コード側で ZmqConsumerStateTable 構築時に指定。

既知の問題¶

docker-sonic-vs: /zmq_swss ディレクトリ不在による orchagent crash¶

症状: docker-sonic-vs で起動した orchagent が即座に crash し大半のサービスが起動しない。ログに以下が出る:

zmq_bind failed on endpoint: ipc:///zmq_swss/p4orch_zmq_swss_ep, zmqerrno: 2

原因: 実機では /zmq_swss が docker-orchagent.mk の -v /zmq_swss:/zmq_swss:rw bind-mount で提供されるが、VS docker はスタンドアロン起動のためホスト側マウントが存在しない。sonic-swss#4243（2026-04-01 merge）以降に顕在化。

回避策:

docker exec <container> mkdir -p /zmq_swss

参照: sonic-net/sonic-buildimage#26776（Triaged）

CrmOrch が reboot 時に ZMQ タイムアウトで crash する¶

症状: reboot コマンドは syncd/SAI を先に shutdown するが orchagent は終了しない。CrmOrch が SAI に対して ZMQ 経由でカウンタ要求を送り続け、SAI 側キューが消滅していると ZMQ タイムアウトが発生して orchagent が crash する。

対象条件: SmartSwitch など firmware update により reboot が 1 分超になるケースで特に問題になる。SmartSwitch のロングリブートは HA による redundancy でカバーされる設計のため、機能影響は限定的とされている。

参照: sonic-net/sonic-buildimage#26300（Bug, Triaged, Medium severity）

orchagent route download 性能劣化（ZMQ 有効時）¶

症状: Northbound ZMQ を有効化した環境で 500k route の download が約 72 秒かかる。ZMQ 無効時は大幅に高速。

原因: sonic-swss PR#3910 で table->pops(entries) のループが削除された。ZMQ 有効時はこの変更がボトルネックとなる。

参照: sonic-net/sonic-buildimage#27098（Performance Regression, Triaged、Nokia・内部 Nokia チームで revert 効果確認済み）

制限事項¶

ZmqClient::sendMsg はリトライ失敗で例外。呼出し側で握る前提
ZMQ は 永続化・観測性が無い。DB 更新 off では redis-cli でも覗けない
HA / failover や複数 ZmqServer のロードバランシングは HLD 範囲外（1:1 ないし 1:多の単純トポロジ）
select 通知と DB 書き込みの 順序保証 は HLD で明示されていない

干渉する機能¶

既存 ProducerStateTable / ConsumerStateTable: API 互換だが、DB 更新 off で Redis に乗らないテーブルが混ざると他コンポーネントとの食い違いが起き得る
orchagent 起動順序: ZMQ は永続化されないため、Producer 起動前に Consumer が立っていないとメッセージ落ち
select イベントループ: m_receivedQueue / m_DbUpdateDataQueue のバックプレッシャ挙動は要確認

トラブルシューティング¶

Producer 例外 → Server m_mqPollThread の停止 / 対向プロセス生存を確認
Consumer に到達しない → (db_name, table_name) の register 漏れ。未登録メッセージは Server で行き場を失う
期待値が Redis に無い → DB 更新が off の可能性。ZmqConsumerStateTable 構築時フラグを確認
順序が乱れる → 複数 Producer が同じ Client を共有する場合、ネットワーク側キューと dispatch ループで Consumer 視点の順序が変わり得る

実装フェーズ境界¶

本ページは monitor: partially_implemented のため、HLD 記載どおり master に取り込み済 (実装済) の範囲と、現行 master との差分が未確認 (未実装相当) の範囲を Phase 別に切り分けて示す。詳細は本文・[実装との乖離 / 補足] 節および各引用元 HLD を参照。

Phase	実装済	未実装
Phase 1: Producer / Server / Consumer API	実装済（HLD 記載の関数群が master に取り込み済）	—
Phase 2: select イベントループ統合	基本フローは実装済	バックプレッシャ・キュー溢れ時の挙動は未確認 / 未実装の可能性
Phase 3: メトリクス / 可観測性	—	通知欠落の検出・カウンタ整備は未実装

実装との乖離 / 補足¶

裏取りステータスを code-verified から discrepancy-found （monitor: partially_implemented）に降格 (2026-05-13)。select イベントループのバックプレッシャ挙動など、HLD で詳細が省略されている部分を本文で「要確認」と明示している。実装側の確定は裏取り課題。
本文に残る「未確認 / 要確認 / 要追跡 / TBD」等の hedge 表現は HLD と実装の差分が未特定であることを示し、後続の裏取り対象。

引用元¶

sonic-net/SONiC doc/sonic-swss-common/ZMQ producer-consumer state table design.md @ 49bab5b5ff0e924f1ea52b3d9db0dfa4191a7c06 ↩↩↩↩↩↩↩↩