CDL のメトリック

概要

この章では、CDL のパフォーマンスのモニターと分析に使用できる重要業績評価指標(KPI)について説明します。

CDL で使用するメトリックのラベル名と説明は、次の表で定義されています。

表 1. メトリックラベルの説明
メトリックラベル名 ラベルの説明
db データストアの名前。
動作 CDL ポッドで実行された操作の名前。
errorCode 応答で送信されるエラーコード。
errorMessage 応答で送信されるエラーメッセージ。
slot_shard_id 操作が実行されるスロットマップまたはシャード ID。
slot_instance_id 操作が実行されるスロットインスタンス ID。
shardId メトリックが固定されるスロットまたはインデックスマップ、またはシャード ID。
instanceId メトリックが固定されるスロットまたはインデックスマップ、またはインスタンス ID。
session_type レコードに存在するセッションデータのタイプ。
bucket バケットは、セッションが存在するバケットを表します。現在のバケットは、1kb 以下、2kb 以下、4kb 以下、8kb 以下、16kb 以下、32kb 以下、32kb 超です
notification_type CDL から送信される通知のタイプ。値:TIMER_EXPIRED、RECORD_CONFLICT、BULK_TASK_NOTIFICATION
topic Kafka へのパブリッシュ中のトピック
not_found_in データが検出されなかったポッド。値:インデックス/スロット

CDL カテゴリ

bulk_task_ongoing

説明:任意の時点で処理されている一括タスクの数を示すゲージメトリック

サンプルクエリ:bulk_task_ongoing

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

  • ラベル:slot_instance_id

    ラベルの説明:スロットインスタンス ID

    例:1、2

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

bulk_task_total

説明:処理ステータスを持つ一括タスクの総数

サンプルクエリ:bulk_task_total

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

  • ラベル:slot_instance_id

    ラベルの説明:スロットインスタンス ID

    例:1、2

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

  • ラベル:status

    ラベルの説明:一括タスクの処理ステータス

    例:timeout、skipped、aborted、 completed_last_record、completed

cdl_ep_to_slot_request_tps

説明:エンドポイントからスロットへの要求 TPS 測定の記録ルール

サンプルクエリ:cdl_ep_to_slot_request_tps

ラベル:

  • ラベル:namespace

    ラベルの説明:メトリックの生成元となる Kubernetes 名前空間

    例:cdl-global

ラベル:

  • ラベル:pod

    ラベルの説明:メトリックの生成元となるエンドポイントポッド名

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、UpdateFlags

  • ラベル:errorCode

    ラベルの説明:削除のための DB 応答の errorCode

    例:0、502

cdl_ep_to_slot_response_time

説明:エンドポイントからスロットへの応答時間測定の記録ルール

サンプルクエリ:cdl_ep_to_slot_response_time

ラベル:

  • ラベル:namespace

    ラベルの説明:メトリックの生成元となる Kubernetes 名前空間

    例:cdl-global

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、UpdateFlags

ラベル:

  • ラベル:errorCode

    ラベルの説明:削除のための DB 応答の errorCode

    例:0、502

cdl_geo_replication_enabled

説明:Geo レプリケーションのステータスを示すゲージメトリック。Geo レプリケーションが有効な場合の値は 1 で、そうでない場合は 0 です

サンプルクエリ:cdl_geo_replication_enabled

cdl_index_record_capacity

説明:CDL の合計インデックス レコード キャパシティ

サンプルクエリ:cdl_index_record_capacity{db=\"session\"}

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

cdl_slice_state

説明:GR インスタンス認識の CDL スライスのアクティブ状態情報。値が 1 の場合、スライスはアクティブです。

サンプルクエリ:cdl_slice_state

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:スロットシャード ID

    例:1、2

cdl_slot_record_capacity

説明:CDL の合計スロット レコード キャパシティ

サンプルクエリ:cdl_slot_record_capacity{db=\"session\"}

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

cdl_slot_size_capacity

説明:CDL の合計スロットサイズキャパシティ

サンプルクエリ:cdl_slot_size_capacity{db=\"session\"}

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

consumer_kafka_nonprocessed_records_total

説明:同じポッドから発信されて以降未処理の Kafka レコードの総数

サンプルクエリ:sum(consumer_kafka_nonprocessed_records_total)by(shardId,instanceId)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Get、Multi

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:instanceId

    ラベルの説明:インスタンス ID

    例:1、2

ラベル:

  • ラベル:reason

    ラベルの説明:消費された Kafka レコードをスキップした理由

    例:old_timestamp

consumer_kafka_records_duration_seconds

説明:消費された Kafka レコードの処理に要した時間

サンプルクエリ:sum(irate(consumer_kafka_records_duration_seconds[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:origin_instance_id

    ラベルの説明:kafka 要求の発信元であるインデックスインスタンス ID。

    例:1.1、1.2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

consumer_kafka_records_total

説明:kafka から消費されたレコードの総数

サンプルクエリ:sum(irate(consumer_kafka_records_total[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:origin_instance_id

    ラベルの説明:kafka 要求の発信元であるインデックスインスタンス ID。

    例:1.1、1.2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

datastore_internal_requests_duration_seconds

説明:内部データストア要求の処理に要した時間

サンプルクエリ:sum(datastore_internal_requests_duration_seconds)by(operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:RemoteBulkRead、RemoteBulkReadIndexing、GetChecksumRemoteSlot

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1401

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

datastore_requests_duration_seconds

説明:cdl-ep での要求の処理に要した合計時間

サンプルクエリ:sum(irate(datastore_requests_duration_seconds{errorCode=\"0\",local_request=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、Find、FindByUK、GetCdlStatus、UpdateFlags

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、400、403、404、409、413、501、502、503、507、508

ラベル:

  • ラベル:local_request

    ラベルの説明:DB 要求がローカルまたは GR のいずれであるか。local_request = 1 の場合はローカルで、それ以外の場合は GR です。

    例:1、0

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

datastore_requests_total

説明:cdl-ep で受信した要求の総数

サンプルクエリ:sum(irate(datastore_requests_total{errorCode=\"0\",local_request=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、Find、FindByUK、GetCdlStatus、UpdateFlags

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、400、403、404、409、413、501、502、503、507、508

ラベル:

  • ラベル:local_request

    ラベルの説明:DB 要求がローカルまたは GR のいずれであるか。local_request = 1 の場合はローカルで、それ以外の場合は GR です。

    例:1、0

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

db_records_softdelete_total

説明:purgeOnEval が設定されているため、ソフト削除/消去状態になっている DB のレコードの総数

サンプルクエリ:sum(avg(db_records_softdelete_total{notify=\"1\"})by(notify))

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:notify

    ラベルの説明:purgeOnNotify が設定されているかどうか。1 は purgeOnNotify=true を示し、それ以外の場合は 0 です。

    例 1

db_records_total

説明:db のレコードの総数。次のメトリックを実現できます。1. レコードの総数:クエリ:sum(avg(db_records_total{namespace=\"$namespace\",session_type=\"total\",appInstanceId=\"0\"})by(systemId,cdl_slice)) 2. スライスワイズレコード数:クエリ:sum(avg(db_records_total{namespace=\"$namespace\",session_type=\"total\",appInstanceId=\"0\"})by(systemId,cdl_slice))by(cdl_slice) 3. システム ID ベースの数:sum(avg(db_records_total{namespace=\"$namespace\",session_type=\"total\",appInstanceId=\"0\"})by(systemId,cdl_slice))by(systemId) 4. セッションタイプによってグループ化されたセッション:クエリ:avg(db_records_total{namespace=\"$namespace\",session_type!=\"total\"}) by (session_type)

サンプルクエリ:sum(avg(db_records_total{namespace=\"$namespace\",session_type=\"total\",appInstanceId=\"0\"})by(systemId,cdl_slice))

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:session_type

    ラベルの説明:データに保存されているセッションタイプ

    例:GX、RX、total

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:appInstanceId

    ラベルの説明:レコードでアプリケーションによって入力されたアプリケーション インスタンス ID。

    例 1

dpapp_internal_requests_total

説明:内部 DP アプリケーション要求の総数

サンプルクエリ:sum(dpapp_internal_requests_total)by(operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:RemoteBulkRead、RemoteBulkReadIndexing、GetChecksumRemoteSlot

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1401

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

duplicate_slot_records_deleted

説明:重複するスロットデータが見つかったために削除されたスロットレコードの総数

サンプルクエリ:duplicate_slot_records_deleted

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、502

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

find_no_record_total

説明:レコードが返送されない検索要求の総数

サンプルクエリ:sum(find_no_record_total)by(not_found_in,operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:FindByUk、FindTagsByUk、Find

ラベル:

  • ラベル:not_found_in

    ラベルの説明:インデックスまたはスロットでデータが見つからないかどうか

    例:index、slot

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

findall_records_bucket

説明:応答で送信されたレコードの数にグループ化できる、受信した findAll 要求の総数

サンプルクエリ:sum(irate(findall_records_bucket[5m]))by(bucket)

ラベル:

  • ラベル:bucket

    ラベルの説明:レコード数によってグループ化されたバケット

    例:=0、<=10、<=20、<=50、<=100、>100

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

index_init_sync_duration_seconds

説明:インデックスが起動時にローカルピアおよびリモートピアと同期するのに要した時間

サンプルクエリ:sum(index_init_sync_duration_seconds)by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

index_rebalanced_keys_total

説明:再調整されたインデックスキーの総数

サンプルクエリ:index_rebalanced_keys_total

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

indexing_audit_deleted_keys_total

説明:インデックス監査中に削除された一意のキーとプライマリキーの総数

サンプルクエリ:sum(irate(indexing_audit_deleted_keys_total{errorCode=\"0\",key_type=\"unique\"}[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:key_type

    ラベルの説明:キーのタイプ

    例:primary、unique

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:302、403

indexing_audit_duration_seconds

説明:インデックス作成監査の実行に要した合計時間

サンプルクエリ:indexing_audit_duration_seconds{pod=~\".*\"}

indexing_audit_total

説明:インデックス作成監査が実行された合計回数

サンプルクエリ:indexing_audit_total{pod=~\".*\"}

indexing_is_leader

説明:インデックス作成はリーダーまたはフォロワーです

サンプルクエリ:indexing_is_leader

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

indexing_kafka_replication_delay_seconds

説明:インデックス内の Kafka からのインデックスのレプリケーションにおける合計遅延

サンプルクエリ:sum(irate(indexing_kafka_replication_delay_seconds[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:origin_instance_id

    ラベルの説明:kafka 要求の発信元であるインデックスインスタンス ID。

    例:1.1、1.2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

indexing_operation_duration_seconds

説明:cdl ep からインデックス アプリケーションに送信されたインデックス作成操作の応答に要した時間

サンプルクエリ:sum(irate(indexing_operation_duration_seconds{errorCode=\"0\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、GetByPk、GetByUk

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404、500、503

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

indexing_operation_total

説明:cdl ep からインデックス アプリケーションに送信されたインデックス作成操作の総数

サンプルクエリ:sum(irate(indexing_operation_total{errorCode=\"0\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、GetByPk、GetByUk

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404、500、503

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

indexing_overwrites_total

説明:インデックスレコードが上書きされているインデックス作成設定操作の総数

サンプルクエリ:sum(indexing_overwrites_total)by(key_type,shardId)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:key_type

    ラベルの説明:キーのタイプ

    例:primary、unique

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

indexing_records_total

説明:インデックス作成におけるレコードの総数

サンプルクエリ:indexing_records_total{pod=~\".*\"}

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

indexing_requests_duration_seconds

説明:受信したインデックス作成要求の応答に要した時間

サンプルクエリ:sum(irate(indexing_requests_duration_seconds{errorCode=\"0\",isKafka=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Set、Delete

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404、1408

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:isKafka

    ラベルの説明:要求が kafka と GRPC のどちらからのものか。isKafka = 1 の場合、その要求は kafka からのものです

    例:1、0

indexing_requests_total

説明:インデックスポッドで受信した要求の総数

サンプルクエリ:sum(irate(indexing_requests_total{errorCode=\"0\",isKafka=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Set、Delete

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404、1408

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:isKafka

    ラベルの説明:要求が kafka と GRPC のどちらからのものか。isKafka = 1 の場合、その要求は kafka からのものです

    例:1、0

inmemory_indexing_operation_duration_seconds

説明:cdl-ep から cdl-index ポッドへの要求に対する応答に要した合計時間

サンプルクエリ:sum(inmemory_indexing_operation_duration_seconds{errorCode=\"0\"})by(operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Get、Multi

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:instanceId

    ラベルの説明:インスタンス ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

inmemory_indexing_operation_total

説明:cdl-ep から cdl-index ポッドへの操作の総数

サンプルクエリ:sum(inmemory_indexing_operation_total)by(operation,shardId)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Get、Multi

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:instanceId

    ラベルの説明:インスタンス ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、404

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

kafka_connection_status

説明:Kafka 接続ステータス

サンプルクエリ:kafka_connection_status

ラベル:

  • ラベル:topic

    ラベルの説明:Kafka トピック名

    例:kv.kafka.shard.1.1.1

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

kafka_producer_downtime_op_total

説明:Kafkaプロデューサが使用できず、ダウンタイムキャッシュに追加された場合の操作の総数

サンプルクエリ:sum(kafka_producer_downtime_op_total) by (pod,reason)

ラベル:

  • ラベル:operation

    ラベルの説明:失敗した操作

    例:Set、Delete

ラベル:

  • ラベル:reason

    ラベルの説明:その操作が失敗した理由

    例:error、queue_full

ラベル:

  • ラベル:success

    ラベルの説明:ダウンタイムキャッシュへの追加が成功したか失敗したか

    例:0、1

kafka_producer_pending_publish_total

説明:kafka へのパブリッシュが保留されているメッセージの総数

サンプルクエリ:kafka_producer_pending_publish_total{pod=~\".*\"}

kafka_producer_republished_total

説明:Kafka プロデューサによって再パブリッシュされた要求の総数

サンプルクエリ:kafka_producer_republished_total

ラベル:

  • ラベル:operation

    ラベルの説明:CDL Kafka の操作

    例:Delete、Set

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:topic

    ラベルの説明:Kafka トピック名

    例:kv.kafka.shard.1.1.1

kafka_producer_requests_duration_seconds

説明:Kafka プロデューサが要求を処理するのに要した合計時間

サンプルクエリ:sum(irate(kafka_producer_requests_duration_seconds[5m])) by (topic)

ラベル:

  • ラベル:topic

    ラベルの説明:Kafka トピック名

    例:kv.kafka.shard.1.1.1

kafka_producer_requests_total

説明:kafka に送信された要求の総数

サンプルクエリ:kafka_producer_requests_total

ラベル:

  • ラベル:topic

    ラベルの説明:Kafka トピック名

    例:kv.kafka.shard.1.1.1

kafka_records_replayed_total

説明:リーダーのスイッチオーバーまたは kafka の再接続が原因で kafka にパブリッシュされたレコードの合計数

サンプルクエリ:sum(kafka_records_replayed_total{reason=\"leader_switchover\"})by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:reason

    ラベルの説明:kafka レコードを再生する理由

    例:leader_switchover、kafka_reconnection

notification_ep_connection_total

説明:CDL から通知エンドポイントへの接続の総数

サンプルクエリ:notification_ep_connection_total

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:appInstanceId

    ラベルの説明:アプリケーション インスタンス ID

    例 1

notification_streaming_enabled

説明:CDL から通知エンドポイントへのストリーミング接続ステータス。ストリーミングが有効になっている場合、値は 1 です。

サンプルクエリ:notification_streaming_enabled

overwritten_index_records_deleted

説明:インデックスでの一意のキーの上書き/重複が原因で削除されたレコードの総数

サンプルクエリ:overwritten_index_records_deleted

ラベル:

  • ラベル:errorCode

    ラベルの説明:削除のための DB 応答の errorCode

    例:0、502

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:prefix

    ラベルの説明:古いレコードを検出した一意のキープレフィックスパターン

    例:uk1

overwritten_index_records_skipped

説明:キューがいっぱいであるために処理されなかった古いレコードの総数

サンプルクエリ:overwritten_index_records_skipped

ラベル:

  • ラベル:action

    ラベルの説明:古いレコードに対して実行される予定だったアクション

    例:delete、notify

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:prefix

    ラベルの説明:古いレコードを検出した一意のキープレフィックスパターン

    例:uk1

records_notification_duration_seconds

説明:通知エンドポイントに送信した通知に要した時間

サンプルクエリ:sum(irate(records_notification_duration_seconds[5m])) by (shardId,instance_id,notification_type)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:notification_type

    ラベルの説明:通知のタイプ

    例:TIMER_EXPIRED、RECORD_CONFLICT、BULK_TASK_NOTIFICATION

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1406

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

records_notification_retry_count

説明:スロットアプリケーションによる通知の再試行の総数

サンプルクエリ:sum(irate(records_notification_retry_count[5m])) by (shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

records_notification_total

説明:通知エンドポイントに送信した通知の総数

サンプルクエリ:sum(irate(records_notification_total[5m])) by (shardId,instance_id,notification_type)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:notification_type

    ラベルの説明:通知のタイプ

    例:TIMER_EXPIRED、RECORD_CONFLICT、BULK_TASK_NOTIFICATION

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1406

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

remote_requests_dropped_total

説明:ドロップされたリモート要求の総数

サンプルクエリ:remote_requests_dropped_total

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、UpdateFlags

ラベル:

  • ラベル:reason

    ラベルの説明:リモート要求をドロップする理由

    例:queue_full

remote_site_connection_status

説明:CDL エンドポイントからリモートサイトへの cdl-ep 接続数

サンプルクエリ:sum(remote_site_connection_status)by(pod,systemId)

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

remote_site_connections_total

説明:エンドポイントポッドごとに設定されたリモートサイト接続の総数

サンプルクエリ:remote_site_connections_total

ラベル:

  • ラベル:systemId

    ラベルの説明:リモートサイトの systemId ID

    例:1、2

slot_checksum_mismatch_total

説明:チェックサムの不一致の総数

サンプルクエリ:sum(irate(slot_checksum_mismatch_total[5m]))by(slot_shard_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

slot_geo_replication_requests_duration_seconds

説明:スロット Geo レプリケーションの応答の送信に要した時間

サンプルクエリ:sum(irate(slot_geo_replication_requests_duration_seconds[5m]))by(systemId,operation)

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:CREATE、DELETE、UPDATE、UPDATEFLAGS

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、503

slot_geo_replication_requests_total

説明:スロット Geo レプリケーションの要求の総数

サンプルクエリ:sum(irate(slot_geo_replication_requests_total[5m]))by(systemId,operation)

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:CREATE、DELETE、UPDATE、UPDATEFLAGS

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、503

slot_init_sync_duration_seconds

説明:起動時にスロットがローカルピアおよびリモートピアと同期するために要した時間

サンプルクエリ:sum(slot_init_sync_duration_seconds)by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

slot_operation_duration_seconds

説明:cdl ep からスロットアプリケーションに送信された操作の応答に要した時間

サンプルクエリ:sum(irate(slot_operation_duration_seconds{errorCode=\"0\",local_request=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、Find、UpdateFlags

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID。メトリックの詳細度が実稼働の場合、空の文字列が保持されます

    例:1、2

ラベル:

  • ラベル:slot_instance_id

    ラベルの説明:スロットインスタンス ID。メトリックの詳細度が実稼働の場合、空の文字列が保持されます

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、104、105

ラベル:

  • ラベル:local_request

    ラベルの説明:DB 要求がローカルまたは GR のいずれであるか。local_request = 1 の場合はローカルで、それ以外の場合は GR です。

    例:1、0

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

slot_operation_total

説明:cdl ep からスロットアプリケーションに送信された操作の総数

サンプルクエリ:sum(irate(slot_operation_total{errorCode=\"0\",local_request=\"1\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Update、Delete、Find、UpdateFlags

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID。メトリックの詳細度が実稼働の場合は、空の文字列です

    例:1、2

ラベル:

  • ラベル:slot_instance_id

    ラベルの説明:スロットインスタンス ID。メトリックの詳細度が実稼働の場合は、空の文字列です

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、104、105

ラベル:

  • ラベル:local_request

    ラベルの説明:DB 要求がローカルまたは GR のいずれであるか。local_request = 1 の場合はローカルで、それ以外の場合は GR です。

    例:1、0

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

slot_purged_sessions_duration_seconds

説明:次の評価タイマーが切れ、purge=true であることによる、スロットでのセッションの消去に要した時間

サンプルクエリ:sum(irate(slot_purged_sessions_duration_seconds{errorCode=\"0\"}[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、501、508

例:インデックスレコードの取得に失敗しました。無効なスライス名を受信しました

ラベル:

  • ラベル:notify

    ラベルの説明:purgeOnNotify が設定されているかどうか。1 は purgeOnNotify=true を示し、それ以外の場合は 0 です。

    例 1

slot_purged_sessions_total

説明:次の評価タイマーが切れ、purge=true であることにより、スロットで消去されたセッションの総数

サンプルクエリ:sum(irate(slot_purged_sessions_total{errorCode=\"0\"}[5m]))by(shardId,instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、501、508

ラベル:

  • ラベル:notify

    ラベルの説明:purgeOnNotify が設定されているかどうか。1 は purgeOnNotify=true を示し、それ以外の場合は 0 です。

    例 1

slot_reconciled_records_total

説明:調整されたレコードの総数

サンプルクエリ:sum(slot_reconciled_records_total)by(systemId,slot_shard_id,slot_instance_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

ラベル:

  • ラベル:slot_instance_id

    ラベルの説明:スロットインスタンス ID

    例:1、2

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Create、Delete

slot_reconciliation_duration_seconds

説明:調整の実行に要した合計時間

サンプルクエリ:sum(slot_reconciliation_duration_seconds{isError=\"0\"})by(slot_shard_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

ラベル:

  • ラベル:isError

    ラベルの説明:調整中にエラーが発生したかどうか。isError = 1 の場合、エラーが発生しています

    例:0、1

slot_reconciliation_total

説明:チェックサムの不一致によってトリガーされた調整の総数

サンプルクエリ:sum(slot_reconciliation_total{isError=\"0\"})by(slot_shard_id)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:slot_shard_id

    ラベルの説明:スロットシャード ID

    例:1、2

ラベル:

  • ラベル:isError

    ラベルの説明:調整中にエラーが発生したかどうか。isError = 1 の場合、エラーが発生しています

    例:0、1

slot_records_size_total

説明:スロット内のレコードの合計サイズ(バイト単位)

サンプルクエリ:sum(slot_records_size_total)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

slot_records_total

説明:スロット内のレコードの総数

サンプルクエリ:sum(slot_records_total{session_type\"total\"}) by(pod)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:session_type

    ラベルの説明:データに保存されているセッションタイプ

    例:GX、RX、total

ラベル:

  • ラベル:systemId

    ラベルの説明:システムの ID

    例:1、2

ラベル:

  • ラベル:bucket

    ラベルの説明:サイズ別にグループ化されたバケット

    例:<= 1kb、2kb、4kb、8kb

ラベル:

  • ラベル:appInstanceId

    ラベルの説明:レコードでアプリケーションによって入力されたアプリケーション インスタンス ID。

    例 1

slot_requests_duration_second

説明:スロットアプリケーションで受信した要求の応答に要した時間

サンプルクエリ:sum(irate(slot_requests_duration_seconds{errorCode\"0\"}[5m])) by (errorCode)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Get、Create、Delete

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1406

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

slot_requests_total

説明:スロットアプリケーションで受信した要求の総数

サンプルクエリ:sum(irate(slot_requests_total{errorCode=\"0\"}[5m])) by (operation)

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:operation

    ラベルの説明:DB 操作のタイプ

    例:Get、Create、Delete

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、1406

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

slot_stale_record_duration_seconds

説明:スロットが古いスロットレコードを処理するのに要した時間

サンプルクエリ:slot_stale_record_duration_seconds

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:delete

    ラベルの説明:古いレコードが削除するために送信されているか、またはスキップされたかを確認します。delete = 1 の場合は削除するために送信されており、それ以外の場合はスキップされています。

    例:1、0

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、502

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:reason

    ラベルの説明:古いレコードの削除の理由

    例:find_all_notify、stale_check_enabled

slot_stale_record_total

説明:処理された古いスロットレコードの削除の総数

サンプルクエリ:slot_stale_record_total

ラベル:

  • ラベル:db

    ラベルの説明:DB 名

    例:session

ラベル:

  • ラベル:delete

    ラベルの説明:古いレコードが削除するために送信されているか、またはスキップされたかを確認します。delete = 1 の場合は削除するために送信されており、それ以外の場合はスキップされています。

    例:1、0

ラベル:

  • ラベル:shardId

    ラベルの説明:シャード ID

    例:1、2

ラベル:

  • ラベル:errorCode

    ラベルの説明:DB 応答の errorCode

    例:0、502

ラベル:

  • ラベル:cdl_slice

    ラベルの説明:論理 CDL スライスの名前

    例:session

ラベル:

  • ラベル:reason

    ラベルの説明:古いレコードの削除の理由

    例:find_all_notify、stale_check_enabled