🟡 HubSpot Operations Hub(Data Hub)実践教科書 — 2026年版
Chapter 2

データ品質管理
クリーンな CRM を維持する

AI が間違えるのは、AI が悪いのではなくデータが汚いからだ。リードスコアの精度が上がらない・パーソナライズメールが明らかに間違った情報を送る・Sales が「このコンタクト、重複してない?」と毎回確認する——これらはすべてデータ品質の問題だ。本章ではData Quality Command Center の全体像・重複検知と自動マージ・フォーマット自動修正ワークフロー・欠損データの補完設計・データ品質 KPI と週次ダイジェスト運用を解説する。

📖 読了目安 25分
🎯 対象:HubSpot 管理者・RevOps・データ管理担当
🔧 必要プラン:Free(基本)/ Professional〜(自動化・AI 重複検知)

📋 この章の内容

  1. 2-1Data Quality Command Center の全体像
  2. 2-2重複検知・自動マージの設計(コンタクト・会社・取引)
  3. 2-3フォーマット自動修正ワークフロー(名前・電話番号・メール・日付)
  4. 2-4欠損データの検知と補完設計
  5. 2-5データ品質の KPI とウィークリーダイジェスト運用
Section 2-1

Data Quality Command Center の全体像

Data Quality Command Center(データ品質コマンドセンター)は、HubSpot ポータル全体のデータ品質問題を一画面で把握・修正できる統合ダッシュボードだ。「Data Management → Data Quality」からアクセスできる。

従来はデータの問題を発見するために個別レコードを手作業で確認するか、CSV エクスポートして Excel で分析するしかなかった。Command Center では重複・フォーマット問題・欠損データ・未使用プロパティの4種類の問題が自動的に検出され、件数・傾向・推奨アクションがまとめて表示される

📊 Data Quality Command Center — モックアップ
最終更新: 2026/03/09 09:00
概要
重複
フォーマット
欠損データ
プロパティ
1,247
重複コンタクト(推定)
▲ 先週比 +83件
3,891
フォーマット問題のあるレコード
▼ 先週比 −214件
8,450
必須フィールド欠損レコード
▲ 先週比 +120件
94.2%
データ品質スコア(全体)
▼ 先週比 −0.3pt
🔴
重複コンタクト——同一メールアドレス
842件
今すぐマージ
🟠
重複コンタクト——名前+会社が類似(AI 検知)
405件
確認して処理
🟡
電話番号フォーマット不統一(E.164 非準拠)
2,134件
自動修正 WF 設定
🟡
姓名が全大文字 / 全小文字
1,757件
一括修正
🔵
業種(Industry)フィールドが空欄
4,210件
補完 WF 設定
未使用ワークフロー(90日間トリガーなし)
23件
棚卸し

Command Center の4つのタブと役割

タブ検出される問題主な対処アクション必要プラン
重複(Duplicates) 同一メールアドレスの重複コンタクト・類似ドメインの重複会社・AI が推定した類似レコード 1件ずつ確認してマージ・自動マージルールの設定 Free〜(AI 検知は Pro〜)
フォーマット問題(Formatting) 電話番号の書式不統一・名前の大文字小文字混在・日付フォーマット不統一・メールアドレスの形式異常 一括修正・自動修正ルールの設定(今後も自動修正) Professional〜
欠損データ(Missing Data) 重要プロパティ(業種・会社規模・ライフサイクルステージ等)が空欄のレコード 補完ワークフローの設定・手動一括更新 Free〜(自動化は Pro〜)
プロパティ(Properties) 90日以上値が入っていないプロパティ・未使用ワークフロー・重複した似た意味のプロパティ プロパティの廃止・統廃合・命名規則の整備 Free〜
💡 週次データ品質ダイジェストを設定する

Command Center の「概要」タブ右下にある「Data Quality Digest を設定」から、毎週月曜朝に自動でデータ品質サマリーをメール通知する設定ができる。管理者が毎週ログインして確認しなくても、「先週より重複が増えた・フォーマット問題が急増した」といった異常に自動で気づける。設定は1分でできるので最優先で有効化すること。

Section 2-2

重複検知・自動マージの設計(コンタクト・会社・取引)

重複レコードは CRM の最大の敵だ。同じ人が2つのレコードに分かれていると、営業が同じ顧客に別々にアプローチ・メールが2通届く・エンゲージメント履歴が分断されて AI の判断が狂うという問題が連鎖する。HubSpot の重複検知は3つのレイヤーで構成されている。

🔍 HubSpot 重複検知の3レイヤー設計
Layer 1
自動マージ(即時)
同一メールアドレスのコンタクト・同一ドメインの会社は、フォーム送信時・API 経由・インポート時に即座に自動マージされる。最も確実性が高い重複をゼロにするファーストライン。
全プラン
Layer 2
AI 重複候補の提示
メールアドレスが異なっても、名前・会社名・電話番号が類似したレコードを AI が「重複候補」として提示。管理者が確認してマージまたは拒否を選択する。
Professional〜
Layer 3
自動マージルール(Beta)
「名前 + 会社名 + 電話番号が一致」などのカスタムルールを設定し、条件に合致した重複候補を自動マージする。大規模ポータルでの重複管理を自動化できる。
Professional〜(Beta)
Layer 4
日次スキャン&アラート
ポータル全体を24時間ごとにスキャンし、重複候補数の上限(デフォルト1,000件/日)を超えたらアラートメールを送信。重複の急増パターンを早期に検知できる。
Professional〜

マージ時の「勝者レコード」の選択ルール

2つのレコードをマージするとき、どちらのレコードの情報を「正」として残すか(勝者レコード = Winner)を決める必要がある。HubSpot のデフォルトは「古いレコード(先に作成された方)を Winner」とするが、以下の考え方で変更することを推奨する。

判断基準推奨 Winner理由
作成日が古い vs 新しい 古い方(デフォルト) エンゲージメント履歴・活動ログが多い古いレコードを残す方が情報量が多い
エンゲージメントが多い vs 少ない エンゲージメントが多い方 メール開封・Web 閲覧・商談履歴が豊富なレコードを残す
Lifecycle Stage が進んでいる Stage が上の方 Customer / MQL のレコードを Winner にして Subscriber のレコードをマージする
フォーム入力で作成 vs 手動作成 フォーム入力の方 顧客本人が入力した情報が最も正確である可能性が高い
✅ マージ前に「マージできないプロパティ」を確認する

HubSpot のマージでは、Winner レコードのプロパティ値が優先され、Loser 側のユニークな値は失われる場合がある。特に「カスタムプロパティに入力した重要情報」「内部メモ」はマージ前に必ず確認し、必要に応じて手動でコピーしてからマージする。一度マージした後の取り消しは困難なため、大量の自動マージを有効にする前に少数サンプルで動作確認を行うこと。

Section 2-3

フォーマット自動修正ワークフロー(名前・電話番号・メール・日付)

Data Hub Professional 以上では、ワークフロー内に「データ形式を整える(Format Data)」アクションが追加される。これを使うと、レコードが作成・更新された瞬間に自動でフォーマットを統一できる——人間が修正し続ける必要がなくなる。

⚙️ コンタクト作成時フォーマット自動修正 WF(基本セット)
ワークフロー名
【DQ】コンタクト作成時 フォーマット自動修正
トリガー
コンタクトが作成された(フォーム・API・インポート・手動を問わず)
遅延
なし(即時実行)

アクション 1
データ形式を整える — 姓・名
対象プロパティ: firstname, lastname / 形式: タイトルケース(先頭大文字、その他小文字)
アクション 2
データ形式を整える — メールアドレス
対象プロパティ: email / 形式: すべて小文字(大文字入力を自動修正)
アクション 3
データ形式を整える — 電話番号
対象プロパティ: phone / 形式: E.164 国際形式(+81-XX-XXXX-XXXX)
アクション 4(条件分岐あり)
会社名が空欄の場合 → メールドメインから補完
条件: company が空欄 / アクション: メールアドレスのドメイン部分を company プロパティに設定
アクション 5
国コードが空欄の場合 → 電話番号の国コードから推定
条件: country が空欄 AND phone に国コードが含まれる / アクション: country を設定

フォーマット問題の具体例と修正ルール

👤 姓・名(firstname / lastname)
TARO YAMADA
Taro Yamada
taro yamada
Taro Yamada
YAMADA TARO
Yamada Taro
ルール:タイトルケース(先頭大文字)に統一。全角スペースは半角に変換。
📧 メールアドレス(email)
taro.yamada @example.com
ルール:すべて小文字に変換。前後のスペースを除去。
📞 電話番号(phone)
090-1234-5678
+81-90-1234-5678
0312345678
+81-3-1234-5678
(03) 1234-5678
+81-3-1234-5678
ルール:E.164 形式(+国コード+市外局番+番号)に統一。記号・スペースは標準化。
🏢 会社名(company)
株式会社example
株式会社Example
EXAMPLE INC
Example Inc
(空欄)
example.com(ドメインから)
ルール:タイトルケースに統一。空欄の場合はメールドメインから補完(要確認)。
⚠️ フォーマット修正 WF を「既存レコード」に適用する方法

上記の WF はデフォルトで「新規作成されたレコード」にのみ適用される。既存の数万件のレコードに一括適用するには、Command Center の「フォーマット問題」タブから対象プロパティを選択し「Fix and Automate(修正して自動化)」ボタンをクリックする。これにより現在の問題を一括修正した上で、以降は新規レコードも自動修正されるルールが設定される。ただし大量処理は HubSpot 内で順次処理されるため、完了まで数時間かかる場合がある。

Section 2-4

欠損データの検知と補完設計

「重複していない・フォーマットも正しい、でも重要フィールドが空欄」という問題が欠損データだ。業種・会社規模・ライフサイクルステージが空欄のままでは、AI の精度・セグメントの精度・パーソナライズの精度がすべて下がる。欠損データへの対処は「発生を防ぐ(入力必須化)」と「すでに空欄のレコードを補完する」の2方向で設計する。

よく欠損するプロパティ別の補完設計

🏭
業種(Industry)
フォームに選択肢がない・インポート時に未入力・Salesforce から同期されていない
メールドメインから Clearbit エンリッチメントで自動補完。または Data Agent の Smart Properties で AI が Web 調査して設定(Professional〜)
👥
会社規模(Company Size)
BtoB では重要だが、フォームで収集しにくい・顧客が正確に答えない
Clearbit / ZoomInfo エンリッチメントで自動補完。または LinkedIn URL から Data Agent が調査して補完(第5章で詳述)
🔄
Lifecycle Stage
手動管理・自動ステージ遷移 WF が未設定・インポート時に未設定
Lifecycle Stage 自動遷移 WF を設定する(第7章で詳述)。インポート時には最低「Subscriber」を設定するルールを作る
🌐
国・都道府県(Country / State)
フォームで収集していない・国際サイトでロケール情報を取得していない
IP アドレスから HubSpot が自動で推定(精度 70〜80%)。電話番号の国コードから逆引きする WF を作成。
👤
コンタクトオーナー(Owner)
インポート時に未割り当て・担当者退職後に未再割り当て
リードルーティング WF でテリトリー・業種・スコアに応じて自動割り当て(第7章で詳述)。四半期ごとに「オーナーなし」コンタクトをレポートで確認する
📊
リードスコア(Lead Score)
スコアリングモデルが未設定・カスタムスコアプロパティの更新 WF が未作成
HubSpot の「コンタクトスコア」機能または カスタム計算プロパティで自動スコアリングを設定する(第7章で詳述)

入力必須化(Required Fields)で欠損を源流でブロックする

欠損データの最良の対策は「入力されないことを仕組みで防ぐ」だ。HubSpot のプロパティ設定で「入力必須」にチェックを入れると、そのプロパティが空欄のままではレコードを保存・次ステージに進められない設定にできる。ただし、すべてのプロパティを必須にするとデータ入力が重くなり、かえって誤入力や適当な値の入力が増えるため、本当に重要なもの(3〜5個程度)に絞ることが重要だ。

フェーズ必須化を推奨するプロパティ理由
リード作成時 メールアドレス・姓名・会社名 重複検知のキー・パーソナライズの最低要件
MQL 昇格時 電話番号・業種・コンタクトオーナー Sales ハンドオフに必要な最低限の情報
商談作成時 金額・クローズ予定日・商談ステージ パイプライン予測・レポートの基本データ
顧客クローズ時 プランタイプ・契約開始日・担当 CSM CS ハンドオフとヘルスモニタリングの起点
Section 2-5

データ品質の KPI とウィークリーダイジェスト運用

データ品質は「一度クリーニングしたら終わり」ではない。毎日新しいレコードが作成され・フォームが送信され・インポートが行われ・外部システムから同期が届く——つまりデータは常に新しく汚れていく。継続的に品質を維持するには、KPI を設定して定期的に確認するケイデンスを作ることが不可欠だ。

📅 データ品質管理ケイデンス
日次・週次・月次・四半期で確認すべき指標とアクション
🌅
日次
同期ステータス確認——Data Sync が Paused になっていないかを確認(通知が届いたとき)
重複アラート——重複候補の日次上限アラートが届いた場合のみ対処(自動化で対応済みなら不要)
📋
週次
データ品質ダイジェスト——毎週月曜に届くダイジェストメールで「重複数・フォーマット問題数・欠損数」の前週比を確認
重複候補のレビュー——AI が検知した「手動確認が必要な重複候補」を週30分で処理する(100件/週を目標)
同期エラーレビュー——同期ログのエラー数を確認し、エラー率が 5% を超えていたら原因調査
📊
月次
データ品質スコアのトレンド確認——Command Center の月次レポートで「スコアが改善しているか」を確認
欠損フィールド TOP 5 の対処——欠損率が高いプロパティの上位5個をリストアップし補完アクション(WF追加・フォーム見直し)を実施
未使用プロパティの整理——90日間値が入っていないプロパティを確認し不要なものを廃止・統合
🔍
四半期
全体データ品質レビュー——全オブジェクト(コンタクト・会社・取引)の品質スコアを経営・RevOps チームに報告
権限・ユーザー棚卸し——退職者アカウント・過剰権限ユーザーの確認と修正(第9章と連動)
フォーマット修正ルールの見直し——ビジネスルール変更・新しい国・地域への展開に伴う修正ルールのアップデート
自動マージルールの効果検証——自動マージした件数・誤マージ率を確認し、ルールの精度を改善

データ品質の目標 KPI 設定例

KPI計算方法初期目標成熟目標
重複率(コンタクト) 重複レコード数 ÷ 総コンタクト数 × 100 5% 以下 2% 以下
メール有効率 有効メールアドレス数 ÷ 総コンタクト数 × 100 85% 以上 95% 以上
業種フィールド充足率 業種が入力済みのコンタクト数 ÷ 総数 × 100 60% 以上 85% 以上
Lifecycle Stage 設定率 Stage が設定済みの数 ÷ 総コンタクト数 × 100 80% 以上 98% 以上
コンタクトオーナー設定率 オーナーが設定済みの数 ÷ 総コンタクト数 × 100 70% 以上 95% 以上
電話番号 E.164 準拠率 E.164 形式の数 ÷ 電話番号ありコンタクト数 × 100 70% 以上 99% 以上
⚡ データ品質改善の「最初の 30 日」でやること

① Command Center の週次ダイジェストを今日中に設定する(5分)。② フォーマット自動修正 WF(名前・メール・電話)を作成して既存レコードに一括適用する(1〜2時間)。③ 重複コンタクトを Command Center の「重複」タブから上位100件だけマージする(30分)。——この3つだけで、ほとんどの組織で翌週のデータ品質スコアが5〜10pt 改善する。完璧を目指すより「まず一番大きな問題から」が最速の改善路だ。

📌 第2章 まとめ

Command Center を「週次チェックの起点」にする

Data Quality Command Center は4つのタブ(重複・フォーマット・欠損・プロパティ)で問題を一元把握できる。週次ダイジェストメールを設定すれば管理者がログインしなくても問題の増減に気づける。まず今日ダイジェストを有効化することが最初のアクション。

重複は「3レイヤー」で防ぐ——即時マージ・AI 候補提示・自動マージルール

同一メールの即時マージ(全プラン)→ AI による類似候補提示(Pro〜)→ カスタムルールによる自動マージ(Pro Beta)の3レイヤーで重複をゼロに近づける。マージ前は「Winner レコードの選択基準」を組織で統一して誤マージを防ぐ。

フォーマット修正は「新規作成時 WF」と「既存一括修正」の2段構えで

新規レコード向けの「コンタクト作成時フォーマット修正 WF」を設定してフォーマット問題の発生を防ぐ。既存の問題は Command Center の「Fix and Automate」で一括修正する。名前・メール・電話の3フィールドが最優先ターゲット。

欠損データは「発生を防ぐ」と「補完する」の2方向で設計する

必須フィールド設定で入力を源流でブロックしつつ、すでに空欄のレコードはエンリッチメント・ワークフローで補完する。必須化は本当に重要な3〜5フィールドに絞り込む。すべて必須化すると誤入力・適当入力が増える逆効果になる。

データ品質は「定期ケイデンス」でしか維持できない

日次・週次・月次・四半期のケイデンスを決め、各タイミングで確認すべき指標とアクションを事前に決めておく。特に週次の「重複候補のレビュー(30分)」と月次の「欠損 TOP5 への対処」を習慣化するだけで、品質スコアは継続的に改善し続ける。

KPI を設定して「改善しているか」を数値で追う

重複率・メール有効率・業種充足率