Active Directory(AD)は「動いているように見えていても」、内部で不整合が進行していることがある。
そのため、定期的な健全性チェックで問題の芽を早期に発見することが重要である。
本ページでは、Windows標準ツールを中心に 基本的なAD健全性チェック項目 を、
「どこを見るか」「正常の目安」「NGの典型」「次に疑うこと」まで含めて整理する。
(詳細な設計・復旧手順・高度な監視は別ページで扱う)
ADはDNSに強く依存している。
まず「クライアントが AD 用DNS を参照しているか」を確認する。
ipconfig /all
ipconfig /all の出力で、次を探す。
- DNS Servers . . . . . . . . . . . :
- Connection-specific DNS Suffix . : <ドメイン名>(表示される環境の場合)
- Primary DNS Suffix . . . . . . . : <ドメイン名>(表示される環境の場合)
- DNS Servers が 社内のDNS(一般的にはDC) を指している
- 複数DNSがある場合、先頭が到達可能なDNSになっている
- 外部DNS(例:8.8.8.8 / 1.1.1.1)を参照している
→ SRVレコードが引けず、ドメイン参加・ログオン失敗/遅延の原因になりやすい
- 存在しないDNSを参照している
→ タイムアウト待ちでログオンが遅くなる
- VPN接続時だけDNSが変わる
→ VPN側のDNS配布/スプリットDNSを確認する
ドメインコントローラー(DC)の基本診断を実施する。
dcdiag
Starting test: の後に、以下のいずれかが出る。
- passed test (正常)
- failed test (異常)
特に注目するテスト(環境により出力順は異なる):
- DNS
- Advertising
- NetLogons
- Services
- Replications
- failed test が出ていない
- DNS系の失敗がない
- DNSテスト失敗
→ SRV登録不整合 / ゾーン不整合 / 名前解決失敗
- Advertising / NetLogons 失敗
→ DCとしての広告や共有(SYSVOL/NETLOGON)問題
- Services 失敗
→ AD関連サービス停止(後述「⑦ 重要サービス」)
複数DCがある環境では、レプリケーション不整合が障害の起点になりやすい。
repadmin /replsummary
repadmin /showrepl
- repadmin /replsummary
- Fails(失敗数)
- Largest Delta(最終成功からの経過)
- repadmin /showrepl
- 相手DCごとの Last attempt と Result
- Fails が 0(または一時的で増え続けない)
- Largest Delta が極端に長くない
- 失敗が増え続ける
→ ネットワーク断 / DNS不整合 / 時刻ずれ / 認証問題
- 特定の相手DCだけ失敗
→ 相手DCの停止 / 到達性 / 名前解決 / FW / 必要ポート
GPO配布やログオン処理に必要な共有フォルダが正常か確認する。
dir \\<ドメイン名>\SYSVOL
dir \\<ドメイン名>\NETLOGON
- 一覧表示できる(タイムアウトしない)
- 余計な資格情報入力を求められない(ドメイン参加済み前提)
- パスが見つからない / タイムアウト
→ DNS不整合、DC到達不可、SMB制限
- SYSVOLが更新されない
→ レプリケーション(DFSR)不整合の可能性
障害の兆候はイベントログに先に出ることが多い。
ここでは「見るログ」「見る観点」を最低限に絞る。
- Directory Service
- AD DS 自体の異常(DB、レプリケーション関連など)
- DNS Server
- System
- 時刻同期、ネットワーク、サービス停止、ディスク等の基盤問題
- (環境により)DFS Replication
Get-WinEvent -LogName "Directory Service" -MaxEvents 50
Get-WinEvent -LogName "DNS Server" -MaxEvents 50
Get-WinEvent -LogName "System" -MaxEvents 50
Get-WinEvent -LogName "DFS Replication" -MaxEvents 50
- 同じエラーが繰り返し出ていないか
- 直近(今日/昨日)から急に増えていないか
- 警告よりも「エラー」「重大」優先で確認する
- 変更作業(Windows Update / 設定変更)直後に出始めたかを意識する
- DNS関連が頻発
→ DNSゾーン/登録/到達性
- レプリケーション関連が頻発
→ DC間通信 / 時刻 / 認証
- DFS Replication のエラーが継続
→ SYSVOL不整合(GPO影響)
Kerberos認証は時刻に依存する。
時刻ずれはログオン失敗や認証エラーの原因になる。
w32tm /query /status
w32tm /query /source
- Source に同期元が出る(Local CMOS Clock になっていない)
- “同期していない” 状態になっていない
- Local CMOS Clock
→ 同期できていない可能性
- 仮想環境でホスト同期と競合
→ ドメイン時刻体系が崩れる可能性
最後に、AD基盤として重要なサービスが停止していないか確認する。
(停止している場合、上記の問題が連鎖しやすい)
Get-Service | Where-Object { $_.Status -ne "Running" } | Select-Object -First 50
- 「ADやDNSに関係するサービス」が停止していないこと
- 停止が見える場合は、意図した停止か(メンテ中か)を確認する
AD健全性チェックは、次の順で確認すると切り分けが早い。
- ① DNS(入口)
- ② DC状態(基盤)
- ③ レプリケーション(整合性)
- ④ SYSVOL/NETLOGON(運用)
- ⑤ イベントログ(兆候)
- ⑥ 時刻同期(Kerberos前提)
- ⑦ 重要サービス(基盤)
トラブル時は「DNS → 時刻 → DC診断 → レプリケーション」を先に見ると判断が早い。