兒童 OSA 睡眠檢查的變異性:Sleep Medicine 2026 研究與臨床應用
作者:黃正憲醫師|台北市立聯合醫院陽明院區小兒科
📅 本文發表於 2026 年 2 月
▉臨床上的困惑
門診偶爾會遇到這樣的情況:孩子第一次睡眠檢查顯示中重度 OSA,家長很擔心,安排了治療計畫。幾個月後追蹤檢查,報告卻顯示輕度甚至正常。
家長問:「醫師,是不是治療有效?」
但仔細一看,中間並沒有積極介入治療。
這樣的變異,到底是真的改善,還是檢查本身的變異性?
2026 年 1 月發表在 Sleep Medicine 期刊網站的這篇研究(正式刊登會在4月),正好回答了這個問題。
▉研究背景:為什麼夜間變異性重要?
多項睡眠檢查(polysomnography, PSG)是診斷兒童 OSA 的黃金標準。阻塞性呼吸中止低通氣指數(obstructive apnea-hypopnea index, OAHI)不僅用來診斷,也用來決定嚴重度,進而影響治療決策。
但 PSG 的結果可能受到多種因素影響:
- 孩子當晚睡眠品質
- 總睡眠時間
- 仰睡時間比例
- 對檢查設備的耐受度
成人文獻對夜間變異性(night-to-night variability)已有充分討論,但兒童研究相對少,尤其是中重度 OSA 族群。
過去研究多半:
- 收案包含所有疑似 OSA 的兒童(輕度為主)
- 使用較舊的評分標準
- 較少 14 歲以下兒童的數據
這篇研究的獨特性在於:
- 專注於中重度 OSA 兒童(OAHI 5-30 events/hour)
- 使用 AASM 最新評分標準
- 兒童年齡涵蓋 4-18 歲
- 兩次檢查間隔較長(中位數 48 天),排除第一晚效應
▉研究方法
研究設計
這是兩個加拿大多倫多病童醫院(Hospital for Sick Children)臨床試驗的次級分析:
- 姿勢治療試驗(22 人):評估姿勢治療對姿勢性 OSA 的效果
- 口服類固醇試驗(5 人):評估 dexamethasone 對扁桃腺肥大 OSA 的效果
收案條件
- 年齡:4-18 歲
- 基線診斷:中度至重度 OSA(OAHI 5-30 events/hour)
- 兩次 PSG 間隔:14-78 天(中位數 48 天)
評估指標
- 主要指標:OAHI(events/hour)
- 次要指標:
- Oxygen desaturation index (ODI)
- Hypoxic burden(%min/hour)
統計方法
- 使用 intraclass correlation coefficient (ICC) 評估一致性
- ICC > 0.75:良好
- ICC 0.5-0.75:中等
- ICC < 0.5:不佳
- Bland-Altman plot 呈現差異分布
▉研究結果
基本資料
27 位兒童納入分析:
- 中位年齡:8 歲
- 女性:41%
- BMI z-score:1.4
- 63% 有複雜慢性疾病(如 Down syndrome, Prader-Willi syndrome, 鎌刀型貧血)
兩次 PSG 比較
| 參數(中位數, IQR) | 第一晚 | 第二晚 | 絕對差異 | p 值 |
|---|---|---|---|---|
| 總睡眠時間(分鐘) | 401 (363-449) |
414 (363-451) |
45 (27-56) |
0.75 |
| 睡眠效率(%) | 88.4 (83.9-93.4) |
88.3 (81.8-91.8) |
4.3 (1.4-15.1) |
0.80 |
| 仰睡時間比例(%) | 41.7 (25.1-57.0) |
47.4 (32.1-67.5) |
16.0 (7.1-28.7) |
0.92 |
| REM 睡眠比例(%) | 18.7 (14.7-22.4) |
19.6 (16.3-24.0) |
5.5 (3.5-7.2) |
0.80 |
| OAHI (events/hour) | 9.4 (7.4-14.0) |
14.2 (5.4-21.6) |
6.9 (3.0-11.1) |
0.80 |
| ODI (events/hour) | 8.9 (6.8-14.4) |
10.9 (6.1-19.2) |
5.4 (3.1-10.4) |
0.44 |
| Hypoxic burden (%min/hour) | 31.9 (22.8-57.9) |
48.7 (15.9-129.2) |
32.5 (20.2-50.9) |
0.48 |
重點發現:
- 兩次檢查的睡眠架構參數(總睡眠時間、睡眠效率、REM 比例、仰睡比例)統計上無顯著差異
- 但 OAHI 的絕對差異中位數達 6.9 events/hour
核心發現:OAHI 相關性不佳
Intraclass correlation coefficient (ICC):
| 指標 | ICC | 95% CI | p 值 | 解讀 |
|---|---|---|---|---|
| OAHI | 0.27 | -0.04 to 0.51 | 0.080 | 不佳 |
| ODI | 0.10 | -0.26 to 0.53 | 0.31 | 不佳 |
| Hypoxic burden | 0.45 | 0.10 to 0.70 | 0.0072 | 不佳至中等 |
統計結果的謹慎解讀
這些數據需要特別注意幾點。
1. 信賴區間比點估計值更重要
OAHI 的 ICC = 0.27,看起來是「不佳相關」。但更重要的是 95% CI 為 -0.04 to 0.51。
這個信賴區間的意義是:
- 下限為 -0.04(接近零甚至負值)
- 上限為 0.51(接近中等相關)
- 換句話說,我們無法排除兩次測量幾乎無相關的可能性
- 也無法排除其實有中等相關的可能性
統計上,這叫做「估計的不確定性很高」。
2. p 值邊緣不顯著的意義
OAHI 的 p = 0.080,傳統上會說「未達統計顯著」(α = 0.05)。
但這不代表「兩次測量有良好相關」,反而是:
- 我們沒有足夠證據說兩次測量相關
- 樣本數可能不夠大(n=27)
- 變異太大,導致無法得到明確結論
在臨床決策上,我們應該關注的是:
- ICC 點估計值很低(0.27)
- 信賴區間下限接近零(-0.04)
- 這兩點都指向「相關性不佳」
3. ODI 相關性更差
ODI 的 ICC = 0.10(95% CI -0.26 to 0.53),p = 0.31。
這個結果更清楚:
- 點估計值幾乎為零
- 信賴區間下限是 -0.26(負相關)
- p 值 0.31,完全不顯著
ODI 常被認為是比較穩定的指標(因為只看血氧,不受評分標準影響),但這個研究顯示,在中重度 OSA 兒童身上,ODI 的夜間變異性可能也很大。
4. Hypoxic burden 表現相對較好
Hypoxic burden 的 ICC = 0.45(95% CI 0.10 to 0.70),p = 0.0072。
這是三個指標中唯一:
- p 值顯著(< 0.01)
- 信賴區間下限 > 0(排除了無相關的可能)
雖然 ICC 0.45 仍屬「不佳」範圍,但至少信賴區間的下限是 0.10,表示「至少有一點相關性」。
這可能暗示:hypoxic burden 作為心血管風險指標,在夜間變異性上可能比傳統的 OAHI 稍微穩定一些。
▉樣本數限制對統計推論的影響
這個研究只有 27 位兒童,這在統計上有幾個含義:
1. 信賴區間會很寬
ICC 的估計需要足夠樣本數才能精確。27 位個案的 95% CI 從 -0.04 到 0.51,跨越了整個「不佳」到「中等」的範圍。
如果樣本數更大(例如 100 位),信賴區間會縮窄,我們才能更肯定地說 ICC 到底是多少。
2. 無法細分次族群分析
理想上,我們會想知道:
- 姿勢性 OSA vs 非姿勢性 OSA,變異性是否不同?
- REM-predominant OSA 變異性是否更高?
- 醫學複雜個案 vs 健康兒童,變異性是否不同?
但樣本數 27,無法進行這些次族群分析。
3. 臨床意義 vs 統計顯著性
雖然 OAHI 的 p = 0.080「未達顯著」,但從臨床角度:
- 26% 兒童從中重度變成輕度/正常
- 59% 兒童 OAHI 改變 ≥5 events/hour
這些臨床上有意義的變異是實際存在的,不會因為 p = 0.080 就消失。
統計不顯著可能只是因為:
- 樣本數不夠
- 個體間變異太大
但個體內的變異(同一個孩子,兩次檢查差很多)是真實的。
臨床意義:嚴重度分類改變
| 變異幅度 | 個案數(%) |
|---|---|
| OAHI 改變 ≥5 events/hour | 16/27 (59%) |
| OAHI 改變 ≥10 events/hour | 8/27 (30%) |
| 第一晚中重度 → 第二晚輕度或無 OSA | 7/27 (26%) |
26% 的兒童第一次檢查符合中重度 OSA(OAHI ≥5),第二次卻降到輕度(OAHI 1.5-5)或無 OSA(OAHI <1 .5="" p=""> 1>
這個比例相當高,意味著如果只做一次檢查,可能會:
- 高估嚴重度,安排不必要的積極治療
- 或低估嚴重度,錯失治療時機
▉研究限制
作者誠實地指出幾個限制。
1. 醫學複雜度高的族群
63% 兒童有複雜慢性疾病,可能不適合推論到一般健康兒童。
不過我的觀點是:這群孩子正是臨床上最需要精確診斷的族群,研究結果對這群個案特別有意義。
2. 多數符合姿勢性 OSA
大部分個案符合姿勢性 OSA(supine-to-nonsupine OAHI ratio ≥2),這可能增加夜間變異性。
但研究數據顯示,兩次檢查的仰睡時間比例並無統計差異(41.7% vs 47.4%, p = 0.92),所以仰睡比例的變化可能不是主要原因。
3. 兩次檢查間可能有呼吸道感染
雖然作者有篩檢並確保檢查前兩週無症狀,但無法完全排除。
4. OSA 自然病程
兩次檢查間隔 48 天,理論上 OSA 是慢性疾病,不太可能在這段時間內自然改善。但這個假設仍需更多研究驗證。
▉與過去研究的比較
這篇研究的結果與過去文獻明顯不同。
過去研究:變異性不大
根據 PubMed 資料庫檢索,過去主要研究的結論是:
Katz et al. (2002) 評估 30 位疑似 OSA 兒童,兩次 PSG 間隔 7-27 天:
→ 結論:所有兒童的臨床診斷(OSA 或單純打鼾)在兩次檢查間保持穩定
Li et al. (2004) 評估 87 位兒童(肥胖 vs 正常體重對照):
→ 結論:第一晚檢查能正確診斷 84.6% 個案,單次 PSG 足以診斷睡眠呼吸障礙
Scholle et al. (2003) 和 Verhulst et al. (2006):
→ 主要討論「第一晚效應」,認為連續兩晚檢查的第二晚睡眠架構較好
→ 但呼吸參數(AHI, AI, JI)在兩晚間無顯著差異
收案族群的關鍵差異
過去研究與本篇研究最大的差異在於收案族群的嚴重度分布。
| 研究 | 收案條件 | 樣本數 | 年齡範圍 | OSA 嚴重度分布 |
|---|---|---|---|---|
| Xiao et al. 2026 (本篇研究) |
只收中重度 OSA OAHI 5-30 events/hour |
27 | 4-18 歲 (中位數 8 歲) |
100% 中重度 (OAHI 5-30) 63% 有複雜慢性疾病 |
| Katz et al. 2002 | 疑似 OSA 的打鼾兒童 (所有嚴重度) |
30 | 1.6-11.3 歲 (平均 4.1 歲) |
混合族群: • OSA 患者 • 單純打鼾 未細分嚴重度 |
| Li et al. 2004 | 病例對照研究: • 46 位肥胖兒童 • 44 位正常體重對照組 診斷標準: OAI ≥1/h |
87 (完成 2 晚) |
平均 11.21 歲 (SD 2.21) |
根據最嚴重的那晚: • 13 位 SDB (15%) • 12 位單純打鼾 • 62 位正常 (71%) |
| Scholle et al. 2003 | 疑似 OSA 轉介個案 (所有嚴重度) |
131 | 2-17 歲 (分 3 組) |
• Group 1: 105 位無異常 (80%) (包含治療後或使用 CPAP) • Group 2: 26 位 OSAS (20%) (未治療) |
| Verhulst et al. 2006 | 疑似 OSAS 轉介個案 診斷標準: • OAI >1, 或 • oAHI >2, 或 • SaO2 ≤89% + 阻塞 |
70 | 2-17 歲 (分 3 組) |
根據最嚴重的那晚: • 38 位 OSAS (54%) • 18 位單純打鼾 (26%) • 14 位正常 (20%) 關鍵:漏診的 6 位中, 只有 1 位 oAHI >5, 其餘都是輕度 OSAS |
Verhulst 研究的重要細節
Verhulst et al. 2006 這篇研究值得特別說明。雖然他們收案了 54% OSAS 個案(38/70),但嚴重度分布仍以輕度為主。
原文明確指出:
- 第一晚漏診的 6 位個案中,只有 1 位 oAHI >5
- 其餘 5 位都是 oAHI 2-5 的輕度 OSAS
- 第一晚診斷 OSAS 但第二晚正常的 7 位個案,全部 oAHI <5 strong="">5>
作者的結論是:「All cases missed had mild OSAS, except for one」(除了一位,所有漏診個案都是輕度 OSAS)。
這與本篇 Xiao et al. 2026 研究形成對比:
| 研究 | 收案 OAHI 範圍 | 漏診或嚴重度改變 |
|---|---|---|
| Verhulst 2006 | 疑似 OSA (多數輕度) |
9% 漏診 (幾乎都 oAHI <5 td=""> 5> |
| Xiao 2026 | 只收 OAHI 5-30 (中重度) |
26% 嚴重度改變 (中重度→輕度/正常) |
這個對比清楚顯示:當 OAHI 基線值較高時(5-30),夜間變異的臨床影響更大。輕度 OSA(oAHI 2-5)的變異可能在 ±2-3 range,但中重度 OSA 的變異可達 ±5-10,足以跨越治療門檻。
為什麼結論不同?
過去研究主要收案對象是:
- 疑似 OSA 的兒童(包含正常、輕度、中重度)
- Li et al. 研究中,71% 完全正常,只有 15% 有 SDB
- Scholle et al. 研究中,80% 無 PSG 異常(包含已治療個案)
- Verhulst et al. 研究中,大部分是輕度 OSAS
這些研究回答的核心問題是:「單次 PSG 能否診斷 OSA?」結論是「可以」,因為診斷分類(有 OSA vs 沒有 OSA)相當穩定。
相對地,本篇研究只收中重度 OSA(OAHI 5-30),回答的問題是:「已確診中重度 OSA,嚴重度分級可靠嗎?」
這個差異很重要,因為:
- 診斷分類穩定 ≠ 嚴重度數值穩定
- 輕度或正常個案的 OAHI 本來就低(1-3 events/hour),即使變異 ±2,也不影響診斷
- 但中重度個案的 OAHI 在 5-30 range,變異 ±5-10 events/hour 就可能跨越治療門檻
另一個差異是檢查間隔:過去研究多為連續兩晚或 1-4 週,本研究中位數 48 天。較長間隔排除了第一晚效應,但也可能引入更多生理變異。
▉可能的機轉:為什麼變異性這麼大?
研究團隊提出幾個可能原因。
1. 真實的生理變異
兒童的呼吸模式本來就可能夜與夜之間不同。
舉例:
- 某些夜晚上呼吸道阻力較高(可能與鼻塞、扁桃腺腫脹程度有關)
- 睡眠深度不同,影響上呼吸道肌肉張力
2. 睡眠架構與姿勢的影響
雖然整體統計無差異,但個別兒童的 REM 比例或仰睡時間可能有變化。
- REM-predominant OSA 的孩子:如果某晚 REM 特別少,OAHI 就會低估
- Positional OSA 的孩子:如果某晚仰睡時間少,OAHI 就會低估
3. 技術測量問題
兒童對 PSG 設備的耐受度是常見挑戰:
- 某些夜晚鼻壓感測器脫落較多
- 某些夜晚孩子較焦慮,影響睡眠品質
這些技術問題會影響呼吸事件的偵測與計分。
▉我的觀點:對臨床實務的啟示
1. 不要過度解讀 p 值
p = 0.080 vs p = 0.049,在臨床決策上沒有本質差異。
重要的是:
- ICC 點估計值 0.27 很低
- 信賴區間很寬,表示估計不確定
- 但沒有任何證據支持「相關性良好」
如果相關性真的很好,即使樣本數只有 27,ICC 也應該在 0.7 以上,信賴區間下限也不會接近零。
2. 臨床觀察比統計檢定更直接
26% 兒童嚴重度分類改變,這是直接的臨床觀察,不需要複雜統計。
這告訴我們:
- 如果你收治 4 位中重度 OSA 兒童
- 其中 1 位,第二次檢查可能會變成輕度或正常
這個比例已經足夠讓我們在臨床決策時更謹慎。
3. 單次 PSG 要謹慎解讀
這個研究提醒我們:
- 不要只看 OAHI 數字
- 要結合臨床症狀、理學檢查、家長觀察
舉例:
- 孩子第一次 PSG 顯示 OAHI 6(輕度),但家長觀察每晚都有明顯呼吸中止
→ 我會建議積極處理,而非因為「輕度」就觀察 - 孩子第一次 PSG 顯示 OAHI 12(中度),但症狀不明顯,扁桃腺也不大
→ 我可能會建議追蹤或居家睡眠檢測,確認是否真的需要手術
4. 追蹤檢查的時機
如果第一次 PSG 結果與臨床表現不吻合,考慮安排第二次檢查:
- 第一次 OAHI 正常,但症狀明顯
- 第一次 OAHI 很高,但症狀不明顯
- 治療前後評估(尤其是非手術治療)
5. 居家睡眠檢測的角色
多次實驗室 PSG 並不實際,成本高、孩子辛苦。
未來可能方向:
- 使用多晚居家睡眠檢測(home sleep apnea testing, HSAT)
- 了解個別兒童的變異模式
- 找出哪些因素與高變異性相關
6. 研究設計的啟示
對於兒童 OSA 研究:
- 使用單次 PSG 的 OAHI 作為主要療效指標可能不夠穩定
- 考慮使用平均多晚 OAHI或症狀量表作為補充指標
- 或者接受 OAHI 本來就有變異性,調整統計檢定力
7. 睡眠時間不足的檢查怎麼辦?
臨床上常遇到一個問題:孩子第一晚睡不好,總睡眠時間只有 5-6 小時,檢查結果正常,要不要重做?
目前的現況是:
- AASM 並未規定最低睡眠時間或最低睡眠效率
- CMS(美國 Medicare)在 2008 年已廢除「2 小時規則」,目前沒有最低睡眠時間的給付限制
- CMS 只規定「如果睡眠不足以下診斷,可以重做檢查」,但沒有具體數字
有些人可能聽過「成人要睡 2 小時」或「兒童要睡 3 小時(180 分鐘)」的說法。這些可能來自:
- 2008 年前 CMS 曾有的「2 小時規則」(已廢除)
- 理論上需要 2 個完整睡眠週期(90 分鐘 × 2 = 180 分鐘)的推論
- 某些睡眠中心的內部品質標準
但這些都不是現行的官方規定。
實際上,2025 年 Geisinger 睡眠中心發表的研究,幾乎所有兒童 PSG 的總睡眠時間都未達 AASM 建議值:
- 1-5 歲兒童:平均睡 6.6-7.3 小時 (建議 10-14 小時)
- 6-12 歲兒童:平均睡 6.9-7.2 小時 (建議 9-12 小時)
- 青少年:平均睡 6.8 小時 (建議 8-10 小時)
如果嚴格要求達到理想睡眠時數,可能一半以上的 PSG 都要重做,這在實務上不可行。
我們目前的實務建議:
| 情境 | 是否重做? | 理由 |
|---|---|---|
| TST < 4 hr + OSA 陰性 | 建議重做 | 樣本不足,可能漏診 |
| TST < 4 hr + OSA 陽性 | 可以考慮不必重做 | 已確診,延長睡眠不改變診斷 |
| TST ≥ 4 hr,完全無 REM + OSA 陰性 | 視臨床表現 | 若症狀明顯,考慮重做(可能 REM-predominant OSA) |
| TST ≥ 4 hr + 有 REM + OSA 陰性 但症狀明顯 | 考慮重做 | 本研究提醒我們,第二晚可能揭露中重度 OSA |
關鍵不是看睡眠時間長短,而是「臨床表現 vs PSG 結果」是否吻合。
Verhulst et al. 的建議最務實:「單次 PSG 足以診斷 OSAS,但如果病史和理學檢查高度懷疑,而第一晚陰性,第二晚檢查是值得考慮的。」
▉未來研究方向
這篇研究開啟了幾個值得深入的方向。
1. 哪些因素預測高變異性?
- REM-predominant OSA 的孩子變異性較高嗎?
- Positional OSA 的孩子變異性較高嗎?
- 醫學複雜度高的孩子變異性較高嗎?
2. 多晚居家睡眠檢測的可行性
- 連續 7 晚的 HSAT 能否更準確反映真實狀況?
- 哪些簡化指標(如 ODI)在多晚檢測中表現較穩定?
3. 變異性的臨床意義
- 高變異性的孩子,心血管併發症風險是否不同?
- 治療反應是否也有高變異性?
4. 更大規模研究的必要性
這個研究的價值在於:
- 首次專注於中重度 OSA 兒童
- 發現了重要的臨床現象
- 但樣本數限制了統計推論的精確度
未來研究應該:
- 收集更大樣本(建議 > 100 位)
- 進行次族群分析
- 探討哪些因素與高變異性相關
▉結語
這篇 2026 年的研究提醒我們:兒童 OSA 的診斷不是單純看一個數字這麼簡單。
OAHI 有其侷限,尤其在中重度 OSA 兒童身上,夜間變異性可能比我們想像的大。雖然統計檢定的 p 值未達傳統顯著水準,但信賴區間下限接近零,加上26% 兒童嚴重度分類改變的臨床觀察,都指向相關性不佳的結論。
臨床決策時,我們需要:
- 完整的病史詢問
- 仔細的理學檢查
- 家長的觀察記錄
- 必要時安排追蹤檢查
把 PSG 當作診斷工具之一,而非唯一依據,才能為孩子做出最適合的治療決定。
💡 醫師小叮嚀
如果孩子的睡眠檢查結果與臨床表現不太吻合,不要急著下結論。可以和醫師討論是否需要追蹤檢查,或者先從改善睡眠環境、調整作息開始。對於睡眠時間不足的檢查,重點不在於「睡了幾小時」,而在於「臨床表現與檢查結果是否吻合」。
參考資料
主要文獻:
Xiao L, Terrance M, Au CT, Massicotte C, Narang I. High night-to-night variability in childhood obstructive sleep apnea severity. Sleep Med. 2026;140:108784. doi: 10.1016/j.sleep.2026.108784
延伸閱讀:
1. Katz ES, Greene MG, Carson KA, et al. Night-to-night variability of polysomnography in children with suspected obstructive sleep apnea. J Pediatr. 2002;140(5):589-594. doi: 10.1067/mpd.2002.123290
2. Li AM, Wing YK, Cheung A, et al. Is a 2-night polysomnographic study necessary in childhood sleep-related disordered breathing? Chest. 2004;126(5):1467-1472. doi: 10.1378/chest.126.5.1467
3. Scholle S, Scholle HC, Kemper A, et al. First night effect in children and adolescents undergoing polysomnography for sleep-disordered breathing. Clin Neurophysiol. 2003;114(11):2138-2145. doi: 10.1016/s1388-2457(03)00209-8
4. Verhulst SL, Schrauwen N, De Backer WA, Desager KN. First night effect for polysomnographic data in children and adolescents with suspected sleep disordered breathing. Arch Dis Child. 2006;91(3):233-237. doi: 10.1136/adc.2005.085365
5. Chediak AD. Why CMS Approved Home Sleep Testing for CPAP Coverage. J Clin Sleep Med. 2008;4(1):16-18. PMID: 18350957
6. Goswami S, Karstens J, Murali H, Naik S. Evaluation of Age-Appropriate Sleep Metrics in Pediatric Patients Undergoing Overnight Polysomnography at Geisinger. Sleep. 2025;48(Supplement_1):A470. doi: 10.1093/sleep/zsaf090.1089
免責聲明:本文內容僅供衛教參考,不能取代醫師的當面診斷與治療。每位孩子的情況不同,請務必與您的兒科醫師討論最適合的處置方式。
利益衝突聲明:作者無相關利益衝突需揭露。
📅 最後更新日期:2026 年 2 月 14 日
留言