ian

週一, 05/25/2026 - 09:29

AI 液冷系統流量穩定度完整指南

Q: 什麼是液冷系統流量穩定度？為什麼比冷媒選擇更重要？

流量穩定度是指液冷系統冷卻液在管路中流動速度的一致性。流量變動±5% = GPU 溫度波動 ±3°C，導致推理延遲變動 2-3%，用戶體驗直接崩潰。冷媒選擇再好，流量不穩定仍然無法散熱均勻。真正的瓶頸在於：(1)管路堵塞偵測、(2)泵浦效率監測、(3)壓力穩定控制。

Q: 液冷系統壓力監測有什麼用？什麼時候需要警報？

壓力是流量的直接指標。供液壓力異常直接代表流量變動。正常範圍 0.2-0.4 MPa；低於 0.15 MPa = 洩漏；高於 0.6 MPa = 堵塞。ATLANTIS DPS-2.5SPD3 設定上下限警報，流量異常 5 秒內觸發，防止靜默故障演變為大面積冷卻失效。

Q: 背板液冷 vs 浸沒式液冷，哪個更需要流量監測？

都需要，但監測重點不同。背板液冷：單個 GPU 冷板流量監測（微米級堵塞敏感）；浸沒式：全槽體流量均勻性監測。背板液冷因為冷板數量多（100+ 個），任何一個堵塞都會導致該 GPU 區域溫度飆升，必須多點壓力監測。

Q: 為什麼說「舊思維選冷媒，新思維監流量」？

舊機房時代（功率密度 5kW/機架）：冷媒選擇決定了 80% 的冷卻效果。但 AI 時代（30-50kW/機架）：流量穩定度決定 80% 的溫度控制效果。因為高密度熱源造成流量變動 1mL/s = 溫度變動 0.5°C，而冷媒種類的溫度差異只有 ±0.2°C。流量穩定度的影響力已經超越冷媒選擇 4-5 倍。

Q: 液冷系統洩漏前有什麼先兆？怎麼提早發現？

洩漏有 3 個階段：(1)無症狀洩漏期（5-10 毫升 / 小時）→ (2)壓力緩慢下降（7-14 天內 -0.05 MPa）→ (3)突發大洩漏（管爆）。Re-Atlantis SDPT-3100 智能傳送器記錄壓力趨勢，數據同步雲端，AI 分析壓力下降速率。速率 > 0.01 MPa / 天 = 預警維護，防止第 3 階段。

Q: AI 機房液冷系統可以做到「零停機」嗎？

不能完全零停機，但可以做到「計畫停機」替代「非計畫停機」。方式：(1)實時監測壓力變化趨勢（SDPT-3100）；(2)提早 48 小時預警（AI 預測堵塞時間點）；(3)選擇低流量時段進行計畫維護；(4)雙迴路備用設計（背板液冷系統）。結果：停機時間 從 4-8 小時（應急）縮短到 30 分鐘（計畫）。

Q: 液冷系統溫度監測和壓力監測需要同時做嗎？

必須同時做。溫度是「結果」指標（已經出現問題），壓力是「原因」指標（提前發現問題）。配置：(1)供液入口溫度 DTT-P4；(2)回液出口溫度 DTT-P4；(3)供液壓力 DPS-2.5SPD3；(4)GPU 區域溫度 20+ 點。完整配置成本 NTD 150-200K，但避免停機損失 NTD 5700 萬 / 小時，ROI 5 秒內回本。

下一代液冷瓶頸不在冷媒，而是流量穩定度｜用壓力監測掌控冷卻命脈

±2%

流量穩定度目標

48小時

液冷故障提前預警

5秒

異常流量反應時間

為什麼說「液冷系統真正瓶頸不是冷媒」？

過去 10 年，數據中心冷卻的討論焦點都在「選對冷媒」上。工程師們花費數百萬採購進口冷媒、優化冷媒迴圈，以為這樣就能解決散熱問題。但現實是：2024-2026 年 AI 機房的冷卻故障 75% 源自流量不穩定，而非冷媒選擇。

殘酷數據：

• 傳統機房（功率密度 5kW/機架）→ 冷媒選擇決定 80% 散熱效果

• AI 機房（30-50kW/機架）→ 流量穩定度決定 80% 溫度控制效果

• 流量變動 ±5% = GPU 溫度波動 ±3°C = 推理延遲變動 2-3%

這篇完整指南會揭示：

為什麼流量穩定度比冷媒更關鍵 — 流體力學根本原理
背板液冷與浸沒式液冷的流量監測策略完全不同 — 具體配置方案
如何用壓力監測實現「48 小時提前預警」 — ATLANTIS 解決方案
從「被動救火」轉變為「主動預防」的投資策略 — ROI 計算

AI 機房液冷現狀：為什麼溫度控制越來越難？

🔥 高功耗 GPU 帶來的三大挑戰

NVIDIA H100 單顆功耗 700W，一個標準機架 8 張卡 = 5.6kW。但實際 AI 推理機房，一個機架常配 10-12 張 H100，功耗達 7-8.4kW / 機架。如果是訓練集群，超過 12kW / 機架 很普遍。

這對液冷系統的挑戰：

挑戰項目	傳統機房	AI 機房	影響
溫度梯度	3-5°C	15-25°C	熱應力導致冷板隆起
流量脈動	±8-10%	±15-20%	冷卻不均，局部過熱
液體壽命	18-24 個月	6-9 個月	氧化加速，微粒增加
堵塞風險	3-5 年內	6-18 個月內	維護成本劇增

❌ 為什麼「只監測溫度」無法解決問題

常見的監測方案：在機房裝 20-30 個溫度計，溫度超過 28°C 才警報。結果是：

反應時間太慢：溫度升高 → 感測反應 2-5 分鐘 → 告警系統處理 3-10 分鐘 → 工程師趕到 15-30 分鐘。流量故障發生 → 溫度異常出現 = 最少 20 分鐘延遲。此時已造成 GPU 降頻或局部熱損傷。
無法區分「根本原因」：溫度高可能是 (a)液冷堵塞、(b)洩漏、(c)泵浦故障、(d)管路設計不良四種原因。傳統溫度計只告訴你「溫度高」，無法告訴你「為什麼高」，工程師必須逐一排查，浪費時間。
無法預警：溫度是「已經發生」的指標。流量逐漸下降（洩漏）5-10 天後溫度才開始上升，這段時間裡系統已經在危險邊緣。

⚠️ 真實案例：某台灣 AI 推理機房

安裝了 30 個溫度計，監測邏輯「溫度 > 28°C 則警報」。某天凌晨 2 點液冷管路微洩漏，壓力從 0.35 MPa 緩慢下降。8 個小時後（凌晨 10 點）流量已下降 30%，但溫度仍在 26-27°C（未觸發警報）。等到下午 2 點溫度升到 29°C 觸發警報時，部分 GPU 已運作在 35-38°C 危險溫度 4 小時，自動降頻 15-20%，推理吞吐量下降 18%，該小時客戶請求處理量虧損 NTD 2400 萬。

液冷系統流量穩定度的物理基礎

流量、壓力、溫度的「黃金三角形」

液冷系統的冷卻效果由三個變數決定：

冷卻能力 = 流量 × 比熱 × (供液溫度 - 回液溫度)

在「比熱」（由冷媒決定）固定的情況下：

流量 ↓ 10%：冷卻能力 ↓ 10%，溫度 ↑ 1.5-2°C
溫度差 ↓ 10%：冷卻能力 ↓ 10%，需要增加流量 20% 才能補償
冷媒種類改變：冷卻能力最多改變 ±10%（PG / 水 / 專用液）

結論：在固定的供液溫度下，流量穩定度的重要性是冷媒選擇的 3-5 倍。

為什麼壓力能反映流量？

根據流體力學，管路流量與壓降的關係：

壓降 = 128 × 粘度 × 流量 / (π × 半徑⁴)（Poiseuille 公式）

簡單理解：

流量固定 → 壓降固定（正常狀態）
流量↓ → 壓降↓（可能是洩漏）
壓降↑ → 流量↓ 或阻力↑（堵塞）

ATLANTIS 的核心策略：用「壓力變化」推斷「流量異常」，遠比直接測流量便宜、更可靠。

監測方式	成本	精度	反應速度	維護成本
直接流量計（渦輪式）	NTD 60-120K	±1%	2-5 秒	高（易堵塞）
壓力計（DPS-2.5SPD3）	NTD 15K	±0.25%	< 1 秒	低（無耗材）
差壓計（DPTX）	NTD 25K	±2%	1-3 秒	低

選擇壓力監測而非流量計的三個關鍵原因：

成本便宜 50-80%：NTD 15K vs NTD 60-120K，單點監測成本極低，可以多裝幾個冗餘點
故障率低 10 倍：流量計有轉子、磁鐵易堵塞；壓力計無活動部件，可靠性高
精度反而更好：DPS-2.5SPD3 精度 ±0.25% vs 流量計 ±1%，特別是在低壓液冷系統（0.2-0.4 MPa）

背板液冷系統的流量監測策略

背板液冷架構與監測點規劃

背板液冷（直接連接 GPU 背部冷板）是目前最廣泛的 AI 機房方案，效率高、改造成本低。但它的流量監測難度比浸沒式更高，因為：

單個機架可能有 10-12 個 GPU，每個都有獨立冷板
冷板之間並聯連接，任何一個堵塞都會導致該 GPU 溫度飆升
流量分配極度敏感，±2% 流量變動就會造成 ±1°C 溫度差異

DPS-2.5SPD3 多功能壓力開關 - 背板液冷流量監測核心設備

完整監測配置（單機架 8 卡 GPU）

監測點位置	設備型號	功能	數量	成本
機架供液入口	DPS-2.5SPD3	壓力上下限（流量保護）	1	NTD 15K
前 4 個冷板匯集點	DPTX	進出差壓（堵塞偵測）	1	NTD 25K
後 4 個冷板匯集點	DPTX	進出差壓（堵塞偵測）	1	NTD 25K
機架回液出口	DPS-2.5SPD3	回液壓力（洩漏警報）	1	NTD 15K
供液溫度	DTT-P4	冷卻效率監測	1	NTD 8K
回液溫度	DTT-P4	冷卻效率監測	1	NTD 8K
GPU 區域溫度	DHT-SD（手持）	巡檢、驗證	8	NTD 16K
單機架總成本				NTD 112K

監測邏輯與警報設定

正常運作區間：

供液壓力：0.30-0.35 MPa（標準工作點 0.32 MPa ± 0.03）
回液壓力：0.15-0.18 MPa（泵出口 0.32，回液阻力 0.15）
前後 4 個冷板的進出差壓：應相等（≤ ±0.02 MPa）
供回液溫度差：4-6°C（標準功耗 500W GPU）

警報邏輯：

供液壓力 < 0.25 MPa → 洩漏警報，自動停泵防損傷

供液壓力 > 0.50 MPa → 堵塞警報，提醒清潔或更換液體

前後冷板進出差壓 > ±0.05 MPa → 流量不均，可能某側冷板堵塞

供回液溫度差 < 2°C → 流量過高，泵浦超速，檢查設定

供回液溫度差 > 8°C → 流量不足，可能開始堵塞或洩漏

浸沒式液冷的流量監測（新一代方案）

浸沒式液冷的優勢與挑戰

浸沒式液冷將整個伺服器浸沒在絕緣冷卻液中，可支持 500+ kW/m² 的超高功耗密度，是下一代 AI 超算中心的標準配置。但它的流量監測邏輯完全不同：

項目	背板液冷	浸沒式液冷
流量特性	點對點高流速（1-3 m/s）	全槽體對流（0.1-0.5 m/s）
堵塞風險	高（細管易堵）	低（開放式液體）
洩漏風險	高（800+ 個接頭）	高（槽體密封）
流量監測難度	直接（每點都可測）	間接（液位 ≈ 流量變動）

浸沒式液冷監測配置（1000L 槽體，容納 8-12 台伺服器）

SLPTX 智能型液位傳送器 - 浸沒式液冷液位監測核心

監測項目	設備型號	用途	數量	成本
槽體液位	SLPTX	洩漏偵測（液位 ↓ = 洩漏）	2	NTD 50K
液體循環泵出口壓力	DPS-2.5SPD3	泵浦效率、流量推估	1	NTD 15K
膨脹罐壓力	DPS-2.5SPD3	液體狀態、溫度變化	1	NTD 15K
液體供應溫度	DTT-P4	冷卻效率監測	1	NTD 8K
液體回收溫度	DTT-P4	冷卻效率監測	1	NTD 8K
伺服器內部溫度	DHT-SD × 6 點	熱流量均勻性	6	NTD 12K
單槽體總成本				NTD 108K

浸沒式液冷的「液位 = 流量」邏輯

浸沒式液冷的流量監測邏輯不是直接測流量，而是透過「液位變化」推斷「流量異常」：

液位穩定 + 溫度上升：正常（泵浦工作，散熱進行）
液位下降 > 2cm / 天：洩漏警報，立即停泵和清潔
液位波動 > ±5cm：泵浦脈動異常，可能泵磨損
液位穩定但溫度均勻性差 > 5°C：流量分配不均，檢查循環方向

浸沒式 vs 背板液冷的監測成本比較：

背板液冷：單機架 NTD 112K（8 個 GPU）= NTD 14K / GPU

浸沒式：單槽體 NTD 108K（10 台伺服器 × 8 GPU = 80 個 GPU）= NTD 1.35K / GPU

→ 浸沒式成本是背板的 1/10，但早期採購量少時單位成本會更高。

ATLANTIS 液冷系統監測完整產品線

核心產品介紹

昶特 ATLANTIS 針對液冷系統設計了專業監測產品線，涵蓋壓力、溫度、液位、智能監控四大類別。與進口品牌相比，成本便宜 40-60%、交期快 50%、本地技術支援 7 天 24 小時。

1️⃣ DPS-2.5SPD3 多功能壓力開關

DPS-2.5SPD3 多功能壓力開關

型號：DPS-2.5SPD3 | 精度：±0.25% FS

應用：液冷供液/回液壓力監測、泵浦保護、膨脹罐監控

規格亮點：

量程：0-0.6 MPa（液冷系統專用）
精度：±0.25%（業界最高）
輸出：雙組開關輸出（上限停泵、下限警報）
顯示：彩色 LCD（紅色警報、綠色正常）
防爆認證：ATEX II 2G（可用於危險區域）

成本：NTD 15K | 壽命：5-8 年

2️⃣ DPTX 防爆差壓傳送器

DPTX 防爆差壓傳送器

型號：DPTX | 精度：±2% FS

應用：冷板進出差壓監測、管路堵塞偵測、流量均勻性確認

規格亮點：

量程：0-0.2 MPa（差壓專用）
輸出：4-20mA + HART 通訊
防爆：ATEX II 2G
隔膜式設計：不易堵塞

成本：NTD 25K | 壽命：5-8 年

3️⃣ DTT-P4 溫度傳送器

DTT-P4 二線式溫度傳送器

型號：DTT-P4 | 精度：Class A (±0.15°C)

應用：供液/回液溫度監測、冷卻效率計算

規格亮點：

Pt100 傳感器：Class A 精度
輸出：4-20mA（PLC 整合）
二線制：長距離傳送無信號衰減
量程：-20～+80°C（液冷系統適用範圍）

成本：NTD 8K | 壽命：5-10 年

4️⃣ SDPT-3100 智能型壓力傳送器

SDPT-3100 智能型壓力傳送器

型號：SDPT-3100 | 通訊：HART

應用：液冷系統壓力趨勢監測、雲端上傳、AI 預測警報

規格亮點：

微處理器內置：可編程邏輯
HART 通訊：與 BMS/SCADA 無縫整合
自學習功能：根據 3 個月數據自動設定警報閾值
趨勢預測：AI 分析壓力變化，提早 48 小時警報
數據記錄：雲端 5 年保存

成本：NTD 20K | 軟體年費：NTD 30K

5️⃣ SLPTX 智能型液位傳送器

SLPTX 智能型液位傳送器

型號：SLPTX | 精度：±0.5% FS

應用：浸沒式液冷槽體液位監測、洩漏偵測

規格亮點：

德國陶瓷電容傳感器：抗腐蝕、穩定性高
三重保護：解決結露問題（液冷環境潮濕）
輸出：4-20mA + HART 通訊
量程：可客製（100-2000L 槽體）

成本：NTD 25K (成對) | 壽命：5-8 年

完整液冷監測配置方案

方案 A：背板液冷中型機房（300m²，30 個機架）

配置層級	設備清單	數量	單價	小計
機架監測	DPS-2.5SPD3（供液壓力）	30	NTD 15K	NTD 450K
	DPTX 差壓計	30	NTD 25K	NTD 750K
	DTT-P4 溫度傳送器	60	NTD 8K	NTD 480K
	安裝與配管	1	NTD 150K	NTD 150K
集中監控	SDPT-3100 雲端平台	1	NTD 200K	NTD 200K
小計（硬體）				NTD 2.03M
年度軟體費 + 維護				NTD 50K

方案 A 的效益：

• 投資回本時間：< 1 個月（避免 1 次停機）

• 年度節能：NTD 180 萬（冷卻優化）

• 停機風險下降：從 80% 降至 5%

• GPU 性能提升：推理延遲穩定性 ±1%（原本 ±5%）

方案 B：浸沒式液冷超高密度機房（500m²，50 個槽體，容納 400+ 台伺服器）

配置層級	設備清單	數量	單價	小計
槽體監測	SLPTX 液位傳送器	100	NTD 25K	NTD 2.5M
	DPS-2.5SPD3 泵浦壓力	50	NTD 15K	NTD 750K
	DTT-P4 液溫度	100	NTD 8K	NTD 800K
	DHT-SD 手持溫度計	10	NTD 4K	NTD 40K
	安裝與配管	1	NTD 300K	NTD 300K
中央平台	SDPT-3100 + AI 模組	1	NTD 500K	NTD 500K
小計（硬體）				NTD 4.89M
年度軟體費 + 維護				NTD 100K

方案 B 的效益：

平均每個 GPU 的監測成本：NTD 1.2K（背板液冷的 1/12）
投資回本時間：< 2 週（避免 1 次大規模停機）
年度節能：NTD 500 萬-1000 萬（能密度優化）
系統可靠性：99.9% 以上（預測警報防止故障）

AI 液冷流量監測 20 問完全解答

Q1. 什麼是液冷系統流量穩定度？為什麼比冷媒選擇更重要？

流量穩定度是指液冷系統冷卻液在管路中流動速度的一致性。流量變動 ±5% = GPU 溫度波動 ±3°C，導致推理延遲變動 2-3%，用戶體驗直接崩潰。冷媒選擇再好，流量不穩定仍然無法散熱均勻。真正的瓶頸在於：(1)管路堵塞偵測、(2)泵浦效率監測、(3)壓力穩定控制。

Q2. 液冷系統壓力監測有什麼用？什麼時候需要警報？

壓力是流量的直接指標。供液壓力異常直接代表流量變動。正常範圍 0.2-0.4 MPa；低於 0.15 MPa = 洩漏；高於 0.6 MPa = 堵塞。ATLANTIS DPS-2.5SPD3 設定上下限警報，流量異常 5 秒內觸發，防止靜默故障演變為大面積冷卻失效。

Q3. 背板液冷 vs 浸沒式液冷，哪個更需要流量監測？

都需要，但監測重點不同。背板液冷：單個 GPU 冷板流量監測（微米級堵塞敏感）；浸沒式：全槽體流量均勻性監測。背板液冷因為冷板數量多（100+ 個），任何一個堵塞都會導致該 GPU 區域溫度飆升，必須多點壓力監測。

Q4. 為什麼說「舊思維選冷媒，新思維監流量」？

舊機房時代（功率密度 5kW/機架）：冷媒選擇決定了 80% 的冷卻效果。但 AI 時代（30-50kW/機架）：流量穩定度決定 80% 的溫度控制效果。因為高密度熱源造成流量變動 1mL/s = 溫度變動 0.5°C，而冷媒種類的溫度差異只有 ±0.2°C。流量穩定度的影響力已經超越冷媒選擇 4-5 倍。

Q5. 液冷系統洩漏前有什麼先兆？怎麼提早發現？

洩漏有 3 個階段：(1)無症狀洩漏期（5-10 毫升 / 小時）→ (2)壓力緩慢下降（7-14 天內 -0.05 MPa）→ (3)突發大洩漏（管爆）。Re-Atlantis SDPT-3100 智能傳送器記錄壓力趨勢，數據同步雲端，AI 分析壓力下降速率。速率 > 0.01 MPa / 天 = 預警維護，防止第 3 階段。

Q6. 液冷管路堵塞的根本原因是什麼？壓力監測能防止嗎？

堵塞成因：(1)冷卻液氧化（3-6 個月開始積聚微粒）、(2)微生物生長、(3)金屬粉（泵磨損）、(4)膠水/密封膠老化。壓力監測的角色是「早期發現」而非「防止」。壓力升高 > 0.3 MPa / 月 = 開始堵塞，提早規劃液體更換，避免流量變動引發溫度控制崩潰。

Q7. ATLANTIS DPS-2.5SPD3 壓力開關為什麼適合液冷系統？

4 個原因：(1)精度 ±0.25% = 0.1 MPa 級別變動都能偵測；(2)雙組輸出 = 上限觸發停泵、下限觸發警報；(3)彩色 LCD 即時顯示 = 無需第三方軟體；(4)防爆認證 ATEX II 2G = 工業級可靠性。特別是「停泵保護」功能，洩漏時自動斷泵，防止損壞伺服器。

Q8. 液冷背板冷板之間流量不均勻怎麼辦？

流量不均勻的根本原因：管路設計阻力不平衡 + 泵浦脈動。解決方案：(1)並聯管路設計，每 4-6 個冷板一個壓力監測點（DPTX）；(2)確保冷板進出口壓力差 < 0.05 MPa；(3)泵浦選型時選最小脈動（齒輪泵 vs 離心泵）。ATLANTIS DPTX 差壓計可監測冷板進出壓差，異常立即警報。

Q9. AI 機房液冷系統可以做到「零停機」嗎？

不能完全零停機，但可以做到「計畫停機」替代「非計畫停機」。方式：(1)實時監測壓力變化趨勢（SDPT-3100）；(2)提早 48 小時預警（AI 預測堵塞時間點）；(3)選擇低流量時段進行計畫維護；(4)雙迴路備用設計（背板液冷系統）。結果：停機時間從 4-8 小時（應急）縮短到 30 分鐘（計畫）。

Q10. 液冷系統溫度監測和壓力監測需要同時做嗎？

必須同時做。溫度是「結果」指標（已經出現問題），壓力是「原因」指標（提前發現問題）。配置：(1)供液入口溫度 DTT-P4；(2)回液出口溫度 DTT-P4；(3)供液壓力 DPS-2.5SPD3；(4)GPU 區域溫度 20+ 點。完整配置成本 NTD 150-200K，但避免停機損失 NTD 5700 萬 / 小時，ROI 5 秒內回本。

Q11. 浸沒式液冷需要流量監測嗎？為什麼？

需要，但方式不同。浸沒式液冷液位和流量是等同概念。液位下降 = 流量變動 + 洩漏。監測方案：(1)液位計 SLPTX（絕對值監測）；(2)膨脹罐壓力 DPS-2.5SPD3（間接流量）；(3)液體循環溫度 DTT-P4 × 3 點。當液體溫度均勻性差 > 3°C = 流量不均，需調整循環泵效率。

Q12. 什麼是「液冷系統效率」？怎麼計算？

液冷效率 = (供液溫度 - 回液溫度) / GPU 峰值功耗。典型數值：背板液冷 15-25°C 溫降 / 500W GPU = 3-5°C / 100W。如果實測溫降 < 2°C / 100W = 效率下降 > 40%，代表堵塞或流量不足。ATLANTIS 配置可監測溫降實時變化，效率下降時自動警報。

Q13. 液冷系統從「被動救火」轉變為「主動預防」，成本差多少？

被動救火（傳統）：只有溫度報警，反應時間 10-30 分鐘，停機風險高。成本：NTD 20-30K（基礎溫度計）+ 年度維護 NTD 200K + 停機損失 NTD 1-5 千萬。主動預防（ATLANTIS）：壓力 + 溫度同監測，反應時間 < 5 秒，預警期 48 小時。成本：NTD 150-200K（完整配置）+ 年度維護 NTD 50K + 停機損失幾乎為零。年度差異 NTD 5700 萬 vs NTD 200K = 投資回本時間 < 2 分鐘。

Q14. AI 新創小機房（100m²、50 個 GPU）該怎麼配置液冷監測？

分階段配置：階段 1（NTD 80K）：DPS-2.5SPD3 × 2 個（供液上下限保護）+ DTT-P4 × 2 個（供回液溫度）。階段 2（+NTD 70K）：SDPT-3100 × 1 個（雲端趨勢監測）+ DPTX × 2 個（冷板進出差壓監測）。階段 3（+NTD 100K）：額外溫度點 × 15 個（GPU 區域分佈監測）。總投資 NTD 250K，分散 3 個季度，每階段都有 ROI。

Q15. 液冷系統流量穩定度和「PUE」效率有什麼關係？

PUE（Power Usage Effectiveness）= 總能耗 / IT 能耗。液冷系統 PUE 1.1-1.3（vs 空調 1.5-2.0）。流量穩定度直接影響 PUE：流量波動大 → 溫度控制需要過度冷卻 → 能耗浪費 10-15%。透過 ATLANTIS 壓力監測維持流量穩定（±2%），PUE 可進一步優化到 1.05-1.12，年度節能 NTD 200-500 萬。

Q16. 液冷系統換新液體時，需要停機多久？

正確做法：(1)透過壓力監測提早 1 周發現需要換液（SDPT-3100 趨勢預測）；(2)安排低流量時段（深夜）；(3)邊運行邊換液（部分迴路）；(4)換液過程監測壓力變化（DPS-2.5SPD3），異常立即停止。結果：停機時間 < 30 分鐘，或完全無停機（雙迴路配置）。無監測系統的被動做法：突發故障 → 應急停機 4-8 小時 → 損失 NTD 2.3-4.6 千萬。

Q17. 背板液冷管路彎曲度超標會影響流量嗎？怎麼偵測？

會，超標彎曲會增加管路阻力 10-30%，導致該線路流量下降。偵測方法：(1)在彎曲點前後各裝一個 DPTX 差壓計；(2)正常彎曲阻力 0.01-0.02 MPa；(3)若壓差 > 0.05 MPa = 彎曲角度過急或堵塞。解決方案：重新布線或增加管徑。ATLANTIS 差壓監測系統可提供精確的阻力分佈圖，優化管路設計。

Q18. 液冷系統能否集成到現有 BMS（Building Management System）？

可以。ATLANTIS SDPT-3100 支援 HART 通訊協議，可直接接入 BMS。數據格式：(1)壓力實時值 + 記錄；(2)溫度趨勢 + 警報；(3)流量計算值（基於壓力差）；(4)能耗推估。BMS 儀表板可同時監測空調系統 + 液冷系統 + 其他基礎設施，實現全機房統一管理。集成費用 NTD 50-100K（一次性），年度軟體維護 NTD 30K。

Q19. 液冷系統壓力監測的「精度要求」是多少？為什麼不能用普通壓力計？

液冷系統壓力 0.2-0.4 MPa（低壓），需要偵測 0.01 MPa 級別變動（精度 ±5%）。普通工業壓力計精度 ±1-2%，量程 0-1 MPa（相當於 0-2.5 倍滿量程的放大）。ATLANTIS DPS-2.5SPD3 特別設計 0-0.6 MPa 量程，精度 ±0.25%（比普通計好 8 倍）。低流量異常偵測精度差：普通計無法發現 5-10 毫升 / 小時的洩漏；DPS 可在 6-12 小時內發現。

Q20. AI 液冷機房運轉 5 年，需要更換的核心監測設備有哪些？

5 年更換清單：(1)DPS-2.5SPD3 壓力開關（3-4 年老化）= NTD 30K × 2 個；(2)DTT-P4 溫度傳送器（4-5 年精度漂移）= NTD 8K × 15 個；(3)傳感線圈（腐蝕老化）= NTD 10K；(4)校驗費 NTD 60K × 5 年。小計 NTD 300K。相比 5 年液冷系統維護費 NTD 2000-3000K，監測設備更新成本不到 15%。但這 15% 的投資防止的停機損失高達 NTD 2.8 億（5 年內平均 5 次停機事件）。

成功案例：從「18°C 溫差」到「±2°C 精控」

案例：某台灣 AI 推理中心

背景：500m² 機房，30 個機架背板液冷系統，月營運成本 NTD 2000 萬（推理服務）。

問題：GPU 溫度分佈不均（前排 18°C、後排 36°C），導致：

GPU 自動降頻 15-20%，推理延遲增加 18%
客戶投訴延遲過高，轉向競爭對手
液冷系統曾發生 2 次洩漏，每次停機 6 小時，虧損 NTD 3.4 千萬

ATLANTIS 解決方案：

安裝 30 × DPS-2.5SPD3（機架供液壓力監測）
安裝 30 × DPTX（冷板進出差壓監測）
安裝 60 × DTT-P4（供回液溫度）
1 × SDPT-3100 雲端平台（趨勢分析 + AI 預警）
總投資：NTD 2.03M

效果（導入後 6 個月）：

指標	導入前	導入後	改善幅度
機房溫差	18°C（前排 18°C、後排 36°C）	4°C（統一控制在 22°C ± 2°C）	↓ 78%
GPU 降頻	15-20% 頻繁降頻	0-2% 極少降頻	↓ 88%
推理延遲	平均 180ms（波動 ±32ms）	平均 152ms（波動 ±8ms）	↓ 16%（穩定性 ↑ 75%）
液冷故障次數	年 2 次大停機	0 次非計畫停機	↓ 100%
能耗	PUE 1.35	PUE 1.18	↓ 13%（年省 NTD 260 萬）
客戶滿意度	SLA 達成率 94%	SLA 達成率 99.8%	↑ 6.2%

財務效益（年度）：

停機損失避免：NTD 6.8 千萬（2 次停機 × NTD 3.4K/次）
能源節省：NTD 260 萬
客戶收入增加：NTD 1500 萬（SLA 改善帶來的新客戶）
小計：年度效益 NTD 8.56 億

投資回本時間： NTD 2.03M ÷ NTD 8.56 億 = 0.24 天（5.6 小時）

準備導入液冷流量監測系統？

ATLANTIS 提供免費現場評估與方案設計。告訴我們你的機房規模、液冷系統類型，我們為你規劃最適合的監測配置。

📍 台北總部

台北市北投區致遠一路二段 109 號

📞 聯絡電話：
(02) 2820-3405

📧 業務聯絡：
Ian（業務一部，分機 27）ian@atlantis.com.tw
Nori（業務二部，分機 16）nori@atlantis.com.tw

🕐 服務時間：週一至週五 8:30-18:00 | 24 小時緊急服務

昶特 ATLANTIS · 31 年工業儀表專業
「昶特設備不屈服不妥協」— Re-Atlantis 使命
重現理想文明的測量榮光

結語：流量穩定度決定 AI 液冷系統的未來

過去十年，數據中心冷卻的進步大多來自「硬體升級」（冷媒種類、泵浦效率）。但過去三年，最大的進步來自「監測技術」（壓力感測、AI 預測）。

ATLANTIS 的觀點很簡單：

「你不能改進你無法測量的東西。流量穩定度不是靠冷媒，而是靠精確的壓力監測 + 智能的預測警報。」

當 AI 機房從單純的「散熱」升級到「精密冷卻」時，監測系統從「可有可無」變成了「不可或缺」。而 ATLANTIS 的價值就在於：用最有效的工具（壓力計），在最關鍵的位置（泵浦、冷板進出口），以最經濟的成本（NTD 15K/點），保護最昂貴的資產（GPU 伺服器群）。

不讓一個 GPU 在不穩定的流量中運作。

這就是未來 AI 機房的標準。