AI/雲端伺服器專用: 高精度、高可靠性 DDR5 記憶體電源解決方案
Kunhung Chen, Payne Lin, Frank Chang, Sophia Tong | AN093
隨著雲端運算、大數據及 AI 應用快速發展,伺服器記憶體電源面臨高精度、低雜訊、高可靠度及高能效等多重挑戰。立錡針對 DDR5 伺服器記憶體,推出一系列高整合電源管理 IC 解決方案,透過快速補償環路、智慧型電壓控制及多重保護機制,確保記憶體穩定運作並提升系統可靠性與能效。此系列解決方案不僅能提升整體電源效率與系統可靠度,同時協助客戶因應多元應用需求,推動伺服器產業升級。
1. 伺服器記憶體電源面臨的主要挑戰
隨著雲端運算、大數據分析及人工智慧等應用的快速發展,現代伺服器對於記憶體的需求不斷提升。記憶體模組的容量與速度持續增加,對電源供應的要求也隨之提高。伺服器記憶體電源在設計與應用上,主要面臨以下幾項挑戰:
1.1 低電壓容忍度架構下,仍需實現超高電壓精度與低雜訊輸出
高精度電壓供應是確保記憶體穩定運作的關鍵。記憶體模組對電壓的容忍度極低,任何微小的電壓波動都可能導致資料錯誤或系統不穩定。因此,電源必須具備極高的電壓調節精度與低雜訊特性。如下表為 DDR5 規範各組輸出電壓的精準度規格需求。
表格 1. 輸出電壓規格
|
VDD |
VDDQ |
VPP |
| Typical Output Voltage |
1.1V |
1.1V |
1.8V |
| DC + AC Tolerance |
+/-2.5% |
+/-2.5% |
+/-2.5% |
| DC Accuracy |
+/-0.75% |
+/-0.75% |
+/-0.75% |
註 1. 詳細規格請參閱參考資料:JESD301-5, PMIC5030 規範。
1.2 在熱插拔與瞬間過壓風險下,需確保長時間可靠運作
高可靠性是伺服器電源設計不可妥協的要求。伺服器通常需要長時間不間斷運作,任何電源故障都可能造成資料遺失或服務中斷,帶來巨大的經濟損失。因此,電源 IC 必須具備過壓/過流/過溫保護等多重防護機制以及元件必須有足夠
的過壓承受力,以確保系統長時間穩定運行。
在伺服器電源應用中,可能發生熱插拔的測試情境,由於伺服器記憶體模組同時需輸入高壓 12V 與低壓 3.3V 兩組電源,且記憶體模組金手指的設計可能導致這兩個電源插拔過程發生短路的現象,如圖 1 所示。此時,考驗電源管理 IC 元件的可靠性,必須具備足夠的過壓承受力以確保模組不會發生損毀。
圖1. RDIMM 金手指示意圖(VIN_BULK 與 VIN_MGMT 為相鄰 PIN)
1.3 高功率密度模組電源架構,仍需提升效率與熱管理穩定性
能效與熱管理也是重要挑戰。伺服器機房的能源消耗龐大,電源轉換效率的提升不僅能降低運營成本,也有助於減少碳排放。此外,隨著功率密度提升,如何有效管理熱能、避免過熱,也是設計時必須考量的重點。如圖 2 所示,在 DDR5 世代中,將電源管理 IC 放到記憶體模組上,有別於舊世代 DDR4 放在主機板上的作法,如此一來,提高整體電源的功率密度,效率提升與溫度監控變得更加重要。
圖 2. DDR5 RDIMM 記憶體模組
2. 立錡伺服器記憶體電源解決方案
針對前述在可靠性、電壓精度、能效與熱管理等多重設計挑戰,立錡提出了一系列的伺服器記憶體電源解決方案,從電路設計、元件選擇到系統整合應用測試,全面提升產品性能與可靠性。針對每一代 DDR5 伺服器記憶體規格需求,包括不同容量和傳輸速度,立錡均有提供對應且合適的電源解決方案,協助客戶因應不同的應用需求,整理如 表格 2 與 表格 3 所示。更多詳細產品規格,請參考立錡官網或諮詢區域業務。
表格 2. 立錡伺服器 DDR5 PMIC 解決方案系列
| Generation |
Server Low Current |
Server High Current |
Server Extreme Current |
Sever Extreme Current Gen2 |
| JEDEC Standard |
P5010 |
P5000 |
P5020 |
P5030 |
| Richtek Solution |
RTQ5119A |
RTQ5150A |
RTQ5152 |
RTQ5153 |
| Application |
RDIMM |
RDIMM, CXL MM |
RDIMM, MRDIMM, CXL MM |
RDIMM, MRDIMM, CXL MM |
| Generation |
Server Low Current |
Server High Current |
Server Extreme Current |
Sever Extreme Current Gen2 |
表格 3. 不同 DIMM 容量與傳輸速率對應的 DDR5 PMIC 應用表
| Card |
Config. |
DRAM Density |
DIMM Capacity |
DDR5 Transfer Rate (MT/s) |
| 4400 |
4800 |
5600 |
6400 |
7200 |
8000 |
>=8800 |
| RDIMM |
1Rx8 |
16 Gb |
16 GB |
RTQ5119A (P5010) |
RTQ5119A or RTQ5150A (P5010/5000) |
RTQ5152 (P5020) |
RTQ5153 (P5030) |
| 24 Gb |
24 GB |
| 32 Gb |
32 GB |
| 2Rx8 |
16 Gb |
32 GB |
| 24 Gb |
48 GB |
RTQ5150A (P5000) |
RTQ5150A or RTQ5152 (P5000/5020) |
| 32 Gb |
64 GB |
4Rx8 (DDP) |
16 Gb |
64 GB |
| 24 Gb |
96 GB |
| 32 Gb |
128 GB |
| 2Rx4 |
16 Gb |
64 GB |
| 24 Gb |
96 GB |
| 32 Gb |
128 GB |
4Rx4 (3DS, SDP or DDP) |
16 Gb |
128 GB |
RTQ5152 (P5020) |
| 24 Gb |
192 GB |
| 32 Gb |
256 GB |
8Rx4 (3DS) |
16 Gb |
256 GB |
| 24 Gb |
384 GB |
| 32 Gb |
512 GB |
| MRDIMM |
2Rx8 |
16 Gb |
32 GB |
RTQ5152 (P5020) MR - 8.8GT/s |
|
RTQ5153 (P5030) MR - 12.8GT/s and above |
|
| 24 Gb |
48 GB |
| 32 Gb |
64 GB |
| 4Rx8 |
16 Gb |
64 GB |
| 24 Gb |
96 GB |
| 32 Gb |
128 GB |
| 2Rx4 |
16 Gb |
64 GB |
| 24 Gb |
96 GB |
| 32 Gb |
128 GB |
4Rx4 (3DS, SDP or DDP) |
16 Gb |
128 GB |
| 24 Gb |
192 GB |
| 32 Gb |
256 GB |
3. 設計方案優勢
3.1 高精準、低雜訊電源控制架構
首先,在高精度電壓供應方面,立錡採用先進的 A2RCOT 電壓回饋控制技術,搭配高精度參考電壓源與低雜訊設計,確保輸出電壓誤差小於 ±0.75%。同時,透過內建補償與自動校正機制,有效抑制溫度漂移與負載變動對輸出電壓的影響,滿足記憶體模組對電源精度的嚴苛要求。以下分別針對溫度特性、負載調節與動態響應進行說明,更多 A2RCOT 電壓回饋控制技術資訊可參考產品規格書。
圖 3. A2RCOT 控制迴路
3.1.1 符合 JEDEC 標準的優異溫度補償特性
圖 4 至 圖 6 顯示立錡 RTQ5153 與主要競品在不同溫度環境下的輸出電壓特性比較。針對伺服器 DDR5 應用,電源管理 IC 的溫度穩定性至關重要,由於伺服器常需長時間運作於高溫或低溫等嚴苛環境,任何電壓波動都可能影響記憶體的資料完整性與系統穩定性。
RTQ5153 在 -20 度至 80 度溫度條件下,輸出電壓曲線始終維持高度穩定,波動幅度遠低於 JEDEC 標準規格要求,並且小於 ±0.75%。與其他競爭對手相比,RTQ5153 在高溫或低溫下的輸出電壓變化更小,展現出更優異的溫度穩定性。
|
|
|
|
圖 4. VDD(SWA/B/E) 輸出電壓與溫度變化
|
圖 5. VDDQ(SWC/F) 輸出電壓與溫度變化
|
|
|
|
|
圖 6. VPP(SWD) 輸出電壓與溫度變化
|
|
3.1.2 符合 JEDEC 標準的精準輸出電壓調節
圖 7 至 圖 9 為立錡 RTQ5153 與主要競品在不同負載條件下的輸出電壓特性比較。針對伺服器 DDR5 記憶體應用,電源管理 IC 必須能夠因應記憶體動態負載變化,持續提供穩定且精確的電壓輸出。若電壓波動過大,將可能導致資料傳輸錯誤、系統不穩定,甚至影響伺服器整體效能。
RTQ5153 在各種負載變化下,輸出電壓曲線展現出平滑且穩定的特性,波動幅度遠低於 JEDEC 標準規格要求,並且小於 ±0.75%,明顯優於其他競爭對手。
|
|
|
|
圖 7. VDD(SWA/B/E) 負載與輸出變化
|
圖 8. VDDQ(SWC/F) 負載與輸出變化
|
|
|
|
|
圖 9. VPP(SWD) 負載與輸出變化
|
|
3.1.3 快速即時的動態響應
立錡 DDR5 電源管理 IC 系列具備先進的電源控制技術,具有高電源穩定性。首先,其內建快速的補償環路,能夠即時偵測並回應負載的快速變動,顯著降低輸出電壓在負載突變時的跌落量,確保系統運作的穩定性與可靠性。此外,還搭載智慧型輸出電壓抗 overshoot 機制,當系統卸載時,控制環路能夠即時反應,主動關閉下橋,有效抑制輸出電壓的過高變動,避免因電壓 overshoot 導致的元件損壞或系統異常。表格 4 可以看到立錡與他廠競品的負載階躍(load step)比較,在不同測試條件下,皆表現優異。
表格 4. 立錡與競品的負載階躍比較
3.2 高可靠度、多重防護機制
在高可靠性設計上,立錡產品內建多重保護機制,包括過壓、過流、短路及過溫保護,如 圖 10 所示,確保在異常狀況下能即時反應並保護系統安全。此外,針對伺服器應用,立錡產品可提供更高的電源輸入腳位耐壓,解決記憶體模組插拔時可能發生的短路過壓問題,進一步提升系統的可用性與容錯能力。
圖 10. DDR5 PMIC 保護功能
3.2.1 輸入過壓及欠壓保護機制
系統需要輸入過壓與欠壓保護,是為在電源異常,例如浪湧、熱插拔尖峰、電池電量過低、和供電錯配時,避免元件過應力與功能失常,如圖 11 和 圖 12 所示。過壓可能造電容與 MOSFET 擊穿,欠壓則易引發 Brownout、資料讀寫
錯誤與反覆重啟等情形。
透過保護機制在異常狀況出現時,立即關閉後級 VR 並於相對的暫存器置位故障旗標,系統得以迅速進入安全狀態、執行診斷並在異常狀況排除後恢復正常狀態。此措施可提升可靠度與壽命、降低維修與保固成本,避免安全風險擴大並維持整體運作穩定。立錡產品在輸入過壓及欠壓保護皆有不同的設定準位,方便系統設計者規劃整體系統保護,詳細內容可參考各產品規格書。
|
|
|
|
圖 11. 輸入過壓保護
|
圖 12. 輸入欠壓保護
|
3.2.2 輸出過壓及欠壓保護機制
在系統上需要輸出過壓與欠壓保護,是為確保後級 DRAM 不被異常電壓損傷,並維持整體穩定運作,如圖 13 和圖 14 所示。輸出過壓可能導致元件擊穿與過熱,輸出欠壓則易造成資料讀寫錯誤與反覆重啟等問題。透過在輸出電
壓超出允許範圍時立即停止並透過撤銷 Power Good 上報故障,可快速進入安全狀態,避免故障擴散且便於診斷與恢復狀態,同時提升可靠度並滿足 DRAM 電壓範圍規格要求。立錡產品在輸出過壓及欠壓保護皆有不同的設定準位,方便系統設計者規劃整體系統保護,詳細內容可參考各產品之規格書。
|
|
|
|
圖 13. 輸出過壓保護
|
圖 14. 輸出欠壓保護
|
3.2.3 輸出過流保護機制
系統需要輸出過電流保護,是因為輸出端出現短路、負載過載或併載瞬間等情況會使輸出電流超出設計上限,導致 IC、電感、PCB 走線過熱受損,並引起電壓下陷、不穩定甚至安全風險。透過過電流保護機制如 圖 15 所示,在異常發生時進行限流,必要時立即關閉輸出並透過撤銷 Power Good 上報故障,可快速切斷能量,避免故障擴散,並與過熱保護與欠壓保護協同,實現受控恢復,且提升可靠度與壽命、滿足安規與品質要求、降低維修成本。立錡產品在輸出過流保護有不同的設定準位,方便系統設計者依照實際系統負載規劃相應之過流保護,詳細內容可參考各產品之規格書。
圖 15. 輸出過電流保護
3.2.4 符合 JEDEC 標準的 EOS 元件耐壓實測
EOS(Electrical Overstress)防護能力是確保產品可靠性的關鍵指標。在 DDR5 伺服器電源管理 IC 系列的兩個輸入端,依據 JEDEC 標準,分別進行 37V 與 10V 的脈衝電壓測試,模擬可能遭遇的瞬間高電壓情境,如 表格 5 所示。經過嚴格測試後,立錡產品不僅完全符合標準要求,且展現出更高的耐受度,能有效抵抗超出規範的電氣過應力事件。這代表在實際應用中,即使遇到異常電壓突波,立錡產品依然能維持穩定運作,為客戶提供更高的安全性與可靠性保障。
表格 5. Vin_Bulk 與 Vin_Mgmt 輸入 Pin EOS 測試結果
|
VIN_BULK Pin EOS 測試結果
|
VIN_MGMT Pin EOS 測試結果
|
|
|
|
|
|
|
3.3 高能效、良好熱管理
在伺服器 DDR5 記憶體應用中,電源管理 IC 的效率表現對系統能耗、散熱設計及運行成本具有決定性影響。針對能效與熱管理,立錡採用高效率同步整流技術,電源轉換效率可達 92% 以上,有效降低能耗與發熱量。同時,透過精
準 ADC 溫度監控與過溫保護機制,確保系統在高負載下仍能維持穩定運作與防止工作溫度超過元件可耐受極限,延長元件壽命並提升伺服器系統的可靠度。
立錡產品透過電路設計最佳化與製程技術提升,顯著提高電源轉換效率。根據以下 圖 16 至 圖 18 實測結果,立錡產品的效率不僅優於 JEDEC 標準規格,亦高於同級競品的平均水準。也就是在相同工作條件下,立錡產品能有效降低
伺服器的整體能耗,減少熱能產生,進一步降低散熱系統的設計壓力與能源支出。
|
|
|
|
圖 16. VDD(SWA/B/E) Efficiency
|
圖 17. VDDQ(SWC/F) Efficiency
|
|
|
|
|
圖 18. VPP(SWD) Efficiency
|
|
3.3.1 高溫警示回報機制
立錡產品在 DDR5 伺服器應用上具備高精度的溫度回報功能,能在溫度達到 85 度時自動啟動保護機制,確保系統安全運作。每一階段的溫度回報誤差均控制在 ±5 度以內,如 表格 6 所示,提供精確且可靠的溫度監控。這項特性不僅符合嚴格的規範要求,更大幅提升產品在各種應用環境下的安全性與穩定性。
表格 6. 溫度量測
| PMIC Ambient Temperature |
PMIC Temperature Measurement |
| 85°C |
85°C |
| 95°C |
96°C |
| 105°C |
106°C |
| 115°C |
117°C |
| 125°C |
127°C |
| 135°C |
138°C |
3.3.2 過溫保護機制
立錡產品內建過溫保護機制,當溫度超過 145°C 時,系統會即時啟動保護措施,關閉所有輸出電壓,如 圖 19 所示,並透過 Power Good 訊號精確上報故障狀態。此設計能有效防止因過熱造成的損壞,確保設備安全運作,同時讓使用者能及時掌握系統健康狀況,提升整體可靠性。
圖 19. 過溫保護
總結
立錡伺服器記憶體電源解決方案在電壓精度、動態響應、可靠度與效率等關鍵指標上,皆符合高階伺服器平台需求。透過高精度回授與快速補償架構,可在負載與溫度變化下維持穩定輸出,確保 DDR5 記憶體於高速運作時仍具足夠電源裕量,降低系統不穩定風險。
方案整合多重保護與狀態回報機制,提升平台容錯能力與長時間運作可靠度。高效率、低損耗設計可有效降低功耗與發熱,簡化散熱設計並改善系統能效。
所有方案皆符合 Intel 電源規範與 AVL 要求,並通過多家 DRAM 原廠系統驗證,可直接導入主流伺服器平台,縮短開發與驗證時程。
立錡結合電源管理核心技術與伺服器平台經驗,持續優化架構與設計,提供具競爭力的記憶體電源解決方案,並透過持續研發與夥伴合作,推動伺服器平台效能與可靠度的提升。
若要獲得更多產品的產品資訊,請訂閱我們的電子報。