隨著大數據和人工智慧技術的迅速發展,對儲存解決方案的需求持續增加,尤其是以AI為核心的創新技術,對儲存容量和耐用性提出了更嚴苛的要求。
為了應對這些挑戰,慧榮科技在2024 OCP Global Summit分享了最新的研究成果。慧榮科技SSD韌體架構師David Wang參與了靈活資料放置(Flexible Data Placement; FDP)討論小組,並發表了『人工智慧應用中,高容量QLC SSD導入FDP所面臨的挑戰』的演講,深入探討相關技術應用。」
QLC以其大容量和高能效比等特點,成為目前讀取密集應用場景中的重要選擇。然而,在AI伺服器中,資料處理過程包括資料採集、準備、訓練及推理等步驟。在這一流程中,存取類型多樣化(如順序讀寫與隨機存取)、操作複雜(讀取、寫入、更新),存取資料大小不一(小塊資料與大型檔案混合),並且具有併發性等特徵。
「正因如此,儘管QLC SSD在讀取密集應用場景中表現出色,但在AI伺服器中卻面臨以下挑戰:
- 性能下降:當寫入操作頻繁時,QLC SSD容易出現較高的寫入放大係數(WAF),從而導致IOPS和吞吐量下降。
- 耐用性不足:QLC NAND快閃記憶體的PE cycle通常較低,這使得磁碟每日寫入量(DWPD)減少,影響了SSD的整體壽命。
為了解決上述問題,慧榮科技採用靈活資料放置技術(Flexible Data Placement, FDP),作為提升QLC SSD性能與耐用度的理想解決方案。
根據慧榮科技的實測數據,基於MonTitan™ 16TB PCIe Gen5 QLC SSD,採用FDP技術方案可以帶來以下優勢:
- 降低寫入放大係數(WAF)FDP技術能顯著減少不必要的寫入操作,從而大幅降低WAF。測試數據顯示,啟用FDP後,WAF從5.5降至1,同時IOPS從120K提升至725K。
- 改善磁碟每日寫入量(DWPD)同樣地,FDP 有助於提升DWPD。在特定條件下,SSD的DWPD可達到 0.96。
- 最大化性能,最小化負面影響FDP不僅提升了性能指標,還減少了低PE週期QLC NAND對整體性能的負面影響,確保長期穩定運行。
從上述圖表可以看出,具備 FDP 的 SSD,不僅在 WAF 方面低於未使用 FDP 的 SSD,還展現了寫入吞吐量的提升。降低的 WAF 表示資料管理更加高效,減少了資料重寫的需求,進而提升了 SSD 的耐用性和性能。寫入吞吐量的增加顯示出 FDP 能夠加快資料寫入速度,讓 QLC SSD 更適合用於寫入密集型應用,同時延長其壽命。
考量到現代資料中心對高效能儲存解決方案的需求,特別是在支援AI訓練和推理的環境中,慧榮科技提出了以下幾個設計重點以確保最佳用戶體驗:
減少DRAM使用以控制成本
- 採用可配置的IU(Indirection Unit)設計,如16K IU適用於大容量驅動器。
- 利用硬體輔助的位元打包L2P條目進一步節省L2P表空間: 例如,使用33位元條目(而非40 位元)來定址8G IU,可以進一步將L2P 表的大小縮減至17.5%。
- 減少大IU上小型寫入導致的WAF: 支援4K IU的RUH和16K IU的RUH。應用程式可將小規模寫入操作放置在4K IU的RUH上,以降低寫入放大。
多命名空間下的QoS和性能一致性
透過慧榮科技獨有的PerformaShape™技術,調整每個命名空間的讀寫性能,降低因為noise neighbor和資源競爭造成的租戶間性能不穩定問題。
實際測試顯示,啟用PerformaShap技術後,讀取和寫入的一致性分別提升了 21%和31%。
隨著這項創新方案的廣泛應用,我們相信,未來的資料中心將變得更加高效且更具成本效益,以因應資料量快速成長的需求。慧榮科技將持續致力於推動儲存技術的進步,為各行各業提供更強大的資料處理能力。
聯絡我們