近日,英特爾的Linux內核測試機器人發(fā)布了一項令人矚目的性能報告,指出主線Linux內核在特定測試中實現(xiàn)了驚人的3888.9%性能提升。
這一顯著進步得益于一項關鍵代碼提交,該提交針對內存管理進行了優(yōu)化,具體為“mm, mmap”部分的修改,限制了匿名映射的透明大頁面(THP)對齊至頁面中部目錄(PMD)對齊的大小。
測試在Intel Xeon Platinum(Cooper Lake)服務器上進行,使用了“will-it-scale.per_process_ops”可擴展性測試用例來驗證性能改進。結果表明,在特定條件下,系統(tǒng)性能得到了極大提升。
然而,這項改動并非全然無害,它同時也導致某些工作負載的性能出現(xiàn)下滑。例如,在某些平臺上運行的cactusBSSN基準測試顯示,性能下降了高達600%。分析發(fā)現(xiàn),這些測試創(chuàng)建了多個4632kB的映射,這些映射在優(yōu)化前能夠合并成更大的THP支持區(qū)域,而現(xiàn)在卻被分割成多個與PMD邊界對齊的小區(qū)域,由此產生的間隙導致了性能損失。
面對這一問題,英特爾已經提出了解決方案,即增加一個條件判斷,要求映射的大小必須是PMD大小的整數(shù)倍,而非僅僅是達到或超過PMD大小。這樣做可以有效避免odd-sized mapping的對齊問題,使其能夠自然合并,從而恢復甚至提升性能。
此次內核性能的大幅提升和優(yōu)化過程中發(fā)現(xiàn)的問題及解決方案,再次證明了開源社區(qū)和英特爾等企業(yè)在不斷推動Linux內核發(fā)展,以適應日益復雜的計算環(huán)境。
Copyright 2024 //www.ahlmtdl.com/ 版權所有 豫ICP備2021037741號-1 網(wǎng)站地圖