創作內容

10 GP

計算機系統未來的瓶頸?(更新1)

作者:垂暮龍-青月(動物朋友│2019-06-18 02:13:56│巴幣:566│人氣:498
雖然以前一堆文章後續都沒補起來,但還是先來開一篇來聊?

但幾乎..或未曾見過有人來小屋聊...可能等於是個無聊的紀錄吧?









隨著平行計算越來越多,多核心或是大規模的計算,如GPU和AI等都開始受限和複雜化架構了。

必須設計出越複雜的快取階層和強化的設計。

然而不管怎麼做,記憶體牆(memory wall)終究得到來。(打錯成well)

就算有強大的技術和定律去豁免了延遲對計算的限制,也依然存在著其他限制。

容量和延遲或頻寬不可兼得。

必須透過一層層的設計,範圍本身和範圍之間的映射來完成高速的通路。

然而控制器再強大再怎麼利用順序讀寫,依然會有不可以快取到的部分。

如果一個應用程式99%負載在快取上被重用,剩下1%也堪稱洪流。

如果5000GB/s被計算,剩下1%沒命中要向外存取就得高達50GB/s。

但是記憶體的成長趕不上CPU的SIMD拓寬和核心數增長,雖然快取系統越來越強大,但是重複利用的技術上的紅利也在消失,遲早抵達極限,耗費更多面積將是無意義的事情。(不是指令級或位級平行)

DDR4從2013年出來到2020年差不多增長兩倍速度(靠技術改進時脈)

8年成長1倍(2133->4266),計算成每年成長率(2^(1/8))=1.09050773267

等於每年成長9%的速度...(或許有人說CPU成長速度沒這麼高)

但如果考慮SIMD完全利用與多核心,比如影片轉檔可能就會受限制了。

如果遊戲持續改進而利用計算密集性,也會隨之而來需要大量搬遷,導致頻寬需求大幅上升。(假設重複利用率不變或是單一資料量相應的計算量不變,計算量越多則存取資料越多)

雖然說CPU核心翻倍成本比翻倍略高些,但從成長上來說,核心數與面積接近線性。

而記憶體卻不能這樣做,還得成長容量,所以導致頻寬增長緩慢。

比起CPU來說GPU更容易翻倍來增長市場的利益。

你翻倍GPU規模可能只需要兩年左右,但是記憶體兩年翻倍??非常困難

如果想要輕易擴充,就需要提高位寬,不管是否片上快取都會使控制器越來越複雜。

最後整個平台的成長不是趨於緩慢就是價格高昂了。

先這樣吧...看看有沒有人想了解。

___________________

為什麼問題會越來越嚴峻呢?追根究柢是因為要隨機存取。

而隨機存取相比順序讀取的分發來說,問題複雜多了,怎麼解決問題都得把問題提前到相當前面去解決,利用演算法去分解出關係,最後生成順序可管線化的指令吞吐出去運作。

這也是為什麼會使得目標計算機架構比以前複雜很多的根本,從記憶體模型下手會發覺很多設計都是最佳化的操作,來壓縮成本。

隨機存取操作在共享地址情況下(不共享就無法一起工作),地址一定會發生碰撞。而順序存取則是良好的一條線,輕易用簡單的位移或是加減法就可以切成N等分,彼此之間不交互。

規模越大,問題就越嚴重,必須得刷新越靠近記憶體控制的部分,而龐大的頁表一更新造成的功耗也就越大,而功耗不大的結果就是緩慢。

只能在功耗和速度中選擇一個。

更新部分包含內容和標籤,標籤設計複雜也比不上內容的量,但也不能太複雜。

如果命中成功,標籤內容可以不更新,維持在低功耗狀態,但命中失敗兩者全更新,功耗就會增加。

所以必須設計出良好權衡,甚至前級就開始對標籤切取部分。

如果標籤中是一個一致位址的標示,那麼越大範圍越前面,影響的機會大也影響的多。(如果後面部分或著是小區塊部分都設計好了)

就會提取出來做管理排程或稱調度,作出優先級來替換。

可是設計複雜也只是緩解問題,不是所有操作都可以預期到,從98->99%比99->100%簡單太多了。

一個有效且等於現實問題縮放的模型,並不能夠通用的存在。

雖然沒有準確的模型存在,只能有統計模型去發覺幕律分佈的問題,或許有優秀的技術能夠持續緩解,但極限還是會到來。

在Server上,已經是大規模擴展多通道的設計,伺服器昂貴並不僅僅是因為需要二十四小時工作,可擴充性這些超前設計應用早已在高價值領域應用上了。

為了高速與可靠性,大量花費金錢購買記憶體進行擴充資料中心不是新聞了。若從服務系統上來看,選擇配置記憶體的成本,是絲毫不下於CPU+其他部分的。

對於這種通訊瓶頸和擴充的高代價,是因為技術持續進步而延緩,早在很久以前就發生過,只是想了許多壓縮技術和取捨硬是支撐了下來。

未來如果我們必須要繞過瓶頸,下放高級技術是很可大的可能,而多通道技術或控制器(PCIE)已經驗證多年的可用,目前3D的IC可用性還有不少時間才能完成,雖然過去5年可能不斷有新聞激勵,但產品終究沒辦法在市場上發芽。

在未來CPU可能不再是主角了,因為陷入瓶頸,過去所有轉移整合來承擔的責任可能必須傳統化的分散回去,否則可擴充和繼續提升的限制會如同高牆一樣,無法逾越。
引用網址:https://home.gamer.com.tw/TrackBack.php?sn=4430844
All rights reserved. 版權所有,保留一切權利

相關創作

留言共 3 篇留言

♙♲⚙\~O_O~/⚙♲♙
突然覺得我沒念好資工系

06-18 14:56

垂暮龍-青月(動物朋友
[e15]沒有吧...只是沒教而已06-18 15:54
alice
有沒有一種確切研究靈魂或自我意識是什麼 有什麼必須得這些才辦得到的 不是靠感覺而是觀測實驗?


有阿 要教你嗎 需要長時間喔 只教你基本

09-19 13:11

垂暮龍-青月(動物朋友
你在這裡回覆不覺得怪怪的嗎09-19 13:12
alice
恩阿 空間不夠阿

附歌喔
https://youtu.be/uMq2RRz0BEk

09-19 13:13

我要留言提醒:您尚未登入,請先登入再留言

10喜歡★digong94 可決定是否刪除您的留言,請勿發表違反站規文字。

前一篇:簡單談談...平行化限制... 後一篇:為什麼GPU越來越複雜?...

追蹤私訊切換新版閱覽

作品資料夾

Lobster0627全體巴友
大家可以多多來我的YT頻道看看哦(*´∀`)~♥https://www.youtube.com/@lobstersandwich看更多我要大聲說昨天15:59


face基於日前微軟官方表示 Internet Explorer 不再支援新的網路標準,可能無法使用新的應用程式來呈現網站內容,在瀏覽器支援度及網站安全性的雙重考量下,為了讓巴友們有更好的使用體驗,巴哈姆特即將於 2019年9月2日 停止支援 Internet Explorer 瀏覽器的頁面呈現和功能。
屆時建議您使用下述瀏覽器來瀏覽巴哈姆特:
。Google Chrome(推薦)
。Mozilla Firefox
。Microsoft Edge(Windows10以上的作業系統版本才可使用)

face我們了解您不想看到廣告的心情⋯ 若您願意支持巴哈姆特永續經營,請將 gamer.com.tw 加入廣告阻擋工具的白名單中,謝謝 !【教學】