色哟哟视频在线观看-色哟哟视频在线-色哟哟欧美15最新在线-色哟哟免费在线观看-国产l精品国产亚洲区在线观看-国产l精品国产亚洲区久久

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

預言未來今后的多核CPU是什么?

電子工程師 ? 來源:網(wǎng)絡整理 ? 作者:佚名 ? 2021-03-24 16:55 ? 次閱讀

隨著莫爾定律的發(fā)展,IC設計者發(fā)現(xiàn)他們有許多硅,這些真實的資產(chǎn)來繼續(xù)發(fā)展。David Chisnall有些他們要去嘗試的冒險想法。

預言未來

明確的預言未來的技術是非常容易的,這東西將會變得更小,更快,更便宜。這將會在幾個世紀里實現(xiàn)并且不大可能發(fā)生改變——至少到我們開車跑起來不加油的時候。這會變得更有趣,并且我們預計未來一些東西會變得更復雜。

一些受雇于未來主義者的人僅僅是盡量預測一些東西,和提起語言正在發(fā)生的人們,不久他們就忽略了一些正確的受爭議的預測。這些接近工作有個限度,但是它不是非常有趣。

在計算機世界里一項好的技術看的是在大型計算機和超級計算機工作組上會發(fā)生什么和預測同樣的排序運算在個人電腦領域會產(chǎn)生怎樣的效果。當我在參加一個IBM 工程師關于他公司的新虛擬化技術的討論時,這條規(guī)則對于像我開車回家。他談論到他的公司有項優(yōu)勢是其他人的工作領域所沒有的:不論什么時候他們被難住,他 們會獨自去大廳的超級計算機設備那里去詢問如何解決同樣的問題在幾十年前。

這種方法在未來是很好的指導:這些東西通常降下來,從低到高的消費階層。

另一種趨勢是昂貴高端的變得越來越小。SGI的錯誤是沒有預料到這是正確的。大概10年前,SGI是一個生產(chǎn)高端昂貴圖形硬件的公司。他們一直保持這種定 位;他們最后的硬件允許一些GPU共享同一個存儲器因此緊緊的結(jié)合在一起工作。不同的是現(xiàn)在NVIDIA生產(chǎn)GPU。很多來自NVIDIA的人從前是在 SGI工作的,但是他們的管理部門不想讓他們生產(chǎn)消費級別的圖形加速設備,直到它能夠和高端昂貴的硬件相媲美時。這些人們繼續(xù)在自己的公司中,和現(xiàn)在他們 擁有20%的重要市場份額大于與SGI競爭的整個市場份額。更糟的是SGI的前途,一些十年前想要生產(chǎn)高端昂貴硬件的人們現(xiàn)在到了僅僅能夠擔負起消費稅的 地步。新使用高端昂貴設備的經(jīng)常會改變,但是最終消費部門追上。

這個階段的成就

雙核CPU第一次被商用領域的IBM制造出來的POWER4在幾年之前。這個主意簡單是:一些大型機器有許多CPU,如果把他們放在一個CPU中可以減少他們實際上的體積。

那些天,IntelAMD跳躍到雙核潮流上,它們的競爭朝向多核甚至更高。這是一個必然的開發(fā)環(huán)境,相應的到摩爾定律——其中一個重大的觀察錯誤會在計算 中。莫爾定律的成立是在CPU中晶體管的數(shù)量每增加一倍需要12-24個月。(這個精確的周期有時變化,取決于你什么時候問戈登?摩爾,但是它通常報出是 18個月。)如果你想花費更多錢,你可以增加更多的晶體管;舉個例子,Extreme Edition的Pentium系列把這些放在了更多緩存上。這個問題變成了他們增加了多于的晶體管。Pentium 2,1997發(fā)售,用了7.5億晶體管。Itanium 2,2004年發(fā)售,用了592億晶體管。它們大部分是緩存。CPU中加入緩存是好的,是一個增加晶體管的簡單方法,緩存很簡單,增加一些只是比芯片設計 的復制粘貼單元快了一些時間。不幸的是它開始減小,并且直接快速返回。一次全部工作進程轉(zhuǎn)載入緩存,加入一些規(guī)則沒用好處。

另一種手法是加入更多 核心,看最后的兩個CPU的晶體管個數(shù),我們看到2004年有必要生產(chǎn)80核心的Pentium 2。在十年前,它是節(jié)約的,可執(zhí)行的方案來生產(chǎn)5000個P6核心。不幸的是,電源設備僅僅可以提供一個芯片的,這意味著需要它單獨的供電設備。沒用提到 靠液氮來冷卻它提供一個穩(wěn)定的支持。這看起來盡管像存儲器技術只會在這個它們可以保存部分提供的數(shù)據(jù)的時期,每個都有自己的總線,但是你不能最低限度的使 用1000根針腳——64000跟為64位內(nèi)存總線。甚至設計他們封裝在一個芯片上分布象征一個工程挑戰(zhàn);設計主板將要鏈接存儲器通道和內(nèi)存bank是個 問題,這會給大部分PCB設計者重復的惡夢。

從芯片上拋棄一些緩存工作變慢了點。從芯片上跑多一些核心變得更慢。終于,不管怎么樣,聰明的解決方法將會出現(xiàn)的。

RISC相對于CISC

其中一次大辯論在上世紀80年代和90年代中是否RISC或者CISC指令接近的部分設計是否正確。這個主意在RISC之后提供了個簡單的指令用在平臺的復雜計算上,很快人們需要復雜指令的CISC為了他們自己的需要。

具體化的CISC設計是VAX,寫VAX匯編和寫高級代碼沒用太大不同。在稍后的VAX系統(tǒng)中,一些指令是微代碼,這些意味著分解在簡單些的真是指令后就是 在實際硬件上運行的。在VAX后,Digital發(fā)明了Alpha,這芯片相對的出色。Alpha有一個微指令集,但是運行的異常快。在幾年里,它是可以 買到的最快的微處理器。甚至到現(xiàn)在,500強計算機中還有一些基于Alpha的,一個不好的事實是這種芯片不會在現(xiàn)今的開發(fā)環(huán)境中超過五年。

在早些年,RISC做到很好。編譯器編寫者喜歡這種芯片;它可以簡單明白指令集,和它在構(gòu)建RISC指令集上比在CISC上更簡單的了解復雜語言。

第一個問題在RISC上的原理變得明顯改善在操作部分。早期RISC芯片沒有除法指令;一些甚至不能有乘法指令。相反的,他們創(chuàng)建了一連串的超過早期的指 令,像變換操作。這不是一個軟件開發(fā)問題;他們會僅復制一連串的指令以在機器結(jié)構(gòu)內(nèi)部完成除法,放一個宏指令在某些地方,用它像我們有一個除法指令時。這 樣一些人找到一個高效的方法使用除法。下一代CPU的除法指令執(zhí)行操作在幾個循環(huán)中,直到那些循環(huán)外部的數(shù)據(jù)執(zhí)行一系列的數(shù)據(jù)用起來像個代替品。這帶到更 遠的一步是Intel最后一代核心的微代碼結(jié)構(gòu)。一些連續(xù)的簡單的x86操作現(xiàn)在是一個簡單的指令集合。

RISC原理的一些部分繼續(xù)存在。它一直 廣泛的被關注像是一個好主意在指令集的正交上,舉個例子,因為提供乘法運算的方法做一件事是在浪費硅晶體。不管怎樣,簡單指令集的方法被列出。甚至現(xiàn)在的 PowerPC和SPARC芯片是占有了占有市場像RISC處理器一樣沒能意識到那些RISC創(chuàng)造的周期。

SIMD和更多

后來一個相對普通的特點在高性能計算機領 域,Pentium MMX是第一個x86芯片加入單指令多數(shù)據(jù)流(SIMD)指令集。這些指令精確列舉他們的建議,提供一種方法執(zhí)行同樣的數(shù)據(jù)乘法操作。稍后傳統(tǒng)(數(shù)量)指 令回去掉從另一處來的數(shù)據(jù),SIMD對應的能去掉四個數(shù)據(jù)從四個數(shù)據(jù)中,執(zhí)行同樣的操作在四次輸入上。這種運算用在許多圖片和視頻程序上。

SIMD 指令加入CPU是相對便宜的,提供一個好的回報在投入上。如果你的進程消耗你10%的CPU你要升級,你不太可能注意到這現(xiàn)在僅僅花費5%。有過你有個進 程占用了100%的CPU,你會很幸運的注意到,如果原來需要10分鐘運行的程序現(xiàn)在需要2分鐘。許多應用SIMD的好處是從SIMD到后面的類型——運 行用了大量CPU能源——因此允許它們運行的更快提供一個可察覺的改善。

超過SIMD,一些進程有合適的指令進行特定運算。VIA的C3,舉個例 子,有些指令專門用于為AES加密運算加速。C7加入了一些為SHA-1和SHA-256哈希運算的加速。像圖形,關于密碼的計算典型的基于CPU。他們 像是更加重要在將來,像這樣的數(shù)據(jù)發(fā)送到網(wǎng)絡,更多的機器和移動設備上。這不是罕見的在偷竊時查看為一個便攜電腦硬件所進行的AES加密運算;加快AES 運算在機器上用磁盤做更快。硬件加速密碼破譯不是新的。一些公司生產(chǎn)PCI卡形式的密碼加速器。

圖形處理單元(GPU)

后來只有一些電腦有一個專用的密碼加速卡,大部分有個圖形處理器。每代GPU越來越相同。這些天,GPU用在很多高性能計算機應用中,因為GPU有龐大的計算能力。在效果上,GPU時個超標量流頂點處理器,它并行處理一些SIMD指令流在很快。

在設計上,GPU和Pentium 4有許多相同的地方。他們都用了超長管線允許他們一次使用許多指令。他們執(zhí)行起來很糟糕如果其中一個管線預報了錯誤。這是Pentium 4的一個問題直到這個支流被發(fā)現(xiàn),平均大約每7個指令。它對于GPU不是大問題,這樣的設計時為了執(zhí)行特殊運算,不會陷入更多的錯誤分歧中。

現(xiàn)在 的環(huán)境在PC世界中很像20年前。回到那時,電腦有幾個處理器時不尋常的,一個時我們?yōu)槭裁匆凶龅闹醒胩幚砥鳎–PU)。CPU的一般目的時計算和協(xié)調(diào) 與其他CPU的活動。通常,工作站和高端昂貴PC有一個浮點處理器(FPU)進行浮點運算。始于80486,F(xiàn)PU同CPU在相同的領域消失了。另外的普 通加法運算時內(nèi)存管理單元。這個單元控制物理和虛擬內(nèi)存之間的轉(zhuǎn)換;那些日子里,你很難找到CPU里沒用MMU單元的。一個現(xiàn)代電腦有一個CPU和并行的 浮點運算器。它不需要很大的飛躍來想象Intel最終要把一個或兩個GPU核心加入CPU中。

在這點上,你或許想這是可能升級的范圍,因此它值得 向后退一步看CPU的發(fā)展。2005年,蘋果的便攜式電腦首次銷量上超過了臺式電腦。這依然在工業(yè)上跟隨。這個增長范圍在移動GPU的銷量上大大超過了在 桌面GPU上的銷量,Intel在CPU和GPU市場時最大的玩家。很少的人升級他們的GPU在便攜式電腦上。

浮點處理器,內(nèi)存控制單元和 頂點處理器已經(jīng)準備加入現(xiàn)代的處理器中。數(shù)字信號處理單元(DSP)已經(jīng)加入了一部分數(shù)量的處理器中,它們像是他們將要發(fā)現(xiàn)他們的方法不久在消費者的 CPU中。第一次用到附加的晶體管時加入了許多執(zhí)行單元,制造深流水線和更寬的超標量結(jié)構(gòu),和更多的緩存。現(xiàn)在我們加入整個同種的處理單元。盡管只有一些 級別透過范圍。這一步從單核到雙核是巨大的改善;在我的電腦的一個CPU上分配75%的CPU資源是少有的,更多普通的將要分配50%,將要在停止共享和 其他程序或核心之間。

從雙核到四核將會是一個非常小的改善,單仍有意義。當年升級到32核或64核,事情就變得有趣了。它經(jīng)常是必須的寫線程代碼 在某些程度上并且使用起來不能有很多漏洞。這些應用一個異步信息很容易,接近于穿過,但是流行的桌面開發(fā)環(huán)境API沒有設計圍繞這個模式。在實際上,很少 的桌面軟件用到這些。一些例如,視頻編輯。舉例子,能吃掉不少拋出的像你將來預料到的CPU資源。已經(jīng)收縮的高端性能將會繼續(xù)。那些日子里,一些人主意到 1GHz Athlon和3GHz Core 2 Duo的區(qū)別在絕大多數(shù)時候。一些人需要最快的電腦可買到的已經(jīng)相當小。需要中檔速度機器的人的數(shù)量將要收縮。

移動計算和精確數(shù)據(jù)中心的繼續(xù)增長,電的消耗變得更加重要。猜想一個32核CPU允許你關閉核心當你不使用它的時候。在移動領域,你大概最好需要2到3個核心。

不同類型核心的CPU

如果你只有一少部分核心在你的進程上,你就開始驚嘆為什么它們存在。少數(shù)應用程序需要所有核心為了加快運行速度在專門的硬件上,因此我們用什么代替它?

我們開始看這個將要形成的趨勢。例子包含了蘋果的Core視頻;它將會運行在你的CPU上如果你需要,它有在CPU的頂點單元如果有,或者GPU需要更快。 OpenSSL將會運行在密碼加速卡上如果它存在,或者運行在CPU上如果它沒有。存在于普通運算的抽象接口是一種功能使它更加容易在硬件上執(zhí)行;只有一 些小的變化是必須使用一些功能的優(yōu)勢。我們看到OpenGL上的一些相同的東西;頂點變換和光線運算在圖形硬件上必須有個新驅(qū)動要寫,但是不能修改現(xiàn)行的 應用代碼。最重要的,專用的硅制造的硬件的效率比一般用途的硬件效率高在未來的工作上,電能的消耗像是更少。

如果讓硅進入太空,為什么沒有讓一個 CPU進入死亡?一個密碼加速器呢?專用硬件在其它昂貴的邏輯計算上如何?當他們不用時,你可以關閉他們。當年需要時,他們將會占用一點能源允許同樣的計 算在普通硬件上,第一步這里整合了FPU和SIMD單元。下一步將要像整合GPU那樣在一起。超越這些,它好像關系到大多數(shù)專用硬件的優(yōu)勢。在一些實例 上,我們將會簡單的看到擴展的基本指令集(像發(fā)生在浮點和SIMD指令的)提供運算一些在邏輯上的傳統(tǒng)運算。終于,我們看起來像是那些引申的超過單指令。

我看起來有個主意是封裝到FPGA中像是十分動人的。這將允許許多靈活的運算,但是像一個有意義的能源消耗。

責任編輯:lq6

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51090

    瀏覽量

    425972
  • 雙核cpu
    +關注

    關注

    0

    文章

    5

    瀏覽量

    7804
  • 晶體管
    +關注

    關注

    77

    文章

    9734

    瀏覽量

    138672
  • 浮點處理器
    +關注

    關注

    0

    文章

    6

    瀏覽量

    7697
收藏 人收藏

    評論

    相關推薦

    FPGA+GPU+CPU國產(chǎn)化人工智能平臺

    平臺采用國產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPUCPU+FPGA等組合模式,形成低功耗、高可擴展性的硬件系統(tǒng),結(jié)合使用場景靈
    的頭像 發(fā)表于 01-07 16:42 ?302次閱讀
    FPGA+GPU+<b class='flag-5'>CPU</b>國產(chǎn)化人工智能平臺

    嵌入式系統(tǒng)的未來趨勢有哪些?

    智能家居領域,嵌入式系統(tǒng)可以集成語音識別和自然語言處理技術,去實現(xiàn)智能家電的語音控制。 2. 更強大的處理能力 在未來的嵌入式系統(tǒng)將具備更加強大的處理能力,以滿足日益變得復雜的計算需求。這包括采用多核
    發(fā)表于 09-12 15:42

    CPU單核性能與多核性能的區(qū)別

    CPU的單核性能與多核性能在多個方面存在顯著的差異,這些差異主要體現(xiàn)在處理能力、應用場景、性能瓶頸以及技術發(fā)展等方面。以下是對兩者區(qū)別的詳細探討。
    的頭像 發(fā)表于 09-02 14:42 ?7652次閱讀

    多核CPU的優(yōu)勢是什么

    多核CPU(Central Processing Unit,中央處理器)作為現(xiàn)代計算機技術的重要里程碑,其優(yōu)勢在于顯著提升了計算性能、多任務處理能力、系統(tǒng)穩(wěn)定性以及能效比等多個方面。以下將詳細闡述多核
    的頭像 發(fā)表于 08-22 14:30 ?3107次閱讀

    針對特定內(nèi)核使用PFlash,是否會影響多核應用程序的性能?

    根據(jù)AURIX TC3xx 系列用戶手冊第一部分(infineon.com)表 71,從本地內(nèi)核 PFlash 獲取指令所需的 CPU 周期比其他內(nèi)核快。因此,根據(jù)我的理解,映射到內(nèi)核 0 的運行
    發(fā)表于 07-04 06:04

    TC2XX/3XX多核斷點設置無效的原因?

    TC2XX/3XX多核斷點設置無效,請問hinghtec的多核要怎么才能被觸發(fā),(函數(shù)已經(jīng)執(zhí)行,但是斷點沒有被觸發(fā))或者如何才能進行多核調(diào)試。
    發(fā)表于 07-03 07:33

    一文解析嵌入式多核異構(gòu)方案,東勝物聯(lián)RK3588多核異構(gòu)核心板系列一覽

    嵌入式智能系統(tǒng)更離不開兼顧強實時和高算力的異構(gòu)多核國產(chǎn)智能芯片和國產(chǎn)基礎軟件。工業(yè)智能系統(tǒng)對基于智能芯片上的混合關鍵系統(tǒng)的需求尤為強勁。混合關鍵性系統(tǒng)是嵌入式系統(tǒng)未來
    的頭像 發(fā)表于 06-17 15:45 ?2318次閱讀
    一文解析嵌入式<b class='flag-5'>多核</b>異構(gòu)方案,東勝物聯(lián)RK3588<b class='flag-5'>多核</b>異構(gòu)核心板系列一覽

    求助,關于ESP32多核使用問題求解答

    關于esp32的多核使用,除了使用xTaskCreatePinnedToCore函數(shù)來控制線程跑的核心外能否有其他的實現(xiàn)比如: 現(xiàn)在有兩個bin文件,每個核心同時跑不同的bin文件,這種是否能夠?qū)崿F(xiàn)。
    發(fā)表于 06-17 06:28

    TC3x多核使用與TC2x多核使用相比是否有任何限制?

    大家好,TC3x 多核使用與 TC2x 多核使用相比是否有任何限制? 舉例說明:TC3x 是否不允許在不同內(nèi)核運行的代碼之間進行多內(nèi)核共享數(shù)據(jù)交換?
    發(fā)表于 05-22 07:32

    risc-v多核芯片在AI方面的應用

    RISC-V多核芯片在AI方面的應用主要體現(xiàn)在其低功耗、低成本、靈活可擴展以及能夠更好地適應AI算法的不同需求等特點上。 首先,RISC-V適合用于高效設計實現(xiàn),其內(nèi)核面積更小,功耗更低,使得它能
    發(fā)表于 04-28 09:20

    龍芯:自主研發(fā)CPU提升性能,單核通用性能提高20倍

    張戈強調(diào),龍芯CPU的主要IP核均為自主研發(fā),這使得其性價比得到顯著提升。他指出,國產(chǎn)CPU與主流CPU的差距主要體現(xiàn)在單核性能上,而非多核性能。近年來,龍芯
    的頭像 發(fā)表于 04-25 15:26 ?847次閱讀

    多核異構(gòu)通信框架(RPMsg-Lite)

    概要 隨著科技的飛速發(fā)展,計算需求日益復雜和多樣化,傳統(tǒng)的單核處理器已難以滿足所有應用場景的需求。在這樣的背景下,異構(gòu)多核系統(tǒng)應運而生,成為推動計算領域進步的重要力量。異構(gòu)多核系統(tǒng)不僅提高了計算效率
    的頭像 發(fā)表于 03-08 18:20 ?5945次閱讀
    <b class='flag-5'>多核</b>異構(gòu)通信框架(RPMsg-Lite)

    什么是多核多線程?多核多線程如何提高程序的運行效率?

    單線程無法充分利用多核處理器的并行計算能力。
    的頭像 發(fā)表于 02-20 10:22 ?1453次閱讀

    TC397A如何多核調(diào)試?

    TC397的開發(fā)板,想試一下多核調(diào)試,請問有相關歷程或者文檔嗎,現(xiàn)在都默認一個核在跑
    發(fā)表于 02-19 08:08

    使用TCPWM信道同時使用兩個內(nèi)核CM7_0和CM7_1并生成中斷,如何在多核CPU中配置TCPWM?

    我正在尋找一些例子: 使用 TCPWM 信道同時使用兩個內(nèi)核 CM7_0 和 CM7_1 并生成中斷,如何在多核 CPU 中配置 TCPWM?
    發(fā)表于 01-30 06:46
    主站蜘蛛池模板: 永久adc视频年龄确认| 亚洲一区免费在线观看| 毛片内射久久久一区| 含羞草传媒在线观看| 国产精品久久久久a影院| jiizzyou欧美喷液| 99国产精品久久人妻| 91福利在线观看| 67194成在线观看免费| 2021自产拍在线观看视频| 长篇高h肉爽文丝袜| 伊人精品在线| 亚洲最大日夜无码中文字幕| 亚洲精品有码在线观看| 亚洲精品久久国产高清| 亚洲99精品A片久久久久久| 脱jk裙的美女露小内内无遮挡| 一级做a爰片久久毛片一| 亚洲精品一区三区三区在线观看| 亚洲精品一二三区区别在哪| 亚洲欧美一区二区三区四区| 亚洲欧洲日本无在线码播放| 亚洲人成网站在线观看90影院| 亚洲最大日夜无码中文字幕| 中文字幕高清在线中文字幕| 8x8x我要打机飞在线观看| 97免费在线视频| WWW亚洲精品久久久乳| mm625亚洲人成电影网| 成人性生交大片| 国产精品视频在线自在线| 国内一级一级毛片a免费| 久久国产伦子伦精品| 美国一级黄色| 日本高清无吗| 午夜A级理论片左线播放| 老师xxxx69动漫| 可以看的黄页的网站| 免费国产黄线在线播放| 欧美xx69| 神马影院午夜伦理限级|