高加索AV无码,99尹人网毛,韩日337p99,一级a片久久无,97色区综合,激情日韩在线一二三,日韩精品久久精品草比,婷婷久久91,亚洲天堂艹比

訂閱
糾錯(cuò)
加入自媒體

Meta 自研 AI 推理芯片:四代路線(xiàn)圖深度解讀

芝能智芯出品

Meta 在AI領(lǐng)域有些豪賭的意味,花了好幾年時(shí)間,專(zhuān)心做推理芯片,基于 RISC-V 架構(gòu)的、模塊化的、可以快速迭代的推理芯片。

MTIA是Meta 的人工智能加速器系列,Meta 發(fā)布了新的硬件路線(xiàn)圖,四代產(chǎn)品終于完整浮出水面:MTIA 300、400、450、500。

Part 1為什么是推理?

很多人可能不理解:為什么 Meta 不去做訓(xùn)練芯片?答案很簡(jiǎn)單訓(xùn)練不是 Meta 的核心需求。

Meta 的日常運(yùn)轉(zhuǎn),依賴(lài)的是排名和推薦系統(tǒng)。每天數(shù)十億用戶(hù)在 Facebook、Instagram、WhatsApp 上的每一次滑動(dòng)、每一次點(diǎn)擊,背后都有一套推薦算法在實(shí)時(shí)運(yùn)算。

這套系統(tǒng)需要的是什么?不是超級(jí)算力,而是海量、頻繁的推理。

生成式 AI 興起之后,這個(gè)邏輯沒(méi)有改變,只是推理的規(guī)模變得更大了。

Meta 的判斷是:與其把訓(xùn)練芯片的算力拿來(lái)跑推理,不如專(zhuān)門(mén)為推理設(shè)計(jì)芯片。用他們自己的話(huà)說(shuō),這是"針對(duì)自身特定需求高度優(yōu)化的硬件"——不是最強(qiáng)的,但是最合適的。

MTIA 平臺(tái)基于行業(yè)標(biāo)準(zhǔn)軟件生態(tài)構(gòu)建,PyTorch、vLLM、Triton 都原生支持,遵循 OCP 硬件標(biāo)準(zhǔn)。這些選擇讓 MTIA 的部署成本遠(yuǎn)低于完全自研體系。

● MTIA 300:第一塊基石

2024 年,Meta 推出了第一代 MTIA 加速器——MTIA 300。

這款芯片的設(shè)計(jì)目標(biāo)很明確:排名和推薦模型的推理加速。在生成式 AI 成為行業(yè)焦點(diǎn)之前,這兩類(lèi)模型是 Meta 最大的算力消耗來(lái)源。

MTIA 300 基于 RISC-V 架構(gòu),這一點(diǎn)本身就值得注意——RISC-V 是開(kāi)源指令集,不存在授權(quán)問(wèn)題,也為后續(xù)迭代留足了自由度。

MTIA 300 已經(jīng)投入生產(chǎn),主要用于排名和推薦訓(xùn)練。它奠定了模塊化設(shè)計(jì)的基礎(chǔ),也驗(yàn)證了 Meta 自研推理芯片這條路是走得通的。

● MTIA 400:生成式 AI 的入場(chǎng)券

生成式 AI 的爆發(fā),讓 Meta 意識(shí)到 300 的能力已經(jīng)不夠用了。

MTIA 400 的計(jì)算性能是 300 的五倍以上,HBM 內(nèi)存帶寬提升了 50%,達(dá)到 9.2TB/s。這個(gè)數(shù)字放到當(dāng)下的 AI 芯片市場(chǎng)里不算頂尖,但已經(jīng)足夠支撐 Meta 跑更大規(guī)模的生成式 AI 推理任務(wù)。

更重要的是擴(kuò)展能力。MTIA 300 最多支持 16 個(gè)節(jié)點(diǎn)的集群擴(kuò)展,MTIA 400 一舉拉到 72 個(gè)節(jié)點(diǎn)。這意味著 MTIA 400 的性能和成本競(jìng)爭(zhēng)力,終于可以和主流商用 AI 加速器正面較量了。

Meta 方面表示,MTIA 400 已完成實(shí)驗(yàn)室測(cè)試,正在推進(jìn)數(shù)據(jù)中心部署。

● MTIA 450:帶寬才是瓶頸

從 400 到 450,Meta 的優(yōu)化方向發(fā)生了微妙的轉(zhuǎn)變。

這次是內(nèi)存帶寬的直接翻倍——從 9.2TB/s 到 18.4TB/s。選擇背后有一套清晰的邏輯:生成式 AI 推理中,內(nèi)存帶寬往往比原始算力更關(guān)鍵。

大模型需要頻繁訪(fǎng)問(wèn)海量參數(shù),帶寬不夠,算力再?gòu)?qiáng)也只是空轉(zhuǎn)。MTIA 450 為推理做了專(zhuān)門(mén)優(yōu)化,HBM 帶寬翻倍的同時(shí),還加強(qiáng)了對(duì)低精度數(shù)據(jù)類(lèi)型——包括 Meta 自定義數(shù)據(jù)類(lèi)型——的支持。

這種定制化的數(shù)據(jù)類(lèi)型支持,是通用芯片很難做到的。計(jì)劃 2027 年初開(kāi)始大規(guī)模部署。

● MTIA 500:模塊化的終極形態(tài)

路線(xiàn)圖上最后一款芯片是 MTIA 500,也是最能體現(xiàn) Meta 設(shè)計(jì)哲學(xué)的一款。HBM 帶寬再提升 50%,達(dá)到 27.6TB/s,容量最高可達(dá)每臺(tái)加速器 512GB。如果 HBM 技術(shù)演進(jìn)順利,這個(gè)容量數(shù)字還有進(jìn)一步提升的空間。

更重要的是封裝方式的變化:MTIA 500 將采用 2×2 的小型計(jì)算芯片組配置。

Meta 在 300 到 400 的迭代中積累了大量模塊化設(shè)計(jì)經(jīng)驗(yàn),2×2 配置意味著計(jì)算芯片、HBM 堆棧、網(wǎng)絡(luò)芯片、SoC 芯片可以獨(dú)立演進(jìn)、單獨(dú)替換。

芯片從設(shè)計(jì)到量產(chǎn)需要兩年以上,在這個(gè)周期里工作負(fù)載可能已經(jīng)發(fā)生巨大變化——模塊化是 Meta 給這個(gè)問(wèn)題準(zhǔn)備的答案。同樣計(jì)劃 2027 年大規(guī)模部署。

Part 2產(chǎn)品的迭代

從 300 到 500,Meta 給出了一組數(shù)據(jù):HBM 帶寬提升 4.5 倍,計(jì)算浮點(diǎn)運(yùn)算能力提升 25 倍。

時(shí)間跨度不到三年。四代產(chǎn)品,平均每代半年到一年的迭代周期。這對(duì)于芯片行業(yè)來(lái)說(shuō),是相當(dāng)快的節(jié)奏。

傳統(tǒng)芯片從設(shè)計(jì)到量產(chǎn)通常需要兩到三年,Meta 能做到這一點(diǎn),靠的就是模塊化——每一代都基于上一代產(chǎn)品,更新最關(guān)鍵的部分,其他部分盡量復(fù)用。

400、450、500 三代芯片共用同一套機(jī)架和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,新芯片推出時(shí)可以直接替換舊芯片,不需要重建數(shù)據(jù)中心。

MTIA 還有一個(gè)容易被忽視的優(yōu)勢(shì):開(kāi)放生態(tài)。

Meta 是 Open Compute Project(OCP)的重要成員,MTIA 的硬件設(shè)計(jì)遵循 OCP 標(biāo)準(zhǔn)。軟件層面,PyTorch、vLLM、Triton 都原生支持,不需要額外的軟件適配。

這些選擇降低了整個(gè)生態(tài)的門(mén)檻——客戶(hù)或者合作伙伴可以更平滑地接入 Meta 的硬件體系。

RISC-V 是開(kāi)源指令集,OCP 是開(kāi)放硬件標(biāo)準(zhǔn),這兩件事加在一起,意味著 MTIA 的技術(shù)路線(xiàn)本身不存在出口管制風(fēng)險(xiǎn)。這也是為什么 MTIA 的演進(jìn)路徑對(duì)國(guó)內(nèi) AI 芯片行業(yè)具有相當(dāng)?shù)膮⒖純r(jià)值。

小結(jié)

MTIA 系列的演進(jìn),專(zhuān)注訓(xùn)練芯片的廠商在追求規(guī)模,專(zhuān)注推理芯片的 Meta 在追求效率。當(dāng)潮水退去的時(shí)候,誰(shuí)的模式更可持續(xù),市場(chǎng)會(huì)給出答案。已有數(shù)十萬(wàn)顆 MTIA 芯片投入生產(chǎn),這個(gè)數(shù)字還在增長(zhǎng)。

       原文標(biāo)題 : Meta 自研 AI 推理芯片:四代路線(xiàn)圖深度解讀

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    智能制造 獵頭職位 更多
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)

    府谷县| 尉犁县| 巨鹿县| 陵水| 大英县| 红河县| 铜鼓县| 信阳市| 隆子县| 神木县| 黄平县| 宝坻区| 吴江市| 锡林郭勒盟| 嵊泗县| 灵璧县| 阳城县| 延川县| 贡觉县| 屯昌县| 萍乡市| 时尚| 八宿县| 成武县| 文登市| 盖州市| 西藏| 合阳县| 沂水县| 梨树县| 麟游县| 揭西县| 卢龙县| 鄢陵县| 托克逊县| 光泽县| 习水县| 土默特左旗| 静宁县| 寿宁县| 广东省|