5月10日,引爆后摩智能正式發布首款存算一體智駕芯片——鴻途?H30,存算最高物理算力256TOPS,體發途典型功耗35W,展后成為國內率先落地存算一體大算力AI芯片的摩智公司。
后摩智能創始人兼CEO吳強
過去二十年中,布鴻算力發展速度遠超存儲,引爆“存儲墻”成為加速學習時代下的存算一代挑戰,原因是體發途在后摩爾時代,存儲帶寬制約了計算系統的展后有效帶寬,芯片算力增長步履維艱。摩智
因此存算一體有望打破馮諾依曼架構,布鴻是引爆后摩時代下的必然選擇,鴻途?H30的存算發布是存算一體的重要實踐。
存算一體優勢顯著,體發途被譽為AI芯片的“全能戰士”,具有高能耗、低成本、高算力等優勢;存算一體按照計算方式分為數字計算和模擬計算,應用場景較為廣泛,SRAM、RRAM有望成為云端存算一體主流介質。
AI引爆存算一體發展
2月中旬ChatGPT出現崩潰,只是算力緊張的一個縮影。隨著百度、京東、騰訊等國內廠商宣布參與大模型領域的AI競爭,未來類似ChatGPT這樣的大模型將越來越多。可以預見,人工智能大模型的發展是大勢所趨,全球市場對于算力的需求也將出現快速的增長。
存算一體的優勢是打破存儲墻,消除不必要的數據搬移延遲和功耗,使用存儲單元提升算力。存算一體主要AI的算力需求、并行計算、神經網絡計算等,因此存算一體需求旺盛;以數據中心為例,百億億次(E級)的超級計算機成為各國比拼算力的關鍵點。
2017年,英偉達、微軟、三星等提出存算一體原型;同年起,國產存算一體芯片企業開始“扎堆”入場,例如后摩智能、億鑄科技等。
高性能計算引擎
后摩智能聯合創始人兼研發副總裁陳亮告訴芯榜記者,鴻途?H30以存算一體創新架構實現了六大技術突破,即大算力、全精度、低功耗、車規級、可量產、通用性。鴻途?H30基于SRAM存儲介質,采用數字存算一體架構,擁有極低的訪存功耗和超高的計算密度,在Int8數據精度條件下,其AI核心IPU能效比高達15Tops/W,是傳統架構芯片的7倍以上。
后摩智能聯合創始人兼研發副總裁陳亮
陳亮稱,為了更好地實現車規級,后摩智能基于鴻途?H30自主研發了硬件增強機制和檢測機制,在提升芯片可靠性的同時,進一步保障了功能安全性。
為了充分發揮存算一體帶來的高計算效率,后摩智能面向智能駕駛場景打造了專用IPU(處理器架構)——天樞架構,采用多核、多硬件線程的方式擴展算力,實現了計算效率與算力靈活擴展的完美均衡,AI計算可以在核內完成端到端處理,保證通用性。
天樞架構的設計理念源自于庭院式的中國傳統住宅,以大布局設計保障計算資源利用效率的同時,再進一步結合現代住宅多層/高層的設計優勢,以多核/多硬件線程的方式靈活擴展算力。得益于靈活、高效的硬件架構設計,鴻途?H30實現了性能2倍提升的同時,還降低了50%功耗。
后摩智能聯合創始人兼產品副總裁信曉旭對鴻途?H30的產品性能與優勢向芯榜記者做了詳細介紹。得益于存算一體的架構優勢,鴻途?H30基于12nm工藝制程,在Int8數據精度下實現高達256TOPS的物理算力,所需功耗不超過35W,整個SoC能效比達到7.3Tops/W,具有高計算效率、低計算延時、低工藝依賴等特點。
后摩智能聯合創始人兼產品副總裁信曉旭
信曉旭分析,在實際性能測試中,鴻途?H30基于Resnet50模型的Benchmark,在BatchSize等于1和8的條件下分別達到了8700幀/秒和10300幀/秒的性能。
賦能智能駕駛
當下消費電子對半導體拉動區域頹勢,汽車芯片成為拉動半導體領域的中流砥柱,據了解每臺新能源汽車所用到的芯片高達1400塊。
為了坐上新能源的“快車”,后摩智能同步推出了基于鴻途?H30芯片打造的智能駕駛硬件平臺——力馭?。有賴于鴻途?H30極高的計算效率和計算密度,力馭?平臺CPU算力高達200Kdmips,AI算力高256Tops,支持多傳感器輸入,能夠為智能駕駛提供更充沛的算力支持,進一步提升了系統的可靠性。力馭?平臺功耗僅為85W,可采用更加靈活的散熱方式,實現更低成本的便捷部署,有利于推動大算力智能駕駛場景的普及應用。
為了讓客戶擁有更好的產品使用體驗,后摩智能還基于鴻途?H30芯片自主研發了一款軟件開發工具鏈——后摩大道?,支持PyTorch、TensorFlow、ONNX等主流開源框架,編程兼容CUDA前端語法,同時支持SIMD和SIMT兩種編程模型,兼顧運行效率和開發效率,以無侵入式的底層架構創新保障了通用性的同時,進一步實現了鴻途?H30得高效、易用。
信曉旭透露,鴻途?H30將于6月份開始給Alpha客戶送測。同時,后摩智能的第二代產品鴻途?H50已經在全力研發中,將于2024年推出,支持客戶2025年的量產車型。
后摩智能創始人兼CEO吳強表示:“2年前,后摩智能成立,我們堅定地選擇以存算一體的底層架構創新,來實現AI計算效率的極致突破。存算一體架構將存儲和計算功能融合,比傳統架構更接近人腦的計算方式,具備遠高于傳統方式的計算效率。隨著GPT等大模型的出現,存算一體芯片越來越受到行業關注。”
本文首發于微信公眾號:芯榜。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。