DeepSeek算力卡脖子,高校AI研究遇瓶頸?華為聯合15校給出解法
來源:本站原創 瀏覽:334次 時間:2025-02-14
梁文峰說,錢從來都不是問題,唯一擔心的是缺算力。不過,基于國產昇騰算力的DeepSeek R1系列推理API,性能已經直接對標高端GPU了!而且,華為已經率先攜手國內15所頭部高校,打造出了獨一份的科教創新卓越/孵化中心,通過產教融合、科教融匯破解高校科研的算力困局。
全美TOP5高校的機器學習博士,實驗室卻連一塊能夠提供大量算力的GPU都沒有?
2024年中旬,一位網友在reddit上發的帖子,立刻引發了社區大討論——
圖片
年底,Nature的一篇報道更是揭露了學術界在GPU獲取上面臨的嚴峻挑戰——研究者竟然需要排隊申請學校GPU集群的使用時間。
圖片
同樣,在我國高校的實驗室內,GPU嚴重匱乏的問題也很普遍。甚至還曾曝出過大學要求學生自備算力上課這樣十分離譜的新聞。
可見,「算力」這個瓶頸,甚至讓AI本身都變成了一件門檻極高的課程。
AI人才緊缺,且算力不足
與此同時,大模型、具身智能等前沿技術的迅猛發展,則正在全球范圍內引發人才短缺。
根據牛津大學教授的計算,在美國,要求具備AI技能的工作崗位的比例增加了5倍。
放眼全球,技術人工智能(Tech-AI)的工作崗位增長了9倍,廣義人工智能(Broad-AI)的工作崗位增長了11.3倍。
在這一時期內,亞洲的增長尤為顯著。
雖然世界各地的大學都在試圖幫助學生掌握關鍵的AI性能,但正如前文所說,算力如今已經成為了一種「奢侈品」。
為了彌合這一差距,企業與高校的合作便成了一個重要手段。
鯤鵬昇騰科教創新孵化中心,開啟高校科研布局
好在,為了在我國高校培養起同樣的創新體系,華為已經開始布局了!
現在,華為已經和北大、清華、上交、浙大、中科大這5所頂尖高校,共同簽訂了「鯤鵬昇騰科教創新卓越中心」的合作。
此外,華為也同步推進和復旦大學、哈爾濱工業大學、華中科技大學、西安交通大學、南京大學、北京航空航天大學、北京理工大學、電子科技大學、東南大學、北京郵電大學等10所高校,開展了「鯤鵬昇騰科教創新孵化中心」的合作。
卓越中心和孵化中心的成立,是產教融合的典范:
通過引入昇騰生態,彌補了高校的算力短缺,極大促進了更多科研成果的迸發;
通過改革課程體系,以科研課題、產業課題、競賽課題驅動,來培養計算產業的頂尖人才;
通過攻堅體系架構、計算加速能力、算法能力、系統能力,力爭孕育世界級的創新成果;
通過打造諸多「AI+X」交叉學科,引領智能化的生態發展。
為AI科研構建完全自主的國產算力
如今,AI for Science的意義,已經不言自明。
根據谷歌DeepMind的最新調查,每三位博士后研究員中就有一位使用大語言模型來協助完成文獻綜述、編程和文章撰寫等工作。
而今年的諾貝爾物理學獎和化學獎,更是都頒發給了AI領域的研究人員。
可以看到,在AI賦能科研的過程中,GPU憑借著在這些對高性能計算有需求的領域里出色的性能,以及針對 LLM 訓練和推理的強大能力,成為了彌足珍貴的「黃金」,遭到了微軟、xAI、OpenAI等各大公司的瘋搶。
然而,美國針對GPU的封鎖,讓我國在AI和科研領域的進展舉步維艱。
為了跨越這道鴻溝,我們必須構建起自主完整的生態體系并將其發展壯大。
在算力層面,華為昇騰系列AI處理器承擔起了重塑我國競爭力的重任。
而在算力之上,我們還需要有一個自研的計算框架去適配,以便充分發揮出NPU/AI處理器的優勢。
眾所周知,專為英偉達GPU而設計的CUDA架構,在AI和數據科學領域較為常見。
在國內真正與之抗衡的,實現替代的就只有CANN了。
作為華為針對AI場景推出的異構計算架構,CANN對上支持PyTorch、TensorFlow以及昇思MindSpore等業界主流AI框架,對下使能昇騰AI處理器,是提升昇騰AI處理器計算效率的關鍵平臺。。
正因如此,CANN天生就在技術上擁有諸多優勢。其中最為關鍵的,是對AI計算更深入的軟硬結合優化以及更加開放的軟件棧:
首先,它可以支持多種AI框架,包括自家的昇思MindSpore,以及第三方的PyTorch、TensorFlow等;
其次,它針對多樣化應用場景,提供了多層次編程接口,支持用戶快速構建基于昇騰平臺的AI應用和業務;
而且,它還提供了模型遷移工具,方便開發者將項目快速遷移到昇騰平臺。
目前,CANN已經初步構建起了自己的生態系統。在技術層面,CANN囊括了大量的應用、工具、庫,擁有完善的技術生態,給用戶提供了一站式的開發體驗。同時基于昇騰技術底座的開發者隊伍也逐步壯大,為未來的技術應用和創新埋下了沃土。
圖片
在異構計算架構CANN之上,我們還需要AI模型搭建的深度學習框架。
幾乎所有的AI開發者,都需要用深度學習框架,而且幾乎所有DL算法和應用,也都要通過深度學習框架去實現。
如今市面上已有熟知的谷歌TensorFlow,以及Meta的PyTorch等主流框架,并且形成了巨大的生態。
邁入大模型訓練的時代,深度學習框架更需要在面對數千臺計算機規模時,進行有效訓練。
2020年3月正式開源的全場景深度學習框架——華為昇思MindSpore,彌補了國內在這一領域的空缺,實現了真正的自主可控。
MindSpore具備云邊端全場景部署、原生支持大模型訓練、支持AI+科學計算等關鍵特性,構建了全場景協同且全流程極簡的原生開發環境,加速了國內科研創新和產業應用。
全美TOP5高校的機器學習博士,實驗室卻連一塊能夠提供大量算力的GPU都沒有?
2024年中旬,一位網友在reddit上發的帖子,立刻引發了社區大討論——
圖片
年底,Nature的一篇報道更是揭露了學術界在GPU獲取上面臨的嚴峻挑戰——研究者竟然需要排隊申請學校GPU集群的使用時間。
圖片
同樣,在我國高校的實驗室內,GPU嚴重匱乏的問題也很普遍。甚至還曾曝出過大學要求學生自備算力上課這樣十分離譜的新聞。
可見,「算力」這個瓶頸,甚至讓AI本身都變成了一件門檻極高的課程。
AI人才緊缺,且算力不足
與此同時,大模型、具身智能等前沿技術的迅猛發展,則正在全球范圍內引發人才短缺。
根據牛津大學教授的計算,在美國,要求具備AI技能的工作崗位的比例增加了5倍。
放眼全球,技術人工智能(Tech-AI)的工作崗位增長了9倍,廣義人工智能(Broad-AI)的工作崗位增長了11.3倍。
在這一時期內,亞洲的增長尤為顯著。
雖然世界各地的大學都在試圖幫助學生掌握關鍵的AI性能,但正如前文所說,算力如今已經成為了一種「奢侈品」。
為了彌合這一差距,企業與高校的合作便成了一個重要手段。
鯤鵬昇騰科教創新孵化中心,開啟高校科研布局
好在,為了在我國高校培養起同樣的創新體系,華為已經開始布局了!
現在,華為已經和北大、清華、上交、浙大、中科大這5所頂尖高校,共同簽訂了「鯤鵬昇騰科教創新卓越中心」的合作。
此外,華為也同步推進和復旦大學、哈爾濱工業大學、華中科技大學、西安交通大學、南京大學、北京航空航天大學、北京理工大學、電子科技大學、東南大學、北京郵電大學等10所高校,開展了「鯤鵬昇騰科教創新孵化中心」的合作。
卓越中心和孵化中心的成立,是產教融合的典范:
通過引入昇騰生態,彌補了高校的算力短缺,極大促進了更多科研成果的迸發;
通過改革課程體系,以科研課題、產業課題、競賽課題驅動,來培養計算產業的頂尖人才;
通過攻堅體系架構、計算加速能力、算法能力、系統能力,力爭孕育世界級的創新成果;
通過打造諸多「AI+X」交叉學科,引領智能化的生態發展。
為AI科研構建完全自主的國產算力
如今,AI for Science的意義,已經不言自明。
根據谷歌DeepMind的最新調查,每三位博士后研究員中就有一位使用大語言模型來協助完成文獻綜述、編程和文章撰寫等工作。
而今年的諾貝爾物理學獎和化學獎,更是都頒發給了AI領域的研究人員。
可以看到,在AI賦能科研的過程中,GPU憑借著在這些對高性能計算有需求的領域里出色的性能,以及針對 LLM 訓練和推理的強大能力,成為了彌足珍貴的「黃金」,遭到了微軟、xAI、OpenAI等各大公司的瘋搶。
然而,美國針對GPU的封鎖,讓我國在AI和科研領域的進展舉步維艱。
為了跨越這道鴻溝,我們必須構建起自主完整的生態體系并將其發展壯大。
在算力層面,華為昇騰系列AI處理器承擔起了重塑我國競爭力的重任。
而在算力之上,我們還需要有一個自研的計算框架去適配,以便充分發揮出NPU/AI處理器的優勢。
眾所周知,專為英偉達GPU而設計的CUDA架構,在AI和數據科學領域較為常見。
在國內真正與之抗衡的,實現替代的就只有CANN了。
作為華為針對AI場景推出的異構計算架構,CANN對上支持PyTorch、TensorFlow以及昇思MindSpore等業界主流AI框架,對下使能昇騰AI處理器,是提升昇騰AI處理器計算效率的關鍵平臺。。
正因如此,CANN天生就在技術上擁有諸多優勢。其中最為關鍵的,是對AI計算更深入的軟硬結合優化以及更加開放的軟件棧:
首先,它可以支持多種AI框架,包括自家的昇思MindSpore,以及第三方的PyTorch、TensorFlow等;
其次,它針對多樣化應用場景,提供了多層次編程接口,支持用戶快速構建基于昇騰平臺的AI應用和業務;
而且,它還提供了模型遷移工具,方便開發者將項目快速遷移到昇騰平臺。
目前,CANN已經初步構建起了自己的生態系統。在技術層面,CANN囊括了大量的應用、工具、庫,擁有完善的技術生態,給用戶提供了一站式的開發體驗。同時基于昇騰技術底座的開發者隊伍也逐步壯大,為未來的技術應用和創新埋下了沃土。
圖片
在異構計算架構CANN之上,我們還需要AI模型搭建的深度學習框架。
幾乎所有的AI開發者,都需要用深度學習框架,而且幾乎所有DL算法和應用,也都要通過深度學習框架去實現。
如今市面上已有熟知的谷歌TensorFlow,以及Meta的PyTorch等主流框架,并且形成了巨大的生態。
邁入大模型訓練的時代,深度學習框架更需要在面對數千臺計算機規模時,進行有效訓練。
2020年3月正式開源的全場景深度學習框架——華為昇思MindSpore,彌補了國內在這一領域的空缺,實現了真正的自主可控。
MindSpore具備云邊端全場景部署、原生支持大模型訓練、支持AI+科學計算等關鍵特性,構建了全場景協同且全流程極簡的原生開發環境,加速了國內科研創新和產業應用。