第290章 很多很多錢&誰來都是弟弟~
第290章 很多很多錢&誰來都是弟弟~
等女友拾掇好,品嘗一番菠蘿味的唇膏,兩人這才晃晃悠悠下樓,趕往張江高科技園區,極光雲總部。
公司自研的專用A1加速卡,驕陽100,已經開始小規模部署。
微光1明天才開售,閒來無事,洛川索性過來瞧瞧熱鬧,順便和王建教授聊一聊,後續的研發路徑。
驕陽100,是基於RISC-V開源架構,定製的專用硬體架構。
並針對LSTM的時序計算模塊,以及Transformer的自注意力並行計算單元,專門定製了硬體單元。
如專門加速矩陣乘法、門控運算的電路等。
這使得驕陽100,天生就適配這兩種模型的計算邏輯。
前者已經初步應用於語音識別、信息流內容推薦等領域。
後者在學術界,已經有了基礎理論,但還沒形成完整的Transformer模型概念。
不過在洛先知的指引下,這兩種架構,已經初步運用到了極光旗下的各個平台之中。
當前,AI仍處於深度學習崛起初期。
為數不多的玩家,基本都是通過FPGA加速卡或CPU做AI加速,連GPU加速都剛起步。
FPGA加速卡,可簡單理解為「萬能積木電路板」。
它的特點是,硬體電路不是固定死的,而是像積木一樣,可以現場編程,通過軟體臨時「拼」出適合當前任務的電路。
屬於「樣樣通,樣樣松」。
不過當前的AI模型,處於百花齊放的階段,沒有統一標準。
FPGA加速卡可快速適配不同算法的特性,倒也算是契合當下的狀態。
而極光自研的「驕陽10o」,則像是「LSTM/Transformer專屬高速晶片」
直接跳過了「通用可編程」的路線,犧牲部分通用性,換取這兩種模型的極致效率。
同樣算力下,功耗更低,速度更快。
比如,訓練一個語言模型時,同樣的數據量,驕陽100的速度比CPU快10倍以上,比FPGA快5倍以上!
且由於不需要像FPGA那樣「萬能積木」式的通用電路,硬體更加精簡,功耗至少可降低30%以上,大幅降低計算成本。
之所以選擇這種極端路線,是因為洛川清楚的知道,這兩種模型,正是未來AI大模型的核心。
Transformer架構,更是大模型的核心底座!
當然,初代產品的性能,不論是算力,還是能效比、內存帶寬等,都還遠遠不足以支撐超大規模分布式訓練,仍需繼續優化疊代。
不過倒是可以先搞一個「億級參數模型」玩玩目前,他們已經在數據中心劃出了獨立集群,小規模部署驕陽100,適配極光雲的特定業務,
以驗證算力卡的實際性能。
如悠米視頻的視頻理解模型,悠米社區、極光微博的文本分類模型,微光基金的數據分析模型等等。
等世博會那邊談妥之後,也會單獨構建一個模型。
而後針對實驗中發現的問題,以及海量數據的反哺,持續優化選代。
等穩定性和兼容性達標後,再向核心業務推廣。
如極光雲的通用AI算力租賃、口袋錢包的數據分析等等。
此外,還需要開發一套,類似於英偉達CUDA的並行計算架構,以及專用的全流程工具鏈,兼容CUDA代碼遷移。
並建立開發者社區,培育自家開放生態。
至於下一步的升級選代路徑,洛川也已經有了大致思路。
即採用更先進的製程,提升算力密度的同時,引入存算一體架構。
就相當於把計算單元和內存「粘在一起」,數據不用來回搬運,直接在內存里算,可有效解決模型的「內存牆」問題。
如此一來,算力可瞬間提升數倍,功耗也大幅降低。
同時還需開發「雲-芯協同」協議,並進一步優化晶片間的高速互聯協議,以實現千卡級集群的分布式訓練。
這之間,估計至少就需要3~5年的時間。
之後再引入異構計算架構,集成專用AI單元+通用CPU核心。
這種混合計算模式,有些類似於後世英偉達的安培架構。
複雜任務由CPU調度,核心計算交給AI單元,兼顧效率和靈活性。
同步開發Chiplet封裝技術,把多個小晶片,如算力單元、內存控制器等,像拼圖一樣封裝在一起。
算力升數倍,同時也降低了研發成本。
再之後,繼續沿著算力、帶寬、通用性、生態的路徑,持續疊代即可,逐步走向大模型時代,
可以說是安排的明明白白王建教授算是有的忙了而洛川需要負責的,就是持續提供「靈感」。
以及持續掏錢。
很多很多錢。。
跟團隊的幾位核心技術骨幹,頭腦風暴了半天,統一後續的研發思路之後,洛川便隨著王建教授,溜達回辦公室。
宋錦同學正叼著一瓶酸奶,愜意的倚靠著老闆椅追劇。
身前辦公桌上,還擺著一個水果拼盤,一杯奶茶,幾袋薯片和妙脆角。
見兩人回來,也只是抬了抬下巴,算是打過招呼,然後繼續嘬著酸奶追劇。
純特麼死廢宅。。
好在這小老娘們兒,還知道這兒不是自己的辦公室,沒脫鞋翹起二郎腿。
丟給女友一記白眼,洛川也懶得念叻她,跟王建教授商議起極光雲出海的相關事宜。
當前,海外雲計算市場,處於三級分化狀態。
亞馬遜雲AWS,憑藉先發優勢和全棧服務,通過降價和生態合作等方式,占據70%的laaS市場份額,處於絕對領先地位。
今年第一季度營收,便超過4億美元,
第二梯隊是企業級玩家。
如微軟、IBM等通過傳統IT渠道,主打企業級市場。
谷歌則專注於初創企業、開發者市場。
第三梯隊,則是開源陣營。
如OpenRackspace聯合NASA推出的OpenStack社區,試圖通過開源挑戰AWS的壟斷地位。
至於國內,自然是極光雲一家獨大。
BAT三家,外加華威,正在緊鑼密鼓研發當中。
進軍海外市場這件事兒,是王建教授提議的,洛川本身其實並沒有太大的興趣。
技術方面,他還是蠻有信心的。
作為全球唯二實現「公有雲+私有雲」穩定混合架構,唯一支持容器化部署與秒級擴縮容的雲服務廠商,真要比服務,誰來都是弟弟。
前世,直到13年,DotCloud公司開源Docker容器化技術,引爆容器化革命,各大雲服務廠商才實現容器化部署。
將應用部署時間,從小時級縮短到分鐘級,效率大幅提升。
但想在海外市場混,可不是單憑技術優勢就能解決的,更是法律、文化、生態的綜合博弈。
合規審查風險、本土化運營的隱性門檻、巴拉巴拉,想想都讓人頭大。
不過反正也不需要他操心,愛咋咋滴吧躺贏就完了~
等女友拾掇好,品嘗一番菠蘿味的唇膏,兩人這才晃晃悠悠下樓,趕往張江高科技園區,極光雲總部。
公司自研的專用A1加速卡,驕陽100,已經開始小規模部署。
微光1明天才開售,閒來無事,洛川索性過來瞧瞧熱鬧,順便和王建教授聊一聊,後續的研發路徑。
驕陽100,是基於RISC-V開源架構,定製的專用硬體架構。
並針對LSTM的時序計算模塊,以及Transformer的自注意力並行計算單元,專門定製了硬體單元。
如專門加速矩陣乘法、門控運算的電路等。
這使得驕陽100,天生就適配這兩種模型的計算邏輯。
前者已經初步應用於語音識別、信息流內容推薦等領域。
後者在學術界,已經有了基礎理論,但還沒形成完整的Transformer模型概念。
不過在洛先知的指引下,這兩種架構,已經初步運用到了極光旗下的各個平台之中。
當前,AI仍處於深度學習崛起初期。
為數不多的玩家,基本都是通過FPGA加速卡或CPU做AI加速,連GPU加速都剛起步。
FPGA加速卡,可簡單理解為「萬能積木電路板」。
它的特點是,硬體電路不是固定死的,而是像積木一樣,可以現場編程,通過軟體臨時「拼」出適合當前任務的電路。
屬於「樣樣通,樣樣松」。
不過當前的AI模型,處於百花齊放的階段,沒有統一標準。
FPGA加速卡可快速適配不同算法的特性,倒也算是契合當下的狀態。
而極光自研的「驕陽10o」,則像是「LSTM/Transformer專屬高速晶片」
直接跳過了「通用可編程」的路線,犧牲部分通用性,換取這兩種模型的極致效率。
同樣算力下,功耗更低,速度更快。
比如,訓練一個語言模型時,同樣的數據量,驕陽100的速度比CPU快10倍以上,比FPGA快5倍以上!
且由於不需要像FPGA那樣「萬能積木」式的通用電路,硬體更加精簡,功耗至少可降低30%以上,大幅降低計算成本。
之所以選擇這種極端路線,是因為洛川清楚的知道,這兩種模型,正是未來AI大模型的核心。
Transformer架構,更是大模型的核心底座!
當然,初代產品的性能,不論是算力,還是能效比、內存帶寬等,都還遠遠不足以支撐超大規模分布式訓練,仍需繼續優化疊代。
不過倒是可以先搞一個「億級參數模型」玩玩目前,他們已經在數據中心劃出了獨立集群,小規模部署驕陽100,適配極光雲的特定業務,
以驗證算力卡的實際性能。
如悠米視頻的視頻理解模型,悠米社區、極光微博的文本分類模型,微光基金的數據分析模型等等。
等世博會那邊談妥之後,也會單獨構建一個模型。
而後針對實驗中發現的問題,以及海量數據的反哺,持續優化選代。
等穩定性和兼容性達標後,再向核心業務推廣。
如極光雲的通用AI算力租賃、口袋錢包的數據分析等等。
此外,還需要開發一套,類似於英偉達CUDA的並行計算架構,以及專用的全流程工具鏈,兼容CUDA代碼遷移。
並建立開發者社區,培育自家開放生態。
至於下一步的升級選代路徑,洛川也已經有了大致思路。
即採用更先進的製程,提升算力密度的同時,引入存算一體架構。
就相當於把計算單元和內存「粘在一起」,數據不用來回搬運,直接在內存里算,可有效解決模型的「內存牆」問題。
如此一來,算力可瞬間提升數倍,功耗也大幅降低。
同時還需開發「雲-芯協同」協議,並進一步優化晶片間的高速互聯協議,以實現千卡級集群的分布式訓練。
這之間,估計至少就需要3~5年的時間。
之後再引入異構計算架構,集成專用AI單元+通用CPU核心。
這種混合計算模式,有些類似於後世英偉達的安培架構。
複雜任務由CPU調度,核心計算交給AI單元,兼顧效率和靈活性。
同步開發Chiplet封裝技術,把多個小晶片,如算力單元、內存控制器等,像拼圖一樣封裝在一起。
算力升數倍,同時也降低了研發成本。
再之後,繼續沿著算力、帶寬、通用性、生態的路徑,持續疊代即可,逐步走向大模型時代,
可以說是安排的明明白白王建教授算是有的忙了而洛川需要負責的,就是持續提供「靈感」。
以及持續掏錢。
很多很多錢。。
跟團隊的幾位核心技術骨幹,頭腦風暴了半天,統一後續的研發思路之後,洛川便隨著王建教授,溜達回辦公室。
宋錦同學正叼著一瓶酸奶,愜意的倚靠著老闆椅追劇。
身前辦公桌上,還擺著一個水果拼盤,一杯奶茶,幾袋薯片和妙脆角。
見兩人回來,也只是抬了抬下巴,算是打過招呼,然後繼續嘬著酸奶追劇。
純特麼死廢宅。。
好在這小老娘們兒,還知道這兒不是自己的辦公室,沒脫鞋翹起二郎腿。
丟給女友一記白眼,洛川也懶得念叻她,跟王建教授商議起極光雲出海的相關事宜。
當前,海外雲計算市場,處於三級分化狀態。
亞馬遜雲AWS,憑藉先發優勢和全棧服務,通過降價和生態合作等方式,占據70%的laaS市場份額,處於絕對領先地位。
今年第一季度營收,便超過4億美元,
第二梯隊是企業級玩家。
如微軟、IBM等通過傳統IT渠道,主打企業級市場。
谷歌則專注於初創企業、開發者市場。
第三梯隊,則是開源陣營。
如OpenRackspace聯合NASA推出的OpenStack社區,試圖通過開源挑戰AWS的壟斷地位。
至於國內,自然是極光雲一家獨大。
BAT三家,外加華威,正在緊鑼密鼓研發當中。
進軍海外市場這件事兒,是王建教授提議的,洛川本身其實並沒有太大的興趣。
技術方面,他還是蠻有信心的。
作為全球唯二實現「公有雲+私有雲」穩定混合架構,唯一支持容器化部署與秒級擴縮容的雲服務廠商,真要比服務,誰來都是弟弟。
前世,直到13年,DotCloud公司開源Docker容器化技術,引爆容器化革命,各大雲服務廠商才實現容器化部署。
將應用部署時間,從小時級縮短到分鐘級,效率大幅提升。
但想在海外市場混,可不是單憑技術優勢就能解決的,更是法律、文化、生態的綜合博弈。
合規審查風險、本土化運營的隱性門檻、巴拉巴拉,想想都讓人頭大。
不過反正也不需要他操心,愛咋咋滴吧躺贏就完了~