記者丨馬永欣 見習生丨汗青
出品丨鰲頭財經(theSankei)
ChatGPT發布距今已經一年多,帶起的AI大模型風潮席卷全球。這一年來,多家國內企業發布了AI大模型,國內對于AI算力的需求也愈發龐大。
算力是大模型的核心底座,也是數字經濟前行的重要引擎。去年10月初,工業和信息化部、中央網信辦、教育部等6部門印發《算力基礎設施高質量發展行動計劃》,提出到2025年,算力規模超過300EFLOPS,智能算力占比達到35%。
如此重要的基礎設施,國內企業都想牢牢把握在自己手里,科大訊飛(002230.SZ)走在了前面。在去年10月份的1024開發者節上,科大訊飛聯合華為打造的國內首個純國產化大模型算力底座“飛星一號”平臺公布,并宣布開啟對標GPT-4的大模型訓練。
飛星一號效果如何?百天之內有了答案。1月30日,基于飛星一號訓練的星火V3.5發布,向外界展示了純國產算力的強大能力。
為什么要做國產大模型算力底座
“通用人工智能不僅能夠在各大領域深度而廣泛應用,而且我們在源頭技術創新、在大模型的底層能力上也會站上全新臺階。”科大訊飛董事長劉慶峰解釋為什么要做算力底座。
首先便是解決“卡脖子”的風險。大模型的發展,除了需要海量數據之外,還需要龐大的智能算力支撐,這需要算力芯片。“GPU芯片是加大AI算力的核心,現在國內企業GPU芯片主要來源是英偉達。”行業內人士向鰲頭財經表示,“現在面臨兩方面問題,一是受限于美國禁令,我國企業無法獲得最先進的GPU芯片,二是英偉達的GPU芯片價格昂貴,單片價格在1到2萬美元之間,成本巨大。”
做算力底座的第一個目的便在于“在源頭進行技術創新”,在AI大模型發展的基礎設施上走自主創新之路。華為吃過“卡脖子”的苦頭,科大訊飛又是國內AI企業領先者,擁有豐富的技術積累和經驗,兩家走到一起在算力底座上深度共建順理成章。
鰲頭財經了解到,基于華為昇騰生態打造的、自主可控的飛星一號,早在去年10月份便可用來訓練上萬億浮點參數規模的大模型。更早之前,科大訊飛和華為已經將昇騰910B的能力由對標英偉達A100的20%提升至90%。“在今天的大模型時代,我們絕不能只用開源模型做應用落地,在通用大模型的底座上一定要有國家隊站出來。”劉慶峰強調。
“自主可控”四個字難能可貴,發展算力底座的另一層原因也在于此。行業數字化升級,需要大模型提質增效,走出一條自主創新的大模型之路,為大模型的發展提供第二種選擇,產業意義重大。
自主創新不單指科大訊飛和華為將算力底座國產化,還有為飛星一號提供大模型生態自主創新的土壤。
1月30日的發布會上,飛星一號的開源大模型——星火開源-13B正式發布。據介紹,星火開源-13B在多項知名公開評測任務中名列前茅,在文本生成、語言理解、文本改寫、行業問答、機器翻譯等場景中,通過對學習輔助、語言理解等領域的深入研究和優化,實用性大幅提升,在處理復雜的自然語言任務時更加得心應手。
開源只有讓更多場景落地,才能更好地增進生態合作。截至目前,在訊飛開放平臺之上,大模型總開發者超35萬,其中企業開發者超22萬,開發者數增長迅猛,大模型應用加速落地,持續夯實第一開發者生態。
星火V3.5帶來的強應用
飛星一號大模型能做到什么程度?一句話概括:其能力已經可以與GPT-4比肩。
鰲頭財經了解到,飛星一號訓練出的訊飛星火V3.5在語言理解、文本生成、知識問答、邏輯推理、數學能力、代碼能力和多模態能力等方面進行了全面升級。其中語言理解、數學能力超過GPT-4 Turbo,代碼達到GPT-4 Turbo的96%,多模態理解達到GPT-4V的91%。
在智能化上,訊飛星火V3.5已經可以成為“打工人”的平替。訊飛星火V3.5的訊飛智文具有文檔一鍵生成、AI撰寫助手、多語種文檔生成、AI自動配圖、多種模板選擇、提供演講備注等功能。在發布會現場的展示環節,訊飛智文制作短時間內生成了超過20頁豐富內容的“合肥市2024年春節旅游推廣策略”PPT,獲得陣陣掌聲。
“從去年5月份發布之初,星火大模型就在往強應用方向發展,無論是訊飛AI學習機,星火語伴App,還是此次迭代后推出的星火智慧黑板等產品,科大訊飛始終將應用放在技術發展第一位,這正是技術革新導向的結果。”行業分析人士表示。
星火V3.5技術能力的提升,是AI對科研、教育、工業、醫療等領域的賦能。以智能教育為例,科大訊飛推出的星火智慧黑板,具備多模態理解與推薦、全自然交互、虛擬人輔學、智慧化錄課與分享等功能。
在演示環節,愛因斯坦出現在星火智慧黑板上,用“吸力巨大的吸塵器”比喻黑洞,深入淺出地為現場觀眾解釋“黑洞是什么”。在立體幾何等知識的教學中,星火智慧黑板通過解構立方體,將枯燥的理論視覺化,教學課堂更加生動有趣。
智慧黑板只是星火V3.5應用場景中的一面,隨著星火大模型不斷升級,應用將會在越來越多場景和領域中拓展。
AI交互方式再度升級
在AI大模型快速發展的2023年,各家企業都在發力大模型搭載語音助手,讓以往只能設鬧鐘、講笑話、播音樂的語音助手變得越來越“通人性”。
1月30日,科大訊飛首次發布了語音大模型,據介紹,星火語音大模型國際領先,漢語、英語、法語、俄語等37個主流語種的語音識別效果超過OpenAI Whisper V3,在多語種語音合成方面,星火語音大模型的40個語種擬人度超83%。
從“大語言模型”到“大語音模型”,帶來的是AI交互方式的又一次升級,也帶來了生產效率和生活方式的革命。劉慶峰介紹,在汽車、客服、家庭、陪伴機器人等場景中,星火語音大模型還有更多用武之地。如賦能汽車,智能駕艙、智能座艙、智能導航、音樂控制等交互體驗將進一步優化;陪伴機器人、導購機器人、輔診機器人、智能家居、穿戴式設備等產業將得到更大推進。
奇瑞汽車已經享受到智能語音帶來的紅利。鰲頭財經了解到,奇瑞汽車出口的國家覆蓋英語、俄語、西班牙語、阿拉伯語、葡萄牙語等數十個語種,汽車中應用的智能語音交互技術全都由科大訊飛提供。
訊飛星火大模型的全面賦能,無疑將為各行業的數字化轉型提供強大的技術支持,引領新一輪的數字化浪潮。
盡管我國AI大模型已經取得了不少成就,但同時也應該看到國產大模型在一些方面與GPT-4存在差距,以劉慶峰的話說,“當前,發展通用人工智能是我們必須要做的事情,否則工業、科研、民生等各個專用領域都會極大落后于世界,而中國是世界唯一有望成為智慧涌現第二極的國家。”
在AI大模型應用領域遍地開花的同時依然能保持清晰的自我認知,這便有理由讓人們相信科大訊飛在AI領域還將作出更多驚人成就。