新華網北京9月18日電 題:大模型落地應用觀察:難點與破局
記者 冉曉寧、陳聽雨、凌紀偉、趙秋玥
大模型太多、應用卻太少,大模型要跑起來、更要用起來……怎樣走好大模型落地應用“最后一公里”,成為近期業內外探討的焦點。
“百模大戰”打響,并非言過其實。目前,通過國家網信辦備案的大模型已達190多個,注冊用戶超6億。今年來,各家大模型全面降價,甚至一降到底免費調用。“不要去卷模型了,卷應用吧”,某知名企業多次表達這一觀點,映射出大模型賽道競爭已進入卷生態、拼“獲客”新階段。
從百花齊放到場景落地,大模型應用面臨哪些挑戰,又該如何破解難題、激活生態?近期,記者采訪大模型開發企業、設計研發機構、制造企業和終端廠商,探尋大模型助推研發、生產提質增效,以及賦能C端提升用戶體驗背后的故事。
大模型重構科研生產關系
當前正處于AI為科研帶來重構生產力和生產關系的關鍵時期。自2018年首次提出以來,科學智能(AI for Science)作為一種新的科學研究范式已在學術界達成共識,AI為科研領域帶來了革命性的影響。新技術的賦能,提升了科研效率,促進了科研原始創新,展小班教學示出人工智能為科學研究帶來的巨大價值,AI大模型領先科研團隊成果豐碩。
中國科學院院士、嘉庚創新實驗室名譽主任田中群表示,AI為理論計算創造了可能,算法的精進,算力的提升,大大提高了計算效率。他打比方說,“做基礎科研工作就好比身處一個只有懸崖峭壁而沒有路徑的孤島,如今,AI提供了一種工具,能幫助科研人員有機會乘浪而上,登上懸崖峭壁。”
在電化學領域,科研需要解決的是新能源產業化的問題。比如,新能源儲能電站,特別是大型儲能電站,如若發生安全問題,后果將非常嚴重。面向電化學的AI技術為能源安全提供了更多保障,能更好地檢測、把控以及反饋和控制。又比如,在電池儲能體系中,參數的采集、處理、反饋涉及海量的數據,依靠傳統的人工處理方式,最快也要以“天”來計算。但對AI來說,可能幾小時、幾分鐘甚至幾秒鐘就夠了。
“AI幫助科學家更快地現問題,分析問題,反饋問題,并進行主動控制,形成閉環,有效提高安全性和效率。”田中群說。
蛋白質是一切生命活動的物質基礎,堪稱分子生物學“皇冠上的明珠”。基于深勢科技發布的Uni-Mol 分子構象大模型,可實現分子生成、性質預測等多種通用能力。在藥物發現領域,基于 Uni-Mol開發的虛擬動力學分子生成方法VD-Gen,能直接在蛋白靶點空腔中生成具有高結合親和力的分子。
深勢科技聯合創始人、CEO孫偉杰介紹,近年來,深勢科技與協作者們推出了DPA分子模擬大模型、Uni-Mol分子構象大模型、Uni-Fold蛋白折疊大模型、Uni-RNA基因序列大模型、Uni-Dock高性能分子對接引擎,以及Uni-SMART科學文獻多模態大模型等一系列科學大模型及底層引擎。
深勢宇知科學大模型體系(深勢科技供圖)
目前地球上已知的蛋白質約有兩億種,每一種蛋白質都有獨特的空間結構。自然界經過漫長的生命進化過程,蛋白質分子在瞬息間就能自發完成整個折疊過程。但科學家若想通過計算氨基酸分子間的相互作用來預測其折疊方式,則要窮盡所有可能的蛋白質構型,需要的時間將超過整個宇宙的年齡。
“現在通過使用AI技術,可以在很短的時間內精確算出蛋白質的三維構象,科學家們還在進一步探索運用AI根據特定的功能需求設計自然界不存在的蛋白質或改造已有的蛋白質。”計算生物學家、分子之心創始人兼首席科學家許錦波教授說,“通過AI預測蛋白質結構,極大提升了人們對蛋白質的認知,理解蛋白質如何行使其生物功能,認識蛋白質與非蛋白質之間的相互作用,進而讓人們更好地理解生命的分子過程,這對生物學、醫學和藥學等領域具有重要影響。比如通過A舞蹈場地I蛋白質結構預測,可以更快速地找到準確的蛋白質靶點,幫助藥物研發人員設計更加有效的藥物分子。”
許錦波認為,AI大模型特別適合用來解決生命科學中的問題。“計算與生物學的結合,最成功的案例就是AI蛋白質結構預測,這是目前為止,AI對生物學、乃至對整個科學界最大的貢獻。但這只是剛剛開始,還遠未到結束的時候。”
分子之心自主研發的AI蛋白質生成大模型NewOrigin(達爾文),就是集成序列、結構、功能和進化的AI蛋白質基礎大模型,它學習了海量高度專業、復雜的多模態數據,可根據產業應用需求,“按需定制”功能性蛋白質。目前,NewOrigin大模型已被廣泛應用于創新藥研發、材料、食品、化工、農業等領域,在大分子藥物設計、極端環境下蛋白質穩定性優化、酶活性優化、酶-特定底物對接、蛋白質從頭設計等多類型的高難度產業任務上取得突破。
AI大模型對科研的助力正從地球邁向遙遠的深空,在深空探測領域發揮重要作用。中國科學院院士、中國月球探測工程首任首席科學家歐陽自遠表示,隨著人類深空探測活動的快速推進,探測數據呈井噴式增長。在數據管理方面,我國已經取得先發優勢;在數據應用方面,我國必須充分發揮現有的人工智能技術優勢。
人類對月球地質演化的研究除了探測返回的樣品,主要依靠撞擊坑識別等月球地質對象的研究。撞擊坑的大小、深淺、形狀等特征,是研究月球地質演化的重要依據。據統計,目前月球上直徑一公里以上的月球撞擊坑數量已超100萬個,直徑一公里以下的撞擊坑數量至今無法確定。如果完全依賴人工,完成所有月球撞擊坑的識別是“幾乎無法實現的”。
在2024數博會上,中國科學院地球化學研究所與阿里云聯合發布國際首個“月球科學多模態專業大模型”(簡稱“月球專業大模型”)。該大模型基于阿里云通義系列模型構建,目前在月球撞擊坑年代和形態判別上,準確率已達到80%以上。月球專業大模型的應用極大提高了科研效率:科研工作者只需輸入月球撞擊坑圖像和相關問題,月球專業大模型即可調用通義視覺、多模態模型,從17種多模態數據中(包括光譜、高程、重力等數據)判定該圖像對應的模態類型。
科研大模型落地需理解底層科學規律
盡管AI大模型已經為科學研究帶來了巨大價值,但在下游工業的科研大模型落地中,仍面臨一系列相關場景挑戰。
許錦波認為,研發蛋白質生成大模型,除了必備的算法、算力、數據等基礎條件,還需要具備兩大專業進階能力:首先是融合計算機、生物、物理等多學科,熟識AI、分子動力學、量子計算等多種方法,且能在實踐中并行考慮序列與結構、主鏈與側鏈、進化與組學的跨領域融合能力。其次是走出實驗室,下沉至真實的產業環境,在需求、驗證、落地上貼近真實產業需求的能力。目前,具備這些能力和條件的人才團隊非常稀缺。
孫偉杰認為,讓AI優先學會微觀粒子宇宙的科學規律和數學分布,才能嘗試解決微觀世界的重要問題。
“已有的算法體系和模型體系所帶來的是一個從原子開始真正重構世界的機會。AI大爆發給科研帶來了重構生產工具、生產力以及生產關系的系統性機會。從原子開始,軟件、數據、表征到最終的制造環節,都將被重構。雖然數字世界的繁榮促進了大模型的發展,但更需要關注的是長遠的終局,而AI重構科研生產力的終局將是邁向‘智能原子制造’時代。”他說。
“物理世界是由微觀粒子構成,所關切的是微觀層面的分子結構、蛋白質基因序列、分子模擬等,這些新模態在經典的大模型里并不能覆蓋和處理,過去的大模型也還沒有辦法真正理解宇宙萬物的底層科學規律。”孫偉杰說。
他進而闡述道,需要讓AI大模型理解微觀粒子的宇宙,并嘗試解決微觀世界的問題,往往缺乏非常有效的數據,因為微觀粒子世界是看不見摸不到的。“在微觀世界,目前最好且已被證明的方法,就是AI for Science。AI for Science正在開辟一條全新科研范式的道路,將人工智能與基礎科學研究緊密結合,賦予AI以理解微觀世界的能力。物理世界大模型、數字世界大模型、具身智能大模型這三大支柱構成了當今AI領域工作和創業的三大主賽道。AI for Science則是AI的三大支柱之一,也是通往AGI的必由之路。”孫偉杰說。
大模型賦能制造需深化融合應用
AI大模型正逐漸滲透到制造業各環節,成為制造業通往智能化、柔性化和自動化的核心技術之一,為制造業帶來新機遇。
政府層面正積極推動大模會議室出租型在生產制造領域的具體應用和創新。今年4月,工業和信息化部科技司提出,推動人工智能在生產制造環節的廣泛運用,并強調“以人工智能和制造業深度融合為主線,布局通用大模型和行業大模型,加速人工智能賦能新型工業化”。
在這一趨勢指引下,家電、汽車、化工等多個行業紛紛探索AI大模型的落地應用。
注塑是生產洗衣機的重要工序,其生產過程看起來不過模具開合,背后卻牽扯著溫度、壓力、成型周期、模具健康、能耗等復雜的工藝和參數,以往只能依靠人工經驗調試。如今,注塑工序的“黑箱”問題已得到解決。
走進海爾天津洗衣機互聯工廠,可以看到由卡奧斯COSMOPlat自主研發的天智工業大模型將注塑老師傅們的工業經驗轉化可量化的數據和指標。相關負責人表示,通過注塑大模型與專家模型的合理適配,使注塑機整體能耗優化降低6%-10%,生產節拍提升5%-12%。據了解,天智工業大模型能夠讀懂工業語言、理解工業工藝及機理、生成工業執行指令及執行工業機械控制,已在海爾天津、佛山的洗衣機互聯工廠應用。
圖為海爾天津洗衣機互聯工廠注塑設備(卡奧斯供圖)
“汽車生產制造中的工業場景及工藝,普遍存在涂膠利用率高、勞務成本高、生產排產需優化,以及工藝設計難以通過人工實現最優工藝編排等痛點。”在中國工業互聯網研究院舉辦的2024“生成式人工智能+汽車”供需對接暨成果轉化活動上,多家車企提到了行業面臨的系列痛點。
“生成式人工智能技術有助于自動進行焊接工序編排、總裝工程編程,從而得出最優負荷均衡,提升工藝文件編制效率。”廣汽埃安新能源汽車股份有限公司副總經理鄭純麒說。云從科技集團股份有限公司汽車行業總監葉統生進一步補充道,大模型的分析能力可以對車輛生產進行全流程品質監控。
在石油化工智能化、工業裝置智能化和實驗研究高效化等方面,催化裂化沉降器結焦智能預測技術,解決催化裂化沉降器的結焦問題。據中國石油大學重質油全國重點實驗室教授鄧春介紹,生成式人工智能通過物料感知、反應機理、核心裝備、工藝優化、系統優化,推動化工行業工業裝置運行智能化的應用。
不過,AI大模型在制造層面的落地并非一帆風順。調研了解到,制造類企業的數據量龐大且碎片化嚴重,導致數據難以被有效匯總和發揮價值。此外,大模型的算力成本、部署成本、試錯成本成本較高,工業AI技術人才也尤為短缺。
“大模型在制造業企業落地應用,需要算法工程師、數據工程師以及企業一線管理者等多方共同努力,特別是要在數據收集及標注、模型微調及流程梳理優化等方面投入大量精力和時間成本。”海南省人工智能協會副理事長、浙江省工商聯數委會委員、AI科技企業實在智能創始人孫林君表示,面對制造業企業復雜的供應鏈,實在Agent智能體借助RPA能夠整合和優化數據資源、低成本的替代接口;借助大模型可以降低數據使用門檻,通過推理分解復雜的業務操作并且調度RPA自動完成業務操作、再通過合理控制模型部署成本及算力資源,可應用于原材料采購、庫存管理、生產計劃和物流配送等各項業務環節和業務流程之中、起到很好的降本增效的作用。
盡管面臨諸多挑戰,但絕大多數受訪企業堅信,AI大模型在制造業的應用前景依然廣闊。
中國電子學會理事長徐曉蘭建議,要發揮好我國工業體系完備、產業規模龐大、應用場景豐富、工程人才富集等優勢,著力夯實AI技術基礎、著力深化AI融合應用、著力健全產業發展生態,深化人工智能技術賦能,加快發展新質生產力,推進新型工業化。
大模型進終端推動AI規模化普及
如果說云端大模型展示了AI的強大技術能力,那端側AI就是加速AI技術紅利普及的載體。
端側AI,為什么這么火?中信建投發布研究報告稱,端側AI是AI發展的下一階段,通過將大模型賦能終端硬件,有望開啟AI應用浪潮。
從終端廠商布局看,OPPO提出今年讓約5000萬用戶手機搭載AI功能,聯想全面推進AIPC“一體多端”智能終端戰略,小米SU7搭載了AI大模型,長虹多系列電視均已搭載長虹云帆AI大模型……可見,大模型進入端側已然呈現加速態勢。
圖為大模型在終端側的分布與定位(來源:艾瑞咨詢)
把大模型裝進小終端,前景無限,挑戰并存。在智譜AI首席執行官張鵬看來,如何在較低傳輸量基礎上讓模型更智能,怎樣在移動端提供獨有的資源支持大模型運行,這是大模型進入終端遇到的一大難題。
成立僅5年的智譜AI,如今已成為模型開發領域的一顆新星。談到怎樣為大模型落地創造空間,張鵬認為合作是關鍵,“一方面是要做好大模型全自研,另外硬件廠商和模型算法廠商、操作系統等一系列生態技術廠商需要一起合作。”智譜AI已與英特爾、高通等協作,讓大模型跑在了PC、手機、汽車等各類終端上。
“關閉前置攝講座像頭”“把電腦音量調靜音”“按照我的閱讀習慣生成摘要”……消費者發現,如今使用某品牌的新品電腦更簡便了。通過與電腦進行簡單對話,就能取代以前復雜的操作。據廠商介紹,未來隨著版本迭代,甚至還能幫用戶實現編發郵件、制作個性化海報、理解一張圖里蘊藏的意思等更高難度的功能。
“2022年,聯想就著手計劃將大模型放置于本地。”聯想集團全球中小企業產品與解決方案總經理鄭愛國說,當時大模型參數太大,本地難以承載。直至去年,大模型開發企業將重點下探至6-7B,聯想開始意識到,大模型本地計劃的實施難度降低。去年5月,聯想便將端側AI大模型與PC項目進行了結合。
小米集團AI實驗室主任王斌認為,一方面模型在變小,另一方面計算能力在變大,硬件能力在變強,再加上各種需求反推,預計在端側,會出現一些殺手級的AI應用。
記者梳理某電商平臺在售的AI手機產品發現,語音、圖像和AI助手是AI手機最集中的三大功能點。當下,主流手機廠商正積極部署輕量大模型,使AI無感化,并大力開拓AI應用場景。有市場研報預測,AI手機在私人智能助理和提升辦公能力等方面呈現較大價值前景。每個終端都內置一個屬于自己的AI助理正在成為現實,這被視為人人可享的AI未來。
AI圖像識別、語音喚醒、計算攝影等端側AI用例,看似簡單,實際上對芯片的算力、DDR帶寬都有非常強的要求。
智能手機上AI用例的迅速增長,突顯了高通這家公司的重要性。“高通在設計的一開始,就將AI的理念貫穿到整顆SoC。”高通公司AI產品技術中國區負責人萬衛星介紹說,針對大模型對DDR帶教學寬的挑戰,高通開發了量化技術、壓縮技術,減少模型大小;針對大模型對算力的要求高,高通在NPU上做了非常專業的設計,滿足不同用例的多樣性需求。
此外,百模齊放,具體到端側大模型又細分成家教場地很多類,而目前在不同終端,模型與模型之間的溝通能力尚未建立。因此在中關村智用人工智能研究院院長孫明俊看來,“未來一段時間,在技術標準的統一和互操作性上,會是一個非常龐大的需要各方去解決的一個技術問題。”
“應用為王”,這一理念在大模型技術發展與落地中尤為時租空間重要。調研采訪中,業內人士普遍認同,大模型真正的價值在于解決實際問題,要為用戶創造實實在在的價值。
隨著“人工智能+”行動向縱深推進,期待在多方協作下,大模型技術乘著“飛輪效應”之風,既賦能千行百業、加快形成新質生產力,又在不斷落地應用中反哺技術迭代與性能提升,開辟大模型應用新的境界。