工業(yè)大模型(Industrial Large Models, ILMs)是近年來在工業(yè)4.0和智能制造背景下發(fā)展起來的新技術,旨在通過大語言模型(LLMs)、大數(shù)據(jù)分析和深度學習模型來解決工業(yè)中的復雜應用與需求,其核心在于能夠利用通用知識或特定領域的知識來指導機器完成特定任務,如數(shù)據(jù)分析、預測、決策支持等。
但就目前的發(fā)展來看,工業(yè)大模型要落地并提升工業(yè)生產(chǎn)效率,仍面臨諸多難題。
01
數(shù)據(jù)質量和可靠性
工業(yè)數(shù)據(jù)收集和清洗本身就是重要挑戰(zhàn),如果再考慮數(shù)據(jù)安全和隱私保護,難度就更大。從加速企業(yè)數(shù)字化轉型的角度來看,數(shù)據(jù)和模型質量問題也面臨著挑戰(zhàn)。
01 / 高質量數(shù)據(jù)供給不足
在工業(yè)大模型應用中,高質量的數(shù)據(jù)是基礎,但目前大多數(shù)情況下高質量數(shù)據(jù)的供給不足,這直接影響了模型的訓練效果和應用性能。同時,隨著工業(yè)大模型應用大潮到來,高質量數(shù)據(jù)的成本可能會越來越高,這對于依賴大量數(shù)據(jù)訓練的工業(yè)大模型來說是一個重大挑戰(zhàn)。
其原因在于,數(shù)據(jù)處理和治理平臺缺乏,這導致了工業(yè)大模型在構建時難以獲得全面、高質量的數(shù)據(jù)進行深度學習訓練。高質量數(shù)據(jù)供給不足,已影響到工業(yè)大模型的性能和應用效果,具體表現(xiàn)如下:
● 數(shù)據(jù)治理滯后。大多數(shù)工業(yè)企業(yè)缺乏專門的數(shù)據(jù)管理組織,數(shù)據(jù)管理人力有限,且大部分工作集中在數(shù)據(jù)操作等基礎領域,缺少頂層規(guī)劃、管理的組織架構和人員。這種滯后性使得數(shù)據(jù)治理工作難以有效進行,進而影響到數(shù)據(jù)的質量和可用性。
● 數(shù)據(jù)質量問題。這與上面的問題緊密相連。正是由于缺乏對大數(shù)據(jù)資源的整體規(guī)劃和綜合治理,導致一些項目實施中止和失敗,結果數(shù)據(jù)也爛尾??此剖菙?shù)據(jù)治理技術的缺失,本質是企業(yè)在大數(shù)據(jù)平臺建設、分析應用等方面沒有將數(shù)據(jù)質量放到重要位置。
● 數(shù)據(jù)安全和合規(guī)性問題。同樣的邏輯線,如果沒有有效的數(shù)據(jù)治理,數(shù)據(jù)的安全性和合規(guī)性就無法得到保障。這導致企業(yè)在使用數(shù)據(jù)進行大模型訓練時,面臨法律風險和商業(yè)風險,影響到企業(yè)的長期發(fā)展。
● 數(shù)據(jù)資源的非競爭性和非排他性。雖然數(shù)據(jù)具有非競爭性和非排他性特征,但在實際應用中,如何有效地管理和利用這些數(shù)據(jù)資源,確保數(shù)據(jù)的質量、安全和合規(guī)性,仍然是一大挑戰(zhàn)。
02 / 數(shù)據(jù)質量和多樣性問題
大模型的訓練過于依賴互聯(lián)網(wǎng)數(shù)據(jù),而專業(yè)語言數(shù)據(jù)(如書籍、科學論文等)占比較小,這影響了數(shù)據(jù)的質量和多樣性。更困難的是,中文數(shù)據(jù)在互聯(lián)網(wǎng)內(nèi)容資料中的占比不足2%,且質量參差不齊。
03 / 數(shù)據(jù)安全和隱私保護問題
隨著企業(yè)和科研機構紛紛涌入人工智能大模型賽道,數(shù)據(jù)安全和隱私保護成為重要挑戰(zhàn)。公有大模型在企業(yè)級場景下的應用存在數(shù)據(jù)安全隱患。
04 / 數(shù)據(jù)開放共享機制不完善
因為數(shù)據(jù)開放共享機制不完善,缺少訓練大模型的高質量工業(yè)數(shù)據(jù)語料庫,限制了高質量數(shù)據(jù)資源的有效利用和共享。
05 / 產(chǎn)業(yè)數(shù)據(jù)規(guī)模和泛化性不足
產(chǎn)業(yè)數(shù)據(jù)規(guī)模和泛化性不足,導致每次更換場景都需要重新訓練大模型,成本很高。同時,大模型對數(shù)據(jù)供給的要求極高,如訓練GPT-4和Gemini Ultra大概需要4萬億至8萬億個單詞,這對于實際應用中的數(shù)據(jù)規(guī)模是巨大挑戰(zhàn)。
02
模型的復雜性和解釋性
多模態(tài)數(shù)據(jù)建模和可解釋的機器學習模型,是工業(yè)大模型當前面臨的挑戰(zhàn)之一。這不僅涉及技術層面的難題,還包括如何使模型更加透明和易于理解。工業(yè)大模型的復雜性對其數(shù)據(jù)處理和解釋性產(chǎn)生了顯著影響。
首先,隨著工業(yè)大模型應用的復雜性增加,單一模型已無法滿足所有需求,因此集成學習和多模型協(xié)同成為發(fā)展趨勢。也就是說,為了處理更復雜的任務和數(shù)據(jù),需要采用更加復雜的模型架構。
其次,工業(yè)大模型能夠處理龐大的數(shù)據(jù)量,并將復雜的數(shù)據(jù)翻譯成人類能看懂的語言。這意味著,盡管數(shù)據(jù)處理能力強大,但如何有效地管理和解釋這些數(shù)據(jù)仍然是一個挑戰(zhàn)。特別是在特定領域和任務中,訓練數(shù)據(jù)的獲取和標注仍然是一個巨大的難題。同時,大模型的參數(shù)特別多,這帶來了解釋速度的挑戰(zhàn)。
最后,這些因素共同導致了在工業(yè)應用中,雖然大模型能夠捕捉更復雜、更抽象的數(shù)據(jù)模式,提高模型性能,但在實際應用中,如何確保模型的可靠性和可解釋性,順暢完成工業(yè)應用,仍然是一個難題。
01 / 模型復雜性問題
在多模態(tài)數(shù)據(jù)建模中,模型的復雜性對工業(yè)大模型落地的影響主要體現(xiàn)在以下幾個方面。
● 模型性能的提升。模型復雜度的增加,使大模型能夠捕捉更復雜、更抽象的數(shù)據(jù)模式,從而提高模型在各種任務中的性能,更好地理解和處理工業(yè)場景中的復雜關系和需求。
● 泛化能力的增強。復雜的模型結構提供了更豐富的參數(shù)空間,使得模型具有更好的泛化能力。這對于工業(yè)大模型來說尤為重要,因為它們需要能夠在不同的工業(yè)場景中有效工作,而這些場景往往具有高度的多樣性和不確定性。
● 數(shù)據(jù)需求的變化。早期的融合方法表明,在訓練數(shù)據(jù)相對較少時,多模態(tài)學習并不占優(yōu),但當數(shù)據(jù)量達到一定規(guī)模時,多模態(tài)種類豐富性的作用就凸顯出來。這表明,只有運用大量的行業(yè)數(shù)據(jù)訓練和優(yōu)化模型,才能更好提升性能并實現(xiàn)泛化能力。
● 技術挑戰(zhàn)和成本問題。雖然模型復雜性的增加有助于提升模型的性能和泛化能力,但也帶來了技術挑戰(zhàn)和成本問題。例如,集成學習和多模型協(xié)同成為工業(yè)大模型發(fā)展的趨勢,這要求更高的計算資源和技術支持。
同時,不應忽略如何有效地管理和利用大量行業(yè)數(shù)據(jù)這一挑戰(zhàn)。另外,可解釋性的機器學習之所以成為問題,是機器學習模型復雜性導致的。解決這個問題,通常使用剪枝與稀疏約束、參數(shù)量化、降低網(wǎng)絡寬度和深度、優(yōu)化算法等技術手段。
02 / 模型解釋性問題
● 用戶理解和信任。解釋性模型能夠幫助用戶理解模型的決策依據(jù),從而增加對模型的信任度。這是因為,當用戶能夠清晰地理解模型是如何作出決策時,他們更傾向于相信模型的輸出是準確和可靠的。此外,模型的可解釋性還可以提高模型的可信度和可靠性,這對于需要高度精準性和可解釋性的工業(yè)場景尤為重要。然而,不能忽視大模型存在“幻覺”和無法解釋的問題,這對強調(diào)精準性和可解釋性的工業(yè)應用構成了挑戰(zhàn)。對此,研究人員提出了多種解釋方法,如特征歸因、基于擾動的解釋和基于梯度的解釋等,以幫助用戶更好地理解模型的工作機制。
● 因果關系的確定。
工業(yè)大模型在解釋性方面確定因果關系的難點主要如下。
一是模型復雜性。大模型的復雜性是導致其難以解釋的一個重要原因。由于深度學習和其他高級機器學習技術的應用,模型的結構變得非常復雜,這使得從模型中提取出可解釋的因果關系變得困難。
二是數(shù)據(jù)不確定性。由于數(shù)據(jù)本身的不完整或不準確,可能會影響到因果關系的準確推斷。
三是關聯(lián)關系與因果關系的區(qū)分。大模型可能會捕捉到關聯(lián)關系,但這些關聯(lián)并不一定代表真正的因果關系。如何正確區(qū)分兩者至關重要,但這一過程在實踐中往往充滿挑戰(zhàn)。
四是泛化性問題。即使能夠從大模型中提取出某些因果關系,這些關系也可能不具備良好的泛化性。即對相似的樣本,其解釋可能劇烈變化,導致用戶無法通過看少量樣本解釋得到本質的、對其他樣本也適用的原因。
五是反事實推斷的難點。在缺乏反事實數(shù)據(jù)的情況下,進行反事實推斷是業(yè)界的難點。這種情況下,如何準確地預測假設改變某個條件會發(fā)生什么,具有極大的挑戰(zhàn)性。六是混雜因素和選擇偏差。在實際應用中,如何有效地識別和處理混雜因素、選擇偏差等問題,以減少偏差和誤差,也是確定因果關系時面臨的一個重要挑戰(zhàn)。
綜上所述,工業(yè)大模型在解釋性方面確定因果關系的難點,主要集中在模型復雜性、數(shù)據(jù)不確定性、關聯(lián)關系與因果關系的區(qū)分、泛化性問題、反事實推斷的難點,以及混雜因素和選擇偏差的處理上。
03 / 解釋與精確度的平衡
工業(yè)大模型在解釋性方面,平衡精確度與復雜性的方法主要體現(xiàn)在:選擇合適的模型復雜度、采用可解釋性算法、設計易于解釋的代理模型、知識注入和模型融合、權衡可解釋性和有效性等。
03
算力成本高
訓練一個大型模型,初期的算力成本非常高,尤其是在參數(shù)越高、模型越大的情況下,泛化能力雖然增強,但相應的成本也會顯著增加。這對于許多企業(yè)來說,可能是一個重大的經(jīng)濟負擔。工業(yè)大模型訓練初期算力成本高的技術挑戰(zhàn)主要包括以下幾個方面。
● 高算力需求。大模型的訓練需要巨大的算力支持。例如,動輒幾億的算力投入僅是模型訓練階段的需求,而在模型推理應用階段,對算力的需求要遠遠高于訓練階段,算力成本可能達到百億量級。當然,算力成本隨著新技術的應用已進入下降通道。
● 硬件成本高昂。大模型訓練需要大量的GPU資源。以微軟與英偉達合作推出的Megatron Turing-NLG(MT-NLG)模型為例,該模型擁有5300億參數(shù),其訓練過程消耗了4480塊A100 GPU,單次訓練的成本可達數(shù)百萬美元。其中,還不包括電費等其他成本,如ChatGPT的初始算力投入成本約為7.59億美元,電費高達591,864kwh/日。
● 數(shù)據(jù)和算力資源分散。當前,我國數(shù)據(jù)開放共享機制不完善,缺少訓練大模型的高質量工業(yè)數(shù)據(jù)語料庫。同時,各地、各高校院所紛紛建立智算中心,造成算力資源分散嚴重。這不僅增加了獲取足夠算力的難度,而且提高了整體的運營成本。
● 技術瓶頸和優(yōu)化方向。大模型訓練是典型的超算應用場景,對算力、算法、數(shù)據(jù)三方面技術均有一定要求。需要專用的高速互聯(lián)計算網(wǎng)絡、高性能文件存儲和強勁的GPU算力共同完成。此外,大模型對單位實例下的算力密度要求達到了前所未有的高度,這也使得其對計算平臺的要求發(fā)生了顛覆性的巨大變化。
● 算力資源調(diào)度管理能力。為了降低千億參數(shù)大模型訓練成本,需要提升算力資源調(diào)度管理能力。除了直接的硬件成本外,還需要考慮如何高效地管理和調(diào)度這些寶貴資源所付出的成本。
04
行業(yè)知識不足
通用大模型在解決行業(yè)中遇到的復雜任務時,往往因為行業(yè)知識、語料不足而難以有效應對。
● 行業(yè)知識缺乏:工業(yè)大模型在應用于特定行業(yè)時,往往需要具備該行業(yè)的專業(yè)知識。然而,目前很多通用大模型缺乏對應行業(yè)的深入知識,這使得它們難以解決行業(yè)中遇到的復雜任務。在工業(yè)制造領域,專業(yè)知識的缺乏是關鍵難點之一。
● 高質量語料短缺:對于從頭開始訓練的模型來說,高質量語料的短缺會在很大程度上限制大模型的發(fā)展。特別是在中文語料方面,由于英文語料庫的占比最大,依賴英語訓練的大模型更具有可信性和權威性,比較而言,中文大模型在語料方面極度不足。
● 數(shù)據(jù)量和質量要求:行業(yè)大模型對數(shù)據(jù)的要求更高,不僅需要涵蓋專業(yè)知識,還需要大量的數(shù)據(jù)支持。這些數(shù)據(jù)往往涉及用戶敏感信息,其融合、脫敏等處理也存在一定難度。
● 二次預訓練需求:由于通用大模型在行業(yè)知識和語料方面的不足,它們很難直接應用于解決行業(yè)中遇到的復雜任務。因此,需要對這些模型進行二次預訓練,以適應特定行業(yè)的應用需求。
● 專屬大模型的挑戰(zhàn):雖然“專屬大模型”旨在通過積累對應行業(yè)和場景的知識,來更好地支撐垂直行業(yè)各式各樣的應用與服務,但這也面臨著如何有效整合和利用行業(yè)知識的挑戰(zhàn)。
05
應用場景受限
盡管工業(yè)大模型在生產(chǎn)制造、研發(fā)設計和經(jīng)營管理等場景中有著廣泛的應用潛力,但在工藝設計等具體應用層面仍存在“硬骨頭”。
01 / 場景適應性問題
● 首先是數(shù)據(jù)和模型質量問題。包括如何解決數(shù)據(jù)標注效率、跨域學習,以及數(shù)據(jù)管理等問題,以訓練出更具泛化性、魯棒性(即系統(tǒng)或算法在面對各種隨機噪聲、異常情況和攻擊等干擾時的抗干擾能力)和場景適應性的模型。
● 其次是應用成本挑戰(zhàn)。目前,定制化千億參數(shù)通用大模型的成本難以被客戶接受,算力成本仍然高居不下,訓練卡價格仍在上升。未來考慮到LLM不斷升級,訓練推理成本或將持續(xù)上行。
● 再次是模型應用的可靠性。工業(yè)領域,尤其是生產(chǎn)制造流程,最重視安全、可靠和穩(wěn)定。這就對人工智能模型,包括大模型提出了更高的要求。因此,保障應用的可靠性成為了一個核心需求。同時,高質量數(shù)據(jù)供給不足成為最大挑戰(zhàn)。
● 然后是自動化和自適應性不足。未來的工業(yè)大模型將越來越注重自動化和自適應性。工業(yè)系統(tǒng)需要能夠自動調(diào)整和優(yōu)化模型參數(shù)、數(shù)據(jù)處理流程,以及模型的部署和推理策略。然而,目前這一領域的技術和實踐還處于初級階段。
● 最后是技術與應用場景間的鴻溝。AI大模型的落地關鍵,是解決技術與應用場景間的鴻溝。這涉及如何使大模型更好地適應特定的工業(yè)應用場景,以及如何克服不同模型和算力平臺特性的差異帶來的現(xiàn)實挑戰(zhàn)。另外,在高精度要求行業(yè)中,應用場景適應性問題難度更大。
02 / 工藝設計適應性問題
數(shù)據(jù)問題:尤其是工藝數(shù)據(jù)的質量和數(shù)量,直接影響到模型的訓練效果和應用性能。
專業(yè)知識缺乏:盡管大模型技術具有強大的表征、泛化和自適應能力,但在特定的工業(yè)應用場景中,專業(yè)知識的缺乏仍然是一個關鍵難點。
模型適應性問題:隨著感知環(huán)境和應用場景的變化,模型的訓練和調(diào)整變得越來越困難。如何使大模型能夠更好地適應不同的工業(yè)場景,成為學術界和工業(yè)界面臨的共同課題。
技術與場景應用的適配性問題:從應用落地角度出發(fā),解決前沿技術與真實應用場景之間的鴻溝是大模型落地的關鍵,包括如何全方位匹配應用落地時的要求,以確保技術的有效性和實用性。
多模型協(xié)同與集成學習的需求:隨著工業(yè)大模型應用的復雜性增加,單一模型不可能滿足所有需求。因此,集成學習和多模型協(xié)同成為發(fā)展的趨勢。
模型設計和調(diào)試的難度:設計和實現(xiàn)適合特定任務的模型結構,需要深入的專業(yè)知識和經(jīng)驗。同時,調(diào)試模型中的錯誤或性能問題也是一項復雜的任務。
06
成本和技術壁壘
訓練大模型的成本和技術壁壘較高,需要尋求業(yè)內(nèi)合作,使用相應的技術與能力。這對于中小企業(yè)來說,會是難以逾越的障礙。
01 / 成本問題
工業(yè)大模型的應用成本較高,至少在百萬級起步,甚至可能達到上千萬。對于企業(yè)而言,引入和維護大模型需要大量的資金投入。
02 / 人才問題
工業(yè)大模型的應用不僅需要大量的資金投入,還需要專業(yè)的人才支持。技術研發(fā)、算力資源投入、數(shù)據(jù)采集與標注,以及市場推廣與商業(yè)化擴展等方面都需要專業(yè)的人才進行操作和管理。同時,隨著AI技術的發(fā)展,對人力資源的需求也在不斷擴大,這進一步增加了企業(yè)的負擔。工業(yè)大模型應用中,人力成本高的原因主要包括以下幾點。
人才需求增加。隨著大模型技術的發(fā)展和應用,企業(yè)需要吸納大量的人工智能領域人才,如機器學習工程師、數(shù)據(jù)科學家、領域專家等,這些崗位的薪酬相對較高,從而推高了整體的人力成本。
技術門檻高。企業(yè)自身開發(fā)大模型的難度很大,不僅訓練成本、存算成本過高,而且開發(fā)工具與社區(qū)支持也不足,這導致企業(yè)在應用大模型時面臨較高的技術門檻和成本壓力。
數(shù)據(jù)處理需求大。中文大模型的成本高,一個主要原因就是中文數(shù)據(jù)量和質量與英文存在差距,訓練中文大模型需要采集和處理更多的中文語言數(shù)據(jù)。此外,算法開發(fā)、測試、迭代、產(chǎn)品化等都需要大量技術人才的支持,進一步增加了人力成本。
極度依賴硬件資源。GPU作為訓練模型與加速推理的關鍵算力硬件,其成本也是影響人力成本的一個重要因素。
03 / 技術壁壘
數(shù)據(jù)處理難題:在工業(yè)大模型應用中,數(shù)據(jù)獲取與處理是一個重要的挑戰(zhàn)。例如,從中國科學院文獻情報中心獲取的千萬級PDF論文數(shù)據(jù)解析就非常困難。
模型應用可靠性:工業(yè)領域尤其是生產(chǎn)制造流程,對安全、可靠和穩(wěn)定性的要求極高。這對人工智能模型,包括大模型提出了更高的要求。
應用成本挑戰(zhàn):從大模型驅動的AI應用方面來看,應用成本需要大幅度降低。目前定制化的大模型應用成本較高,這是企業(yè)面臨的一個重要挑戰(zhàn)。
芯片和分布式訓練基礎設施軟件的技術壁壘:雖然大模型這項技術本身的技術壁壘并不算高,但是芯片和穩(wěn)定的分布式訓練基礎設施軟件技術壁壘卻很高。
算力基礎設施的挑戰(zhàn):大模型部署技術難點大,參數(shù)量太大,一般的顯卡無法滿足需求。
產(chǎn)業(yè)突破的挑戰(zhàn):大模型的難點不僅僅在于技術追趕,更重要的是如何在產(chǎn)業(yè)場景中落地應用,創(chuàng)造實際價值。
數(shù)據(jù)和模型質量問題:工業(yè)AI在數(shù)據(jù)和模型質量方面的問題,會對大模型的工業(yè)應用構成不小的挑戰(zhàn)。
技術和商業(yè)落地的雙重挑戰(zhàn):企業(yè)很難真正把大模型做得面面俱到,因為每一項業(yè)務都有其專業(yè)性。關鍵是要考慮如何盡快形成自己的技術壁壘,并成功商業(yè)落地。
盡管存在諸多挑戰(zhàn),但通過應用工業(yè)大模型可以大幅提升生產(chǎn)效率、節(jié)約研發(fā)成本、優(yōu)化資源配置已是業(yè)界共識。因此,工業(yè)大模型應用被視為推動制造業(yè)高質量發(fā)展的重要手段。
未來,工業(yè)大模型產(chǎn)業(yè)將朝著定制化、邊緣計算、產(chǎn)業(yè)協(xié)作等方向發(fā)展。這意味著未來的工業(yè)大模型將更加注重滿足特定行業(yè)或應用場景的需求,同時也將更加注重與產(chǎn)業(yè)的深度融合和協(xié)作。
違法和不良信息舉報投訴電話:0377-62377728 舉報郵箱:fbypt@ex12580.com
網(wǎng)絡警察提醒你 a>
中國互聯(lián)網(wǎng)舉報中心
網(wǎng)絡舉報APP下載
掃黃打非網(wǎng)舉報專區(qū)