
隨著人工智能技術(shù)的快速發(fā)展,AI已成為推動(dòng)社會(huì)進(jìn)步和產(chǎn)業(yè)升級(jí)的重要力量。大模型作為AI技術(shù)的核心之一,憑借其強(qiáng)大的數(shù)據(jù)分析和處理能力,在各個(gè)行業(yè)領(lǐng)域展現(xiàn)出巨大的應(yīng)用潛力,成為推動(dòng)產(chǎn)業(yè)變革的關(guān)鍵引擎。
為了規(guī)范大模型技術(shù)的發(fā)展和應(yīng)用和產(chǎn)業(yè)健康發(fā)展,由中國(guó)電子技術(shù)標(biāo)準(zhǔn)化研究院牽頭,國(guó)家人工智能標(biāo)準(zhǔn)化總體組大模型專題組在全國(guó)信標(biāo)委人工智能分委會(huì)組織下于2023年中陸續(xù)開展人工智能大模型系列標(biāo)準(zhǔn)的研制工作,2023年12月完成標(biāo)準(zhǔn)化技術(shù)文件并在此基礎(chǔ)上開始研制大模型系列國(guó)家標(biāo)準(zhǔn)。
2024年6月,全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)發(fā)布《人工智能 預(yù)訓(xùn)練模型(征求意見稿)》,面向全社會(huì)公開征求標(biāo)準(zhǔn)意見。后續(xù)根據(jù)征求意見修改標(biāo)準(zhǔn)名稱為《人工智能 大模型》系列標(biāo)準(zhǔn),目前該系列標(biāo)準(zhǔn)正在技術(shù)審查中。
表1 《人工智能 大模型》系列標(biāo)準(zhǔn)
《人工智能 大模型 第1部分:通用要求》標(biāo)準(zhǔn)詳細(xì)規(guī)定了人工智能大模型在功能視角下的參考架構(gòu)、通用技術(shù)要求以及相關(guān)方活動(dòng),是大模型系列標(biāo)準(zhǔn)的基礎(chǔ)。制定參考架構(gòu)的目的是為了明確圍繞大模型整個(gè)生態(tài)系統(tǒng)下各功能組件及其技術(shù)要素,進(jìn)而規(guī)范其技術(shù)要求。功能視角下的大模型參考架構(gòu)如圖1所示,包括資源池、工具、數(shù)據(jù)資源、模型、行業(yè)應(yīng)用和服務(wù)平臺(tái)。資源池包括計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等硬件資源及資源虛擬化及調(diào)度等軟件資源;工具包括數(shù)據(jù)工具、模型工具;數(shù)據(jù)資源包括通用數(shù)據(jù)、領(lǐng)域數(shù)據(jù)和私有數(shù)據(jù);模型包括基礎(chǔ)大模型和定制化大模型。其中定制化大模型是依據(jù)用戶需求對(duì)基礎(chǔ)大模型進(jìn)行微調(diào)后定制生產(chǎn)環(huán)境所需的垂類行業(yè)大模型;行業(yè)應(yīng)用是為各行業(yè)場(chǎng)景用戶提供大模型下游任務(wù)匹配服務(wù);服務(wù)平臺(tái)/組件貫穿各層次提供支持大模型和相關(guān)服務(wù)的編排、部署、模型推理、運(yùn)維和管理。標(biāo)準(zhǔn)中強(qiáng)調(diào)大模型支持單模態(tài)或多模態(tài)訓(xùn)練,這預(yù)示著未來大模型將更加注重跨模態(tài)融合能力,能夠同時(shí)處理文本、圖像、語音等多種數(shù)據(jù)類型,提高模型的泛化性和實(shí)用性。
圖1 功能視角下的大模型參考架構(gòu)
另外該標(biāo)準(zhǔn)還定義了用戶視角下的大模型相關(guān)方及其活動(dòng)內(nèi)容,包括基礎(chǔ)設(shè)施提供者、數(shù)據(jù)提供者、模型提供者、應(yīng)用服務(wù)者、應(yīng)用消費(fèi)者和管理者,為圍繞大模型提供服務(wù)和管理活動(dòng)提供了參考依據(jù)。大模型的發(fā)展不僅僅是技術(shù)本身的突破,更需要整個(gè)產(chǎn)業(yè)鏈上下游生態(tài)的協(xié)同合作。從基礎(chǔ)設(shè)施提供者到應(yīng)用消費(fèi)者,各個(gè)環(huán)節(jié)的緊密配合和高效協(xié)同將推動(dòng)大模型的快速發(fā)展和廣泛應(yīng)用。
圖2 大模型的相關(guān)方及其活動(dòng)
《人工智能 大模型 第2部分:評(píng)測(cè)指標(biāo)與方法》主要針對(duì)人工智能大模型的評(píng)測(cè)體系進(jìn)行了規(guī)范,包括評(píng)測(cè)維度、評(píng)測(cè)指標(biāo)及對(duì)應(yīng)的評(píng)測(cè)方法。基礎(chǔ)評(píng)測(cè)維度包括單模態(tài)理解、單模態(tài)生成、多模態(tài)理解、多模態(tài)生成四大類。其中,單模態(tài)文本理解能力評(píng)測(cè)涵蓋了文本分類、信息抽取、推理能力、任務(wù)分解、知識(shí)問答、代碼理解等多個(gè)方面,確保模型具備全面的語義理解和信息處理能力。單模態(tài)理解能力還包括了圖像、音頻分類和識(shí)別等能力維度。多模態(tài)圖文理解能力評(píng)測(cè)涵蓋了圖文檢索、視頻圖像問答、視覺語言推理、視覺蘊(yùn)含、圖表推理等方面,旨在評(píng)估模型對(duì)圖文信息進(jìn)行綜合理解和推理的能力,從而推動(dòng)多模態(tài)人工智能技術(shù)在智能辦公、智能營(yíng)銷、自動(dòng)駕駛等領(lǐng)域的應(yīng)用。同時(shí),單模態(tài)文本生成能力評(píng)測(cè)包括摘要總結(jié)、機(jī)器翻譯、文本改寫、代碼生成等多個(gè)維度。多模態(tài)生成能力包括了文生圖、文生視頻、視頻或圖片生成文本描述、語音合成等多個(gè)維度。大模型多模態(tài)生成能力的評(píng)測(cè)可以有效評(píng)估模型融合文本、圖像、視頻等多種模態(tài)信息的能力,從而推動(dòng)多模態(tài)人工智能技術(shù)在教育娛樂、創(chuàng)意設(shè)計(jì)、虛擬現(xiàn)實(shí)、人機(jī)交互等領(lǐng)域的應(yīng)用。
《人工智能 大模型 第3部分:服務(wù)能力成熟度評(píng)估》主要為大模型服務(wù)的評(píng)估提供框架和指導(dǎo)。標(biāo)準(zhǔn)首先定義了大模型服務(wù)的三種類型,包括軟硬件平臺(tái)服務(wù)、開發(fā)定制服務(wù)和推理運(yùn)營(yíng)服務(wù),并闡述了其服務(wù)能力框架,包括軟硬件平臺(tái)能力域、模型開發(fā)定制能力域和模型推理及運(yùn)營(yíng)域。每個(gè)能力域下又細(xì)分為多個(gè)能力子域,如硬件能力、軟件及工具鏈能力、模型設(shè)計(jì)、模型訓(xùn)練、模型推理等。標(biāo)準(zhǔn)將大模型服務(wù)能力成熟度劃分為三個(gè)等級(jí):基礎(chǔ)應(yīng)用級(jí)、協(xié)同優(yōu)化級(jí)和深度賦能級(jí)。每個(gè)等級(jí)都對(duì)應(yīng)著不同的能力要求,從基礎(chǔ)的技術(shù)要求到復(fù)雜的服務(wù)能力,再到深度賦能的能力,逐步提升。標(biāo)準(zhǔn)還規(guī)定了評(píng)估指標(biāo)和方法,包括軟硬件平臺(tái)、模型開發(fā)定制和模型推理運(yùn)營(yíng)三個(gè)方面的具體要求,并對(duì)每個(gè)能力子域的技術(shù)要求進(jìn)行了詳細(xì)描述。通過這份標(biāo)準(zhǔn),用戶可以全面評(píng)估大模型服務(wù)的各項(xiàng)能力,并根據(jù)評(píng)估結(jié)果選擇適合自身需求的服務(wù)。同時(shí),標(biāo)準(zhǔn)也為大模型服務(wù)提供商提供了能力建設(shè)的參考和指導(dǎo),幫助他們提升服務(wù)能力和成熟度等級(jí)。
《人工智能 大模型 第1部分:通用要求》、《人工智能 大模型 第2部分:評(píng)測(cè)指標(biāo)與方法》、《人工智能 大模型 第3部分:服務(wù)能力成熟度評(píng)估》這三個(gè)標(biāo)準(zhǔn)共同構(gòu)建了大模型的標(biāo)準(zhǔn)化體系,統(tǒng)一規(guī)范了大模型的技術(shù)要求,為人工智能行業(yè)有效開展大模型及其相關(guān)應(yīng)用的測(cè)試驗(yàn)證,有效評(píng)估大模型性能水平提供了重要支撐,也為大模型實(shí)際落地應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。


