金融網(wǎng)站模板源代碼(金融相關(guān)網(wǎng)站)
智能時代的三要素:
數(shù)據(jù)、算法和算力
史愛武中華讀書報2021-09-22
近幾年,人工智能技術(shù)和應(yīng)用飛速發(fā)展,在我們生活和工作中都得到大量的普及應(yīng)用,歸功于推動人工智能發(fā)展的三大要素:數(shù)據(jù)、算法和算力。這三個要素缺一不可,相互促進、相互支撐,是智能技術(shù)創(chuàng)造價值和取得成功的必備條件。
數(shù) 據(jù)
在人類發(fā)明史上,很多發(fā)明都是從模仿動物開始的,比如,模仿鳥類來實現(xiàn)人類的飛行夢想。歷史上記載有各種關(guān)于模仿鳥類飛行的故事,當(dāng)然,結(jié)果是可想而知的,肯定都以失敗告終。我們把使用這種方法論的人統(tǒng)稱為“飛鳥派”。
從此,學(xué)術(shù)界開始意識到,讓計算機獲得智能的鑰匙其實是大數(shù)據(jù)。
數(shù)據(jù)對于人工智能,就如食材對于美味菜肴,人工智能的智能都蘊含在大數(shù)據(jù)中。因為人工智能的根基是訓(xùn)練,就如同人類如果要獲取一定的技能,必須經(jīng)過不斷地訓(xùn)練才能獲得,而且有“熟能生巧、巧能生仙”之說。
人工智能也是如此。只有經(jīng)過大量的訓(xùn)練,才能總結(jié)出規(guī)律,應(yīng)用到新的樣本上。如果現(xiàn)實中出現(xiàn)了訓(xùn)練集中從未有過的場景,人工智能則會基本處于瞎猜狀態(tài),正確率可想而知。對于人工智能而言,大量的數(shù)據(jù)太重要了,而且需要覆蓋各種可能的場景,這樣才能得到一個表現(xiàn)得更智能的模型。
當(dāng)前的時代,無時無刻不在產(chǎn)生大數(shù)據(jù)。人手一部的手機、無處不在的攝像頭和傳感器等設(shè)備都在產(chǎn)生和積累著數(shù)據(jù),這些數(shù)據(jù)形式多樣化,大部分都是非結(jié)構(gòu)化數(shù)據(jù)。
這些大數(shù)據(jù)需要進行大量的預(yù)處理過程(特征化、標(biāo)量化、向量化),處理后的數(shù)據(jù)才能為人工智能算法所用。
算 法
幸運的是,科學(xué)家從嬰兒身上得到了啟發(fā)。沒有人教過嬰兒怎么“看”,都是孩子自己從真實世界自學(xué)的。如果把孩子的眼睛當(dāng)作是一臺生物照相機的話,那這臺相機平均每200毫秒就拍一張照——這是眼球轉(zhuǎn)動一次的平均時間。到孩子3歲的時候,這臺生物相機已經(jīng)拍攝過上億張真實世界照片。
這給科學(xué)家很好的啟發(fā):能不能給計算機看非常非常多貓的圖片,讓計算機自己抽象出貓的特征,自己去理解什么是貓。
當(dāng)前,機器學(xué)習(xí)算法是主流算法,是一類從數(shù)據(jù)分析中獲得規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進行預(yù)測的算法。機器學(xué)習(xí)算法主要分為傳統(tǒng)的機器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,神經(jīng)網(wǎng)絡(luò)算法快速發(fā)展,其中最熱門的分支當(dāng)屬深度學(xué)習(xí),近年來深度學(xué)習(xí)的發(fā)展達到了高潮。
算法對于人工智能,就是廚師(烹飪的方法)與美味菜肴的關(guān)系。算法是實現(xiàn)人工智能的根本途徑,是挖掘數(shù)據(jù)智能的有效方法。
算 力
展開全文
算力也就是計算能力,算力對于人工智能,如同廚房的煤氣/電力/柴火對于美味佳肴一樣。有了大數(shù)據(jù)和算法之后,需要進行訓(xùn)練,不斷地訓(xùn)練,算力為人工智能提供了基本的計算能力的支撐,本質(zhì)是一種基礎(chǔ)設(shè)施的支撐。
AI中有一個術(shù)語叫Epoch,一個Epoch就是所有訓(xùn)練樣本在神經(jīng)網(wǎng)絡(luò)中都進行一次正向傳播和一次反向傳播,再通俗一點,一個Epoch就是將所有訓(xùn)練樣本訓(xùn)練一次的過程。
只把訓(xùn)練集從頭到尾訓(xùn)練一遍神經(jīng)網(wǎng)絡(luò)是學(xué)不好的,而是要將完整的數(shù)據(jù)集在同樣的神經(jīng)網(wǎng)絡(luò)中傳遞多次,把訓(xùn)練集翻過來、調(diào)過去訓(xùn)練多少輪。就像和小孩講一個道理,一遍肯定學(xué)不會,必須一遍一遍反復(fù)地教,一遍就會那就是神童了。
有了大數(shù)據(jù)和先進的算法,還得有處理大數(shù)據(jù)和執(zhí)行先進算法的計算能力。每個智能系統(tǒng)背后都有一套強大的硬件或者軟件計算系統(tǒng)。
超級計算機是一個國家科技發(fā)展水平和綜合國力的反映。沒有超級計算機,天氣預(yù)報不可能預(yù)報15天,中國的大飛機研制不可能進展如此之快。另外,核武器的爆炸模擬、地震預(yù)警、抗擊新冠肺炎藥物研發(fā)等領(lǐng)域也離不開超級計算機。
目前世界運算速度排第三位的超級計算機是中國的神威太湖之光,峰值性能達每秒12.5億億次,運算速度相當(dāng)于普通家用電腦的200萬倍,神威太湖之光一分鐘的運算量需要全球72億人用計算器不間斷運算32年。
人工智能的發(fā)展對算力提出了更高的要求。除了訓(xùn)練,人工智能算法實際需要運行在硬件上,也需要推理,這些都需要算力的支撐。然而,能提供超強計算能力的超級計算機,價格也是超級昂貴,不是一般人都能使用得到的。
目前的人工智能算力主要是由專有的AI硬件芯片,以及提供超級計算能力的公有云計算服務(wù)來提供。其中GPU領(lǐng)先其他芯片,在人工智能領(lǐng)域中用得最廣泛,GPU有更高的并行度、更高的單機計算峰值、更高的計算效率。
一般來說,GPU浮點計算的能力是CPU的10倍左右。另外,深度學(xué)習(xí)加速框架通過在GPU之上進行優(yōu)化,再次提升了GPU的計算性能,有利于加速神經(jīng)網(wǎng)絡(luò)的計算。
云計算是計算能力的放大器。云計算是一種基于互聯(lián)網(wǎng)的分布式超級計算模式。在遠程的數(shù)據(jù)中心里,成千上萬臺服務(wù)器等計算設(shè)備連接起來組成一個云,協(xié)同計算。云中的單個計算機性能可能非常一般,甚至就是普通電腦,但是很多一般加在一起的計算能力卻不容小覷。
將GPU和FPGA的計算能力部署在云端對外提供云服務(wù)意味著優(yōu)勢的進一步放大。云計算甚至可以讓你體驗每秒10萬億次的運算速度,計算能力堪比超級計算機。俗話說得好,三個臭皮匠頂個諸葛亮、聚沙成塔、集腋成裘。
當(dāng)前,隨著人工智能算法模型的復(fù)雜度和精度愈來愈高,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)呈幾何倍數(shù)增長,在數(shù)據(jù)規(guī)模和算法模型的雙層疊加下,人工智能對算力的需求越來越大。
毫無疑問,人工智能走向深度學(xué)習(xí),計算力已成為評價人工智能研究成本的重要指標(biāo)??梢哉f,計算力即是生產(chǎn)力。
從智能時代的三個要素來看,我們也可以進一步解析出云計算、大數(shù)據(jù)和人工智能之間的關(guān)系。為了簡化和幫助理解,以炒菜這個應(yīng)用場景為例來說明它們之間的關(guān)系:
大數(shù)據(jù)相當(dāng)于炒菜需要的食材,也就是生產(chǎn)原料。云計算等算力就相當(dāng)于炒菜需要的煤氣/電力/柴火,人工智能算法就相當(dāng)于烹飪的方法,算法和算力也就是產(chǎn)生動力的生產(chǎn)引擎。有了生產(chǎn)原料和生產(chǎn)引擎,就可以在不同的應(yīng)用場景下生產(chǎn)出我們所需要的不同東西。
2006年Hinton教授等人提出了深度學(xué)習(xí)算法,實現(xiàn)了人工智能算法理論的創(chuàng)新突破;隨著移動互聯(lián)網(wǎng)的生活化普及,促進了AI發(fā)展的“大數(shù)據(jù)”產(chǎn)生;大數(shù)據(jù)和深度學(xué)習(xí)等算法的雙劍合璧,再配合摩爾定律下的算力快速提升——大數(shù)據(jù)、算力、算法作為輸入,從技術(shù)角度推動了人工智能的發(fā)展。只有在實際的場景中進行輸出,才能體現(xiàn)出人工智能的實際價值。
人工智能的常見應(yīng)用場景包括:自動駕駛、虛擬助理、金融服務(wù)、醫(yī)療和診斷、設(shè)計和藝術(shù)創(chuàng)作、合同訴訟等法律實務(wù)、社交陪伴、服務(wù)業(yè)和工業(yè)。應(yīng)用場景的不同決定了人工智能的應(yīng)用落地和效果。同樣是物流分揀中心,規(guī)模不同、信息化基礎(chǔ)不同、企業(yè)數(shù)據(jù)不同、人員素質(zhì)不同,對人工智能的要求和所發(fā)揮的效益也自然不同了。
人工智能發(fā)展到如今還是一個被大數(shù)據(jù)喂養(yǎng)起來的小怪獸,而且在深度學(xué)習(xí)算法沒有明顯突破的情況下,人工智能實現(xiàn)自我學(xué)習(xí)能力看起來還遙遙無期。因此,AI對人類的替代性以及威脅,還遠沒有達到讓人類擔(dān)憂的地步,當(dāng)前大家探討最多的還是人工智能在各個領(lǐng)域的應(yīng)用。
(作者史愛武系中國電子學(xué)會云計算專家委員會委員,中國通信學(xué)會云計算專家委員會委員,教育部戰(zhàn)略研究中心云計算首席科學(xué)家,武漢紡織大學(xué)云計算與大數(shù)據(jù)研究中心主任)
數(shù)據(jù)、算法和算力,5G時代智能風(fēng)控要關(guān)注什么?
世界上唯一不變的就是變化本身,這句話在套用在風(fēng)控身上非常適用。風(fēng)控跟業(yè)務(wù)是緊密聯(lián)系在一起的,而業(yè)務(wù)是不斷變化的,這就決定了風(fēng)控模式要主動去適應(yīng)和追趕業(yè)務(wù)模式的變化。就像4G來臨之前人們很難預(yù)測到會有短視頻、直播等應(yīng)用的出現(xiàn),隨著5G的大范圍商用,在可預(yù)見的幾年內(nèi),一些全新的業(yè)態(tài)將會出現(xiàn),甚至一些業(yè)態(tài)將會超越當(dāng)下人們的思維框架,風(fēng)控體系業(yè)務(wù)模式、業(yè)務(wù)場景的發(fā)展將變得難以預(yù)測。我們嘗試著從過去的經(jīng)驗來談?wù)?G時代可能會給風(fēng)控帶來的挑戰(zhàn)。如果將現(xiàn)有的風(fēng)控體系簡化成一個抽象的公式,大概是這樣的。
數(shù)據(jù) + 算法 + 算力 = 決策
狹義地講,有更多的數(shù)據(jù)、更適應(yīng)的算法、更強大的算力,就能做出更精準(zhǔn)的風(fēng)控決策。當(dāng)然在實際應(yīng)用層面,情況要復(fù)雜得多,往往需要多個機構(gòu)和系統(tǒng)進行跨維度、成體系的綜合協(xié)同。比如通過可信數(shù)據(jù)體系的建設(shè),緩解算力的負擔(dān),并提升用戶體驗;通過聯(lián)邦學(xué)習(xí)等前沿算法的研發(fā),解決部分數(shù)據(jù)獲取的敏感和隱私問題;通過建立一套正反饋的決策流程,幫助算法和模型自動化迭代提升等。隨著5G時代的到來,信息的獲取和傳遞的速度會更加迅猛,相應(yīng)的風(fēng)險的傳遞和感染也將進入前所未有的不確定期。在數(shù)據(jù)、算法、算力三個維度,5G都會給傳統(tǒng)的風(fēng)控體系帶來新的挑戰(zhàn)。
一
數(shù)據(jù)——數(shù)據(jù)濫用和隱私保護問題嚴峻
1.新型數(shù)據(jù)的處理
5G時代全世界的數(shù)據(jù)量會產(chǎn)生指數(shù)級增長,而且這些數(shù)據(jù)大部分將會在新的物聯(lián)網(wǎng)場景下誕生,比如智能設(shè)備、智能制造、智能家居、智慧金融、智慧交通、智慧城市等領(lǐng)域,如何更好發(fā)揮這些替代數(shù)據(jù)的價值之外,數(shù)據(jù)濫用和隱私保護的問題會成為各界更為關(guān)注的議題。
2.可信的端環(huán)境
回顧互聯(lián)網(wǎng)和計算機的發(fā)展歷史,可以發(fā)現(xiàn)一條清晰的脈絡(luò),即計算、存儲、網(wǎng)絡(luò)能力不斷拆分為更細的粒度,比如從大型主機、小型機、pc服務(wù)器、虛擬機、容器和微服務(wù),再到現(xiàn)在的serverless。
5G時代這條規(guī)律依然適用,未來瘦客戶端+云計算的組合模式可能性是比較大的。在瘦客戶端的環(huán)境下如何解決端的安全,現(xiàn)有的風(fēng)控體系如何跟5G原生的安全機制相結(jié)合等問題會顯得異常重要。
二
算法——算法自動化奇點來臨
性能考驗是算法首當(dāng)其沖的挑戰(zhàn),更深層次來講,算法本身的安全問題其實更值得警惕。風(fēng)控決策很多時候就依賴于幾個核心模型并行得到的結(jié)果,換言之 模型能力就是風(fēng)控能力,算法安全就是線上服務(wù)安全。攻擊者當(dāng)然也深諳此道,近年來一些針對AI模型的特定攻擊方式頻繁發(fā)生,例如:數(shù)據(jù)污染、投毒、藥餌、模型惡意代碼、模型竊取、模型逃逸、拒絕服務(wù)等等。
在5G時代,將會催生出更多算法,當(dāng)下機器學(xué)習(xí)與深度學(xué)習(xí)的無監(jiān)督訓(xùn)練算法可能是邁出了算法自動化的一小步, 在5G高并發(fā)、低延遲、實時決策的基礎(chǔ)上,我們大膽預(yù)測算法自動化的奇點將會來臨,越來越多的業(yè)務(wù)需要算法自動化處理。如何避免算法的錯誤,以及可能帶來公平與公正,誰來決策和監(jiān)督等等問題,人們將會陷入一個空前激烈的輿論和技術(shù)攻防戰(zhàn)中。
三
算力——尋求邊緣和中心的協(xié)調(diào)
一套完整的風(fēng)控系統(tǒng)會用到包括規(guī)則計算、流計算、圖計算、機器學(xué)習(xí)、深度學(xué)習(xí)等在內(nèi)的多種計算方式。根據(jù)麥特卡夫定律,當(dāng)網(wǎng)絡(luò)節(jié)點越多,價值就越大,同時節(jié)點之間的連接數(shù)量會成幾何倍數(shù)上升, 5G時代算力的瓶頸將是一大挑戰(zhàn),有人提出通過邊緣計算解決這一問題,但對于風(fēng)控體系來說可能集中式的系統(tǒng)更有優(yōu)勢,可以充分發(fā)揮“風(fēng)控大腦”的作用。
我們能否尋求到效率和性能的平衡點?
現(xiàn)在關(guān)于5G可能給智能風(fēng)控體系帶來的挑戰(zhàn),很多思考、判斷還是比較淺顯和主觀,甚至一些觀點在未來有可能被證明是錯誤的。盡管我們還不能馬上拿出完善的解決方案,但至少先預(yù)判風(fēng)險從何處而來,才能更好的未雨綢繆?,F(xiàn)在我們能確定的是,5G肯定能催生出新的生態(tài)、新的技術(shù)架構(gòu)、新的商業(yè)模式,雖然很難對這個“新”準(zhǔn)確定義,但是我們已經(jīng)聽到由遠及近的腳步聲,隨著時間的推進,下一代風(fēng)控系統(tǒng)會逐漸明朗,同盾作為行業(yè)的領(lǐng)軍企業(yè),正在多方布局,以積極的姿態(tài)迎接新的產(chǎn)業(yè)革命。
【作者:丁楊 同盾科技產(chǎn)品總監(jiān)】
日前,中國信息通信研究院發(fā)布《人工智能白皮書(2022 年)》,報告提出:算法、算力和數(shù)據(jù)被認為是人工智能發(fā)展的三駕馬車,也是推動人工智能發(fā)展的重要基礎(chǔ)。
一、在算法層面,新算法不斷涌現(xiàn),超大規(guī)模預(yù)訓(xùn)練模型等成為近兩年最受關(guān)注的熱點之一
1、預(yù)訓(xùn)練模型參數(shù)數(shù)量、訓(xùn)練數(shù)據(jù)規(guī)模按照 300 倍/年的趨勢增長,跨模態(tài)預(yù)訓(xùn)練大模型日益普遍,已經(jīng)從早期只學(xué)習(xí)文本數(shù)據(jù),到聯(lián)合學(xué)習(xí)文本和圖像,再到如今可以處理文本、圖像、語音三種模態(tài)數(shù)據(jù),未來使用更多種圖像編碼、更多種語言、以及更多類型數(shù)據(jù)的預(yù)訓(xùn)練模型將會涌現(xiàn)。
2、輕量化深度學(xué)習(xí)技術(shù)不斷探索,計算效率顯著提升。復(fù)雜的深度學(xué)習(xí)模型往往需要消耗大量的存儲空間和計算資源,難以在端、邊等資源受限情形下應(yīng)用,具備低內(nèi)存和低計算量優(yōu)勢的技術(shù)成為業(yè)界需求。
3、“生成式人工智能”技術(shù)不斷成熟,未來聽、說、讀、寫等能力將有機結(jié)合起來。目前,“生成式人工智能”技術(shù)被廣泛應(yīng)用于智能寫作、代碼生成、有聲閱讀、新聞播報、語音導(dǎo)航、影像修復(fù)等領(lǐng)域,通過機器自動合成文本、語音、圖像、視頻等正在推動互聯(lián)網(wǎng)數(shù)字內(nèi)容生產(chǎn)的變革。
4、知識計算成為推動人工智能從感知智能向認知智能轉(zhuǎn)變的重要探索。目前,圍繞著知識獲取、知識建模、知識管理、知識應(yīng)用等過程,已經(jīng)形成了涵蓋知識圖譜、知識庫、圖計算 等技術(shù),覆蓋知識表示、知識計算、知識推理與決策能力的體系,
二、在基礎(chǔ)算力層面,單點算力持續(xù)提升,算力定制化、多元化成為重要發(fā)展趨勢;計算技術(shù)圍繞數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)交互三大能力要素演進升級,類腦芯片、量子計算等方向持續(xù)探索 。
三、在數(shù)據(jù)層面,以深度學(xué)習(xí)為代表的人工智能技術(shù)需要大量的標(biāo)注數(shù)據(jù),這也催生了專門的技術(shù)乃至服務(wù),隨著面向問題的不斷具體化和深入,數(shù)據(jù)服務(wù)走向精細化和定制化;此外,隨著知識在人工智能的重要性被廣泛提及,對知識集的構(gòu)建和利用不斷增多。
AI的三大基石:數(shù)據(jù)、算力和算法
近年來,人工智能(AI)發(fā)展迅速并日益受到重視,日前中國信息通信研究院發(fā)布的《全球人工智能戰(zhàn)略與政策觀察(2020)》報告指出,截至2020年12月底,全球已有39個國家和地區(qū)制定了AI的戰(zhàn)略政策、產(chǎn)業(yè)規(guī)劃文件。AI三大核心要素是數(shù)據(jù)、算力和算法。
圖片由“小i機器人”公司提供
數(shù)據(jù)是AI算法的“飼料”
算法是AI的背后“推手”
AI算法是數(shù)據(jù)驅(qū)動型算法,是AI的推動力量。主流的算法主要分為傳統(tǒng)的機器學(xué)習(xí)算法和神經(jīng)網(wǎng)絡(luò)算法,目前神經(jīng)網(wǎng)絡(luò)算法因為深度學(xué)習(xí)的快速發(fā)展而達到了高潮。南京大學(xué)計算機系主任、人工智能學(xué)院院長周志華教授認為,今天“AI熱潮”的出現(xiàn)主要由于機器學(xué)習(xí),尤其是機器學(xué)習(xí)中的深度學(xué)習(xí)技術(shù)取得了巨大進展,并在大數(shù)據(jù)和大算力的支持下發(fā)揮了巨大的威力。當(dāng)前最具代表性的深度學(xué)習(xí)算法模型有深度神經(jīng)網(wǎng)絡(luò)(簡稱DNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(簡稱RNN)、卷積神經(jīng)網(wǎng)絡(luò)(簡稱CNN)。DNN和RNN就是深度學(xué)習(xí)的基礎(chǔ)。DNN內(nèi)部的神經(jīng)網(wǎng)絡(luò)層可以分為三類,輸入層、隱藏層和輸出層。一般來說第一層是輸入層,最后一層是輸出層,而中間的層數(shù)都是隱藏層。DNN可以理解為有很多隱藏層的神經(jīng)網(wǎng)絡(luò),是非常龐大的系統(tǒng),訓(xùn)練出來需要很多數(shù)據(jù)、很強的算力進行支撐。
算力是基礎(chǔ)設(shè)施
AI算法模型對于算力的巨大需求,推動了今天芯片業(yè)的發(fā)展。據(jù)OpenAI測算,2012年開始,全球AI訓(xùn)練所用的計算量呈現(xiàn)指數(shù)增長,平均每3.43個月便會翻一倍,目前計算量已擴大30萬倍,遠超算力增長速度。在AI技術(shù)當(dāng)中,算力是算法和數(shù)據(jù)的基礎(chǔ)設(shè)施,支撐著算法和數(shù)據(jù),進而影響著AI的發(fā)展,算力的大小代表著對數(shù)據(jù)處理能力的強弱。算力源于芯片,通過基礎(chǔ)軟件的有效組織,最終釋放到終端應(yīng)用上,作為算力的關(guān)鍵基礎(chǔ),芯片的性能決定著AI產(chǎn)業(yè)的發(fā)展。
算法、算力、數(shù)據(jù)作為AI核心三要素,相互影響,相互支撐,在不同行業(yè)中形成了不一樣的產(chǎn)業(yè)形態(tài)。隨著算法的創(chuàng)新、算力的增強、數(shù)據(jù)資源的累積,傳統(tǒng)基礎(chǔ)設(shè)施將借此東風(fēng)實現(xiàn)智能化升級,并有望推動經(jīng)濟發(fā)展全要素的智能化革新。讓人類社會從信息化進入智能化。
加快補齊AI芯片短板
從技術(shù)架構(gòu)來看,AI芯片可以分為通用性芯片、半定制化芯片、全定制化芯片和類腦芯片(特點是功耗低、響應(yīng)速度快)。AI本質(zhì)上是使用人工神經(jīng)網(wǎng)絡(luò)對人腦進行的模擬,替代人們大腦中的生物神經(jīng)網(wǎng)絡(luò)。由于每個任務(wù)對芯片的要求不同,所以可以使用不同的AI芯片進行訓(xùn)練和推理。
在過去二十年中,處理器性能以每年大約55%的速度提升,內(nèi)存性能的提升速度每年只有10%左右,存儲速度嚴重滯后于處理器的計算速度。隨著AI技術(shù)的發(fā)展,所需數(shù)據(jù)量變得越來越大,計算量越來越多,“內(nèi)存墻”(內(nèi)存性能嚴重限制CPU性能發(fā)揮的現(xiàn)象)的問題越來越嚴重。因此,存算一體(將部分或全部的計算移到存儲中,計算單元和存儲單元集成在同一個芯片,在存儲單元內(nèi)完成運算),有望成為解決芯片性能瓶頸及提升效能比的有效技術(shù)手段。
目前,核心算力中芯片通用的GPU占主導(dǎo)地位。IDC的研究指出,2020年,中國的GPU服務(wù)器占據(jù)95%左右的市場份額,是數(shù)據(jù)中心AI加速方案的首選。但IDC也做出預(yù)測,到2024年,其他類型加速芯片的市場份額將快速發(fā)展,AI芯片市場呈現(xiàn)多元化發(fā)展趨勢。近年來,我國AI雖然取得了不少的突破和進展,比如“小i機器人”公司主導(dǎo)了全球第一個AI情感計算的國際標(biāo)準(zhǔn),并在國際上具備一定的競爭力,但AI芯片對外依賴較大,并缺乏AI框架技術(shù)支撐。
未來人們對科技的依賴會與日俱增,AI也將會成為大國競爭的焦點。為擺脫我國AI的短板,有專家表示AI芯片方面我國可以借鑒開源軟件的成功經(jīng)驗,降低創(chuàng)新門檻,提高企業(yè)自主能力,發(fā)展國產(chǎn)開源芯片;算法框架方面則可通過開源形成廣泛的應(yīng)用生態(tài),廣泛支持不同類型的AI芯片、硬件設(shè)備、應(yīng)用等。( 來源:科普時報)
周智勇:智慧城市建設(shè)進入數(shù)據(jù)、算法和算力融合推進的新階段,構(gòu)建算法和算力能力的公共資源平臺將成為的新制高點!構(gòu)建智慧城市數(shù)字孿生體其實不是終極目標(biāo),最終目標(biāo)是通過數(shù)據(jù)、算法和算力的跨場景融合應(yīng)用為城市創(chuàng)造管理價值、社會價值以及企業(yè)價值。
目前,業(yè)內(nèi)存在的難題是數(shù)據(jù)源源不斷,但是,算法和算力資源卻跟不上。
人工智能面臨著四大挑戰(zhàn)。分別是算力供應(yīng)嚴重不平衡,稀缺而且昂貴;比如很多傳統(tǒng)行業(yè)對部署的場景要求高,環(huán)境惡劣多變;云邊的數(shù)據(jù)無法協(xié)同和互通;專業(yè)技術(shù)要求門檻高,專業(yè)人才短缺。
http://www.ocn.com.cn/shangye/201909/xkijh10140647.shtml
人工智能面臨著四大挑戰(zhàn)。分別是算力供應(yīng)嚴重不平衡,稀缺而且昂貴;比如很多傳統(tǒng)行業(yè)對部署的場景要求高,環(huán)境惡劣多變;云邊的數(shù)據(jù)無法協(xié)同和互通;專業(yè)技術(shù)要求門檻高,專業(yè)人才短缺。
http://www.ocn.com.cn/shangye/201909/xkijh10140647.shtml
數(shù)據(jù)在不斷升遷,算力增加是必然的,往后更需要大算力芯片。而大算力的芯片除了感知之外,還可以在邊緣側(cè)提取特征和空間分析;到了中心側(cè),能夠完成二維、三維、四維數(shù)據(jù)的分析。
http://news.yesky.com/hotnews/422/457385422.shtml
數(shù)據(jù)在不斷升遷,算力增加是必然的,往后更需要大算力芯片。而大算力的芯片除了感知之外,還可以在邊緣側(cè)提取特征和空間分析;到了中心側(cè),能夠完成二維、三維、四維數(shù)據(jù)的分析。
http://news.yesky.com/hotnews/422/457385422.shtml
算法孵化器的目的是通過把整個算法產(chǎn)生過程工具化、標(biāo)準(zhǔn)化來降低一個單一算法的一次性產(chǎn)生成本,并為客戶提供快速應(yīng)用的能力。
http://www.sohu.com/a/290381283_115503
算法孵化器的目的是通過把整個算法產(chǎn)生過程工具化、標(biāo)準(zhǔn)化來降低一個單一算法的一次性產(chǎn)生成本,并為客戶提供快速應(yīng)用的能力。
http://www.sohu.com/a/290381283_115503
從算力、算法、數(shù)據(jù)和應(yīng)用看AIGC
01、核心觀點
AIGC未來已來,超預(yù)期持續(xù)出現(xiàn)。從2018到2023年,四代GPT模型高速進步,從簡單的問答、閱讀理解、文本總結(jié),到在眾多測試 中獲得“人類級別表現(xiàn)”評級,AI迭代進化的速度越來越快??梢灶A(yù)期,AI達到人類智能水平、乃至超 越人類智能水平的時代會以超預(yù)期的形態(tài)和速度出現(xiàn)。
數(shù)據(jù)、算力、算法為AIGC核心要素,海內(nèi)外廠商各占鰲頭。數(shù)據(jù),通過算力,最后產(chǎn)生了算法或者應(yīng)用。數(shù)據(jù)作為新興生產(chǎn)要素,數(shù)據(jù)的擁有者、加工者是產(chǎn) 業(yè)發(fā)展的基礎(chǔ)。算力作為基礎(chǔ)設(shè)施,是AIGC資本開支的主要受益者,核心參與者英偉達、AMD競爭優(yōu) 勢顯著。AIGC的技術(shù)壁壘主要體現(xiàn)在算法上,當(dāng)前通用型AI由GPT領(lǐng)跑,而在細分領(lǐng)域上,行業(yè)內(nèi)的主 要參與者包括谷歌、Meta、Anthropic、Hugging Face和百度等公司。隨著細分龍頭競相研發(fā)創(chuàng)新算 法和優(yōu)化現(xiàn)有技術(shù)、以及模型迭代下對數(shù)據(jù)、算力的需求高速膨脹,AIGC行業(yè)技術(shù)壁壘將不斷提高,現(xiàn) 有優(yōu)秀參與者護城河極深。
AIGC市場潛力巨大,應(yīng)用領(lǐng)域迎來生產(chǎn)力解放。全球AI軟件市場規(guī)模將在2025年達到1260億美元,2021年到2025 年年復(fù)合增長率為41.02%。一級市場的火熱也反映了AIGC發(fā)展的確定性趨勢。在大模型的快速迭代推 動下,搜索引擎、辦公軟件、汽車、媒體、AI繪畫設(shè)計、AI廣告營銷、智能工作助理等應(yīng)用率先落地的 行業(yè)將具備較強商業(yè)化機會。
02、生成式AI:ChatGPT引燃市場,數(shù)字經(jīng)濟未來已至
生成式AI:自然語言處理演變十余年,迎來變現(xiàn)階段
AIGC(AI Generated Content)即生成式AI,多領(lǐng)域應(yīng)用逐漸成熟。AIGC涉及無監(jiān)督和半監(jiān)督學(xué)習(xí)算 法,截至目前其發(fā)展歷程主要分為三個階段:統(tǒng)計機器學(xué)習(xí)方法階段(2010年前):首先對數(shù)據(jù)進行手工標(biāo)注,然后構(gòu)建其重要特征,最后構(gòu)建概率 模型并進行參數(shù)優(yōu)化,從而將概率最大的輸出作為結(jié)果;基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型(2010年-2017年):深度學(xué)習(xí)算法被引入,本質(zhì)上是通過大量數(shù)據(jù)訓(xùn)練 神經(jīng)網(wǎng)絡(luò),主要表現(xiàn)形式為:CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))等。相比統(tǒng)計學(xué)習(xí)方法, 省去了復(fù)雜且手工的特征構(gòu)建;基于Transformer結(jié)構(gòu)的預(yù)訓(xùn)練模型(2017年至今):利用大量無標(biāo)注數(shù)據(jù)進行自監(jiān)督學(xué)習(xí),然后再使 用少量的標(biāo)注數(shù)據(jù)對下游任務(wù)進行微調(diào)(即遷移學(xué)習(xí))。
生成式AI:GPT模型迭代四大版本,進化速度不斷提升
OpenAI創(chuàng)立于2015年12月,發(fā)布ChatGPT引燃AI行業(yè)熱度。GPT系列是OpenAI打造的自然語言處 理模型,采用以Transformer結(jié)構(gòu)為核心的模型,其最大特點是使用了大量的未標(biāo)注的語料進行無監(jiān)督的 預(yù)訓(xùn)練,然后在各種有監(jiān)督的任務(wù)上進行微調(diào)。OpenAI于2022年11月先后推出了GPT-3.5和ChatGPT,GPT-3.5使用了更新的語料進行預(yù)訓(xùn)練,而 ChatGPT是基于GPT-3.5的對話機器人,能夠根據(jù)用戶的輸入生成流暢、有邏輯的回答,以及完成撰寫論 文報告、翻譯文字、編寫代碼等文本生成任務(wù),并且能根據(jù)聊天的上下文進行互動。
生成式AI:AI產(chǎn)品全面開花,生產(chǎn)力將達新高度
GPT模型穩(wěn)定進步,AI已是成熟生產(chǎn)工具。從GPT-1到最新發(fā)布的GPT-4模型,其應(yīng)用已經(jīng)不僅局限 于問答、閱讀理解等文本處理,雖然目前GPT-4在現(xiàn)實場景中的能力可能不如人類,但在各種專業(yè)和學(xué)術(shù) 考試上表現(xiàn)出明顯超越人類水平的能力,GPT-4在模擬律師考試中,分數(shù)排在前10%;相比之下,GPT3.5的得分則在倒數(shù)10%附近。隨著算力、算法、數(shù)據(jù)量的演進,行業(yè)內(nèi)不斷出現(xiàn)高質(zhì)量的AI產(chǎn)品,微軟New Bing、AI繪畫、智能 駕駛等等,體現(xiàn)出AI未來在多個領(lǐng)域的應(yīng)用潛力。ChatGPT版Office、百度“文心一言”兩大產(chǎn)品正式推 出,或?qū)I的生產(chǎn)力推向新的高度。
生成式AI:AI進化加速,數(shù)字經(jīng)濟未來已至
AI行業(yè)星辰大海,數(shù)字經(jīng)濟未來已至。從2018到2023年,四代GPT模型高速進步,從簡單的問答、 閱讀理解、文本總結(jié),到在眾多測試中獲得“人類級別表現(xiàn)”評級,此外近期AI衍生產(chǎn)品的層出不窮,顯 現(xiàn)出背后AI行業(yè)的星辰大海。2020年,馬斯克預(yù)言五年內(nèi)人工智能將比人類更聰明,當(dāng)前AI迭代進化的速度越來越快,雖然GPT 還未通過圖靈測試,距離真正的“智能”還有距離,但我們認為,AI達到人類水平、乃至超越人類的時代 即將到來。
生成式AI:算力、算法、數(shù)據(jù)三位一體
數(shù)據(jù),通過算力,最后產(chǎn)生了算法或者應(yīng)用。AIGC是人工智能、大數(shù)據(jù)、云計算、5G等多個技術(shù)領(lǐng) 域的整合,是一種跨領(lǐng)域的合作發(fā)展模式。在AIGC行業(yè)中,算力、算法、數(shù)據(jù)是三個核心概念,它們共同 構(gòu)成了這個領(lǐng)域的基礎(chǔ)設(shè)施。未來隨著技術(shù)的進步和應(yīng)用場景的不斷拓展,這三個概念將繼續(xù)發(fā)揮重要作 用,推動整個行業(yè)的創(chuàng)新和發(fā)展。
03、數(shù)據(jù):大模型訓(xùn)練的基礎(chǔ)資源
數(shù)據(jù):大模型訓(xùn)練的基礎(chǔ)資源,需求不斷擴大
數(shù)據(jù)是訓(xùn)練大模型的基礎(chǔ)資源,以GPT系列模型為例,對比三代模型間使用的數(shù)據(jù)集,訓(xùn)練所需的 數(shù)據(jù)集在質(zhì)量和數(shù)量方面均不斷提升。隨著人工智能模型迭代發(fā)展,高質(zhì)量數(shù)據(jù)集的需求將進一步增長。從自然數(shù)據(jù)源簡單收集取得的原料數(shù)據(jù)并不能直接用于有監(jiān)督的深度學(xué)習(xí)算法訓(xùn)練,必須經(jīng)過專 業(yè)化的采集、加工,形成相應(yīng)的工程化訓(xùn)練數(shù)據(jù)集后才能供深度學(xué)習(xí)算法等訓(xùn)練使用。目前,帶有監(jiān)督學(xué)習(xí)的算法對于訓(xùn)練數(shù)據(jù)的需求遠大于現(xiàn)有的標(biāo)注效率和投入預(yù)算,基礎(chǔ)數(shù)據(jù)服 務(wù)將持續(xù)釋放其對于算法模型的基礎(chǔ)支撐價值。
04、算力:大模型發(fā)展帶來高算力需求
算力:算力需求不斷攀升,GPU行業(yè)市場巨大
AIGC模型硬件以GPGPU為主,GPU市場規(guī)模有望在2030年超過4000億美元。GPU在并行計算方 面具有性能優(yōu)勢,在AI領(lǐng)域分化成兩條分支:一條是傳統(tǒng)意義的GPU,專門用于圖形圖像處理用途;另一 條是GPGPU,作為運算協(xié)處理器,增加了專用指令來滿足不同領(lǐng)域的計算需求。使用GPGPU在云端進行 模型訓(xùn)練算法能夠顯著縮短海量訓(xùn)練數(shù)據(jù)的訓(xùn)練時長,減少能源消耗,從而降低人工智能的應(yīng)用成本,目 前全球人工智能相關(guān)處理器解決方案仍以GPGPU為主。根據(jù)VerifiedMarketResearch報告,2021年全球GPU芯片市場規(guī)模已經(jīng)達到了334.7億美元,并預(yù) 計到2030年將達到4,773.7億美元,CAGR高達33.3%。GPU市場保持著高速增長態(tài)勢,其在人工智能領(lǐng)域 中仍然是不可或缺的計算資源之一。
算力:英偉達芯片龍頭市場地位穩(wěn)固
英偉達:高算力芯片龍頭,AI芯片市場地位領(lǐng)先。人工智能平臺需要巨大的數(shù)據(jù)處理能力,英偉達的 A100顯卡適合于支持ChatGPT、Bard等工具的機器學(xué)習(xí)模型,這款芯片能夠同時執(zhí)行眾多簡單的計算,而 這對于訓(xùn)練和使用神經(jīng)網(wǎng)絡(luò)模型很重要,使得A100顯卡成為目前主流AI芯片。長期展望,AI芯片市場快速增長將帶動英偉達營收快速增長,根據(jù)中商產(chǎn)業(yè)研究院數(shù)據(jù)顯示,預(yù)計全 球AI芯片市場規(guī)模有望從2020年的約175億美元提升到2025年的726億美元,年復(fù)合增長率32.9%。根據(jù)花 旗集團預(yù)估,ChatGPT 的使用可能會在 12 個月內(nèi)為英偉達帶來 30 億至 110 億美元的銷售額。
算力:AMD封裝理念Chiplet領(lǐng)先,推出高性能APU
AMD:高算力芯片代表企業(yè),即將推出世界首款集成數(shù)據(jù)中心CPU和GPU的APU產(chǎn)品。在2023年的 CES上,AMD預(yù)覽了AI推理加速器AMD Alveo V70,主打高能效,峰值A(chǔ)I算力可達到400TOPS,TDP僅 75W。AMD稱這是最強AI算力的75W TDP級產(chǎn)品。AMD還預(yù)覽了其首款集成數(shù)據(jù)中心CPU和GPU的APU產(chǎn)品AMD Instinct MI300。該款產(chǎn)品采用了 Chiplet封裝理念。Chiplet策略是一項重要的硬件創(chuàng)新,擺脫了單芯片微縮的限制,同時能夠優(yōu)化設(shè)備的性 能、功耗和性價比。MI300加速器專為領(lǐng)先的高性能計算(HPC)和AI性能而設(shè)計,借助3D封裝技術(shù)將 CPU和加速計算單元集成在一起,總共有1460億個晶體管。
算力:英偉達、AMD壟斷全球,國產(chǎn)芯片奮起直追
全球GPU市場中英偉達和AMD占據(jù)96%份額,國內(nèi)GPU主要研發(fā)企業(yè)為海光信息、寒武紀(jì)等。根據(jù) Wccftech,2022Q3獨立GPU市場中英偉達和AMD分別占據(jù)88%、8%市場份額。根據(jù)海光信息招股書公 布技術(shù)指標(biāo)數(shù)據(jù),當(dāng)前國內(nèi)高端GPU相比國際巨頭在顯存頻率、帶寬等參數(shù)上還有一定差距,但在典型應(yīng) 用場景下,深算一號已基本能夠達到國際上同類型高端產(chǎn)品的水平。在國際市場上,英偉達和AMD在高性能計算和人工智能領(lǐng)域具有豐富的產(chǎn)品線和完善的生態(tài)系統(tǒng), 疊加長期積累的技術(shù)優(yōu)勢和市場地位,預(yù)計仍將長期維持AI算力芯片領(lǐng)域的龍頭地位。
算力:國產(chǎn)芯片發(fā)展迅速,填補AI市場空缺
高端芯片進口受限,國產(chǎn)芯片需求加速擴大。在NVIDIA、AMD高端產(chǎn)品被限制向中國出售的情況下, 國產(chǎn)大模型算力需求將快速推動國產(chǎn)芯片市場增長,當(dāng)前國產(chǎn)GPGPU芯片的研發(fā)和生產(chǎn)已經(jīng)取得了一定的 進展,海光、炬芯、寒武紀(jì)等企業(yè)均擁有具備自主知識產(chǎn)權(quán)的GPU芯片,為國內(nèi)高性能計算和人工智能領(lǐng) 域的發(fā)展提供了重要支持。根據(jù)前瞻產(chǎn)業(yè)研究院,國產(chǎn)人工智能芯片自2020年來呈爆發(fā)式增長,2023年市場空間預(yù)計將超過 1,300億元,2020-2023年CAGR為95.86%??傮w而言,在國際關(guān)系緊張、芯片進口受限的前提下國產(chǎn)人 工智能芯片市場未來的發(fā)展前景廣闊,隨著國內(nèi)廠商加大研發(fā)投入和技術(shù)創(chuàng)新力度,進一步提升產(chǎn)品性能, 看好其在國內(nèi)乃至國際市場中獲得更多的份額和競爭優(yōu)勢。
05、算法:大模型算法助力AIGC突破
算法:微軟Azure超算為GPT提供保障
Azure算力支持,數(shù)億投入始現(xiàn)回報。GPT系列是OpenAI打造的自然語言處理模型,基于文本 預(yù)訓(xùn)練的GPT-1,GPT-2,GPT-3三代模型都采用以Transformer結(jié)構(gòu)為核心的模型。微軟在2019年向OpenAI投資10億美元,并為OpenAI建造了一臺由數(shù)萬個A100 GPU組成的大 型AI超級計算機,成本或超過數(shù)億美元。GPT模型正是由這臺超級計算機提供支持,OpenAI試圖訓(xùn) 練更多需要學(xué)習(xí)海量數(shù)據(jù)、擁有超大參數(shù)規(guī)模的AI模型,需要長期訪問強大的云計算服務(wù),GPT-3的 參數(shù)量達到了1,750億,微軟構(gòu)建了一個可在非常大的范圍內(nèi)運行且可靠的系統(tǒng)架構(gòu),這使得 ChatGPT成為可能。
算法:ChatGPT引入最新模型GPT-4具備識圖能力
算法:GPT-4模型回答準(zhǔn)確性顯著提高
相較GPT-3.5,回答準(zhǔn)確性顯著提高。根據(jù)OpenAI公布數(shù)據(jù)顯示,GPT-4在專業(yè)和學(xué)術(shù)方面表現(xiàn)優(yōu) 異,在諸多標(biāo)準(zhǔn)化考試中均取得了優(yōu)秀的分數(shù)。比如其能通過模擬律師考試,且分數(shù)在應(yīng)試者的前10% 左 右,相比之下,GPT-3.5的得分在倒數(shù) 10% 左右。GPT-4在GRE(Graduate Record Examination)數(shù) 學(xué)考試中取得應(yīng)試者前20%左右成績,而GPT-3.5僅能排在應(yīng)試者后25%。GPT-4在大部分語言上的準(zhǔn)確性均超過了GPT-3.5在英語上的表現(xiàn)。OpenAI使用 Azure Translate 將 MMLU 基準(zhǔn) —— 一套涵蓋 57 個主題的 14000 個多項選擇題 —— 翻譯成多種語言。在測試的 26 種 語言的 24 種中,GPT-4 優(yōu)于 GPT-3.5 和其他大語言模型(Chinchilla、PaLM)的英語語言性能。
算法:最大視覺語言模型PaLM-E,可操控機器人
谷歌:發(fā)布目前最大視覺語言模型PaLM-E,有望率先落地智能機器人相關(guān)產(chǎn)品。PaLM-E是一種多 模態(tài)視覺語言模型(VLM),具有 5620 億個參數(shù),是全球已知的最大視覺語言模型。根據(jù)谷歌公布的演示視頻顯示,只需要給 PalM-E 下達一條高級命令,比如“把抽屜里的薯片拿給 我”,它就可以給一個帶機械臂的移動機器人平臺(由谷歌機器人開發(fā))生成行動計劃,然后自行執(zhí)行。PaLM-E 通過分析來自機器人攝像頭的數(shù)據(jù)來實現(xiàn)這一點,整個過程不需要對場景表示進行預(yù)處理。并且,PaLM-E表現(xiàn)出了“正遷移”,又稱助長式遷移,它能把一項任務(wù)中學(xué)到的知識和技能遷移至另一項 任務(wù),而且與單任務(wù)機器人模型相比具有“明顯更高的性能水平”。
算法:針對研究群體的模型“LLaMA”,目標(biāo)明確
Meta:“LLaMA”致力于輔助學(xué)術(shù)研究人員完成研究工作。LLaMA (Large Language Model Meta AI)模型參數(shù)相對少,意味著運行模型算力要求較低,但基準(zhǔn)測試表現(xiàn)優(yōu)秀。同ChatGPT、New Bing不同,LLaMA是一個開源的“研究工具”,旨在完成在文本生成、問題回答、書面材料總結(jié),以及自 動證明數(shù)學(xué)定理、預(yù)測蛋白質(zhì)結(jié)構(gòu)等工作幫助研究人員推進研究工作。根據(jù)Meta發(fā)布的信息,LLaMA包含4個基礎(chǔ)模型,參數(shù)分別為70億、130億、330億和650億。其中, LLaMA 65B 和 LLaMA 33B在1.4萬億個tokens上訓(xùn)練,而最小的模型LLaMA 7B也經(jīng)過了1萬億個tokens 的訓(xùn)練。在大多數(shù)基準(zhǔn)測試中,參數(shù)小的多的LLaMA-13B的性能優(yōu)于GPT3.5的前身GPT3-175B,而 LLaMA-65B更可與業(yè)內(nèi)最佳的Chinchilla-70B和PaLM-540B競爭。
算法:對人工智能的安全性監(jiān)督日益重要
Anthropic:聚焦“安全”的人工智能,或?qū)⒊蔀锳I安全領(lǐng)域?qū)<?。隨著大語言模型的發(fā)展,AI在很 多任務(wù)上的能力將會超過人類,這將讓人類無法監(jiān)督模型。為了確保 AI 在超過人類能力后仍保持安全性, 需要開發(fā)一種可擴展的模型監(jiān)督技術(shù)。CAI( Constitutional AI )技術(shù)即是這種模型監(jiān)督技術(shù),原理是人類可以指定一套行為規(guī)范或原則, 而不需要手工為每個有害輸出打標(biāo)簽,模型根據(jù)這套行為規(guī)范和準(zhǔn)則選擇最佳結(jié)果。Anthropic所開發(fā)的 聊天機器人Claude,在對話安全領(lǐng)域上做得更為突出,更擅長拒絕有害詞或有害的引導(dǎo),與人類價值觀更 加相符。并且CAI技術(shù)有望對未來所有人工智能模型實施有效安全性監(jiān)督。
算法:構(gòu)建AI開發(fā)平臺,加速AI模型迭代更新
Hugging Face:與亞馬遜旗下云計算部門AWS擴大合作,將在AWS上構(gòu)建下一個版本語言模型。近日,AWS宣布與美國明星AI創(chuàng)企Hugging Face擴大合作,以加速構(gòu)建生成式AI應(yīng)用的大型語言模型和 大型視覺模型的訓(xùn)練、微調(diào)和部署。Hugging Face是OpenAI的主要競爭對手之一,其主要業(yè)務(wù)包括生產(chǎn) AI產(chǎn)品和托管其他公司開發(fā)的產(chǎn)品,已發(fā)展成AI開發(fā)者共享開源代碼和模型的在線中心之一。據(jù)AWS數(shù)據(jù)庫、分析和機器學(xué)習(xí)副總裁Swami Sivasubramanian透露,Hugging Face將在AWS上 構(gòu)建其語言模型的下一個版本BLOOM。該開源AI模型在規(guī)模和范圍上將與OpenAI用于研發(fā)ChatGPT的大 型語言模型競爭,將運行在AWS自研AI訓(xùn)練芯片Trainium上。
算法:國產(chǎn)大模型奮力追趕,行業(yè)布局廣泛
百度:國內(nèi)首個類GPT產(chǎn)品,有望在外部壓力驅(qū)動下快速推動國內(nèi)應(yīng)用結(jié)合落地?!拔男囊谎浴北M管模 型能力水平上與ChatGPT等有一定差距,但在下游應(yīng)用逐步對接后,有望依靠合作伙伴的高質(zhì)量數(shù)據(jù)集快速 提升模型能力。由于國內(nèi)無法使用ChatGPT的API接口,且出于數(shù)據(jù)安全等角度考慮,勢必需要國產(chǎn)大模型, 百度“文心一言”作為國產(chǎn)大模型的先行者,在國內(nèi)政策扶持和產(chǎn)業(yè)鏈協(xié)同發(fā)展的背景下,將進一步加速國 內(nèi)AI技術(shù)進步和產(chǎn)業(yè)化進程,填補市場空缺。根據(jù)百度文心大模型的布局全景,“文心一言”有望通過飛槳開源開放平臺、百度智能云等賦能到工業(yè) 、能源、金融、通信、媒體、教育等各行各業(yè),通過接入合作伙伴的方式,進一步獲取高質(zhì)量數(shù)據(jù)集以強化 模型訓(xùn)練調(diào)整,快速提升模型性能。
06、產(chǎn)業(yè)應(yīng)用:各領(lǐng)域應(yīng)用加速落地,商業(yè)化前景廣闊
產(chǎn)業(yè)應(yīng)用:AIGC市場潛力巨大,落地領(lǐng)域迎來生產(chǎn)力解放
AIGC市場潛力巨大,即將實現(xiàn)多領(lǐng)域應(yīng)用。根據(jù)Tractica的預(yù)測數(shù)據(jù)顯示,全球AI軟件市場規(guī)模將在 2025年達到1260億美元,2021年到2025年年復(fù)合增長率為41.02%。在大模型的快速迭代推動下,AIGC 市場預(yù)計將保持高速增長,市場潛力巨大。生成式AI領(lǐng)域在一級市場同樣受到青睞,全球早期資金調(diào)研機構(gòu) CB Insights最新報告顯示,2022年有110筆創(chuàng)投交易和ChatGPT概念有關(guān),投資資金超過26億美元。我們預(yù)計搜索引擎、辦公軟件、汽車、媒體、AI繪畫設(shè)計、AI廣告營銷等應(yīng)用率先落地的行業(yè)將具備 較強商業(yè)化機會,AI服務(wù)將極大解放生產(chǎn)力,帶來行業(yè)新模式。
【搜索引擎】微軟(MSFT.O):高質(zhì)量廣告更加符合用戶需求
搜索引擎的主要代表為微軟Bing。根據(jù)用戶搜索內(nèi)容,必應(yīng)將生成相應(yīng)問題答案的方案,比如當(dāng)用戶 輸入“計劃一次為期五天的墨西哥之旅”的命令時,除了返回一些網(wǎng)址鏈接供你參考之外,跟使用 ChatGPT 一樣,必應(yīng)對話框會直接給你寫出一個方案,用戶可以直接復(fù)制這個答案,不滿意的話也可以要 求它再生成一個另外的方案,而必應(yīng)可能會在回復(fù)中給出與搜索內(nèi)容相關(guān)的廣告。由于生成式搜索下回復(fù)將 對用戶具有更高的匹配度,因此廣告也將更符合用戶需求。
【辦公軟件】微軟(MSFT.O):AI助手解放生產(chǎn)力,辦公模式迎來變革
【汽車】Mobileye(MBLY.O):自動駕駛或達新高度
【媒體】Buzzfeed(BZFD.O):率先落地AI,互動更加個性化
根據(jù)CBS消息,美國知名媒體BuzzFeed宣布與OpenAI合作,將從“Quizzes”欄目入手,引入生成式 AI進行內(nèi)容創(chuàng)作。該欄目主要由一系列有趣的問題測試組成,比如包括“測測你是迪士尼里的哪位公主”, “你最像復(fù)仇者聯(lián)盟里的哪位超級英雄”之類等,根據(jù)用戶回答生成個人報告。ChatGPT接入到Buzzfeed后,將被用于為每位客戶生成個性報告的編寫過程中,AI的自動化生產(chǎn)內(nèi)容 將為這一工作縮減不必要的人工勞動,從而降低內(nèi)容生產(chǎn)的成本,有望迎來人力成本的解放。根據(jù)Buzzfeed 同創(chuàng)辦人兼執(zhí)行長Jonah Peretti表示,AI將會被應(yīng)用在建立測驗、集思廣益,并協(xié)助為閱聽眾提供客制化內(nèi) 容,幫助媒體作者提高效率。
【設(shè)計繪畫】Stability AI:AI高效繪圖,改變行業(yè)工作模式
目前該行業(yè)領(lǐng)域暫無對應(yīng)上市公司,主要公司之一為Stability AI。Stability AI是一家元宇宙及數(shù)字媒 體工具開發(fā)商,構(gòu)建了可制作數(shù)字藝術(shù)的AI繪畫平臺“Stable Diffusion”,該工具是一種根據(jù)描述生成圖片 的AI技術(shù)模型。只需輸入簡單的文字描述,其就能在幾秒鐘內(nèi)自動生成一幅真實的畫作。AI技術(shù)的發(fā)展讓人們的想象逐 漸成為現(xiàn)實。無論是需要一個角色立繪,還是設(shè)計場景背景,均可以通過AI繪圖工具迅速完成。該類AI繪圖 應(yīng)用有望為設(shè)計繪畫行業(yè)帶來效率的極大提升,釋放大量人工勞動力,人類所扮演得角色將更傾向于提出意 見,而不是親自做圖。
【游戲】Scenario、網(wǎng)易(9999.HK):生成游戲素材,增強交互體驗
游戲資產(chǎn)生成:Scenario 允許創(chuàng)建由游戲開發(fā)人員或游戲藝術(shù)家訓(xùn)練的自定義生成器,以僅匹配他們 自己圖像的風(fēng)格。在用戶上傳了一組定義給定游戲或項目的角色、物品、環(huán)境或其他資產(chǎn)的視覺效果后, Scenario平臺可以根據(jù)用戶上傳數(shù)據(jù)快速生成相應(yīng)游戲資產(chǎn),大大降低了游戲開發(fā)成本。增強交互體驗:近期網(wǎng)易旗下手游《逆水寒》官方宣布,實裝國內(nèi)首個游戲內(nèi)類GPT技術(shù),采用了大量 來自網(wǎng)易伏羲人工智能實驗室以及網(wǎng)易雷火事業(yè)群的 AI 技術(shù)。從官方公布演示視頻來看,《逆水寒》手游已 經(jīng)能讓智能 NPC 和玩家自由生成對話,同時也能基于對話內(nèi)容做出合適的邏輯行為反饋,包括聲音和形體動 作。生成式AI在游戲中的應(yīng)用可以大大增強玩家劇情代入感,大幅提高游戲交互體驗,提升玩家對游戲的探 索欲望。
【廣告營銷】Jasper AI:快速創(chuàng)建各類廣告內(nèi)容,降低營銷成本
Jasper AI是一個AI文本生成工具,用戶可以通過其自動創(chuàng)建博客文章、社交媒體文章、廣告、電子書 、登陸頁面副本、故事、小說等等。一旦用戶給出一些輸入文本(關(guān)于需要生成的內(nèi)、標(biāo)題、相關(guān)關(guān)鍵詞等 的簡介),它就會生成對應(yīng)的原創(chuàng)內(nèi)容。其深耕廣告營銷領(lǐng)域,有望成為垂直領(lǐng)域行業(yè)龍頭,主要具備以下 三個優(yōu)勢:
精細的營銷模板:用戶可以根據(jù)想要生成的內(nèi)容形式,選擇更加符合需求的模板,平臺提供50個簡短的文 案模板,可幫助用戶為各種日常任務(wù)創(chuàng)建文案,其中包括用于為電子郵件、網(wǎng)站、博客、廣告、電子商 務(wù)、社交媒體、視頻等編寫內(nèi)容的 AI 模板。產(chǎn)品交互體驗優(yōu)秀:該平臺工具交互界面清晰易上手,產(chǎn)品符合用戶使用邏輯,且會根據(jù)用戶反饋頻繁更 新優(yōu)化。優(yōu)秀的配套培訓(xùn)體系:Jasper AI提供名為 "Jasper BootCamp" 的培訓(xùn),幫助新用戶快速了解該軟件的工 作原理,并且獲得營銷基本知識。
.
《南方治理評論》稿約
《南方治理評論》始創(chuàng)于2013年,CNKI來源集刊。廣州大學(xué)南方治理研究院主辦、社會科學(xué)文獻出版社出版的連續(xù)性學(xué)術(shù)輯刊?!赌戏街卫碓u論》秉持“培育公共精神,直面轉(zhuǎn)型中國,詮釋社會熱點,擴展學(xué)術(shù)深度,貼近重大需求,服務(wù)國家治理”,追求“本土化、專業(yè)化、個性化、國際化”,崇尚原創(chuàng)研究、微觀研究和深度研究的學(xué)術(shù)精神,試圖在中國繁雜的地方語境下運用本土話語體系著力解讀地方性知識和日常性邏輯。主要設(shè)置有“學(xué)術(shù)一線”、“數(shù)字治理”、“健康治理”、“災(zāi)害治理”、“南國講堂”、“伶仃書評”、“回歸訪談”等欄目。
通訊地址:廣州市大學(xué)城外環(huán)西路230號文逸樓512室
投稿郵箱:gdgzpar@163.com
投稿網(wǎng)站:http://iedol.ssap.cm.cn/(選擇“社會政法”)
投稿體例:https://pan.wps.cn/l/srr2hdj
《南方治理評論》第8輯
《南方治理評論》第7輯
《廣州公共管理評論》第6輯
《廣州公共管理評論》第5輯
《廣州公共管理評論》第4輯
《廣州公共管理評論》第3輯
《廣州公共管理評論》第2輯
《廣州公共管理評論》第1輯
當(dāng)前瀏覽器不支持播放音樂或語音,請在微信或其他瀏覽器中播放 癡情冢 音樂: 賈青;徐溢 - 新天龍八部 電視原聲帶
廣州大學(xué)南方治理研究院
掃描二維碼推送至手機訪問。
版權(quán)聲明:本文由飛速云SEO網(wǎng)絡(luò)優(yōu)化推廣發(fā)布,如需轉(zhuǎn)載請注明出處。