亚洲无码公司,黄视频网址

對話澎湃新聞 | 訓(xùn)練ChatGPT有多燒錢,？國產(chǎn)大模型有機會嗎？

來源：法國里昂商學(xué)院時間：2023-03-04

在ChatGPT大熱的環(huán)境下,，同時引發(fā)社會各界的熱烈討論與深度思考,。法國里昂商學(xué)院多位教授受多家媒體采訪，發(fā)表深刻見解,。近期,，法國里昂商學(xué)院人工智能管理學(xué)院 (AIM) 院長、全球商業(yè)智能中心 (BIC) 主任龔業(yè)明接受澎湃科技采訪,，就這一個問題給出專業(yè)分析,。

GPT1.0和GPT2.0是開源的，目前很多國產(chǎn)大語言模型是用開源軟件,，加上中文語料處理的,，差距和GPT3.5可能并不只相差了一代。而現(xiàn)在GPT3.0沒有可靠的開源軟件,。

“誠然很多國內(nèi)廠商對ChatGPT有興趣,，但是他們的興趣點也很多，跟風(fēng)投機性強,，無法像OpenAI那樣全力以赴,，意志堅定?！?

ChatGPT風(fēng)靡全球后,，科技巨頭們紛紛入局，各類初創(chuàng)公司也如雨后春筍,。最近,，原美團聯(lián)合創(chuàng)始人王慧文的一條“5000萬美元,，帶資入組，不在意崗位,、薪資和title,，求組隊”的宣言更是引起諸多討論。

然而,，訓(xùn)練通用大模型非?！盁X”,。據(jù)國盛證券報告《ChatGPT需要多少算力》估算,，GPT-3訓(xùn)練一次的成本約為140萬美元，對于一些更大的LLM (大型語言模型),，訓(xùn)練成本介于200萬美元至1200萬美元之間,。以ChatGPT在1月的獨立訪客平均數(shù)1300萬計算，其對應(yīng)芯片需求為3萬多片英偉達A100 GPU,，初始投入成本約為8億美元,，每日電費在5萬美元左右。

更直觀地理解,，如果將當(dāng)前的ChatGPT部署到谷歌進行的每次搜索中,，需要512820.51臺A100 HGX服務(wù)器和總共4102568個A100 GPU，這些服務(wù)器和網(wǎng)絡(luò)的總成本僅資本支出就超過1000億美元,。

“大模型的訓(xùn)練和推理成本一直以來是AI產(chǎn)業(yè)發(fā)展的瓶頸,，因此具有大模型構(gòu)建能力的企業(yè)往往是世界科技巨頭。這會形成強大的護城河,，造成強者恒強的局面,。”法國里昂商學(xué)院人工智能管理學(xué)院 (AIM) 院長,、全球商業(yè)智能中心 (BIC) 主任龔業(yè)明接受澎湃科技 (www.thepaper.cn) 采訪時表示,。

“的確成本很高，所以短期內(nèi)大廠具有優(yōu)勢,?；蛘哔Y本市場高度看好這一領(lǐng)域，重金投資出一些創(chuàng)業(yè)公司來做大模型,?！盜DC中國研究總監(jiān)盧言霞對澎湃科技表示，“將來要么是大廠作為最上游提供基礎(chǔ)模型,，中小型企業(yè)作為下游開發(fā)出基于大模型的應(yīng)用,。要么是也會誕生出一批做大模型的AI創(chuàng)企，即使如此,，產(chǎn)業(yè)也將是大模型提供商為上游,。還有可能大模型發(fā)展到一定階段,，開源的越來越多，頭部行業(yè)用戶基于開源模型開發(fā)自己的AI應(yīng)用,，提供給行業(yè)里其他友商,，也就是類似行業(yè)云的形式?！?

國產(chǎn)大模型與ChatGPT基礎(chǔ)模型相差不止一代

“ChatGPT本質(zhì)上是一個由浮點數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡(luò)大模型,，屬于深度學(xué)習(xí)的框架。ChatGPT的推出是深度學(xué)習(xí)提出后又一個里程碑式的技術(shù)革命,，將為以自然語言處理為核心的認知智能技術(shù)發(fā)展提供新的‘歷史機遇期’,。”科大訊飛副總裁,、研究院執(zhí)行院長劉聰對澎湃科技解釋道,。

近期，除了驚艷于ChatGPT的表現(xiàn)之外,，AI行業(yè)內(nèi)對于中國能否做出類ChatGPT的產(chǎn)品也有諸多討論,。國內(nèi)大模型究竟與ChatGPT背后的GPT系列大模型相差多少？

“GPT1.0和GPT2.0是開源的,，目前很多國產(chǎn)大語言模型是用開源軟件,，加上中文語料處理的，差距和GPT3.5可能并不只相差了一代,?！饼彉I(yè)明表示。

而現(xiàn)在GPT3.0沒有可靠的開源軟件了,，龔業(yè)明說,，“但是有理論論文發(fā)表，一些國產(chǎn)大語言模型正在根據(jù)GPT3.0論文和一些相關(guān)的情報開發(fā)系統(tǒng),，但是和OpenAI的原創(chuàng)模型會有較大差距,。”

據(jù)龔業(yè)明分析,，問題在于GPT3.0比很多目前國產(chǎn)大模型采用的GPT2.0要進化很多,，而OpenAI正在一個從GPT3.5到GPT4.0的發(fā)展過程中。如果要徹底達到GPT3.5的水平,，在短期內(nèi)是不太可能的,，語料庫的建立，人工標注,，算法的訓(xùn)練都需要時間,。

很多國產(chǎn)大模型計劃用半年完成追趕，龔業(yè)明判斷,，“半年后市場會出現(xiàn)一批這樣的所謂的GPT,，但要達到真正實用需要2-3年,，那時候OpenAI又進步了?！?

差距的背后是什么,？

從技術(shù)角度來看，龔業(yè)明認為,，國內(nèi)的AI領(lǐng)域在基礎(chǔ)理論,、算法研究、語料庫以及技術(shù)人才方面相對滯后,。

? 第一,，就語料庫而言，龔業(yè)明具體解釋道,，“一個裝樣子的語料庫的構(gòu)建和獲取也許不是特別費勁,，但是語料的標注與理解工作比較繁復(fù)。目前有很多人工智能專家還認為中文語料質(zhì)量會影響國產(chǎn)大模型的發(fā)展,。語言學(xué)的長期研究告訴我們，語料庫的構(gòu)建最好不能只局限于簡體中文語料庫,，要能理解多種語言,，才能構(gòu)建一流的中文語料庫。所以不要認為靠人海戰(zhàn)術(shù)和低人力成本建一個簡中語料庫就能解決語言學(xué)問題,?！?

? 第二是算法。“GPT對算法的要求特別高,。算法要能容納和分析大數(shù)據(jù),，個別國產(chǎn)大語言模型出現(xiàn)了過載問題，就是算法處理不了更大的數(shù)據(jù),，或增加了數(shù)據(jù)后服務(wù)質(zhì)量沒提高,。”龔業(yè)明說,。

? 第三是運算量,。“GPT需要高端顯卡和高端芯片。在目前的國際環(huán)境中,，并不是所有我國企業(yè)能獲取足量的高端顯卡和高端芯片,。同時運算量也要求較高的投資?！饼彉I(yè)明也聊到當(dāng)下的現(xiàn)狀,，“誠然很多國內(nèi)廠商對ChatGPT有興趣，但是他們的興趣點也很多,，跟風(fēng)投機性強,，無法像openAI那樣全力以赴,，意志堅定?！?

? 最后,，“短期內(nèi)很不容易找到GPT的領(lǐng)軍人才，在這個領(lǐng)域領(lǐng)軍人才幾乎全在美國,?！饼彉I(yè)明不無遺憾地總結(jié)道，“由于這些關(guān)鍵因素,，我不認為能夠比較容易地在短期內(nèi)實現(xiàn)追趕,。”

另一方面,，“國內(nèi)缺乏明確的前瞻性生態(tài)與商業(yè)布局,。”龔業(yè)明從商業(yè)模式角度分析,，“現(xiàn)在出現(xiàn)了ChatGPT這樣的產(chǎn)品,，國內(nèi)也會出現(xiàn)很多的公司、機構(gòu),，但在技術(shù)路徑的復(fù)制上面,，由于缺乏基礎(chǔ)模型積累和大量的訓(xùn)練數(shù)據(jù)來源，所以復(fù)制難度較大,。OpenAI在很多年前就理解了GPT的價值,，我們到現(xiàn)在別人已經(jīng)做出來，才知道該這樣發(fā)展,，才理解其中的商業(yè)價值,，就慢了點?！?

ChatGPT商業(yè)價值幾何,？“兵家必爭之地”

劉聰認為，這次ChatGPT所帶來的革命將會深刻地改變當(dāng)今世界的生產(chǎn)和生活方式,，重構(gòu)產(chǎn)業(yè)格局,，是人工智能領(lǐng)域推動工業(yè)乃至社會變革的重大戰(zhàn)略機遇，是未來發(fā)展兵家必爭之地,。

具體而言,，劉聰概括了四個方面的變革。

一是改變現(xiàn)有人機交互模式,，未來人們可能用自然對話的方式與智能產(chǎn)品交互,。
二是改變信息分發(fā)獲取模式，基于認知智能技術(shù)可實現(xiàn)更高效的信息整合和知識推薦等,。
三是革新內(nèi)容生產(chǎn)模式,，提高生產(chǎn)力,。“未來ChatGPT被集成到word,、excel,、ppt等工具軟件后，將提升內(nèi)容生產(chǎn)效率與豐富度,，變革人們的辦公方式,，成為新的全行業(yè)生產(chǎn)力工具?！?
”四是加速“AI for Science”的發(fā)展,，“隨著其學(xué)習(xí)的科研數(shù)據(jù)越來越多，未來ChatGPT有可能提供專業(yè)的研究建議甚至主動探索發(fā)現(xiàn)新的理論,，帶來整個科學(xué)研究范式的全新變化,。”

盧言霞則認為,，ChatGPT短期內(nèi)不可能顛覆AI行業(yè)格局,，其對市場真正的影響在于底層大模型對AI開發(fā)模式的轉(zhuǎn)變。

這句話包含了兩層判斷,。

為何ChatGPT短期內(nèi)不可能顛覆AI行業(yè)格局,？盧言霞認為，基于GPT-3模型已讀取的數(shù)據(jù),，ChatGPT可以回答用戶的問題，甚至可以為用戶推薦適配的產(chǎn)品,、服務(wù),。其所提供的答案在準確性、廣泛性方面仍存在局限,，因此現(xiàn)階段無法直接用于企業(yè)特定的場景中以替代之前的AI應(yīng)用,，不可能徹底顛覆搜索市場，也不可能改變?nèi)斯ぶ悄苁袌龈窬??！?

龔業(yè)明則持截然相反的觀念，“由于內(nèi)容可信度還不是特別高,，交互成本高,，很多市場分析人員認為ChatGPT對市場真正的影響有限，這種看法可能對這個技術(shù)的商業(yè)價值理解不是特別深刻,。目前也只是處在ChatGPT發(fā)展的早期,，內(nèi)容可信度會隨著訓(xùn)練與算法的提高，逐步解決,?！?

對于另一個AI開發(fā)模式轉(zhuǎn)變的判斷,，盧言霞進一步解釋道，“以前很多AI應(yīng)用都是直接使用通用AI軟件,，或者通用AI公有云服務(wù),。ChatGPT基于大模型的效果被認知到并且重視以后，將會有越來越多的AI應(yīng)用或是嵌入大模型,，或是直接用基于大模型的AI軟件替代,。也就是說，這會是已經(jīng)部署的AI應(yīng)用更新?lián)Q代的機會,?！?

“之前AI市場很分散，未來如果大模型發(fā)展起來,，那么產(chǎn)業(yè)鏈可能的分工是：大廠提供大模型,，AI應(yīng)用廠商基于大廠的大模型開發(fā)AI應(yīng)用。這將是上下游的關(guān)系,，不再是之前的競合關(guān)系,。”盧言霞說,。

歐科云鏈研究院高級研究員蔣照生則對澎湃科技談到一個新的角度,，ChatGPT將加速Web 3.0時代的到來。

“以ChatGPT為代表的生成式AI完全有潛力成為Web 3.0時代的生產(chǎn)力工具,，通過從包括鏈上數(shù)據(jù)在內(nèi)的新型生產(chǎn)要素中學(xué)習(xí)和分析,，為Web 3.0創(chuàng)作者和貢獻者們提供更可靠和更便捷的生產(chǎn)力工具，解決數(shù)字世界的數(shù)據(jù)資產(chǎn)與內(nèi)容生產(chǎn)難題,，補齊Web 3.0發(fā)展中的生產(chǎn)力短板,。”蔣照生表示,。

龔業(yè)明也表達了相似的想法,。他認為從長期來看，AIGC (人工智能生成內(nèi)容) 將成為元宇宙生產(chǎn)工具,?！癈hatGPT等AIGC應(yīng)用程序?qū)@著提升數(shù)字人的制造效率，內(nèi)容生成快,、成本低且可定制,。AIGC能顯著提高數(shù)字人多模態(tài)交互中的識別感知和分析決策能力，成為元宇宙世界重要的生產(chǎn)工具,。AIGC有望成為元宇宙搭建的重要工具,，并推動web 3.0的發(fā)展。”

在采訪的最后,，盧言霞說,，未來充滿想象，不可預(yù)測,。

*本文出自澎湃科技原文鏈接：https://m.thepaper.cn/newsDetail_forward_21953944

里昂智庫

對話澎湃新聞 | 訓(xùn)練ChatGPT有多燒錢,？國產(chǎn)大模型有機會嗎？

國產(chǎn)大模型與ChatGPT基礎(chǔ)模型相差不止一代

差距的背后是什么,？

ChatGPT商業(yè)價值幾何,？“兵家必爭之地”

相關(guān)閱讀more+

聯(lián)系我們