實踐項目 返回列表

大模型的(de)未來趨勢與挑戰

2023/11/27 16:06:33

來源:科協之聲 

作者:劉鋒


自(zì)2022年(nián)11月起,以ChatGPT為(wèi)典型代表的(de)大模型在全球數字科技界引起了極大關注。全球範圍內(nèi)的(de)大模型數量受其影響在不到一(yī)年(nián)的(de)時間內(nèi)就已超過一(yī)百種。

未标題-1.jpg
截至2023年(nián)10月,大模型技術已經步入了快速發展的(de)階段。在中國,超過10種大模型已完成備案。其中,百度的(de)文心大模型升級至4.0版本後,在理(lǐ)解、生成、邏輯和(hé)記憶等四項核心能力上均實現了顯著的(de)提升。與此同時,OpenAI的(de)ChatGPT也經曆了一(yī)次重大升級,除了多模态視(shì)覺能力、DALL·E 3以及語音合成API的(de)開放。最引人注目的(de)升級是,為(wèi)每個用戶提供了一(yī)種名為(wèi)GPTS的(de)工具,使用戶能夠構建專屬的(de)GPT模型。
微軟公司創始人比爾·蓋茨公開表示,自(zì)1980年(nián)首次看到圖形用戶界面以來,以GPT為(wèi)代表的(de)大模型是他所見過的(de)最具革命性的(de)技術進步。對于大模型未來的(de)産業發展趨勢和(hé)面臨的(de)挑戰究竟如(rú)何,我們可(kě)以從三個方面進行探讨。

未标題-2.jpg

其一(yī),人類種群知識庫從外化、索引化到智能化的(de)三部曲。


     


我們在《崛起的(de)超級智能》一(yī)書中提出,生物的(de)競争本質上是種群知識庫的(de)競争。在過去(qù)的(de)幾億年(nián)裏,恐龍因為(wèi)滅絕導緻種群知識庫消失為(wèi)0,鲨魚一(yī)直保持在海洋中遊蕩,種群知識庫沒有發生大的(de)變化,熊貓因為(wèi)趨于滅絕從而種群知識庫不斷萎縮。
隻有人類在近200萬年(nián)裏,在知識和(hé)智慧上不斷擴展和(hé)加速,在最近數百年(nián)裏随着蒸汽機、工業革命、核能的(de)出現,人類種群知識庫出現了巨大的(de)增長(cháng)。特别是互聯網誕生後,第一(yī)次将人類的(de)種群知識庫外化成一(yī)個龐大的(de)網絡知識庫,通過萬維網的(de)發明進一(yī)步促使人類種群知識庫急劇擴容。表現在科技領域就是21世紀大量新科技新概念不斷湧現。
未标題-3.jpg
面對海量的(de)互聯網公共知識,如(rú)何索引就成了人類必須解決的(de)重要課題。20世紀90年(nián)代,搜索引擎出現了蓬勃發展,其中優秀和(hé)典型的(de)代表分别是谷歌和(hé)百度,它們成長(cháng)背後的(de)推動力也是人類種群知識庫發展的(de)必然要求。
互聯網知識庫被索引之後,如(rú)何智能化也就成為(wèi)了一(yī)個重要議題。在過去(qù)的(de)近30年(nián)裏,以谷歌、百度為(wèi)代表的(de)搜索引擎公司加大了智能化的(de)步伐,人工智能的(de)興起也與此有密切的(de)關系。
2022年(nián)OpenAI的(de)ChatGPT成功引發了大模型的(de)興起,标志着互聯網這個外化的(de)人類種群知識庫完成了從索引化到智能化的(de)轉變。但不能忘記的(de)是,OpenAI ChatGPT的(de)成功離(lí)不開谷歌提出的(de)Transformer注意力機制模型,也離(lí)不開微軟通過Bing搜索引擎提供的(de)海量數據和(hé)巨大資金支持。
從搜索引擎的(de)發展看,通過激烈的(de)競争,搜索引擎最終形成了若幹個巨頭公司為(wèi)人類提供互聯網海量數據的(de)索引服務,同樣我們認為(wèi)作為(wèi)搜索引擎的(de)升級版,人類社會也不需要很多大模型提供同質的(de)服務。我們判斷包括搜索引擎、大數據、社交網絡等領域擁有優質大數據、人工智能技術積累和(hé)廣泛應用場景的(de)公司中,在未來的(de)競争中會脫穎而出一(yī)家或若幹家為(wèi)人類提供集中統一(yī)的(de)智能服務。


其二,行業垂直大模型建設思路:繼續提升通用大模型智能水平。


     


應該指出,當前人類社會對大模型充滿了熱情,特别在中國,很多人希望大模型能夠與金融、法律、工業、農業、電力、建築等等行業領域結合,從而實現快速發展。
其實大模型的(de)成功并不僅僅是參數量大,而是用大規模預訓練+微調的(de)方式,對海量的(de)跨領域知識進行學(xué)習時湧現出來新的(de)能力,而且這些新的(de)能力往往與創新有關,如(rú)翻譯、創作文章(zhāng)、創作圖像等,然而這種創新能力并不穩定,會出現“幻覺”和(hé)胡編亂造的(de)情況。同時由于神經網絡本身的(de)特點,其可(kě)解釋性問題也一(yī)直沒有解決,因此對于需要精密控制或精确結果的(de)産業領域,大模型并不是可(kě)靠的(de)工具和(hé)技術。
還有一(yī)個誤區是,認為(wèi)用大模型的(de)訓練方法加上行業産業的(de)大數據就可(kě)以形成高(gāo)質量的(de)行業大模型。這個觀點并不符合大模型湧現出創新能力的(de)規律,過于單一(yī)領域的(de)知識反而會降低(dī)大模型湧現出新能力的(de)水平。因此應繼續提高(gāo)ChatGPT、文心一(yī)言、LLama等等通用大模型的(de)智能水平,通過通用大模型平台與其他可(kě)靠性高(gāo)的(de)人工智能技術協同工作,并與各個行業結合,這種路徑要比建設專門的(de)行業大模型更為(wèi)穩健和(hé)有效。


其三,值得期待的(de)大模型未來。


     


大模型的(de)不斷發展和(hé)與其他技術産品結合的(de)過程将是持續探索和(hé)嘗試的(de)過程。無論如(rú)何,大模型的(de)出現的(de)确是一(yī)個革命性的(de)突破,有很多科學(xué)家認同ChatGPT等大模型已經可(kě)以突破圖靈測試,未來在智能和(hé)意識的(de)基礎原理(lǐ)上也将帶來更多突破性的(de)啓發。
未标題-4.jpg
在産業應用上,大模型與其他不同類型的(de)人工智能技術、網絡技術、大數據技術結合,與不同的(de)辦公、學(xué)習、生産、生活結合會持續産生出具有非凡想象力的(de)應用。例如(rú)微軟辦公Office接入GPT-4,由AI驅動的(de) Microsoft 365 Copilot ,打破了傳統辦公軟件辦公的(de)方式,能自(zì)動生成文檔、電子(zǐ)郵件、PPT。百度的(de)文心行業大模型的(de)數量已經達到了 11 個,覆蓋能源電力、金融、航天、傳媒、影視(shì)、汽車、城市管理(lǐ)等多個領域,OpenAI計劃再推出GPT商店。這将類似于蘋果的(de)App Store,讓開發者可(kě)以在商店中上架他們的(de)自(zì)定義GPT,供其他用戶購買和(hé)使用。
雖然大模型有着令人驚歎的(de)智能表現,但我們還需要耐心等待大模型的(de)持續發育和(hé)成長(cháng),如(rú)果從以ChatGPT3.5為(wèi)代表的(de)大模型大規模向人類提供服務算起,畢竟它還是一(yī)個從出生來到全人類面前還不到1年(nián)的(de)嬰兒。