大模型的(de)未來趨勢與挑戰

2023/11/27 16:06:33

來源：科協之聲

作者：劉鋒

自(zì)2022年(nián)11月起，以ChatGPT為(wèi)典型代表的(de)大模型在全球數字科技界引起了極大關注。全球範圍內(nèi)的(de)大模型數量受其影響在不到一(yī)年(nián)的(de)時間內(nèi)就已超過一(yī)百種。

截至2023年(nián)10月，大模型技術已經步入了快速發展的(de)階段。在中國，超過10種大模型已完成備案。其中，百度的(de)文心大模型升級至4.0版本後，在理(lǐ)解、生成、邏輯和(hé)記憶等四項核心能力上均實現了顯著的(de)提升。與此同時，OpenAI的(de)ChatGPT也經曆了一(yī)次重大升級，除了多模态視(shì)覺能力、DALL·E 3以及語音合成API的(de)開放。最引人注目的(de)升級是，為(wèi)每個用戶提供了一(yī)種名為(wèi)GPTS的(de)工具，使用戶能夠構建專屬的(de)GPT模型。

微軟公司創始人比爾·蓋茨公開表示，自(zì)1980年(nián)首次看到圖形用戶界面以來，以GPT為(wèi)代表的(de)大模型是他所見過的(de)最具革命性的(de)技術進步。對于大模型未來的(de)産業發展趨勢和(hé)面臨的(de)挑戰究竟如(rú)何，我們可(kě)以從三個方面進行探讨。

未标題-2.jpg

其一(yī)，人類種群知識庫從外化、索引化到智能化的(de)三部曲。

我們在《崛起的(de)超級智能》一(yī)書中提出，生物的(de)競争本質上是種群知識庫的(de)競争。在過去(qù)的(de)幾億年(nián)裏，恐龍因為(wèi)滅絕導緻種群知識庫消失為(wèi)0，鲨魚一(yī)直保持在海洋中遊蕩，種群知識庫沒有發生大的(de)變化，熊貓因為(wèi)趨于滅絕從而種群知識庫不斷萎縮。

隻有人類在近200萬年(nián)裏，在知識和(hé)智慧上不斷擴展和(hé)加速，在最近數百年(nián)裏随着蒸汽機、工業革命、核能的(de)出現，人類種群知識庫出現了巨大的(de)增長(cháng)。特别是互聯網誕生後，第一(yī)次将人類的(de)種群知識庫外化成一(yī)個龐大的(de)網絡知識庫，通過萬維網的(de)發明進一(yī)步促使人類種群知識庫急劇擴容。表現在科技領域就是21世紀大量新科技新概念不斷湧現。

面對海量的(de)互聯網公共知識，如(rú)何索引就成了人類必須解決的(de)重要課題。20世紀90年(nián)代，搜索引擎出現了蓬勃發展，其中優秀和(hé)典型的(de)代表分别是谷歌和(hé)百度，它們成長(cháng)背後的(de)推動力也是人類種群知識庫發展的(de)必然要求。

互聯網知識庫被索引之後，如(rú)何智能化也就成為(wèi)了一(yī)個重要議題。在過去(qù)的(de)近30年(nián)裏，以谷歌、百度為(wèi)代表的(de)搜索引擎公司加大了智能化的(de)步伐，人工智能的(de)興起也與此有密切的(de)關系。

2022年(nián)OpenAI的(de)ChatGPT成功引發了大模型的(de)興起，标志着互聯網這個外化的(de)人類種群知識庫完成了從索引化到智能化的(de)轉變。但不能忘記的(de)是，OpenAI ChatGPT的(de)成功離(lí)不開谷歌提出的(de)Transformer注意力機制模型，也離(lí)不開微軟通過Bing搜索引擎提供的(de)海量數據和(hé)巨大資金支持。

從搜索引擎的(de)發展看，通過激烈的(de)競争，搜索引擎最終形成了若幹個巨頭公司為(wèi)人類提供互聯網海量數據的(de)索引服務，同樣我們認為(wèi)作為(wèi)搜索引擎的(de)升級版，人類社會也不需要很多大模型提供同質的(de)服務。我們判斷包括搜索引擎、大數據、社交網絡等領域擁有優質大數據、人工智能技術積累和(hé)廣泛應用場景的(de)公司中，在未來的(de)競争中會脫穎而出一(yī)家或若幹家為(wèi)人類提供集中統一(yī)的(de)智能服務。

其二，行業垂直大模型建設思路：繼續提升通用大模型智能水平。

應該指出，當前人類社會對大模型充滿了熱情，特别在中國，很多人希望大模型能夠與金融、法律、工業、農業、電力、建築等等行業領域結合，從而實現快速發展。

其實大模型的(de)成功并不僅僅是參數量大，而是用大規模預訓練+微調的(de)方式，對海量的(de)跨領域知識進行學(xué)習時湧現出來新的(de)能力，而且這些新的(de)能力往往與創新有關，如(rú)翻譯、創作文章(zhāng)、創作圖像等，然而這種創新能力并不穩定，會出現“幻覺”和(hé)胡編亂造的(de)情況。同時由于神經網絡本身的(de)特點，其可(kě)解釋性問題也一(yī)直沒有解決，因此對于需要精密控制或精确結果的(de)産業領域，大模型并不是可(kě)靠的(de)工具和(hé)技術。

還有一(yī)個誤區是，認為(wèi)用大模型的(de)訓練方法加上行業産業的(de)大數據就可(kě)以形成高(gāo)質量的(de)行業大模型。這個觀點并不符合大模型湧現出創新能力的(de)規律，過于單一(yī)領域的(de)知識反而會降低(dī)大模型湧現出新能力的(de)水平。因此應繼續提高(gāo)ChatGPT、文心一(yī)言、LLama等等通用大模型的(de)智能水平，通過通用大模型平台與其他可(kě)靠性高(gāo)的(de)人工智能技術協同工作，并與各個行業結合，這種路徑要比建設專門的(de)行業大模型更為(wèi)穩健和(hé)有效。

其三，值得期待的(de)大模型未來。

大模型的(de)不斷發展和(hé)與其他技術産品結合的(de)過程将是持續探索和(hé)嘗試的(de)過程。無論如(rú)何，大模型的(de)出現的(de)确是一(yī)個革命性的(de)突破，有很多科學(xué)家認同ChatGPT等大模型已經可(kě)以突破圖靈測試，未來在智能和(hé)意識的(de)基礎原理(lǐ)上也将帶來更多突破性的(de)啓發。

在産業應用上，大模型與其他不同類型的(de)人工智能技術、網絡技術、大數據技術結合，與不同的(de)辦公、學(xué)習、生産、生活結合會持續産生出具有非凡想象力的(de)應用。例如(rú)微軟辦公Office接入GPT-4，由AI驅動的(de) Microsoft 365 Copilot ，打破了傳統辦公軟件辦公的(de)方式，能自(zì)動生成文檔、電子(zǐ)郵件、PPT。百度的(de)文心行業大模型的(de)數量已經達到了 11 個，覆蓋能源電力、金融、航天、傳媒、影視(shì)、汽車、城市管理(lǐ)等多個領域，OpenAI計劃再推出GPT商店。這将類似于蘋果的(de)App Store，讓開發者可(kě)以在商店中上架他們的(de)自(zì)定義GPT，供其他用戶購買和(hé)使用。

雖然大模型有着令人驚歎的(de)智能表現，但我們還需要耐心等待大模型的(de)持續發育和(hé)成長(cháng)，如(rú)果從以ChatGPT3.5為(wèi)代表的(de)大模型大規模向人類提供服務算起，畢竟它還是一(yī)個從出生來到全人類面前還不到1年(nián)的(de)嬰兒。

行業實踐

實踐項目返回列表

大模型的(de)未來趨勢與挑戰

行業實踐

實踐項目 返回列表

大模型的(de)未來趨勢與挑戰

實踐項目返回列表