大模型的未來趨勢與挑戰

2023/11/27 16:06:33

來源：科協之聲

作者：劉鋒

自2022年11月起(qǐ)，以ChatGPT爲典型代表的大模型在全球數字科技界引起(qǐ)了極大關注。全球範圍内的大模型數量受其影響在不到一年的時間内就已超過(guò)一百種(zhǒng)。

截至2023年10月，大模型技術已經(jīng)步入了快速發(fā)展的階段。在中國(guó)，超過(guò)10種(zhǒng)大模型已完成(chéng)備案。其中，百度的文心大模型升級至4.0版本後(hòu)，在理解、生成(chéng)、邏輯和記憶等四項核心能(néng)力上均實現了顯著的提升。與此同時，OpenAI的ChatGPT也經(jīng)曆了一次重大升級，除了多模态視覺能(néng)力、DALL·E 3以及語音合成(chéng)API的開(kāi)放。最引人注目的升級是，爲每個用戶提供了一種(zhǒng)名爲GPTS的工具，使用戶能(néng)夠構建專屬的GPT模型。

微軟公司創始人比爾·蓋茨公開(kāi)表示，自1980年首次看到圖形用戶界面(miàn)以來，以GPT爲代表的大模型是他所見過(guò)的最具革命性的技術進(jìn)步。對(duì)于大模型未來的産業發(fā)展趨勢和面(miàn)臨的挑戰究竟如何，我們可以從三個方面(miàn)進(jìn)行探讨。

未标題-2.jpg

其一，人類種(zhǒng)群知識庫從外化、索引化到智能(néng)化的三部曲。

我們在《崛起(qǐ)的超級智能(néng)》一書中提出，生物的競争本質上是種(zhǒng)群知識庫的競争。在過(guò)去的幾億年裡(lǐ)，恐龍因爲滅絕導緻種(zhǒng)群知識庫消失爲0，鲨魚一直保持在海洋中遊蕩，種(zhǒng)群知識庫沒(méi)有發(fā)生大的變化，熊貓因爲趨于滅絕從而種(zhǒng)群知識庫不斷萎縮。

隻有人類在近200萬年裡(lǐ)，在知識和智慧上不斷擴展和加速，在最近數百年裡(lǐ)随著(zhe)蒸汽機、工業革命、核能(néng)的出現，人類種(zhǒng)群知識庫出現了巨大的增長(cháng)。特别是互聯網誕生後(hòu)，第一次將(jiāng)人類的種(zhǒng)群知識庫外化成(chéng)一個龐大的網絡知識庫，通過(guò)萬維網的發(fā)明進(jìn)一步促使人類種(zhǒng)群知識庫急劇擴容。表現在科技領域就是21世紀大量新科技新概念不斷湧現。

面(miàn)對(duì)海量的互聯網公共知識，如何索引就成(chéng)了人類必須解決的重要課題。20世紀90年代，搜索引擎出現了蓬勃發(fā)展，其中優秀和典型的代表分别是谷歌和百度，它們成(chéng)長(cháng)背後(hòu)的推動力也是人類種(zhǒng)群知識庫發(fā)展的必然要求。

互聯網知識庫被(bèi)索引之後(hòu)，如何智能(néng)化也就成(chéng)爲了一個重要議題。在過(guò)去的近30年裡(lǐ)，以谷歌、百度爲代表的搜索引擎公司加大了智能(néng)化的步伐，人工智能(néng)的興起(qǐ)也與此有密切的關系。

2022年OpenAI的ChatGPT成(chéng)功引發(fā)了大模型的興起(qǐ)，标志著(zhe)互聯網這(zhè)個外化的人類種(zhǒng)群知識庫完成(chéng)了從索引化到智能(néng)化的轉變。但不能(néng)忘記的是，OpenAI ChatGPT的成(chéng)功離不開(kāi)谷歌提出的Transformer注意力機制模型，也離不開(kāi)微軟通過(guò)Bing搜索引擎提供的海量數據和巨大資金支持。

從搜索引擎的發(fā)展看，通過(guò)激烈的競争，搜索引擎最終形成(chéng)了若幹個巨頭公司爲人類提供互聯網海量數據的索引服務，同樣(yàng)我們認爲作爲搜索引擎的升級版，人類社會(huì)也不需要很多大模型提供同質的服務。我們判斷包括搜索引擎、大數據、社交網絡等領域擁有優質大數據、人工智能(néng)技術積累和廣泛應用場景的公司中，在未來的競争中會(huì)脫穎而出一家或若幹家爲人類提供集中統一的智能(néng)服務。

其二，行業垂直大模型建設思路：繼續提升通用大模型智能(néng)水平。

應該指出，當前人類社會(huì)對(duì)大模型充滿了熱情，特别在中國(guó)，很多人希望大模型能(néng)夠與金融、法律、工業、農業、電力、建築等等行業領域結合，從而實現快速發(fā)展。

其實大模型的成(chéng)功并不僅僅是參數量大，而是用大規模預訓練+微調的方式，對(duì)海量的跨領域知識進(jìn)行學(xué)習時湧現出來新的能(néng)力，而且這(zhè)些新的能(néng)力往往與創新有關，如翻譯、創作文章、創作圖像等，然而這(zhè)種(zhǒng)創新能(néng)力并不穩定，會(huì)出現“幻覺”和胡編亂造的情況。同時由于神經(jīng)網絡本身的特點，其可解釋性問題也一直沒(méi)有解決，因此對(duì)于需要精密控制或精确結果的産業領域，大模型并不是可靠的工具和技術。

還(hái)有一個誤區是，認爲用大模型的訓練方法加上行業産業的大數據就可以形成(chéng)高質量的行業大模型。這(zhè)個觀點并不符合大模型湧現出創新能(néng)力的規律，過(guò)于單一領域的知識反而會(huì)降低大模型湧現出新能(néng)力的水平。因此應繼續提高ChatGPT、文心一言、LLama等等通用大模型的智能(néng)水平，通過(guò)通用大模型平台與其他可靠性高的人工智能(néng)技術協同工作，并與各個行業結合，這(zhè)種(zhǒng)路徑要比建設專門的行業大模型更爲穩健和有效。

其三，值得期待的大模型未來。

大模型的不斷發(fā)展和與其他技術産品結合的過(guò)程將(jiāng)是持續探索和嘗試的過(guò)程。無論如何，大模型的出現的确是一個革命性的突破，有很多科學(xué)家認同ChatGPT等大模型已經(jīng)可以突破圖靈測試，未來在智能(néng)和意識的基礎原理上也將(jiāng)帶來更多突破性的啓發(fā)。

在産業應用上，大模型與其他不同類型的人工智能(néng)技術、網絡技術、大數據技術結合，與不同的辦公、學(xué)習、生産、生活結合會(huì)持續産生出具有非凡想象力的應用。例如微軟辦公Office接入GPT-4，由AI驅動的 Microsoft 365 Copilot ，打破了傳統辦公軟件辦公的方式，能(néng)自動生成(chéng)文檔、電子郵件、PPT。百度的文心行業大模型的數量已經(jīng)達到了 11 個，覆蓋能(néng)源電力、金融、航天、傳媒、影視、汽車、城市管理等多個領域，OpenAI計劃再推出GPT商店。這(zhè)將(jiāng)類似于蘋果的App Store，讓開(kāi)發(fā)者可以在商店中上架他們的自定義GPT，供其他用戶購買和使用。

雖然大模型有著(zhe)令人驚歎的智能(néng)表現，但我們還(hái)需要耐心等待大模型的持續發(fā)育和成(chéng)長(cháng)，如果從以ChatGPT3.5爲代表的大模型大規模向(xiàng)人類提供服務算起(qǐ)，畢竟它還(hái)是一個從出生來到全人類面(miàn)前還(hái)不到1年的嬰兒。

行業實踐

實踐項目返回列表

大模型的未來趨勢與挑戰

行業實踐

實踐項目 返回列表

大模型的未來趨勢與挑戰

實踐項目返回列表