一天前發布的GPT-4將OpenAI推上了“AI終結者”的位置,關于百度能否講好中國大模型的故事的猜測也愈甚。
百度給出了答案。北京時間3月16日14時,百度科技園工區的標志性建筑熊掌會議室中,百度宣布正式推出基于百度新一代大語言模型的生成式AI 產品“文心一言(ERNIE Bot)”。
出席陣容可謂豪華。百度創始人兼CEO李彥宏坐鎮會場——這也是繼2018年為自動駕駛平臺“蘿卜快跑”和智能視頻音箱“小度在家”后,李彥宏時隔五年親臨發布會現場,為單個產品站臺。
同樣出席發布會的百度CTO王海峰。此前36氪報道中提及,王海峰也是文心一言項目的總指揮。
從2月7日立下發布大語言模型的“軍令狀”,到文心一言亮相的短短一個多月,亦是百度在AI領域十多年的積累的試金石。
預期之內的答卷
前有OpenAI公開GPT-4,后有即將接入最新版ChatGPT的微軟召開產品發布會,文心一言的發布備受壓力。
不可否認的是,由于中文粘連度高等難以被AI處理的特征,文心一言的研發難度并不亞于全球巨頭的。百度搜索產品總監張燕薊曾表示,中文語義的理解難度遠大于非中文,因此百度必須研發一個更難、更復雜的大模型。
基于百度自研的ERNIE及PLATO系列模型,文心一言的關鍵技術包括監督精調、人類反饋的強化學習、提示、知識增強、檢索增強和對話增強。李彥宏介紹,文心一言大模型的訓練數據包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。
發布會上,李彥宏用文學創作、商業文案創作、數理邏輯推算、中文理解和多模態生成5個基礎的Prompt(問答提示),對文心一言的能力進行了測試。
從現場演示的結果來看,文心一言具備處理基礎問題的能力,回答具有一定的準確性、邏輯性和流暢性,并提供了GPT-4目前并不具備的多模態生成能力。但李彥宏也承認,在部分場景的準確性和理解能力上,文心一言仍無法克服大多語言生成大模型的通病。
此前,外界關于文心一言的產品形態就有諸多討論。發布會揭示了最終答案。李彥宏表示,大語言模型將給產業帶來三大機會,文心一言也將抓住機會:
首先是提供新型云計算服務。文心一言將通過百度智能云對外提供服務,幫助企業構建自己的模型和應用,李彥宏預告稱,百度智能云將于近期舉辦新聞發布會,主題圍繞文心一言的云服務和應用產品,既有公有云服務和也可以做私有化部署。
其次是提供行業模型精調的中間層服務。目前,百度文心大模型已經在電力、金融、媒體等領域,發布了10多個行業大模型。
最后是為應用提供大模型底座服務。李彥宏認為,對與大部分創業者和企業而言,從頭開始做基礎大模型并不現實。因此基于通用大語言模型搶先開發重要的應用服務,這可能才是真正的機會。
AI,百度尋求的新杠桿
去年12月底的一次內部全員會中,李彥宏正視了百度這幾年的頹勢。
他說:“百度這幾年過得比較苦,財報、業務增長性都不是那么光鮮……有些技術同學做的事離市場很遠,純屬自嗨,做了一兩年發現東西沒人用。”
以2010年“自然語言處理部”成立為起點,百度在AI上發力已經超過十年。但直到去年,百度全年廣告營收仍占60.4%,被寄予厚望的AI還在往撐起百度第二增長曲線的目標努力。
ChatGPT爆火后,三個月達到過億用戶,其矚目程度也讓國內科技公司趨之若鶩,同樣身披搜索+AI標簽的百度,自然不會放過這一機會。2月初,百度CEO李彥宏的OKR曝光:“引領搜索體驗的代際變革”。
擁有大量數據、技術沉淀和業務場景的百度,是現有互聯網企業中跑通大模型可能性最大、速度最快的一家——芯片有昆侖,學習框架有飛槳,模型有文心,應用則有搜索、智能云、智能駕駛等廣闊的落地場景。
文心一言的基座、2019年發布的通用大模型“文心大模型ERNIE”,目前以迭代至千億級參數的ERNIE 3.0 Zeus,具備智能創作等自然語言理解和生成任務。在李彥宏的期待中,一旦文心一言與百度多項業務結合,數據和模型迭代的飛輪將會快速轉動:“目前,ERNIE 3.0每天接受數十億次用戶的搜索請求。這讓文心一言能夠基于一個龐大的、高效的數據池,快速地學習和改進。”
3月16日起,文心一言官網針對少量用戶開啟了內測,后續將陸續開放給更多用戶。此外,百度智能云即將面向企業客戶開放文心一言API接口調用服務。
文心一言能否真能如李彥宏期待的那樣,成為撬動業務發展的杠桿,還需要市場的檢驗。
下附李彥宏在文心一言發布會的演講全文(略經36氪編輯):
各位媒體朋友,各位嘉賓,大家好。歡迎參加文心一言新聞發布會。非常感謝大家對文心一言的關注和支持。
最近一段時間,很多朋友問我,“為什么是今天,你們真的ready了嗎”。其實從某種意義上說我們已經為此準備了多年,我們十幾年前就開始投入AI研究,2019年就推出了文心大語言模型,今天的文心一言是過去多年努力的延續。
但也不能說我們完全ready了,文心一言對標ChatGPT、甚至是對標CGT-4,門檻是很高的,全球大廠還沒有一個做出來的,百度是第一個。我自己測試感覺還是有很多不完美的地方。
那為什么是今天?因為市場有需求。百度的很多產品,從搜索到智能云,再到自動駕駛,到小度,大家都有需要,更重要的是我們的客戶需要,合作伙伴需要,從我們承認文心一言的存在到現在,短短一個月的時間,就有超過650家合作伙伴宣布加入文心一言生態,大家都希望能早一點用上最新最先進的大語言模型。
當然,一旦有了真實的人類反饋,文心一言的進步速度會非常快,我們都希望它快點成長,早日為用戶和客戶創造價值。
百度希望和大家一起,推動人工智能技術進步,讓所有人都能使用最先進的生產力工具,讓所有人都能從中受益。
一、
下面,我會演示五個場景的Demo,包括文學創作、商業文案創作、數理推算、中文理解、多模態生成。(演示過程略)
AI要寫好一篇稿子,除了需要準確理解我們的意圖,還要有清晰的表達能力。
這背后有一個基礎,就是龐大的數據規模。人類常說“讀萬卷書”,而AI可以說是 “讀書破千億卷”。文心一言大模型的訓練數據就包括,萬億級網頁數據,數十億的搜索數據和圖片數據,百億級的語音日均調用數據,以及5500億事實的知識圖譜等,這讓百度在中文語言的處理上,能夠處于獨一無二的位置。
有研究表明,數據規模足夠大,參數達到千億級,大模型就可能發生“智能涌現”,即使在沒有專門訓練過的領域,也能涌現出知識理解和邏輯推理能力。
文心一言已具備了一定的思維能力,能夠學會數學推演及邏輯推理這類相對復雜任務。當然,現階段準確率還不是100%,我們還需要給它更多的時間來學習和成長。
作為扎根于中國市場的大語言模型,文心一言具備中文領域最先進的自然語言處理能力。這個例子就比較清楚的展示了我們在中文上的優勢。
相對應的,一言目前對英文語種、代碼場景的訓練還不夠多,表現還不夠好,接下來我們還要加緊訓練,不斷完善這些能力。
目前文心一言的版本,已經能夠生成文字、圖片和語音。生成視頻因為成本比較高,還沒有對所有用戶開放,未來我們會逐步接入。但是熟悉百家號創作的朋友,應該都體驗過這個功能了,每天有幾萬篇文章通過這個能力轉成視頻內容在百度分發。
多模態是生成式AI一個明確的發展趨勢。未來,隨著百度多模態統一大模型的能力增強,文心一言的多模態生成能力,也會不斷提升。
從文心一言的表現看,某種程度上它具有了對人類意圖的理解能力,回答的準確性、邏輯性、流暢性,都逐漸接近人類水平。
但整體而言,這類大語言模型還遠未到發展完善的階段,它們有時候會有很驚艷的表現,但不少場景下,細究起來還有明顯的bug,進步空間很大。未來這段時間它一定會飛速發展,日新月異。
通過定向微調,可以在百度內外部各類產品上逐步展示出驚人的親和力,讓每一個產品離自己的用戶和客戶更近。
二、
文心一言這樣的大語言模型,會成為每個人必不可少的生產力工具。
不過,無論是哪家公司,都不可能靠突擊幾個月就能做出這樣的大語言模型。深度學習、自然語言處理,需要多年的堅持和積累,沒法速成。
人類進入人工智能時代,IT技術的技術棧發生了根本性變化。過去基本分為三層:芯片層,操作系統層和應用層。現在可以分為四層:芯片層、框架層、模型層和應用層。
今天,百度是全球為數不多、在這四層進行全棧布局的人工智能公司,從高端芯片昆侖芯,到飛槳深度學習框架,再到文心預訓練大模型,到搜索、智能云、自動駕駛、小度等應用,各個層面都有領先業界的自研技術。
文心一言位于模型層。2019 年,百度推出了文心大模型ERNIE 1.0。目前,ERNIE 3.0每天接受數十億次用戶的搜索請求。這讓文心一言能夠基于一個龐大的、高效的數據池,快速地學習和改進。
大模型訓練堪稱暴力美學,需要有大算力、大數據和大模型,每一次訓練任務都耗資巨大。全棧布局的優勢在于,可以在技術棧的四層架構中,實現端到端優化,大幅提升效率。尤其是,框架層和模型層之間,有很強的協同作用,可以幫助構建更高效的模型,并顯著降低成本。事實上,超大規模模型的訓練和推理,給深度學習框架帶來了很大考驗。比如,為了支持千億參數模型的高效分布式訓練,百度飛槳專門研發了 4D 混合并行技術。
另外,芯片、框架、大模型、和終端應用場景,可以形成一個高效的反饋閉環,幫助大模型不斷去調優迭代,越做越好。更好的大模型,會讓用戶體驗不斷升級。
我還想強調一點,在全球范圍內,在四層架構的每一層都有領先產品的公司幾乎沒有,百度的優勢非常獨特,相信大家會在后續文心的迭代速度上有明顯感受。
三、
自2月份百度官宣“文心一言”以來,已有超過650家企業宣布接入文心一言生態,感謝每一位伙伴的支持。
這也意味著,很多的企業已經理解到,文心一言和生成式AI,代表了一個新的技術范式,是一個每家企業都不可以錯過的巨大的機會。AI市場即將迎來爆發性的需求增長,其商業價值的釋放將是前所未有的、指數級的。
我們對文心一言的定位,是一個通用的賦能平臺,金融、能源、媒體、政務等千行百業,都可以基于這個平臺來實現智能化變革,實現效率提升,創造巨大的商業價值。
文心一言不僅僅會影響搜索或者互聯網公司,而是會影響到每一家公司,由于它超強的自然語言理解和表達能力,它讓任何公司都有機會離自己的客戶更近,有機會通過這些能力去創建最好的客戶體驗,從而比其他人更能抓住客戶,獲得更強的競爭優勢。
文心一言對個人的改變也會是巨大的,有機構預測,到2030年,人工智能可以將每一個知識工作者的生產力提高4倍以上。很多人的工作性質會發生不可逆轉的改變。
我認為生成式AI,將催生新產品、新業態,會有很多創業和投資機會。
對于大部分創業者和企業來說,真正的機會并不是從頭開始做ChatGPT和文心一言這樣的基礎大模型,這很不現實,也不經濟。
對于大部分創業者和企業來說,真正的機會是,基于通用大語言模型,搶先開發重要的應用服務。就像移動互聯網時代,最成功的商業產品不見得是安卓和IOS,而是基于安卓和IOS開發的微信、淘寶、抖音等各種超級應用。
我認為大模型時代將產生三大產業機會:
第一類是新型云計算公司,其主流商業模式從IaaS變為MaaS。文心一言,將根本性地改變云計算行業的游戲規則。之前企業選擇云廠商更多看算力、存儲等基礎云服務。未來,更多會看框架好不好、模型好不好,以及模型、框架、芯片、應用這四層之間的協同。
文心一言將通過百度智能云對外提供服務,幫助企業構建自己的模型和應用,農業、工業、金融、教育、醫療、交通、能源等重點領域,都會因此效率大幅提升,并在每一個行業快速形成新的產業空間,助力數字中國的實現。百度智能云將于近期舉辦新聞發布會。主題圍繞文心一言的云服務和應用產品,我們既有公有云服務和也可以做私有化部署,請大家期待。
第二類是進行行業模型精調的公司,這是通用大模型和企業之間的中間層,他們具有行業Konwhow,調用通用大模型能力,為行業客戶提供解決方案。我們的文心大模型,已經在電力、金融、媒體等領域,發布了10多個行業大模型。在各行各業都有機會。非常歡迎大家來跟我們合作。
第三類是基于大模型底座進行應用開發的公司,即應用服務提供商。今天,基于文本生成、圖像生成、音頻生成、視頻生成、數字人、3D等場景,已經涌現出很多創業明星公司,他們可能就是未來的新巨頭。這里面的機會非常多,可以說每家企業在現在這個階段都有機會。
我們相信,人工智能會徹底改變我們今天的每一個行業。AI的長期價值,對各行各業的顛覆性改變,才剛剛開始。未來,將會有更多的殺手級應用、現象級產品出現,將會有更多的里程碑事件發生。
四、
之后,文心一言將建立起真實用戶反饋、開發者調用和模型迭代之間的飛輪,效果會迅速提升,給你“士別三日,當刮目相看”的驚喜。
最后我想說,文心一言不是中美科技對抗的工具,而是一代代百度技術人員追逐科技改變世界的夢想的產物,是我們服務億萬用戶,賦能千行百業的全新的平臺,是創新驅動發展的最佳證明。
謝謝大家的關注和支持。