大模型兩年：百度與它的“超級應(yīng)用”還有多遠(yuǎn)

2024-11-12 21:02:59 來源：北京商報(bào)

　　“應(yīng)用來了”，百度世界大會(huì)2024年的主題簡單明了，11月12日百度CEO李彥宏一上場也緊扣主題，“這代表了百度對當(dāng)前大模型和生成式人工智能時(shí)代的認(rèn)知和判斷”，并從智能體和產(chǎn)業(yè)應(yīng)用兩個(gè)方向“上新”：可以直播的角色類智能體、可以將照片變成動(dòng)畫的工具類智能體等。

　　大模型是新的革命還是新的泡沫？李彥宏認(rèn)為百度有資格回答這個(gè)問題，截至11月12日文心大模型日均調(diào)用量超15億，他也承認(rèn)眾所期待的AI超級應(yīng)用還沒有出現(xiàn)�！癙C時(shí)代的應(yīng)用是軟件和網(wǎng)站，移動(dòng)時(shí)代是App，大模型時(shí)代是智能體”，多次強(qiáng)調(diào)智能體還不夠，李彥宏當(dāng)天將智能體的重要性拔到新高度。

　　基本解決幻覺問題

　　“要想基于大模型開發(fā)應(yīng)用，消除幻覺是必須的”，李彥宏一針見血，“如果這個(gè)模型總是一本正經(jīng)的胡說八道，就不會(huì)有人信你，就不會(huì)有應(yīng)用”。

　　其實(shí)，在大模型爆發(fā)的兩年里，幻覺現(xiàn)象在不同使用場景下的改善程度也不一樣。

　　在李彥宏看來，“大模型是一個(gè)概率模型，生成的內(nèi)容具有不確定性。采用RAG（檢索增強(qiáng)生成）技術(shù)后，大模型會(huì)利用檢索到的信息來指導(dǎo)文本或答案的生成，提高內(nèi)容的質(zhì)量和準(zhǔn)確性。文字層面的RAG已經(jīng)做得很好了，但圖像等多模態(tài)內(nèi)容和RAG的結(jié)合還不夠”。

　　他拿兩張?zhí)靿膱D片舉例，大模型生成的天壇是四層的，真正的天壇其實(shí)只有三層，這就是典型的文生圖幻覺現(xiàn)象。回到應(yīng)用層面，這種幻覺現(xiàn)象目前仍然很普遍，“所以今天的多模態(tài)大模型，沒有什么成規(guī)模的應(yīng)用出來。就是幻覺沒有解決，至少?zèng)]有像文生文RAG解決得那么好”，李彥宏說。

　　基于此，百度開發(fā)了iRAG技術(shù)，即檢索增強(qiáng)的文生圖技術(shù)。該技術(shù)將百度搜索的圖片資源跟基礎(chǔ)模型能力相結(jié)合，可以生成各種超真實(shí)的圖片。

　　百度CTO王海峰詳細(xì)介紹稱，“百度基于大模型對用戶的需求進(jìn)行分析理解，自動(dòng)規(guī)劃精準(zhǔn)或泛化方案；接著在增強(qiáng)階段，對需要增強(qiáng)的實(shí)體，檢索并選擇相應(yīng)的參考圖；最后在生成階段，自研了多模可控生圖大模型。在實(shí)際應(yīng)用中，這個(gè)方法也支持用戶上傳參考圖，應(yīng)用戶期望進(jìn)行生成”。

　　一些立等可取的現(xiàn)貨

　　不論是熱門新能源汽車還是大模型，技術(shù)、應(yīng)用、商業(yè)模式都是漸進(jìn)的過程。就像中歐AI與管理創(chuàng)新研究中心秘書長錢文穎說的，“人工智能目前處于早期階段，更多是以實(shí)驗(yàn)室創(chuàng)新為主。隨著技術(shù)成熟，企業(yè)需要將這些橙黃新應(yīng)用到實(shí)際場景中，滿足實(shí)際需求，逐步實(shí)現(xiàn)商業(yè)化”。

　　當(dāng)天，李彥宏就展示了iRAG的應(yīng)用場景：品牌宣傳。“試想一下，如果給大眾汽車生成的海報(bào)，車型長得像豐田”，他開了個(gè)玩笑，“之前一組汽車海報(bào)拍攝需要一二十萬，甚至大幾十萬元，現(xiàn)在創(chuàng)作成本接近于0，iRAG的商業(yè)價(jià)值在于：無幻覺、超真實(shí)、沒成本、立等可取”。

　　55分鐘的演講中，他提到兩次“立等可取”這個(gè)詞，第二次是談到“自由畫布”時(shí)，一個(gè)由百度文庫和百度網(wǎng)盤聯(lián)合開發(fā)的工具類智能體，核心功能體現(xiàn)在輸入、編輯、創(chuàng)作、分享環(huán)節(jié)。

　　以創(chuàng)作為例，在劃好重點(diǎn)后，用戶框選全部需要的素材就能一鍵生成，根據(jù)現(xiàn)場分享的視頻，輸入一張兒童的照片，加上故事的背景等，自由畫布就可以生成一個(gè)漫畫。

　　“自由畫布可以幫你完成從找資料、到編輯、再到生成和分享的全部任務(wù)。每個(gè)人都可以成為漫畫家、短視頻導(dǎo)演”，說到這兒，李彥宏的聲音明顯提高，“這不是期貨，是立即可用的現(xiàn)貨”。

　　和自由畫布一樣零門檻的還有無代碼工具“秒噠”，一個(gè)多智能體協(xié)作工具。以設(shè)計(jì)一個(gè)蘿卜快跑新技術(shù)發(fā)布會(huì)的邀請函為例，包括海報(bào)生成、文案生成、嘉賓報(bào)名、地圖信息展示等，工作人員不需要懂代碼就可以完成，用李彥宏的話說，“你不需要去招募項(xiàng)目經(jīng)理、設(shè)計(jì)人員、開發(fā)人員、測試人員等，自己就可以指揮多個(gè)智能體來協(xié)同完成任務(wù)”。

　　應(yīng)用的樣貌不一樣

　　一個(gè)是智能體，一個(gè)是智能體協(xié)作工具，李彥宏看好的智能體在百度世界大會(huì)2024官宣前、預(yù)熱時(shí)、主論壇演講和展區(qū)都出現(xiàn)在C位。

　　北京商報(bào)記者體驗(yàn)了展區(qū)的農(nóng)民院士智能體�！澳愫茫沂寝r(nóng)民院士朱有勇的智能體，你可以通過向我提問，了解旱地優(yōu)質(zhì)稻的具體問題解答”，“院士”有問必答。截至北京商報(bào)記者發(fā)稿，這款智能體在文心智能體平臺(tái)上的瀏覽次數(shù)11.3萬次，幫助2.9萬人。整個(gè)文心智能體平臺(tái)上，已吸引15萬家企業(yè)和80萬名開發(fā)者參與。

　　11月12日當(dāng)天，李彥宏大部分時(shí)間也在給智能體打call，他將百度的智能體分為四類：公司類智能體、角色類智能體、工具類智能體、行業(yè)類智能體。

　　“智能體是AI應(yīng)用的最主流形態(tài)，即將迎來它的爆發(fā)點(diǎn)”，他再一次強(qiáng)調(diào)，“未來公司官方智能體很可能替代官網(wǎng)”，并從PC時(shí)代追溯至今，“在人類信息技術(shù)變革的不同歷史時(shí)期，應(yīng)用出現(xiàn)的樣貌也不一樣：在PC時(shí)期，它是一個(gè)個(gè)的軟件和網(wǎng)站；在移動(dòng)時(shí)期，它是一個(gè)個(gè)的App和可被關(guān)注的賬號；在AI時(shí)代，應(yīng)用主要的形態(tài)就是智能體”。

　　應(yīng)用、智能體為什么屢次被提及？換一個(gè)角度或許更容易理解，“正常健康的生態(tài)應(yīng)用是：應(yīng)用創(chuàng)造的價(jià)值>云廠商>芯片GPU（圖形處理器）”，零一萬物創(chuàng)始人及CEO 李開復(fù)說。

關(guān)注同花順財(cái)經(jīng)（ths518），獲取更多機(jī)會(huì)

0人

24小時(shí)播報(bào)>>

我的自選股自選股新聞

代碼\|股票名稱	最新	漲跌幅

大模型兩年：百度與它的“超級應(yīng)用”還有多遠(yuǎn)

網(wǎng)站地圖