第四范式創(chuàng)始人兼 CEO 戴文淵表示:「C 端產(chǎn)品已經(jīng)逼近用戶體驗(yàn)的上限,而 B 端的企業(yè)級軟件往往是個十分復(fù)雜的執(zhí)行系統(tǒng),堆砌十幾層菜單和成千上萬功能也不算多?!?/p>
戴文淵認(rèn)為,目前這些 B 端軟件極為復(fù)雜的交互體驗(yàn),以及復(fù)雜性帶來的極低開發(fā)效率,恰恰為生成式 AI 留下足夠大的重構(gòu)和改造空間。
「過去很難通過人類語言(自然語言)的方式去調(diào)用企業(yè)軟件的功能,現(xiàn)在當(dāng)我們有更強(qiáng)的語義理解和生成能力,再加上 GPT 任務(wù)翻譯、任務(wù)分發(fā)和推理的能力,就可以通過更好的「對話框式」交互方式實(shí)現(xiàn)功能的調(diào)用,不再需要找到某個位于十幾級的菜單目錄之下的功能?!?/p>
這背后還是大模型的能力。第四范式現(xiàn)場拔網(wǎng)線,展示了式說大模型的圖片理解、多輪對話、寫小說、迅速畫圖等能力。
基礎(chǔ)能力 demo
此外,現(xiàn)場展示了式說通過推理能力完成更加復(fù)雜的「裝箱」操作,以及其現(xiàn)場編寫代碼的能力。
裝箱和寫代碼 demo
在戴文淵看來,要做到 AIGS,大模型未必需要是知識廣博、十項(xiàng)全能冠軍的通才,更重要的在于模型具備 Copilot(副駕艙),和思維鏈 CoT(chain of thoughts,多步推理)的能力。
「要去改造企業(yè)軟件,大模型不能只有語言能力。式說 2.0 就加入了多模態(tài)和 Copilot,因?yàn)楹芏嗥髽I(yè)軟件里的數(shù)據(jù)是多模態(tài)的,而 Copilot 能把人的指令翻譯成要調(diào)用后臺的哪個 API?!勾饲鞍l(fā)布的式說 2.0 的 Demo 中,門店員工通過語音、文本等交互方式向式說發(fā)起指令,式說理解后,聯(lián)網(wǎng)門店監(jiān)控軟件調(diào)出后廚未戴口罩的圖片,并直接將圖片以對話框的形式輸出給員工。
大模型去調(diào)用軟件內(nèi)置的一個個功能、數(shù)據(jù)來「對話框式」完成任務(wù),已經(jīng)能產(chǎn)生巨大價值。但員工用企業(yè)軟件時也會面臨復(fù)雜任務(wù),需要人按照順序執(zhí)行一個個功能。
因此,式說 3.0 強(qiáng)調(diào)的是 Copilot 加上思維鏈 CoT,具有更強(qiáng)的推理能力,在學(xué)習(xí)大量數(shù)據(jù)和「攻略」后,能形成中間的邏輯推理步驟,從而做到拆分并執(zhí)行復(fù)雜工作。
第四范式將 AIGS 的路徑總結(jié)為三個階段:
第一階段,Copilot 調(diào)動不同的信息、數(shù)據(jù)、應(yīng)用,作為助手完成用戶的指令。相當(dāng)于在所有企業(yè)級軟件系統(tǒng)里,配備一個指揮官。指揮官聽用戶的指揮,比如「把照片亮度調(diào)亮 20%」。
第二階段,Copilot+基于企業(yè)規(guī)則的「知識庫」,AI 能夠參照規(guī)則做復(fù)雜工作,進(jìn)一步豐富了「對話框」的能力。比如 AI 查詢了「人像美化」知識庫后,能執(zhí)行把照片修好看的步驟。
第三階段,Copilot+CoT(思維鏈)。軟件系統(tǒng)的使用行為最終會被大模型學(xué)會,形成 AI 針對這個領(lǐng)域的思維鏈,意味著「把照片處理得更好看」這種復(fù)雜指令,AI 能自動地按照步驟完成。
第四范式的 AIGS 戰(zhàn)略,就是指基于式說大模型背后的 Copilot+COT 能力,把企業(yè)軟件改造成新型的交互范式,并在新型交互上不斷地學(xué)習(xí)軟件的使用過程,形成領(lǐng)域軟件的「思維鏈」。
在我國航空制造代表企業(yè)的實(shí)際場景演示中,其與第四范式基于 Copilot 技術(shù),聯(lián)手改造了某工業(yè)設(shè)計軟件。
零件搜索和裝配 demo
現(xiàn)場某醫(yī)療行業(yè)的實(shí)際場景演示中,式說的「思維鏈」能夠清晰指出將藥品銷售出去的具體步驟。
醫(yī)藥代表賦能 demo
最終,由于新的交互形式的出現(xiàn),企業(yè)軟件的開發(fā)效率變得更高。以前是功能和執(zhí)行邏輯被編排在軟件界面,每次一個功能升級,都要周而復(fù)始的經(jīng)歷原型圖、設(shè)計、開發(fā)等,至少是月級別的開發(fā)時間。而現(xiàn)在由于「對話框式」的界面是固定的,功能和邏輯被改寫在數(shù)據(jù)、API 和內(nèi)容層面,變成了天級別的開發(fā)效率。
值得一提的是,在式說 3.0 發(fā)布現(xiàn)場,來自航空制造、金融、醫(yī)療等行業(yè)的客戶代表出席并做產(chǎn)品的 live demo 演示。ChatGPT 出現(xiàn)的短短兩個月內(nèi),眾多企業(yè)與合作伙伴已經(jīng)與范式在生成式 AI 方面開展了深度合作。式說作為基于大模型的新型開發(fā)平臺,期待與更多合作伙伴與企業(yè)客戶及一起,探索以生成式 AI 重構(gòu)企業(yè)軟件的機(jī)會,共同提升企業(yè)軟件的易用性和生產(chǎn)力。
- 第四范式AIGS戰(zhàn)略背景材料
關(guān)于大模型:
1、第四范式什么時候開始關(guān)注投入 GPT和大模型:
在 BERT 出來的時候,范式研究院就開始關(guān)注并投入在這個技術(shù)領(lǐng)域,GPT3 出來以后更加明確了要朝這個方向。不過相比今年的投入,過去幾年肯定還是有差距的。ChatGPT 對我們最大的幫助,就是整個市場的信心一下從 0 調(diào)滿了,確定性的投入更大了,再往后就是變成產(chǎn)品、變成商業(yè)化的路線往市場去推。
2、是否跟同行做過對比?
中國目前還沒有像 OpenAI 那樣在大模型上絕對領(lǐng)先的公司,也會有更多的大模型。大模型是新的生產(chǎn)力,大家都得有大模型作為底座,所以入局的門檻確實(shí)是變高了。
但是在達(dá)到這個門檻之后,重點(diǎn)在于如何選擇方向。比如培養(yǎng)了一個大學(xué)生后,到公司再接受專業(yè)的訓(xùn)練,在某一個領(lǐng)域積累專業(yè)的能力,這是很重要的。但不具備一定的素質(zhì)有很多事就干不了,所以底層的大模型也很重要。
第四范式認(rèn)為比較大的機(jī)會在于改造整個的企業(yè)軟件行業(yè),也就是 AIGS 這個方向。發(fā)力的大模型技術(shù)方向是 Copilot 可控(執(zhí)行可控、知錯能改),和思維鏈 COT((chain of thoughts,多步推理、復(fù)雜任務(wù)拆分)的能力,形成數(shù)據(jù)飛輪(比如將某垂直領(lǐng)域的數(shù)據(jù)和流程投入大模型,很快可以形成模型在該領(lǐng)域的思維鏈)。
3、式說在短短兩個月的時間已經(jīng)發(fā)布了 3 個版本,從 1.0-3.0這中間的迭代過程是?
1.0——ChatGPT 火了之后,大部分的客戶和伙伴還沒有真的使用上 GPT 類似的技術(shù),我們當(dāng)時出了第一代的產(chǎn)品。式說 1.0 有生成語言的能力,并且解決 GPT 技術(shù)應(yīng)用時內(nèi)容可信、數(shù)據(jù)安全和成本的三大問題。當(dāng)時主要的場景就是文庫問答,相當(dāng)于讓 GPT 學(xué)習(xí)的企業(yè)知識后,可以解答專業(yè)問題,并且是可溯源的。
2.0——在式說語言能力基礎(chǔ)上,加入了文本、語音、圖像、表格、視頻等多模態(tài)輸入及輸出能力,并增加了企業(yè)級 Copilot 能力。以與企業(yè)內(nèi)部應(yīng)用庫、企業(yè)私有數(shù)據(jù)等進(jìn)行聯(lián)網(wǎng),對信息和數(shù)據(jù)進(jìn)行分析,回答員工的問詢或執(zhí)行相關(guān)任務(wù),從知識助手成為業(yè)務(wù)助手。
3.0——在生成式和語言能力的基礎(chǔ)之上,3.0 發(fā)力 Copilot 和思維鏈 COT(多步推理、復(fù)雜任務(wù)拆分、形成數(shù)據(jù)飛輪),改造傳統(tǒng) B 端企業(yè)軟件的體驗(yàn)與開發(fā)效率,我們叫 AIGS(AI generated software),以生成式 AI 重構(gòu)企業(yè)軟件。
關(guān)于 AIGS:
4、為什么想到做 AIGS(software)?什么是 AIGS?
C 端的軟件體驗(yàn)在過去的十幾年已經(jīng)被打磨到了比較高的水準(zhǔn),你用對話未必就一定更好用。但是 B 端(想象一下在企業(yè)報銷系統(tǒng)、HR 系統(tǒng)、OA 系統(tǒng)),體驗(yàn)還是比較差的??赡苣阍诓藛卫锩纥c(diǎn)一個下拉菜單,再點(diǎn)下拉菜單,再點(diǎn)幾下才能進(jìn)入到某一個功能。
過去很難通過自然語言的方式去調(diào)用這些功能,現(xiàn)在當(dāng)我們有更強(qiáng)的語義理解的自然語言的時候,可以通過更好的交互方式去實(shí)現(xiàn)功能的調(diào)用,從而實(shí)現(xiàn)用新型的通過語音/對話的交互模式,去替代老的交互,從而使 B 端企業(yè)軟件的體驗(yàn)迅速一個顛覆式的提升。
其次是開發(fā)效率的提升。原先 B 端企業(yè)軟件都是高度定制化的,基于菜單式的開發(fā),基本每次一個功能升級,又要產(chǎn)品經(jīng)理畫界面,設(shè)計、開發(fā)等,至少是月級別的開發(fā)時間。而由于新的交互形式的出現(xiàn),以前是功能和執(zhí)行邏輯被編排在軟件界面,現(xiàn)在功能和邏輯被改寫在數(shù)據(jù)、API 和內(nèi)容層面,變成了天級別的開發(fā)效率。
就像 ChatGPT 不再是一個復(fù)雜的菜單和一堆的功能,只需要一個對話框就能做很多事情。并且它背后每天都在迭代,但你感受不到它的界面發(fā)生了什么變化。以前軟件是在界面層面的升級,未來是在數(shù)據(jù)層面的升級。
我們看到大模型能夠帶來用戶體驗(yàn)的提升,開發(fā)效率的提升,所以一定會形成軟件行業(yè)的飛躍,就是誰率先能做出來的問題。這是一個巨大的市場。大模型是新的生產(chǎn)力,以大模型基礎(chǔ)設(shè)施為先導(dǎo)項(xiàng)目,改造整個軟件產(chǎn)業(yè),整個行業(yè)的業(yè)務(wù)價值、商業(yè)模式都會得到飛躍。
5、式說如何能實(shí)現(xiàn) AIGS?
去改造軟件大模型不能只有語言能力。式說 2.0 就加入了多模態(tài)和 Copilot,因?yàn)楹芏嗥髽I(yè)軟件里的數(shù)據(jù)是多模態(tài)的,而 Copilot 支持用對話去調(diào)用軟件內(nèi)置的一個個功能/數(shù)據(jù)來完成任務(wù)。2.0 的時候,員工可以通過語音、圖像、表格、視頻等多模態(tài)方式向式說發(fā)起詢問或下達(dá)指令,式說理解之后,聯(lián)網(wǎng)企業(yè)軟件調(diào)出有關(guān)功能,并以所需要的形式輸出答案。
我們?nèi)ネ瓿扇蝿?wù)的時候,往往不完全是一個功能。比如說圖像處理軟件,如果你要調(diào)亮度、對比度,這是功能。但如果是將人物 P 瘦一點(diǎn),它就不是一個單一功能能實(shí)現(xiàn)的了。這背后需要人按照經(jīng)驗(yàn),執(zhí)行軟件的一個個的功能才能實(shí)現(xiàn)。
人接收到復(fù)雜的工作,會在大腦里推理出一步步要執(zhí)行的子任務(wù),然后再按步驟去執(zhí)行。換成機(jī)器,如果對于同一個工作,機(jī)器在過去見到過足夠多的人(累積數(shù)據(jù))通過一二三四步把這個工作完成了,它已經(jīng)可以這個套路總結(jié)出來,就形成了思維鏈。
所以式說 3.0 強(qiáng)調(diào)的是 Copilot 加思維鏈 CoT。大模型用更強(qiáng)的 CoT 推理能力,去不斷學(xué)習(xí)新領(lǐng)域的思維鏈,相當(dāng)于用軟件本身的使用行為,去構(gòu)建 AI 針對這個領(lǐng)域的思維方式。
對于企業(yè)軟件合作伙伴來說,可以基于范式的大模型能力,在一個個領(lǐng)域里面鉆的足夠深,學(xué)習(xí)到足夠多的數(shù)據(jù),最終所形成領(lǐng)域的思維鏈,發(fā)展成「領(lǐng)域」大模型。當(dāng)思維鏈復(fù)雜度到一定程度以后,它的軟件就能夠自動執(zhí)行越來越復(fù)雜的功能。
6、過去范式做的事對此有什么積累?
首先,范式擁有做大模型的技術(shù)能力。雖然先知不是做通用模型的定位,當(dāng)時定位是做專用模型,但先知一直強(qiáng)調(diào)模型是要高維的,所謂的高維其實(shí)就是參數(shù),要把模型做大,就像 GPT3.5 是 1700 多億的參數(shù),這是從技術(shù)上來說能平移過去的地方。此外范式擁有國內(nèi)領(lǐng)先的研究院、工程化、產(chǎn)品力的全棧技術(shù)能力。
其次,范式原有市場和新市場所面對的產(chǎn)業(yè)鏈正好是上下游。以前 AI 更像是一種重要零件或者元器件,這些以外的其他地方不是 AI 覆蓋,是企業(yè)軟件覆蓋。企業(yè)軟件經(jīng)過了這么多年發(fā)展,基本上能把所有的事都覆蓋了。范式和軟件公司一直互為生態(tài),范式做的是軟件里面的 AI 決策,軟件公司做功能和流程的實(shí)現(xiàn)。比如 AI 預(yù)測出門店明天要運(yùn)多少雞翅,這需要放到門店管理的系統(tǒng)里。
我們互相共生也很了解,看到 GPT3 時已經(jīng)知道了,是可以幫助到企業(yè)軟件市場的。做這個事情還是需要非常強(qiáng)的一個行業(yè)積累,第四范式過去幾年在行業(yè)里面扎得還是比較深的,我們對 AI 產(chǎn)業(yè)化的深層次理解,更清楚明白大模型作為新生的生產(chǎn)力工具,如何落地才能產(chǎn)生最大的價值。
來源:極客公園 (侵刪)