王慧文豪擲3.4億,眾人都想復制ChatGPT|貳月大變局
(圖片來源:攝圖網(wǎng))
作者|陳平安 來源|伯虎財經(jīng)(ID:bohuFN)
如果非要用一個詞來形容ChatGPT最近的熱度,那我只能稱之為“絕殺”。
已經(jīng)很久沒有一個科技圈的熱點能夠承包全網(wǎng)小編2周的KPI。從北京中關村到加州硅谷,從創(chuàng)投大佬到普通學生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。
這么些年來,和AI相關的熱點不是沒有,比如之前阿爾法狗和自動駕駛。熱度來的快去的也快,阿爾法狗幾乎已經(jīng)無人提及,自動駕駛遭遇寒冬,企業(yè)集體降維求生。
但這次是真不一樣。ChatGPT顛覆了大眾對于AI的認知,真正把通用模型擺到了普通用戶的面前,不僅能幫你寫材料,敲代碼,還能通過選拔性考試的測驗,美國賓夕法尼亞大學稱,ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。
ChatGPT的強大甚至還讓國際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。
業(yè)界大佬們也紛紛出來為它站臺。馬斯克和比爾蓋茨曾經(jīng)堅定的相信“AI威脅論”,為了預防人工智能帶來的災難性影響,推動人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營利機構,OpenAI。(是的,就是ChatGPT的研發(fā)公司)
現(xiàn)在這兩人,一個稱贊“ChatGPT好嚇人,我們離強大到危險的人工智慧不遠了”,一個甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。
更為不同尋常的是大廠們的動作。面對ChatGPT,大廠們的反應強烈,谷歌冒著翻車的危險也要強行上線內測產(chǎn)品,國內包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關的研發(fā)上線時間表。
小公司為提振股價強行蹭熱度還可以理解,業(yè)務穩(wěn)定的大公司為何非要冒這個風險呢?
一
AI不會取代你,一個使用AI的人會取代你
要理解ChatGPT的革命性,不如先從搜索聊起。
90后以前的互聯(lián)網(wǎng)用戶們應該都知道,國內的中文信息服務大致經(jīng)歷了三個階段。
第一個階段是導航網(wǎng)站和門戶網(wǎng)站階段,尋找信息要經(jīng)由導航網(wǎng)站。
第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶的開放性問題被轉換成互聯(lián)網(wǎng)信息圖譜上具有關聯(lián)性優(yōu)先級的、一個更具體的選項擴列,人們可以通過搜索來獲得自己想要的信息。
第三階段是移動互聯(lián)網(wǎng)階段。智能手機的普及和字節(jié)的推薦算法讓那些你想要的信息自動被推送到你的面前。
不難看出,每一個階段的更迭都伴隨著效率的提升。如果把以上三個階段的效率分別比作步行,馬車和汽車,那么ChatGPT則更像是“導彈”。
這也就難怪谷歌CEO皮柴會如此火急火燎的在官網(wǎng)上宣布上馬類ChatGPT產(chǎn)品——一款實驗性的對話AI服務Bard,即便這款產(chǎn)品在內部算不上準備充足。
因為家都快被偷了。
但ChatGPT,或者說將其包含在內的AIGC展現(xiàn)的潛力,遠不止搜索這一個領域。
比如今年2月8日,微軟就推出了由 ChatGPT 提供技術支持的高級 Teams 產(chǎn)品,不僅可以自動幫助參會者生成會議記錄,即使沒有參加會議,智能回顧功能也能幫助用戶生成會議記錄和要點。
由ChatGPT中分拆而出的CodeX則成為了自動補齊代碼應用 Copilot 的基礎,這款旨在輔助程序員寫代碼的應用從去年 8 月開始收費,每月 10 美元。
至于實際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準確率。
游戲產(chǎn)業(yè)同樣面臨著來自ChatGPT的挑戰(zhàn)。國外開發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開發(fā)了一個實驗性Mod,在ChatGPT的幫助下,原本相對呆板的NPC變得靈動起來,不再只能重復幾句固定的臺詞。
此前社交媒體上討論火熱的AI繪畫同樣如此。去年8月,游戲設計師Jason Allen通過AI繪圖工具Midjourney生成原畫,再經(jīng)過Photoshop潤色而完成的作品《太空歌劇院》在科羅拉多州博覽會上獲得了數(shù)字類別的一等獎。雖然AI繪畫的能力并不能和資深的人類畫師媲美,但無疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報道,有業(yè)內人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分。”
根據(jù)騰訊研究院《AIGC發(fā)展趨勢2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務的未來,其中包括以預訓練模型為主的基礎層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應用為主的應用層。
這意味著ChatGPT這樣的產(chǎn)品或將逐漸成為一種類似基礎設施的存在,一如pc和手機。
當下,已經(jīng)有許多公司開始利用 GPT-3 系列模型做應用端的開發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計,現(xiàn)在已經(jīng)有了 628 個調用 GPT-3 系列模型開發(fā)的應用程序。背靠 GPT-3 模型的寫作輔助工具 Jasper,成立 18 個月估值達 15 億美元。
簡而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預見的,可以提升整個社會生產(chǎn)效率的可落地工具,就像蒸汽機解放雙手,汽車解放雙腿那樣。在這樣的大前提下,移動互聯(lián)網(wǎng)時期字節(jié)超車百度的事件可能會再次重演。
ChatGPT 在 LinkedIn 分享的一篇,原本針對“ChatGPT會不會讓我失業(yè)”的帖子或許也適合回答開頭末尾的那個問題:“AI 不會取代你。一個使用 AI 的人將取代你”。
二
大廠的游戲
ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個游戲的玩家寥寥無幾。這點從OpenAI的發(fā)展歷程就能看出。
OpenAI 在2015年末成立時是一家非營利性機構,創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見肘。
這和2018年以后,OpenAI堅持大模型訓練有關。2015年以前,小模型被公認為是AI模型的最優(yōu)選。這是因為小型的模型對于硬件的要求較低,同時和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點在于,對通用任務的處理表現(xiàn)并不好。換言之,他們很難針對特定領域或者場景去進行定制。
在這個背景下,大模型脫穎而出。大模型可泛化能力強,可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進行微調或不進行微調就能完成多個場景的任務,從而擺脫小模型應用碎片化、作坊式開發(fā)的特點。簡單來說,就是大模型更加“通用”。
2019年,OpenAI推出了大型語言模型GPT-2,參數(shù)超過15億,是上一代語言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達到1750億。大模型的訓練讓自然語言模型取得了突破性的進展,GPT-2已經(jīng)能根據(jù)用戶輸入的文字生成看上去邏輯正常的文字。
但大模型太花錢了。布羅克曼等人測算,訓練大模型消耗的計算量,每 3、4 個月會翻一倍。據(jù)多位業(yè)內人士估算,OpenAI 訓練 GPT-3 一年,僅算力成本就有 2000 萬美元。
由于研發(fā)所需資金太大,OpenAI 在2019年轉變?yōu)橛舷扌徒M織,和微軟達成了資本掙到有限收益之后,后續(xù)收益歸非盈利實體。截至目前,微軟對OpenAI最新一輪投資額達100億美元。
無論是訓練模型所需的龐大數(shù)據(jù)和算力,還是參與開發(fā)的頂級人工智能科學家,亦或是推廣和普及所需的生態(tài)支持,都足見產(chǎn)業(yè)的門檻之高,國內也只有互聯(lián)網(wǎng)巨頭們有這個數(shù)據(jù)優(yōu)勢和資金積累。
這也是為什么日前原美團聯(lián)合創(chuàng)始人王慧文在社交平臺官宣出資5000萬美元,要打造中國的OpenAI,卻被網(wǎng)友質疑“5000萬美元夠干什么?”的原因。
基于數(shù)據(jù)安全和應用效果的考慮,國內需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠們需要擔負起這個責任。
誰能率先突圍?
ChatGPT的爆火也讓很多國內媒體開始反思,為什么中國的科技環(huán)境無法誕生這種創(chuàng)新?對于這類看法,伯虎財經(jīng)認為,對國內AI產(chǎn)業(yè)的看法不應如此悲觀。
首先需要承認的是,在ChatGPT上,國內確實存在一定差距,普遍的看法認為這種技術上的差距在2年左右。
同時大模型在某種意義代表著一種暴力美學,訓練大模型需要空前的語料數(shù)據(jù)。相對于英語語境,中文互聯(lián)網(wǎng)在表達習慣上會缺乏嚴謹,比如讓許多中年人頭疼的拼音簡寫,YYDS。這類表達必然會影響AI訓練的效果和效率。這也是為什么ChatGPT爆火后,內容質量相對較高的知乎會迎來一波股價暴漲。
不過我們也要看到國內AI產(chǎn)業(yè)也有足夠的底氣。
大模型的訓練離不開算法、算力和數(shù)據(jù)。算法決定了其本身的學習能力,算力則影響著算法的學習效率,數(shù)據(jù)決定了AI的訓練效果。
國內擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶,在數(shù)據(jù)積累方面有一定優(yōu)勢。而根據(jù)《2021―2022全球計算力指數(shù)評估報告》顯示,在算力上中美大致處于同一梯隊。
和芯片或者操作系統(tǒng)不同,國內玩家在AI產(chǎn)業(yè)不需要面對前者必須直面的困難,比如核心技術壟斷,制造上的門檻,即便是ChatGPT,其本質仍然屬于自然語言NLP的范疇,是人工智能技術長期發(fā)展和積累的結果。
Meta首席人工智能科學家Yann LeCun也曾評論:“就底層技術而言,ChatGPT 并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實驗室正在使用同樣的技術,開展同樣的工作。”
也就是說,國內具備追趕甚至超越的能力。當前國內大廠基本都具備訓練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤古大模型,騰訊的混元AI大模型等。
從AI相關技術來看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應用四層技術棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專利儲備分列世界前兩位。
相對而言,字節(jié)在應用端的開發(fā)更領先。根據(jù)tech星球報道,在ChatGPT被用作寫文章前,字節(jié)跳動就研發(fā)了Xiaomingbot自動寫稿平臺,自2016年上線以來,已經(jīng)累計寫了60萬篇文章,覆蓋了17項的體育賽事,支持6種語言。
(圖源:Tech星球)
此前國內AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當下各家基本上確定了相關研發(fā)上線的時間表,最早的比如百度的“文心一言”在3月完成內測后,就將和公眾見面。
Gartner預測,到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個比例還不足1%。
在這波新的智能浪潮里,中國需要土生土長的ChatGPT,互聯(lián)網(wǎng)大廠們也需要爭做潮頭的破浪者。
參考來源:
1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項,問什么答什么,網(wǎng)友直呼童年夢想成真
2、騰訊研究院:《AIGC發(fā)展趨勢2023》
3、品玩:谷歌發(fā)布自己的ChatGPT!華人團隊主導,緊急上線,新的搜索大戰(zhàn)要來了
4、騰訊研究院:一文讀懂:有關ChatGPT的十個問題
5、晚點LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復制丨TECH TUESDAY
編者按:本文轉載自微信公眾號:伯虎財經(jīng)(ID:bohuFN),作者:陳平安
前瞻經(jīng)濟學人
專注于中國各行業(yè)市場分析、未來發(fā)展趨勢等。掃一掃立即關注。