編寫代碼、翻譯小說(shuō)、參加考試……2022年末,人工智能聊天機(jī)器人ChatGPT刷爆網(wǎng)絡(luò)。一位互聯(lián)網(wǎng)從業(yè)者“爆料”:現(xiàn)在幾乎所有程序員都爭(zhēng)先恐后去領(lǐng)略它的超高情商和巨大威力,ChatGPT輸出的答案有時(shí)幽默、有時(shí)深刻,很難分清與他對(duì)話的究竟是人還是機(jī)器。
ChatGPT由人工智能研究實(shí)驗(yàn)室OpenAI于11月30日推出。上線短短5天,用戶數(shù)量已突破100萬(wàn)。由于太過(guò)火爆,OpenAI不得不暫時(shí)關(guān)閉了用戶的測(cè)試入駐窗口。
2016年3月,AlphaGo擊敗圍棋世界冠軍李世石,被視為人工智能發(fā)展歷程中的一次里程碑事件。而今,ChatGPT再次掀起了一波人工智能發(fā)展應(yīng)用的高潮。
它究竟會(huì)給人類社會(huì)帶來(lái)哪些深刻影響?人工智能的顛覆性應(yīng)用即將來(lái)了嗎?
擅長(zhǎng)“絲滑”寫作,有時(shí)也會(huì)“翻車”
科幻作家劉慈欣的藝術(shù)三部曲之《詩(shī)云》中曾經(jīng)描繪過(guò)這樣一個(gè)故事:外星人仰慕地球文學(xué),但又苦于無(wú)法寫出李白那樣的詩(shī)句,于是他們用量子計(jì)算機(jī)將所有漢字的排列組合窮舉出來(lái),這之后,任何人寫下的任何文字都能在外星人的“文學(xué)數(shù)據(jù)庫(kù)”中找到。
從某種程度上來(lái)看,GPT的技術(shù)路線與“詩(shī)云”類似。2017年,人工智能領(lǐng)域一篇重磅論文《transform(一種采用自注意力機(jī)制的深度學(xué)習(xí)模型)》橫空出世。這篇論文用巧妙的計(jì)算模擬出任何兩個(gè)詞之間所有維度的潛在關(guān)系,這一模型影響了其后的人工智能研究。
2018年,OpenAI推出第一代GPT,之后兩年迭代了三個(gè)版本。2020年,GPT-3的問(wèn)世在業(yè)界掀起不小的波瀾。這是一個(gè)擁有1750億參數(shù)、利用45萬(wàn)億字節(jié)文本數(shù)據(jù)進(jìn)行訓(xùn)練的人工智能算法模型。在它出現(xiàn)之前,世界上最大的語(yǔ)言模型是微軟旗下的Turing-NLG,還不到兩億參數(shù)。
“最新推出的ChatGPT大約相當(dāng)于GPT的3.5版本。”國(guó)內(nèi)領(lǐng)先的文本處理公司達(dá)觀數(shù)據(jù)聯(lián)合創(chuàng)始人文輝表示。盡管目前尚未有ChatGPT的相關(guān)論文披露,但人們可以從關(guān)于GPT的論文中了解到,GPT是通過(guò)文字接龍以及人工引導(dǎo)接龍反饋的模式訓(xùn)練這一語(yǔ)言模型的。
比如,讓GPT在“你好”后面接一個(gè)字,它在瀏覽了大量互聯(lián)網(wǎng)信息后,會(huì)篩選出人類使用頻率較高的字,如美、高、嗎等,工程師給接“美”的標(biāo)注“這是一個(gè)好答案”,手工標(biāo)注幾萬(wàn)條后,再輸入到計(jì)算機(jī)模型中,創(chuàng)建出一個(gè)模擬老師的機(jī)器人模型,再讓機(jī)器學(xué)習(xí)這一模型。
總之,GPT每次輸出的答案其實(shí)是一次概率分布,它能“絲滑”地寫出美妙的文章或代碼,卻很可能在極簡(jiǎn)單的問(wèn)題上“翻車”。比如,當(dāng)你問(wèn)它numbers(數(shù)字)這個(gè)單詞有幾個(gè)字母時(shí),它有時(shí)會(huì)回答7,有時(shí)會(huì)回答9。
聊天之外,ChatGPT將會(huì)撼動(dòng)誰(shuí)?
ChatGPT上線的短短幾天之內(nèi),它已經(jīng)參加了美國(guó)高校的入學(xué)資格考試(SAT),成績(jī)?yōu)橹械葘W(xué)生水平;用《老友記》主角口吻創(chuàng)作了劇本對(duì)白;構(gòu)思了簡(jiǎn)短的偵探小說(shuō)……人們迫切地想要知道,它還會(huì)給我們帶來(lái)多少驚喜?
盡管這一機(jī)器人模型的名字中有chat(聊天),但受ChatGPT影響最大的,并非微信這樣的聊天工具,而是搜索引擎。“許多人已經(jīng)養(yǎng)成了同一個(gè)問(wèn)題問(wèn)一遍搜索引擎,再問(wèn)一遍ChatGPT的習(xí)慣。”文輝說(shuō)。雖然目前ChatGPT仍會(huì)出現(xiàn)“人工智障”的回答,或是反復(fù)橫跳的立場(chǎng),但它無(wú)疑是給民用AI的落地,以及下一代搜索引擎指明了方向。
從發(fā)展趨勢(shì)看,ChatGPT很可能會(huì)成為人們的私人助理。你可以列出這周的工作關(guān)鍵詞,讓它寫一篇工作報(bào)告;或者讓它幫你訂一張從上海到北京的機(jī)票;又或者模仿你喜歡的作家的口吻發(fā)一條網(wǎng)絡(luò)信息……這些工作它都能勝任。或許,我們離人人配備一個(gè)處理文字的“AI小秘書”的時(shí)代已經(jīng)不遠(yuǎn)了。
不過(guò),ChatGPT也并非無(wú)所不能。由于它的答案不是從一篇文檔中摘出來(lái),而是由模型自生成,這使得它更容易“一本正經(jīng)地胡說(shuō)八道”。比如,當(dāng)它按照你的要求生成一段代碼,如果你對(duì)此并不熟悉,可能看不出其實(shí)通篇都是錯(cuò);對(duì)于一些最新發(fā)生的事,比如阿根廷和法國(guó)誰(shuí)能贏得世界杯冠軍,傳統(tǒng)搜索引擎可能幾分鐘后就能全網(wǎng)查詢,但自生成結(jié)果則要慢得多。
圖文并茂,生成式AI時(shí)代或已到來(lái)
劉慈欣在創(chuàng)作《三體》時(shí)未曾想到,如果那時(shí)有ChatGPT,羅輯在描述夢(mèng)想中的女孩時(shí),她的形象就會(huì)被自動(dòng)生成出來(lái)。ChatGPT的能力已經(jīng)涉及到AI模型之間的合作,畢竟引領(lǐng)了文字生圖潮流的人工智能圖像生成器DALL-E,也是出自O(shè)penAI之手。
“人工智能在幾秒鐘之內(nèi)迅速生成圖片、視頻等創(chuàng)造性內(nèi)容,業(yè)內(nèi)普遍認(rèn)為AI的下一個(gè)范式——生成式AI時(shí)代已經(jīng)到來(lái)。”文輝說(shuō)。
雖然在全局層面還無(wú)法與ChatGPT的“智能”一較高下,但在特定垂直領(lǐng)域,中國(guó)人工智能企業(yè)的AI智能也能與ChatGPT“掰掰手腕”。如今,稅務(wù)、金融、新能源汽車等行業(yè)的許多企業(yè),都用上了達(dá)觀數(shù)據(jù)的“自動(dòng)流程機(jī)器人”(RPA),其核心就是一套語(yǔ)義智能識(shí)別系統(tǒng),機(jī)器人可以自動(dòng)填寫單據(jù)、自動(dòng)識(shí)別單據(jù)內(nèi)容、自動(dòng)判斷填寫內(nèi)容是否合法合規(guī)。
回答開(kāi)放問(wèn)題一直是人工智能的痛點(diǎn)。科大訊飛今年在交互系統(tǒng)的認(rèn)知關(guān)鍵技術(shù)上取得了突破性進(jìn)展。目前,訊飛定義了1517個(gè)意圖、近2000個(gè)事件,圍繞認(rèn)知智能技術(shù),實(shí)現(xiàn)了于語(yǔ)義圖網(wǎng)絡(luò)的開(kāi)放場(chǎng)景語(yǔ)義理解,在深度語(yǔ)義理解技術(shù)上又邁進(jìn)了一大步。