隨著自然語言處理、知識(shí)庫等人工智能技術(shù)的發(fā)展,許多媒體已經(jīng)開始了機(jī)器人報(bào)道的探索。《紐約時(shí)報(bào)》數(shù)字部門開發(fā)了機(jī)器人編輯 Blossomblot,每天推送300篇文章,每篇文章的平均閱讀量是普通文章的38倍。此外,《紐約時(shí)報(bào)》還會(huì)在財(cái)報(bào)季、運(yùn)動(dòng)比賽報(bào)道的時(shí)候使用機(jī)器人來寫稿;美聯(lián)社在過去一年多時(shí)間里使用Wordsmith系統(tǒng)編發(fā)企業(yè)財(cái)報(bào);在華爾街引起巨大反響的Kensho可以通過接入美國勞工部等數(shù)據(jù)源來自行創(chuàng)造投資分析報(bào)告;電訊社也計(jì)劃使用雅虎在報(bào)導(dǎo)夢(mèng)幻橄欖球聯(lián)賽時(shí)用到的技術(shù),用來發(fā)布一些美式橄欖球回顧;AutomatedInsights的寫作軟件去年寫了150億篇文章,宣稱自己是世界上最大的內(nèi)容生產(chǎn)者;路透社也在發(fā)表機(jī)器撰寫的文章,該系統(tǒng)的負(fù)責(zé)人認(rèn)為「在一次盲測(cè)中,機(jī)器的作品表現(xiàn)得比人類作品更具可讀性。」;此外,還有專門提供「標(biāo)題黨」服務(wù)的Click-o-Tron公司。
媒體領(lǐng)域出現(xiàn)這種趨勢(shì)的原因在于相關(guān)技術(shù)已經(jīng)達(dá)到了一定的成熟度,而且這種成熟度是和新聞媒體的要求很好的匹配在了一起。在卡斯韋爾的「結(jié)構(gòu)化故事」系統(tǒng)中,所謂的「故事」完全不是個(gè)故事,而是一個(gè)信息網(wǎng),我們可以像對(duì)待文案、信息圖表或者其它表達(dá)形式一樣去組裝它,閱讀它,就像我們擺弄音樂音符一樣。任何一類信息——從法院報(bào)道到天氣預(yù)報(bào)——都能夠最終能放入到這個(gè)數(shù)據(jù)庫中。這樣的系統(tǒng)的潛力是巨大的。
「大多數(shù)自然語言系統(tǒng)都是在簡單地描述一個(gè)事件。但是大多數(shù)新聞都是描繪性的,甚至是事件驅(qū)動(dòng)的」來自密蘇里大學(xué)DonaldWReynolds新聞機(jī)構(gòu)的大衛(wèi)·卡斯韋爾說。「事件們?cè)诓煌牡攸c(diǎn)發(fā)生,這些事件之間的因果關(guān)系是這些事件的核心敘述結(jié)構(gòu)。」需要把它們放到古老的新聞術(shù)語中:誰,發(fā)生了什么,在哪里,什么時(shí)候。
根據(jù) DonaldWReynolds的說法,人工智能系統(tǒng)在進(jìn)行新聞創(chuàng)作時(shí)需要解決非常多的技術(shù)難題,包括自然語言處理中的自動(dòng)摘要、文本分類等,還有知識(shí)庫和知識(shí)發(fā)現(xiàn)(KDD)等相關(guān)技術(shù),比如實(shí)體定義、關(guān)系抽取、問答系統(tǒng)等。簡單來說,就是機(jī)器首先需要理解自然語言,然后通過知識(shí)管理弄明白新聞中各個(gè)要素(各類知識(shí))之間的關(guān)系。
Xiaomingbot、CFO只是頭條實(shí)驗(yàn)室眾多研究布局中的階段性成果,后者旨在推動(dòng)人工智能技術(shù)研究,讓算法更好地理解文字、圖片、視頻、環(huán)境場(chǎng)景和用戶興趣,從而促進(jìn)人類信息與知識(shí)交流的效率和深度。今日頭條不僅僅是新聞客戶端,是一款基于機(jī)器學(xué)習(xí)的個(gè)性化資訊推薦引擎,是所有信息、內(nèi)容分享創(chuàng)作的平臺(tái)。人工智能和機(jī)器學(xué)習(xí)的算法起到了重要作用,能夠幫助高效精準(zhǔn)地把用戶感興趣的內(nèi)容推薦出去。今日頭條的內(nèi)容平臺(tái)對(duì)應(yīng)著雙邊用戶:一邊是內(nèi)容的創(chuàng)作者,另一邊是內(nèi)容的消費(fèi)者。所以為了把最好的內(nèi)容推薦給最需要的讀者,就需要機(jī)器學(xué)習(xí)的技術(shù)。今日頭條等媒體巨頭對(duì)人工智能技術(shù)在研發(fā)和應(yīng)用上的加碼,讓我們看到了人工智能在未來對(duì)媒體業(yè)造成的巨大影響。《淺狽中提到,互聯(lián)網(wǎng)作為一種智力工具,在給我們帶來便利的同時(shí)也在重塑著我們的思維方式。隨之而來的問題是,互聯(lián)網(wǎng)這種媒介傳遞的信息越多,我們想找到優(yōu)質(zhì)或者自己所需信息的難度也就越大。而這正是人工智能的優(yōu)勢(shì)所在,它可以讓大數(shù)據(jù)從負(fù)擔(dān)變成便利,會(huì)重塑媒體的內(nèi)容生產(chǎn)和分發(fā)。
在采用Wordsmith之前,美聯(lián)社需撰寫約300家公司的財(cái)報(bào)文章,可想而知這并不是個(gè)輕松的工作量。在使用機(jī)器人Wordsmith之后,美聯(lián)社每季度可以出3000家公司財(cái)報(bào),雖然其中仍有120篇需要人力更新或添加獨(dú)立的后續(xù)報(bào)道,但顯然它替人類編輯承擔(dān)了絕大部分的工作量。
在哥倫比亞大學(xué)慶祝普利策獎(jiǎng)?wù)Q生一百年之際,智能機(jī)器人也將在財(cái)經(jīng)報(bào)道、體育實(shí)況報(bào)道、騙點(diǎn)擊的標(biāo)題黨新聞(clickbait)以及其它原本只有受過訓(xùn)練的記者才能報(bào)導(dǎo)的領(lǐng)域開始一展身手。「總有一天,機(jī)器人會(huì)贏得普利策獎(jiǎng)」,來自NarrativeScience的KrisHammond如此預(yù)測(cè)。這家公司專注于「自然語言生成」。「我們能講述隱藏在數(shù)據(jù)中的故事。」最近的進(jìn)步味著,人工智能現(xiàn)在能夠撰寫出具有可讀性的流暢文字,并且還能比亢奮的寫手更快地大量炮制模板型文章。「有了自動(dòng)化,我們現(xiàn)在能為4,000家公司追蹤、撰寫季度收益報(bào)告,」來自世界第一個(gè)也是迄今為止唯一個(gè)使用自動(dòng)化編輯的通訊社——美通社的賈斯汀·邁爾斯說,「以前我們只能做到400家。」
而對(duì)于機(jī)器人能否拿普利策新聞獎(jiǎng)這個(gè)問題,邁爾斯也「絕對(duì)相信」——因?yàn)闄C(jī)器人已經(jīng)做到了。BillDedman因一篇抵押貸款中存在種族主義問題的調(diào)查報(bào)道,而獲得了普利策獎(jiǎng)。這篇報(bào)道雖然發(fā)表于1988年,卻是由電腦協(xié)助寫作成的。
自動(dòng)化新聞不僅僅具有數(shù)量優(yōu)勢(shì),還有助于定位客戶需求——通過用戶畫像、情感分析等技術(shù)為用戶提供個(gè)性化內(nèi)容,或者對(duì)于智能對(duì)話系統(tǒng)與用戶進(jìn)行交互。
隨著人工智能技術(shù)在新聞?lì)I(lǐng)域的參與程度越來越高,對(duì)于人工智能技術(shù)是否造成失業(yè)問題的爭(zhēng)論也愈演愈烈。牛津大學(xué)此前發(fā)布了一篇報(bào)告稱,目前47%的工作崗位將最終被自動(dòng)化。但對(duì)此的批評(píng)意見認(rèn)為,工作被取代,并不意味著勞動(dòng)者將失去工作,正如曾經(jīng)汽車的出現(xiàn)取代了許許多多的馬車夫和馬童,但同時(shí)創(chuàng)造了更多修建高速公路和服務(wù)加油站的工作。
對(duì)于媒體領(lǐng)域來說同樣如此,機(jī)器人負(fù)責(zé)這項(xiàng)單調(diào)而又乏味的工作就能把記者們解放出來,讓他們追求一些需深度思考的報(bào)道,同時(shí)機(jī)器人也可以將消費(fèi)者從海量信息中解放出來,提高他們獲取信息和知識(shí)的效果和效率,而這就是人工智能對(duì)媒體的最重要影響。不久的未來,我們將看到人工智能作為工具在新聞產(chǎn)業(yè)產(chǎn)出發(fā)揮重要的作用。