首頁>書畫·現(xiàn)場>訊息訊息
人工智能畫畫 是深夢還是噩夢
提到谷歌的人工智能,大家想到的大多是會(huì)下棋的阿爾法狗和Waymo無人車??梢艺f,谷歌對于教人工智能畫畫這件事,好像有種特別的執(zhí)念。
今年,谷歌推出了一款可以幫助人畫簡筆畫的工具Autodraw,隨便畫幾筆,算法就能識別出你想要畫什么圖案,為你優(yōu)化出來。其實(shí)這并不是谷歌推出的第一個(gè)人工智能+繪畫項(xiàng)目,早從2015年開始,谷歌就已經(jīng)在用算法挑戰(zhàn)人類對藝術(shù)的認(rèn)識和審美了。
DeepDream:是深夢還是噩夢?
谷歌不僅僅有DeepMind,還有DeepDream——利用深度學(xué)習(xí)技術(shù)識別圖片,再把自己解讀的畫面呈現(xiàn)出來。后來谷歌將這一項(xiàng)目開源,讓所有人都可以上傳圖片,再生產(chǎn)出被DeepDream解讀的結(jié)果。
不知道是不是在訓(xùn)練是被喂了太多眼睛和小狗的圖案,反正經(jīng)過DeepDream加工過的圖片基本都是這樣……
充滿了狗臉、眼睛、詭異的螺旋圖案,有種異樣的魔性。谷歌甚至還為DeepDream舉辦過一次展覽,展出的六幅作品還被一位收藏家拍了下來,最高單幅價(jià)格高達(dá) 8000 美元。這可能是第一位靠“藝術(shù)”賺錢的人工智能了。
實(shí)際上,谷歌DeepDream真正想要了解的,是神經(jīng)網(wǎng)絡(luò)黑盒子的工作邏輯。我們都知道,神經(jīng)網(wǎng)絡(luò)在識別圖像時(shí)通常是層數(shù)越多、越細(xì)致,第一層神經(jīng)網(wǎng)絡(luò)可能在識別輪廓,中間層的神經(jīng)網(wǎng)絡(luò)可能就在識別紋理、筆觸等等細(xì)節(jié)了。我們看到的那些正確識別出圖像的算法,都是經(jīng)由人工調(diào)試后的,而DeepDream則跳過了人工指導(dǎo)、矯正這一步,直接憑著自己的意愿識別圖片,并且會(huì)經(jīng)過數(shù)次重復(fù),最終就成了我們現(xiàn)在看到的樣子。
和上圖一樣,如果讓我們把樹看成建筑,把植物看成鳥,恐怕只能去發(fā)揮想象力了。這種機(jī)器識別出人眼不能識別的圖案的情況,讓我們再一次開始思考機(jī)器視覺和人類視覺的不同?;蛟S,DeepDream真的是一個(gè)有著無限想象力的嬰兒人工智能,把人類世界里的一切都看做它可愛的寵物狗。
Quick,Draw!來和人工智能玩你畫我猜
很快,谷歌就不再止步于只讓人工智能畫狗臉了。在去年,谷歌推出了一款叫Quick, Draw!的繪畫小程序。Quick, Draw!其實(shí)就是人與人工智能合作的“你畫我猜”,系統(tǒng)隨機(jī)顯示一個(gè)名詞,要求用戶在20秒內(nèi)把它畫出來。用戶用鼠標(biāo)簡單畫出物體形狀后,然后 Quick, Draw! 會(huì)判斷你畫的到底像不像,并且會(huì)顯示出除了題目之外,你的畫還像什么其他的東西。
顯然,這是一個(gè)收集數(shù)據(jù)的好方法。僅僅半年的時(shí)間,就有來自 100 個(gè)國家的 2000 萬用戶,在 Quick, Draw! 上共繪制了 8 億幅涂鴉。谷歌還表示,這些數(shù)據(jù)了反映的不同文化背景與觀念,比如不同國家的人所畫的椅子是不一樣的,有些國家人畫的椅子總是側(cè)面,有些則通常是正面?,F(xiàn)在,谷歌已經(jīng)開放了其中的部分?jǐn)?shù)據(jù),供所有開發(fā)者一起玩耍。
Autodraw:人工智能涂鴉大師
文章開頭提到的Auto draw就是Quick,Draw!數(shù)據(jù)的研究成果,也展示了谷歌強(qiáng)大的機(jī)器學(xué)習(xí)技術(shù)。
Autodraw能做到的不僅僅是識別你在畫什么,它甚至能幫你補(bǔ)完未完成的涂鴉,糾正其中的錯(cuò):如果你花了一只三只眼睛的貓,Autodraw會(huì)去掉一只眼睛。
這意味著,Autodraw已經(jīng)擁有了我們所說的抽象思維,它并非僅僅是按照歷史數(shù)據(jù)規(guī)整圖畫的線條,而是“知道”眼睛這一概念,并且知道貓只有兩只眼睛。
Autodraw的背后,是人工智能系統(tǒng)SketchRNN。當(dāng)我們在Quick,Draw!上作畫時(shí),SketchRNN會(huì)記下我們每一筆的形狀和順序,為每一種特定物體(貓、椅子等等)訓(xùn)練出一種神經(jīng)網(wǎng)絡(luò)。
把人類涂鴉的筆畫當(dāng)成輸入,進(jìn)行序列編碼,用人們的繪畫方式來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。完成這一訓(xùn)練后,SketchRNN就了解了某一圖案繪畫時(shí)的“一般規(guī)則”。
比如我們畫貓時(shí),會(huì)畫一張圓臉,兩個(gè)尖耳朵,兩只眼睛,六根胡須。SketchRNN就能明白,一個(gè)大圓、兩個(gè)小圓、六根線和兩個(gè)尖角加起來就是“貓”。然后,再向其中引入變量,讓SketchRNN可以輸出和接受隨機(jī)性。比如貓臉的圓形可以不那么圓,貓的胡須可以長短不齊。但是三只眼睛這種錯(cuò)誤超過了變量浮動(dòng)的范圍,是會(huì)被SketchRNN修正的。
SketchRNN雖然神奇,可很多人認(rèn)為這項(xiàng)技術(shù)的實(shí)用性比較差。因?yàn)镾ketchRNN能識別甚至創(chuàng)造圖形的原因,是因?yàn)閳F(tuán)隊(duì)為每一種圖案都訓(xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)。能做到這些,離不開Quick,Draw!收集到的龐大數(shù)據(jù)量,更離不開TensorFlow的強(qiáng)大算力??蓜?dòng)用了如此之多的資源之后,SketchRNN的應(yīng)用范圍還只限制于涂鴉之中,如果圈定在“筆畫”這個(gè)邏輯里,或許以后還能在書法上有所作為,但效率如果還停留在每個(gè)個(gè)字搭建一個(gè)神經(jīng)網(wǎng)絡(luò)上,性價(jià)比未免太低了。
不過也有人提出了其他的看法,有學(xué)者認(rèn)為,“筆畫”是世界范圍共用的溝通方式。象形文字、壁刻畫式的線條會(huì)對人類大腦形成一種天然的刺激,人類的藝術(shù)創(chuàng)造越來越具象,或許展示了一種大腦和思維進(jìn)化的可能。按照這個(gè)邏輯,SketchRNN或許能為我們找回曾經(jīng)的思維方式,在未來幫助考古、史學(xué)、人類學(xué)等等領(lǐng)域更好的進(jìn)行研究。
編輯:楊嵐
關(guān)鍵詞:人工智能畫畫 谷歌DeepDream