Hakeem Oluseyi是一位天文物理學家、宇宙學家、發明家、科普教育家,寫過書、做過演員、當過兵的人道主義者。他訪談Hany Farid博士--一位加州大學柏克利分校信息科學系的教授,專門研究識別互聯網上各種深度偽造(DeepFake)作品的問題,或許您對這個題目也有興趣。
(這篇訪談是去年10月份錄製的,幾個月過去,現在的偽造和識別技術恐怕都已經進一步發展了。)
Oluseyi:我們現在有電腦系統專門識別AI生成的文字、聲音、圖像,您能不能詳細解釋一下識別軟件到底是怎麼識別的?
Farid:關於生成式人工智能(AI)DeepFake,你要知道它基本上是藉著觀看幾十億個圖像、聲音、視頻的模式,來學習如何生成它們。但它不知道甚麼叫做鏡頭,也不懂物理世界和幾何,它不會像你我坐在這裡一樣,來重新創作這個節目。隨便拿一個戶外物體的形象為例,我們這裡現在天晴,陽光照耀,到處都看見影子。影子的出現遵循一定的物理定律:太陽是個單一主要光源,所以我們的幾何技術能夠告訴我們,一個東西和它的影子指示出太陽的方位,無論影子出現多少次,計算結果都是一致的。
O:每個影子都一樣嗎?F:每個影子都一樣。它們若不是一致地指向太陽光源,那麼這個景象在物理上是不可能的。
O:聽來好像AI可以算出來影子該在哪裡嘛。
F:你想它應該能。但它不能的原因我描述過,就是:影子是個三維過程,發生在三維世界,而AI住在二維空間,它不作三維的推理。雖然它可以偽造,好像畫家偽造(很多畫作在物理上是不可能的),反正我們的視覺系統只注意漂亮圖畫,並不關心那些細節--我喜歡這種識別技術。
F:還有一項識別技術我也很喜歡,就是立體世界的東西從遠處看小,從近處看大。比如你站在兩條絕對平行的火車鐵軌之間,會看到直直的鐵軌在遠處越靠越近,在視覺上最終匯合--叫作「消失點」。這個文藝復興時期的畫家就已經發現了。因為你若為一件物品照像,形像大小取決於與鏡頭的距離,一定是越近越大,越遠越小。如同火車鐵軌最終匯合,萬物在遠處看都好像聚合了。這叫作「射影幾合」,任何平行的直線因此看起來都可能不平行--窗戶的上下框啊,建築物的邊沿啊,人行道啊,任何有平行線的平面都會向一個消失點匯合。所以,我們可以測量一個圖像,若發現偏差就從物理上不合理--因為這個圖像違反幾何。
F:我最喜歡一個識別技術是看包裝。你要AI幫你畫一幅畫,它必須用很多像素和一定的格式(Jpeg或Png等等)來包裝這個形像。它是怎麼做到的呢?打個比方:我從網上購物,找到我要的產品,那個產品運來時是包裝在盒子裡的--不同的零售商有不同的包裝方式,有的很講究,有的很隨便。不同的AI工具--OpenAI或Anthropic或Midjourney用不同的方式來包裝他們的圖像--與我們的手機用像素來包裝不同,與Photoshop也不同,於是我們能夠從包裝看出是哪家AI的產品。一般人都只注意商品,不注意包裝,但我們用它來識別。
F:上述是分析辨識偽造成品的技術,還有另外一整套的技術,叫作「主動技術」。谷歌公司最近宣布,凡是從他們生成的圖像、音頻、視頻,都將要有察覺不到的水印。錢幣上的水印你可以對著光看到,防止偽造或讓偽造很難做。所以谷歌會在圖像生成時加入這種水印,表明「谷歌製造」。我們有特殊軟件來檢測到這些水印信號,因為我們與谷歌有合作關係。這很棒,假如蘋果公司也決定在每部手機的自然作品上加這種水印,那麼偽造的作品沒有水印,就很容易識別了。
F:我還可以告訴你一個音頻識別技術。我們現在製作這個節目,是在一個優良的工作室:柔軟牆壁、高質量話筒等等,能夠聽到的話音reverberation(混響)相當小--因為你們很專業。聲音混響取決於周圍的物理空間幾何,物體表面的堅硬度,所以製作出來的話音質量不會忽高忽低。而AI生成的話音不同,即使是在同一段話中,話筒和混響都會改變,因為不是在實際的物理空間錄製的,所以「不自然」。
O:原來是這樣!總歸是尋找實際物理世界所期待看見的現象,還有主動在真實產品中加水印,等等。
F:還有一些技術是對調換面孔的識別,我不想多說。因為我們想要了解對手用了甚麼技術,研究人員深挖軟件代碼,去了解偽造是如何達到的--先做這步,再做那步等等。結果發現,很多換面技術是用一個方框,把面部框住、取掉,然後與新面孔合成,放回圖片框。在所有的開源AI軟件中,你都可以用換面孔的方法偽造。他們做得很好,你看不見,但我們知道如何找到那些方框。這是一個「逆向工程」的例子,還有一些我不告訴你。
O:我明白,這是抗爭。請問,我們這些不是科學家的普通人,如何能夠識別AI深度偽造的作品?
F:你不能識別,這是我們的現實。不要以為你看了這集播客,就以為從此可以辨認社交媒體上的真假。即使我告訴你的都可靠,過幾個月情況可能會改變,我不要你得到一個錯誤的安全感。這是一個情況不斷改變、很難做的工作。
No comments:
Post a Comment