性导航APP精品视频,国产精品亚洲片在线观看不卡,一级国产交换配乱婬

微信咨詢

咨詢QQ

咨詢電話

公眾號

TOP

首頁 > 資訊 > 科普新聞

中國工程院院士潘云鶴：開拓人工智能視覺知識的“北大荒”-

來源：中國科學(xué)報

作者：韓揚眉

發(fā)布時間：2021-06-08

瀏覽次數(shù)：1072

中國工程院院士潘云鶴：開拓人工智能視覺知識的“北大荒”-

潘云鶴

■本報記者韓揚眉

近年來，圖像識別水平的快速提升推動了人工智能熱潮。圖像識別技術(shù)的突破不僅提高了計算機對人臉、文字、指紋及生物特征、醫(yī)學(xué)圖片等識別的準(zhǔn)確率，而且進(jìn)一步推動了安全監(jiān)控、智能交通、無人機、智能制造等多領(lǐng)域的發(fā)展，但其進(jìn)一步發(fā)展也遇到了諸如可解釋、可分析綜合、可設(shè)計仿真等方面的挑戰(zhàn)。

對此，在《信息與電子工程前沿》上，中國工程院院士、浙江大學(xué)教授潘云鶴提出了“視覺知識”概念。他認(rèn)為，實現(xiàn)視覺知識表達(dá)、推理、學(xué)習(xí)和應(yīng)用技術(shù)將是人工智能2.0取得突破的關(guān)鍵所在。近日，潘云鶴在接受《中國科學(xué)報》專訪時，詳細(xì)闡述了視覺知識發(fā)展面臨的5個基本問題。

“認(rèn)知心理學(xué)早已指出，心象是人類知識記憶的重要部分，被用來進(jìn)行形象思維。視覺知識就是計算機對心象的模擬?！迸嗽弃Q指出。

潘云鶴認(rèn)為，視覺知識表達(dá)是第一大問題。與當(dāng)今人工智能所用的知識表達(dá)方式不同，視覺知識概念具有典型與范疇結(jié)構(gòu)、層次結(jié)構(gòu)與動作結(jié)構(gòu)等要素。視覺概念能構(gòu)成視覺命題，包括場景結(jié)構(gòu)與動態(tài)結(jié)構(gòu)；視覺命題能構(gòu)成視覺敘事，例如無聲電影就是視覺敘事的顯示形式。

不同于言語知識，視覺知識的特征是能表達(dá)對象的大小、色彩、紋理、空間形狀及關(guān)系；能表達(dá)對象的動作、速度及時間關(guān)系；能進(jìn)行對象的時空變換、操作與推理等。事實上，人類記憶中儲存的視覺知識遠(yuǎn)多于言語知識。

視覺識別是第二個問題?！皬娜斯ぶ悄茉缙陂_始，模式識別便是最重要的研究領(lǐng)域，其中圖象和視頻識別是發(fā)展最快的方向?！迸嗽弃Q表示，近年來，深度學(xué)習(xí)提供的方法是，用大量標(biāo)識的圖像訓(xùn)練出深度神經(jīng)網(wǎng)絡(luò)模型用于圖像識別，顯著提高了正確率，已獲廣泛應(yīng)用。

但與深度神經(jīng)網(wǎng)絡(luò)模型方法不盡相同，人類在工作記憶中進(jìn)行視覺識別時，不僅分析視網(wǎng)膜即時感知后傳入短期記憶中的數(shù)據(jù)，而且激活了長期記憶中過去學(xué)到的并記住的相關(guān)心象，即視覺知識。因此，人類在完成視覺識別任務(wù)時往往只需少量數(shù)據(jù)，而且可解釋也可推理。

潘云鶴說，在視覺識別中，協(xié)同使用數(shù)據(jù)和視覺知識，形成數(shù)據(jù)驅(qū)動和視覺知識指導(dǎo)的協(xié)同計算范式是視覺識別的重要研究方向。

第三、四個問題分別是視覺形象思維模擬、視覺知識學(xué)習(xí)。潘云鶴指出，視覺形象思維模擬在計算機輔助設(shè)計和仿真、計算機動畫、游戲、兒童教育和數(shù)字媒體創(chuàng)意等領(lǐng)域應(yīng)用十分廣泛，計算機圖形學(xué)已儲備很多基礎(chǔ)技術(shù)，但有待與人工智能打通。

“視覺知識學(xué)習(xí)則要將目標(biāo)從三維（3D）形狀的重建提升到視覺知識概念和命題的重建?！迸嗽弃Q指出，這就需要對現(xiàn)有計算機視覺技術(shù)做進(jìn)一步研究——不僅要重建3D形狀，而且要重構(gòu)3D形狀的概念結(jié)構(gòu)與層次結(jié)構(gòu)。在此基礎(chǔ)上，有望發(fā)展出視覺知識的自動學(xué)習(xí)手段?！爱?dāng)前的場景圖研究是向視覺知識自動學(xué)習(xí)前進(jìn)的一個合適的中間方法。當(dāng)今，特別需要人工智能、計算機圖形學(xué)和計算機視覺3個領(lǐng)域的研究者聯(lián)手研究?！?/p>

多重知識表達(dá)是第五大問題。潘云鶴認(rèn)為，人腦中的知識往往通過多重表達(dá)來描述，因此，人工智能2.0的知識應(yīng)有多種表達(dá)方式，包括知識的言語表達(dá)、深度神經(jīng)網(wǎng)絡(luò)表達(dá)、形象表達(dá)等，多重知識表達(dá)將形成跨媒體智能和大數(shù)據(jù)智能新的技術(shù)理論和模型。

“視覺知識和多重知識表達(dá)的研究是發(fā)展新的視覺智能的關(guān)鍵，也是促進(jìn)人工智能2.0取得重要突破的關(guān)鍵理論與技術(shù)?！迸嗽弃Q表示，視覺知識的獨特優(yōu)點是具有形象的綜合生成能力、時空演化能力和形象顯示能力。人工智能與計算機視覺、計算機輔助設(shè)計、計算機圖形學(xué)技術(shù)聯(lián)合，將為人工智能在創(chuàng)造、預(yù)測和人機融合等方面的新發(fā)展提供重要的新基礎(chǔ)、新動力。

“視覺知識是一塊寒濕而肥沃的人工智能的‘北大荒’，也是一塊充滿希望、值得多學(xué)科合作勇探的‘無人區(qū)’。”潘云鶴呼吁道。

《中國科學(xué)報》 (2021-06-08 第1版要聞)

關(guān)注【深圳科普】微信公眾號，在對話框：
回復(fù)【最新活動】，了解近期科普活動
回復(fù)【科普行】，了解最新深圳科普行活動
回復(fù)【研學(xué)營】，了解最新科普研學(xué)營
回復(fù)【科普課堂】，了解最新科普課堂
回復(fù)【科普書籍】，了解最新科普書籍
回復(fù)【團(tuán)體定制】，了解最新團(tuán)體定制活動
回復(fù)【科普基地】，了解深圳科普基地詳情
回復(fù)【觀鳥知識】，學(xué)習(xí)觀鳥相關(guān)科普知識
回復(fù)【博物學(xué)院】，了解更多博物學(xué)院活動詳情