9月27日下午,計算機與信息科學學院在致用樓102學術會議廳舉辦第三期“圖靈學術大講堂”,華中科技大學教授喻莉應邀作題為《面向機器視覺的圖像視頻編碼技術》的學術報告。計算機與信息科學學院黨政領導班子、全體教師、研究生參加,會議由副院長崔少國主持。
報告中,喻莉首先基于自動駕駛、智慧城市、工業(yè)互聯(lián)網(wǎng)等場景中的視頻分析,對面向機器視覺的圖像視頻編碼的研究背景進行闡釋。她指出,面向人類的視頻與面向機器的視頻在應用場景、信息處理、編碼和信息處理與使用上存在著差異。隨后,她從VCM標準發(fā)展現(xiàn)狀,Track-1特征壓縮、Track-2 先壓縮后分析的兩條技術路線,以及MPEG143次會議中VCM最新進展等進行了詳細介紹。她談到,機器視覺編碼是研究以智能應用為目標的壓縮編碼,在保障壓縮率的同時,要做到計算機視覺任務的無損。提取到的壓縮視頻或特征碼流可服務于多種機器任務,同時保障高壓縮效率和機器智能任務性能。
同時,喻莉還介紹了三個核心任務(目標檢測/實例分割/目標追蹤)加兩個主要評估數(shù)據(jù)集(OpenImageV6/TVD)。兩條思路中兩條標準里所提到的VCM架構,一個是根據(jù)特征來統(tǒng)計的壓縮方法,另一個是將特征轉換成圖像,然后再進行圖像壓縮編碼的壓縮方法。對于特征壓縮,一方面是現(xiàn)有的編解碼方案,可以把它變成HEVC、VVC等;另一方面是新的技術方案,包括有特征變換,就是對統(tǒng)計特性進行視頻域的分布的變換。最后,喻莉指明了面向機器視覺圖像視頻編碼技術未來的努力方向。
交流環(huán)節(jié),與會師生分別就機器視覺提取出的特征難以恢復,用該技術是否可以用于隱私的保護/多尺度特征提取的問題/如何區(qū)分出感興趣區(qū)域等問題與喻莉教授進行了請教溝通。
報告前,學院還為喻莉教授舉行了兼職教授授予儀式,并頒發(fā)“兼職教授”聘書。
