国产精品久久久久久久妇,色五月日韩成人综合网,好看aV中文字幕大全,狠狠色 综合色区

項(xiàng)目管理資源網(wǎng)

您的位置:項(xiàng)目管理資源網(wǎng) >> 新聞

可以看視頻講故事的機(jī)器學(xué)習(xí)模型來了

2018/8/6 11:51:03 |  2262次閱讀 |  來源:DeepTech深科技   【已有0條評論】發(fā)表評論

架起自然語言與視覺之間的橋梁一直是計(jì)算機(jī)視覺和多媒體領(lǐng)域追求的目標(biāo)。這一領(lǐng)域早起探索的任務(wù)是對圖片進(jìn)行描述,也就是生成單個(gè)句子描述圖片內(nèi)容。近年來的工作則更多關(guān)注于對圖片和短視頻內(nèi)容進(jìn)行更為詳盡的描述,生成包含多個(gè)句子的段落。同時(shí),研究者們也探索了根據(jù)照片流來講述故事。

不過,人們在記錄人生中重要的事件時(shí),相比于短的視頻片段,往往更喜歡使用長視頻,比如生日派對和婚禮。為此,來自新加坡國立大學(xué)與明尼蘇達(dá)大學(xué)的研究者們提出了該領(lǐng)域新的任務(wù):針對長視頻生成簡介、連貫的描述性故事。為此,他們建立了新的數(shù)據(jù)集并提出了新的模型。在該數(shù)據(jù)集上,他們將新模型與前人工作中效果最佳的模型進(jìn)行了比較,新模型取得了更優(yōu)的結(jié)果。

圖|上圖為人類所寫的故事; 下圖為新模型生成的故事; 均只選擇了故事的前五句和視頻中它們nm相應(yīng)的關(guān)鍵幀的采樣。

針對長視頻生成故事這一新任務(wù)與以往的各項(xiàng)任務(wù)都存在著顯著的差別。與短視頻詳細(xì)描述任務(wù)相比,該任務(wù)更關(guān)注包含復(fù)雜動態(tài)事件的長視頻,抽取其中的重要場景生成故事,而不要求包含視頻中出現(xiàn)的每一個(gè)細(xì)節(jié)。而與根據(jù)照片流生成故事相比,該任務(wù)更基于視覺內(nèi)容。因?yàn)橛烧掌魃晒适碌娜蝿?wù)中,視覺材料由一張張照片組成,相對貧乏,故而任務(wù)的關(guān)鍵是填補(bǔ)照片中間的信息鴻溝。這就意味著故事講述的過程需要想象力和先驗(yàn)知識,得到的故事可能因?yàn)闃?biāo)注者的背景不同而產(chǎn)生很大差異。而這項(xiàng)任務(wù)的視覺信息十分充足,根據(jù)視覺信息就足以生成故事,不會受到過多主觀因素的影響。

基于這些特性,這項(xiàng)新任務(wù)也主要面臨兩大挑戰(zhàn)。第一,與單句描述相比,長故事包含數(shù)量更多,更多樣化的句子。而對于相同的視覺內(nèi)容,可能有多種多樣的描述。為此,保證故事的簡潔性和連續(xù)性就更為困難。第二,長視頻中通常包含多個(gè)角色、地點(diǎn)和活動,難以把握故事的主線。

為了應(yīng)對這些挑戰(zhàn),研究者將該任務(wù)分解為兩個(gè)子任務(wù)。首先從長視頻中挖掘重要的片段,然后通過檢索的方式選擇合適的句子生成故事。根據(jù)這兩個(gè)子任務(wù),他們提出了由兩個(gè)部分組成的模型。

模型的第一部分是上下文感知多模態(tài)嵌入學(xué)習(xí)框架,通過兩個(gè)步驟,由局部到全局建立起多模態(tài)語意空間,也就是將視頻內(nèi)容和自然語言映射到同一語意空間中,將其聯(lián)系在一起。它首先對視頻片段-句子對進(jìn)行建模,然后將長視頻轉(zhuǎn)化為一系列的視頻片段。通過一個(gè)殘差雙向 RNN(Residual Bidirectional RNN)進(jìn)行處理。該結(jié)構(gòu)不僅能將上下文信息整合到多模態(tài)語意空間中,同時(shí)可以保證時(shí)序上的連貫性和語意嵌入的多樣性。

圖|局部到整體的多模態(tài)嵌入式學(xué)習(xí)模型。左側(cè)部分為局部嵌入學(xué)習(xí)。針對每一個(gè)輸入的視頻片段-句子對,利用 CNN+RNN 對視頻片段進(jìn)行編碼,利用 RNN 對句子進(jìn)行編碼。

右側(cè)為全局嵌入學(xué)習(xí),將視頻片段和句子應(yīng)映射到同一語意空間。

模型的第二部分稱之為“旁白”。給定一個(gè)視頻,該結(jié)構(gòu)首先從中抽取一系列重要的剪輯片段,接下來在語意空間中檢索與這些剪輯片段最匹配的句子,生成整個(gè)故事。視頻中哪些方面對于一個(gè)好故事是重要的呢?換句話說,什么樣的片段是重要的呢?這顯然沒有一個(gè)明確的定義。因此,這一模塊被設(shè)計(jì)為一個(gè)強(qiáng)化學(xué)習(xí)的代理,通過觀察一系列的輸入視頻來學(xué)習(xí)一個(gè)策略,通過該策略選擇獎勵最大的剪輯片段。而這個(gè)獎勵,就是通過這些剪輯片段生成的故事與人類書寫的參考故事之間的相似度來決定。

圖|上圖為旁白網(wǎng)絡(luò),根據(jù)輸入的視頻提取重要的視頻片段。下圖為根據(jù)提取出的片段檢索出句子組合成故事的過程。

數(shù)據(jù)集一直是驅(qū)動該領(lǐng)域研究進(jìn)步的重要因素

    項(xiàng)目經(jīng)理勝任力免費(fèi)測評PMQ上線啦!快來測測你排多少名吧~

    http://m.opto-elec.com.cn/pmqhd/index.html

“項(xiàng)目管理生根計(jì)劃”
企業(yè)項(xiàng)目經(jīng)理能力培養(yǎng)和落地發(fā)展方案下載>>

分享道


網(wǎng)站文章版權(quán)歸原作者所有,如有認(rèn)為侵權(quán)請聯(lián)系我們,將于1個(gè)工作日內(nèi)作出處理!
網(wǎng)友評論【 發(fā)表評論 0條 】
網(wǎng)友評論(共0 條評論)..
驗(yàn)證碼: 點(diǎn)擊刷新

請您注意護(hù)互聯(lián)網(wǎng)安全的決定》及中華人民共和國其他各項(xiàng)有關(guān)法律法規(guī)或間接導(dǎo)致的民事或刑事法律責(zé)任
·您在項(xiàng)目管理資源網(wǎng)新聞評論發(fā)表的作品,項(xiàng)目管理資源網(wǎng)有權(quán)在網(wǎng)站內(nèi)保留、轉(zhuǎn)載、引用或者刪除
·參與本評論即表明您已經(jīng)閱讀并接受上述條款
中文字幕精品丝袜久久| 女性| 人人爱av| 丰满熟妇乱又伦| 自怕偷自怕亚洲精品| 亚洲一区影院| AV黄色在线免费观看| 曰韩砖区高清无专码大家好| 欧州XXX高潮喷水| 极品骚妇在线| 性视频蜜桃网站麻豆| 成人黄色网站在线播放视频| 牛牛AV成人免费αV| 情侣浪潮AV| 淫妇久久| 九九色综合| 国产又大又长又粗| 老司机AV无码色| 亚洲欧美日韩国产麻豆| 哥也色| 亚洲精品日韩AV| 久久精品一区亚洲| 成人精品99| 999国产精品消防| 欧美精品中文| 人妻av不卡| 精品久久久无码中字| 久久电影1区| 九九九九久久之久| 色欲天天天综合网| 久久综合日| 色舞月亚洲综合一区二区 | 人妻在线综合资源| 国产精品96| 国产精品精品国产色婷婷| 神马夜久久| 曰韩人妻无码一区二区三区综合部| 无码十八禁 免费看| 国产精品啊啊啊啊| www狠狠干| 久久人妻有码|