欧美大肚乱孕交hd孕妇_欧美成人女星排行榜_中文字幕五月欧美_日韩免费福利电影在线观看

您的位置:互聯網 > 正文

視頻解析工具Video-ChatGPT上線 可用文本描述視頻內容_世界觀察

來源: 時間:2023-05-29 20:56:08

編程客棧()5月29日 消息:雖然像Runway ML這樣的公司在將文本轉換為視頻方面取得了長足的進步,但 VideoChatGPT卻另辟蹊徑,賦予語言模型分析視頻的能力。Vide編程客棧o-ChatGPT 可以用文本描述視頻的內容,例如,通過突出顯示不尋常的元素來解釋為什么剪輯可能很有趣。

開發人員通過一段長頸鹿從跳水板上跳入水中的視頻來演示這一點。Video-ChatGPT 指出:“這并不常見,因為長頸鹿并不擅長雜技或潛水。”


(資料圖)

鏈接到開源語言模型的預訓練視頻編碼器

研究人員將 Video-ChatGPT 的設計描述為簡單且易于擴展。它使用預訓練的視頻編碼器,并將其與預訓練然后微調的語言模型相結合。

盡管名稱如此,阿布扎比穆罕默德本扎耶德人工智能大學的項目并未使用 OpenAI 技術。相反,研究人員嵌入了一個線性層,將視頻編碼器連接到語言模型。

除了要求特定任務的用戶提示外,語言模型還會使用定義其角色和一般工作的系統命令進行提示。

人機增強數據集

研究人員結合使用人工注釋和半自動化方法來生成高質量數據,以微調 Vicuna 模型。這些數據的范圍從詳細描述到創造性任務和訪談,涵蓋了各種不同的概念。

總的來說,該數據集包含大約86,000個高質量的問答,一些由人類注釋,一些由 GPT 模型注釋,一些由圖像分析系統的上下文注釋。

Video-ChatGPT 的核心是其結合視頻理解和文本生成的能力。它在視頻推理、創造android力和對時間和空間php的理解方面的能力已經過廣泛測試。

多模態人工智能未來

在最近文本生成取得重大進展之后,OpenAI 和谷歌等公司正在轉向多模態模型。Bard 理解并可以對圖像做出反應,并在其正式發布時展示了這些能力。

從圖像到移動圖像編程客棧將是下一個合乎邏輯的步驟。谷歌已經宣布開發一款將于今年晚些時候發布的 帶有 Project Gemini 的大型多模式 AI 模型。

關鍵詞:

精彩推送

公司

吉卜力工作室如今已加入到主題公園的浪潮,并于11月1日正式對公眾開放全球首個項目,將《龍貓》等經典作品的場景復原至現實世界。對于吉卜

詳細>>

隨著在線旅游企業數量的不斷增多,售賣不合理低價旅游產品、違規利用用戶個人信息等問題也時有發生。11月1日,文旅部發布《文化和旅游部關

詳細>>

兩個小時,這是越南全國首票榴蓮從裝車到運送至我國廣西崇左友誼關口岸的時間。得益于一體化供應鏈,2021年,中國與越南進出口貿易額達到23

詳細>>

11月1日,北京商報記者梳理發現,截至9月末,10家A股上市農商行資產規模均有所擴大,重慶農商行、上海農商行仍以萬億元總資產位居前列。營

詳細>>

西貝餐飲集團(以下簡稱西貝)在兒童餐的道路上越走越深。11月1日,北京商報記者從西貝獲悉,其將推出西貝兒童餐零售產品。目前,部分西貝門

詳細>>

新一期麻辣粉和逆回購操作如期公布。9月15日,央行發布消息稱,為維護銀行體系流動性合理充裕,開展4000億元中期借貸便利(MLF)操作和20億元

詳細>>
主站蜘蛛池模板: 欧美二区在线| 亚洲最大福利网| 麻豆成人av| 国产精品 日韩| 日韩av免费一区| 国产精品久久久久久久久久久久| 欧美在线一区二区三区四| 欧美精品一本久久男人的天堂| 97精品一区二区视频在线观看| 日韩在线免费视频V| 激情五月五月婷婷| 日韩免费在线观看av| 国产精品av免费观看| 国产免费一区二区三区四在线播放| 国产精品第3页| 久久久水蜜桃| 久久精品国产精品| 国产一区视频免费观看| 欧美精品在线免费| 国产二区视频在线| 久久精品在线免费视频| 日韩欧美亚洲日产国产| 国产有码在线一区二区视频| 国产亚洲精品美女久久久m| 久久精品夜夜夜夜夜久久| 日日噜噜噜噜夜夜爽亚洲精品| 国产美女精彩久久| 国产精品欧美久久| 日本一区二区久久精品| 亚洲视频在线观看日本a| 国产精品久久国产精品| 久久亚洲欧美日韩精品专区| 不卡日韩av| 国产精品免费入口| 国产精品午夜国产小视频| 国产日韩在线一区二区三区| 91精品91久久久久久| 日韩av综合在线观看| 日韩在线不卡视频| 日韩精品综合在线| www.亚洲一区|