非營利組織 LAION-AI 發布了OpenFlamingo,這是一個用於訓練和評估大型多模態模型(LMM)的框架,屬於DeepMind 的Flamingo 模型(一種能夠處理和推理圖像、視頻和文本的等多模態內容的框架)的開源複製品。
其數據集OpenFlamingo-9B 的Demo 頁面展示了訓練結果,用戶可以上傳圖片讓該模型進行識別。
小編淺試了一下,一張簡單的圖片耗時11 秒,可以相當精準地描述圖片的主體:
對於另一張內容較多的圖片,識別的時間則上到16 秒左右,但識別出來的內容仍是圖片中心的主體,並沒有其他細節內容。
可以看出精度並不是很理想,還需要繼續迭代。
LAION-AI 稱OpenFlamingo 的目標是開發一個可以處理各種視覺語言任務的多模態系統,最終目標是在處理視覺和文本輸入方面與GPT-4 的功能相匹配。
OpenFlamingo 的首個版本主要包含如下內容:
- 一個用於訓練Flamingo 風格LMM 的Python 框架(基於Lucidrains 的flamingo 實現和David Hansmair 的flamingo-mini 存儲庫)。
- 具有交叉圖像和文本序列的大規模多模態數據集。
- 視覺語言任務的上下文學習評估基準。
- OpenFlamingo-9B 模型(基於LLaMA )的第一個版本
OpenFlamingo-9B 模型在LAION-AI 自研的多模態C4 數據集上訓練,LAION-AI 稱即將發布該數據集的細節。
OpenFlamingo 的整體架構圖如下,可以看出技術細節上很大程度上是跟著DeepMind 的Flamingo 模型走,Flamingo 模型在包含交叉文本和圖像的大規模網絡語料庫上進行訓練,OpenFlamingo 同樣是使用交叉注意力層來融合預訓練的視覺編碼器和語言模型。
You may also like
相关贴文:
- 經過20 多年開發,Stellarium 1.0 正式發布- 科技資訊
- PhpStorm 2022.2.3 發布- 科技資訊
- 得物雲原生全鏈路追踪Trace2.0-採集篇- 得物技術的個人空間- 科技資訊
- RedisFront 1.0.6 發布- 跨平台Redis 桌面客戶端工具
- Bugzilla 項目負責人“回歸”,沉寂許久後恢復更新- 科技資訊 – 中文開源技術交流社區
- :fire: 週熱點| GPT-4發布;文心一言亮相;微軟開源Visual ChatGPT…
- 英特爾GPU 工作主要推動者將離職,創立AI 初創公司- 科技資訊
- open-geoip首頁、文檔和下載- IP 地址地理信息查詢服務- 科技資訊
近期文章
- Shoplentor的WooCommerce Gutenberg Blocks
- 如何在WooCommerce上添加訂單跟踪頁面|分步指南2025
- 開始使用WordPress和WooCommerce在線銷售
- 如何使用UPSellWP插件在WooCommerce中創建經常購買的捆綁包
- 使用多合一SEO來增強您的WooCommerce頁面
- 使用WooCommerce啟動板增強您的在線商店| |終極電子商務解決方案2025
- 頂級Whols插件功能可提高您的批發銷售!
- 將產品類別添加到WordPress WooCommerce中的菜單| weeweb
- 如何在WordPress上安裝WooCommerce(Cloudways教程逐步)
標籤雲
Dropshipping
ecommerce
JavaScript
Joomla
OSCHINA博客
python
REBELLION
Shopify
Shopify 商店設置
Shopify 直銷
Woocommerce
WordPress
代發貨
刀塔2
和
商店
商業
喬姆拉
在
如何創建 Shopify 商店
如何在
如何建立 Shopify 商店
如何開始代出貨
年
店舖教學
店鋪化
店鋪培訓
教學
獲獎產品
直銷 Shopify
直銷教程
科技資訊
程式碼
網路業務
網路賺錢
臉書廣告
與
行銷
詳解
購物
跨平台
運輸船
適合初學者的 Shopify 教學課程
適合初學者的直銷
電子商務