- S的 AI X GPT 研究所
- Posts
- 🤖 蘋果首款多模態AI 模型揭曉
🤖 蘋果首款多模態AI 模型揭曉
還有更多:Google Gemini將植入iPhone中?

歡迎, 熱愛AI的你
蘋果剛剛揭示了多模態AI 模型家族MM1,展示了與領先技術與GPT-4V和Google Gemini媲美的能力。除此之外,蘋果還正在與Google談判,計劃將Google Gemini 引擎整合到iPhone中。更令人興奮的是,由馬斯克領導的xAI決定將人工智慧聊天機器人Grok開源了。讓我們深入了解!
今天的觀察重點:
蘋果推出 MM1,其第一個多模式LLM系列
蘋果正在討論將Gemini引擎整合進iPhone中
xAI開源了Grok
閱讀時間:4分鐘
🗞️最新發展
Apple
🤖 蘋果首個多模態MM1

GPT研究所: 蘋果悄悄發表了一篇新論文,揭示了MM1,這是一個全新的多模態AI 模型家族,能夠與GPT-4V和Google Gemini競爭。
重點整理:
蘋果工程師發表了一篇關於多模態大型語言模型(MLLMs)的研究論文。
論文概述了他們如何建立一個稱為MM1的MLLM家族,最高達到30B參數。
MM1在圖像標題生成、視覺問答、自然語言推理方面展現出令人印象深刻的能力。
詳情:
儘管蘋果尚未正式公開一款人工智慧模型,但一篇新的研究論文揭示了該公司在多模態人工智慧技術領域取得的進步。他們引入的MM1模型因其卓越的圖像和文本處理及理解能力而脫穎而出。這一能力使其不僅與GPT-4V和Google Gemini等著名模型相媲美,甚至在處理視覺信息的任務上可能超越它們。MM1之所以引人注目,是因為它儘管模型規模較小,卻能達成這些成就。它特別擅長理解圖像,基於所“見”之物回答問題,並通過分析多個圖像來解決問題。它成功的一大因素來自一個特殊組件,稱為視覺編碼器。這一個組件,連同高質量的訓練數據,對於提升模型性能起了關鍵作用。此外,MM1採用的訓練方法是混合不同類型的數據,這種方法在學習範例稀缺的情況下特別有效,突顯了多樣化數據在提高模型學習能力方面的價值。
為什麼要知道:
看到蘋果如此開放地與更廣泛的AI社群分享研究成果特別有趣,蘋果這個以保密著稱的公司,發表了一篇詳細介紹其多模態基礎模型的論文。研究人員表示,“在這篇論文中,我們記錄了MLLM建構過程,並試圖制定設計經驗訓練,希望這對社群有所幫助。”MM1模型將如何被展現在蘋果的產品中仍有待觀察。發表的MM1能力示例暗示著,當Siri最終學會“看”時,她將變得更加聰明。
Apple & Google
🔬蘋果討論將Gemini 引擎整合進iphone中。

GPT研究所: 蘋果正在討論將Google Gemini 引擎整合進iPhone中。
重點整理:
蘋果想要在新iPhone功能中使用Gemini AI。
蘋果也探索了與OpenAI可能的合作。
這次合作旨在通過生成性AI 增強iPhone在創意任務上的能力。
詳情:
科技巨頭蘋果和谷歌可能即將聯手。蘋果在尋找AI世界中的強大盟友時,對谷歌的Gemini項目表示出了興趣。這樣的夥伴關係可能顯著增強蘋果iOS 18為iPhone帶來的能力,融入下一代AI功能。這次升級承諾將賦予用戶前所未有的輕鬆生成圖像和撰寫文章的能力。然而,這次合作的確切細節,包括條款和品牌方式,仍未決定。官方公告可能會在蘋果的全球開發者大會上發布。隨著AI技術競爭持續延燒,蘋果選擇合作的決定可能會決定未來技術發展的方向。
為什麼要知道:
蘋果和谷歌之間的這一潛在合作可能預示消費科技中AI整合的新時代,將蘋果的硬件卓越性與Google 的AI創新結合。除了技術上的協同效應外,這也提出了有關市場動態、隱私和AI驅動界面未來的問題。
XAI
🚀 xAI開源Grok

GPT研究所: 3月11日,伊隆·馬斯克表示其公司xAI將開源其人工智慧聊天機器人Grok,現在GitHub上已經可以找到開放發布版本。
重點整理:
馬斯克的xAI公司發布了Grok的模型權重和架構。。
擁有3140億參數的Grok超越了其開源競爭對手。
開源行為與馬斯克更廣泛的商業和意識形態策略相一致。
詳情:
忠於他的承諾,億萬富翁、多公司的領導人伊隆·馬斯克的新創公司xAI今天使其首款大型語言模型(LLM)Grok開源。公司的一篇文章解釋說,這次開放發布包括了“3140億參數專家混合模型,Grok-1”的“基礎模型權重和網絡架態”。他繼續說,這個模型來自於去年十月的一個檢查點,並且沒有經過“針對任何特定應用程序,例如對話”的微調。Grok在Apache License 2.0下開源,該許可證允許商業使用、修改和分發,但不能被商標化,且不承擔任何責任或提供保證。此外,用戶必須復制原始許可證和版權聲明,並說明他們所做的更改。
為什麼要知道:
Grok的開源行為顯然也是馬斯克在他對OpenAI的訴訟和一般批評中的一個有益的意識形態立場。他最近起訴了他的前公司,指控它放棄了作為非營利組織運營的“創立協議”。至少在公眾輿論法庭上,OpenAI發布了電子郵件作為其辯護,表明馬斯克知情且可能支持其轉向專有的、盈利的技術。
🎯一分鐘快速看
🎭️ 醫療科技 :醫生們正將醫療生成式人工智慧轉化為能蓬勃發展的業務項目。
熱門AI工具
🔊 LALAL.AI -在音軌分離方面表現出色的AI音頻工具,使用者可以從音頻或影片中提取單獨組件(連結)
謝謝你的閱讀!👏🏻
see you soon !
S