🗣️ChatGPT 語音模式上線!

還有更多:Meta 一鍵分割影片

歡迎, 熱愛AI的你

這將是AI領域激動人心的一周! OpenAI 剛剛發布了 ChatGPT 高級語音模式的 alpha 版本,首先開放給 ChatGPT Plus 訂閱者。 Meta 也透過 SAM 2 掀起了波瀾,SAM 2 是其 Segment Anything Model 的增強版本,現在可以在影片中提供一鍵分割。同時,Midjourney 推出了 6.1 版本,擁有重大升級,例如改進的影像品質和更快的處理時間。讓我們深入了解一下!


今天的觀察重點:

  • ChatGPT 的語音模式對部分使用者開放

  • Meta 一鍵分割影像

  • Midjourney V6.1:增強的 AI 影像生成


    閱讀時間:3分鐘

🗞️最新發展

GPT研究所: OpenAI 已開始與一組選定的 ChatGPT Plus 用戶測試其「高級語音模式」。


重點整理:

  • 新功能正在逐步推出,最初是針對 ChatGPT Plus 用戶,計劃於 2024 年秋季提供更廣泛的服務。

  • GPT-4o 的語音功能包括情緒語調和較低的延遲。

  • OpenAI 實施了嚴格的控制措施來防止濫用,包括阻止未經授權的語音模仿。

 

詳情:

OpenAI 開始為 ChatGPT 推出類似 Her 的語音模式。與先前的版本不同,它將所有音訊處理任務整合到一個模型中,從而提高了反應時間和情緒敏感度。由於潛在的道德問題,特別是在假冒和版權問題方面,此次發布採取了謹慎的態度。 OpenAI 與 45 種語言的 100 多個外部紅隊一起測試了 GPT-4o 的語音功能。為了保護使用者隱私,該模型僅以四種預設聲音說話。OpenAI還實施了系統來防止輸出偏離這些聲音。

 為什麼要知道:

期待已久的高階語音模式終於面世,我們很可能會看到許多公司紛紛效仿,發布自己的語音模式為人們提供AI 助理,像亞馬遜和蘋果都宣布計劃更新語音技術。

source:Google

GPT研究所:Meta 引入了一種名為 Segment Anything Model 2 或 SAM 2 的新AI模型,據稱該模型可以辨別哪些像素屬於影片中的某個物件。

 重點整理

  • SAM 2 整合了影像分割,在準確性和即時性方面表現出色。

  • 在 Apache 2.0 下發布,促進各領域的創新表現。

  • 新的 SA-V 資料集包含 51,000 個影片。

詳情:

 使用 SAM 2,影片編輯器可以比目前編輯軟體的有限功能更輕鬆地隔離和操作場景中的對象,並且遠遠超出手動調整每個影格的範圍。 Meta 預計 SAM 2 也會徹底改變互動式影片。借助AI模型,使用者可以在即時視訊或虛擬空間中選擇和操作物件。

Meta 認為 SAM 2 還可以在電腦視覺系統的開發和訓練中發揮至關重要的作用,特別是在自動駕駛汽車中。準確且有效率的物件追蹤對於這些系統安全地解釋和導航其環境至關重要。 SAM 2 的功能可以加快視覺資料的註釋過程,為這些AI 系統提供高品質的訓練資料。

 為什麼它很重要:

研究人員將 SAM 2 視為機器視覺領域的重要進步,可以推動進一步的研究和應用,例如可以更可靠地移動並與現實世界互動的機器人,或在生成 AI 視訊模型中實現影片效果。 Meta 在 Apache 2.0 許可證下以開源方式發布 SAM 2 模型、程式碼和權重。

 

GPT研究所 : Midjourney V6.1 現已推出升級,包括更好的影像品質、更快的處理速度和新的個人化功能。

重點整理

  • 提高複雜主題影像的連貫性。

  • 增強的影像品質微小的特徵。

  • 新的升級選項可提供更好的紋理和解析度。



詳情

  V6.1 引入了更連貫和詳細的圖像,減少了像素偽影並增強了紋理。該模型擅長渲染眼睛和手等微小特徵;新的升級器提高了影像品質。處理速度提高 25%。改進的文字準確性和新的個人化模型增加了細微差別。然而,修復/修復仍然與V6.0相同。

 為什麼要知道

Midjourney歷時7個月才發布V6.1,這是繼V6發布後的新版本。總體而言,這是 Midjourney 的顯著改進,為基礎模型陷入困境的領域提供了重大的改變。這也是對 V7 即將推出的內容的一個有希望的跡象。

🎯一分鐘快速看

🎨Shutterstock: 新的 Generative 3D 允許使用者建立 3D 物件和 360 度背景。

🤝Canva:  Canva 收購了 Leonardo AI 圖像新創公司。


熱門AI工具

🚀AIPromptLab - 中文圈#1指令製造所,每週更新(連結)

💹Profit LeapTaped- 商業智慧和策略洞察的工具。(連結)

🚀 Taped- AI 支援的工作流程管理 (連結)

📹Loom -錄製更好、更流暢的影片 (連結)

💡 Inline Help- 直接在網站或應用程式中提供上下文支援和知識的工具(連結)


與6000+頂尖人士 分享你的產品/服務

透過與我們合作獲得新客戶並增加收入

與GPT Savy 電子報合作,涵蓋超過6000+ 企業家、創辦人、軟體工程師、投資者等精準客群。

如果您有興趣,請發送電子郵件至[email protected],主題為「GPT Savvy 商業合作」。



謝謝你的閱讀!👏🏻

see you soon !

S