⚡️ Nvidia 揭示了一個新開源模型

還有更多:中國新創公司的機器人

歡迎, 熱愛AI的你

輝達已經掌控了AI慧晶片產業——現在它也正在推動開源大型語言模型領域向前發展。該晶片製造商最新的「Nemotron」模型系列開啟了訓練資料能力的新世界,為更強大的AI 系統鋪平了道路。讓我們一起深入了解吧!


 今天的觀察重點:

  • Nvidia 的新開源 AI 模型

  • 中國新創公司創造現實機器人

  • Tiny LLM 在數學上與 GPT-4 相當


    閱讀時間:4分鐘

🗞️最新發展

Image source: Nvidia

 GPT研究所Nvidia 剛剛推出了 Nemotron-4 340B,這是一系列開源語言模型,旨在產生高品質的合成訓練資料並建立跨行業的強大 AI 應用程式。

詳情:

  這三個模型(基礎、指導、獎勵)形成了一個“管道”,用於創建合成數據來培訓新的、強大的大型語言模型。Instruct 創建高品質的合成訓練資料(並接受了 98% 的合成資料的訓練),而 Reward 則過濾資料以獲得最高品質的範例。Nemotron-4 車型在各種基準測試中均符合或超過 Llama-3、Mixtral 和 Qwen-2 等開源競爭對手。NVIDIA 也發布了 Mamba-2 Hybrid,這是一種選擇性狀態空間模型 (SSM),其精度超越了類似的基於 Transformer 的 LLM。



為什麼要知道:

NVIDIA才剛提供了一個免費的開源模型系列,它不僅可以與該領域一些頂級競爭對手的能力相匹配,而且還擅長製作繼續提升大型語言模型所需的合成數據

GPT研究所一家名為 Ex-Robots 的中國新創公司正在開發超現實的人形機器人,可以密切模仿人類的面部表情和情緒。


  詳情:

Ex-Robots 栩栩如生的人形機器人可以微笑、皺眉,並使用嵌入矽膠臉部的小型馬達來複製微妙的臉部動作。該新創公司使用多模式AI 和演算法,使機器人能夠根據感知環境來識別和表達情感。目前製造一個人形機器人需要 2-4 週的時間,每台成本高達 27.5 萬美元。該公司表示,近期用例包括博物館展覽,最終在醫療保健、治療和兒童服務方面發揮作用。


為什麼要知道::

超現實機器人的進步與AI的力量相結合,即將創造一些奇怪的新領域。人類會被這種看起來像人類的仿生機器人嚇到嗎,相較於像特斯拉的Optimus這樣的偏機械類型的選擇? 目前還不清楚世界是否準備好了……但我們很快就會知道!

Image source: Midjourney

 GPT研究所: 上海AI 實驗室的研究人員剛剛開發了一種名為 MCT Self-Refine 的新演算法,該演算法允許相對較小的 8B 參數模型在複雜數學上達到 GPT-4 級別的性能。

詳情:

MCT Self-Refine 將 8B LLaMa 模型與蒙特卡羅樹搜尋結合,蒙特卡羅樹搜尋是 Google DeepMind 著名的用於掌握圍棋遊戲的AI技術。該演算法建立搜尋樹,透過一系列過程和自我評估來完善答案。在 GSM-Hard 數學應用題基準測試中,引入蒙特卡羅樹搜尋使 8B 模型的準確率從 25.5% 提高到 45.5%。該模型在 GSM8K 基準測試中也達到了 96.7%,明顯優於 GPT-4、Claude 和 Gemini 等更大的模型。 

為什麼要知道

研究表明,無需大規模即可提高數學能力,而使用減少 200 倍參數訓練的模型實現 GPT-4 級別的性能是一項令人印象深刻的壯舉。如果該方法被證明是實現高級推理更有效的途徑,我們可能正處於新一波模型加速的風口浪尖。

🎯一分鐘快速看
  

🤖OpenAI : OpenAI 執行長表示公司可以成為營利性的公司。

🍔McDonalds麥當勞將暫時停止測試AI接受得來速訂單。

🍎Apple提姆庫克承認蘋果可能永遠無法讓AI停止說謊。


熱門AI工具

✍️Brave Leo AI - 最好的AI 寫作平台連結

💼Empress.eco - 用於業務成長和削減成本的自動化服務連結

 🔎Leap AI Lead Research - 輸入Email以查找有關該人的所有訊息(連結)

🕸️ WebscrapeAI- 使用 AI 無需程式碼即可抓取任何網站(連結)

✍️TrollyAI - 創建專業 SEO 文章速度提高 2 倍(連結)

謝謝你的閱讀!👏🏻

see you soon !

S