- S的 AI X GPT 研究所
- Posts
- ⚡️ Nvidia 揭示了一個新開源模型
⚡️ Nvidia 揭示了一個新開源模型
還有更多:中國新創公司的機器人

歡迎, 熱愛AI的你
輝達已經掌控了AI慧晶片產業——現在它也正在推動開源大型語言模型領域向前發展。該晶片製造商最新的「Nemotron」模型系列開啟了訓練資料能力的新世界,為更強大的AI 系統鋪平了道路。讓我們一起深入了解吧!
今天的觀察重點:
Nvidia 的新開源 AI 模型
中國新創公司創造現實機器人
Tiny LLM 在數學上與 GPT-4 相當
閱讀時間:4分鐘
🗞️最新發展
NVIDIA
⚡️Nvidia 的新開源人工智慧模型

Image source: Nvidia
GPT研究所:Nvidia 剛剛推出了 Nemotron-4 340B,這是一系列開源語言模型,旨在產生高品質的合成訓練資料並建立跨行業的強大 AI 應用程式。
詳情:
這三個模型(基礎、指導、獎勵)形成了一個“管道”,用於創建合成數據來培訓新的、強大的大型語言模型。Instruct 創建高品質的合成訓練資料(並接受了 98% 的合成資料的訓練),而 Reward 則過濾資料以獲得最高品質的範例。Nemotron-4 車型在各種基準測試中均符合或超過 Llama-3、Mixtral 和 Qwen-2 等開源競爭對手。NVIDIA 也發布了 Mamba-2 Hybrid,這是一種選擇性狀態空間模型 (SSM),其精度超越了類似的基於 Transformer 的 LLM。
為什麼要知道:
NVIDIA才剛提供了一個免費的開源模型系列,它不僅可以與該領域一些頂級競爭對手的能力相匹配,而且還擅長製作繼續提升大型語言模型所需的合成數據。
EX-ROBOTS
🤖中國新創公司創造了逼真的機器人

GPT研究所:一家名為 Ex-Robots 的中國新創公司正在開發超現實的人形機器人,可以密切模仿人類的面部表情和情緒。
詳情:
Ex-Robots 栩栩如生的人形機器人可以微笑、皺眉,並使用嵌入矽膠臉部的小型馬達來複製微妙的臉部動作。該新創公司使用多模式AI 和演算法,使機器人能夠根據感知環境來識別和表達情感。目前製造一個人形機器人需要 2-4 週的時間,每台成本高達 27.5 萬美元。該公司表示,近期用例包括博物館展覽,最終在醫療保健、治療和兒童服務方面發揮作用。
為什麼要知道::
超現實機器人的進步與AI的力量相結合,即將創造一些奇怪的新領域。人類會被這種看起來像人類的仿生機器人嚇到嗎,相較於像特斯拉的Optimus這樣的偏機械類型的選擇? 目前還不清楚世界是否準備好了……但我們很快就會知道!
AI RESEARCH
🏅 Tiny LLM 在數學上與 GPT-4 相當

Image source: Midjourney
GPT研究所: 上海AI 實驗室的研究人員剛剛開發了一種名為 MCT Self-Refine 的新演算法,該演算法允許相對較小的 8B 參數模型在複雜數學上達到 GPT-4 級別的性能。
詳情:
MCT Self-Refine 將 8B LLaMa 模型與蒙特卡羅樹搜尋結合,蒙特卡羅樹搜尋是 Google DeepMind 著名的用於掌握圍棋遊戲的AI技術。該演算法建立搜尋樹,透過一系列過程和自我評估來完善答案。在 GSM-Hard 數學應用題基準測試中,引入蒙特卡羅樹搜尋使 8B 模型的準確率從 25.5% 提高到 45.5%。該模型在 GSM8K 基準測試中也達到了 96.7%,明顯優於 GPT-4、Claude 和 Gemini 等更大的模型。
為什麼要知道:
研究表明,無需大規模即可提高數學能力,而使用減少 200 倍參數訓練的模型實現 GPT-4 級別的性能是一項令人印象深刻的壯舉。如果該方法被證明是實現高級推理更有效的途徑,我們可能正處於新一波模型加速的風口浪尖。
🎯一分鐘快速看
🍔McDonalds:麥當勞將暫時停止測試AI接受得來速訂單。
🍎Apple:提姆庫克承認蘋果可能永遠無法讓AI停止說謊。
熱門AI工具
🔎Leap AI Lead Research - 輸入Email以查找有關該人的所有訊息(連結)
🕸️ WebscrapeAI- 使用 AI 無需程式碼即可抓取任何網站(連結)
✍️TrollyAI - 創建專業 SEO 文章速度提高 2 倍(連結)
謝謝你的閱讀!👏🏻
see you soon !
S