☰

Groq 獲 6.4 億美元融資；傳 ResNet 作者張祥雨加盟階躍星辰；OpenAI 研發 ChatGPT 文本水印丨AI情報局

今日融資快報

人工智能芯片初創公司Groq獲6.4億美元融資，挑戰英偉達

Groq是一家開發芯片以比傳統處理器更快地運行生成式 AI 模型的初創公司，該公司週一表示，已在由Blackrock領投的新一輪融資中籌集了 6.4 億美元。Neuberger Berman、Type One Ventures、思科、KDDI和三星 Catalyst Fund 也參與其中。

這筆資金使 Groq 的總融資額超過 10 億美元，公司估值達到 28 億美元，這對 Groq 來說是一次重大勝利，據報道，該公司最初希望以略低的估值（25 億美元）籌集3 億美元。

Meta 首席人工智能科學家Yann LeCun將擔任 Groq 的技術顧問，英特爾代工業務前負責人、惠普前首席信息官 Stuart Pann 將加入這家初創公司擔任首席運營官。

優地機器人變更爲股份公司並增資至3.5億

優地機器人（無錫）有限公司發生工商變更，市場主體類型由有限責任公司（港澳臺投資、非獨資）變更爲股份有限公司（港澳臺投資、未上市），名稱變更爲優地機器人（無錫）股份有限公司，同時註冊資本由約1707.9萬人民幣增至3.5億人民幣。官網顯示，優地科技專注於配送機器人核心技術的應用性研發與商業化落地。

機器人初創公司 DELIVERS.AI 新一輪融資後估值達 3,600 萬美元

DELIVERS.AI 的自主移動平臺使用先進的、人工智能驅動的低排放路面交付機器人和汽車，旨在使最後一英里物流變得經濟實惠且可持續。

DELIVERS.AI 估值達到 3600 萬美元，並籌集了新一輪融資，具體金額尚未披露。這家總部位於英國沃裡克的公司獲得了來自日本郵政資本、土耳其發展基金、保加利亞的推動資本和伊斯坦布爾技術大學的資金。之前的投資者包括 Driventure、Arz Portföy、StartupFON、Plug and Play Ventures、Inveo Ventures、StartersHUB 和 Kalyon Ventures。

AI驅動的飾品公司Stepin獲千萬元天使輪融資

Stepin是一家飾品跨境出海品牌，專注AI飾品跨境電商，藉助AI技術與中國供應鏈優勢，實現“小單快返”的快速上新、高週轉模式。Stepin完成千萬元天使輪融資，由新嶽資本與九九資本領投，其他產業機構與天使投資人蔘與跟投，浪潮資本擔任獨家財務顧問。目前，AI在Stepin內部的應用主要是創意泛化、生成相對初級的3D模型供設計師微調。（36氪）

（歡迎添加微信AIyanxishe2，瞭解更多AIGC、融資情況，與志同道合的朋友一同暢聊時新AI產品）

今日大廠風聞

傳 ResNet 作者張祥雨加盟階躍星辰

量子位消息，90 後 AI 大牛張祥雨加盟階躍星辰，他是 ResNet 的四位作者之一，孫劍的首位深度學習博士生，並且是未來科學大獎的得主。張祥雨在西安交通大學獲得了軟件工程學士學位，並在微軟亞洲研究院與孫劍、何愷明、任少卿合作完成了 ResNet，該論文在 2016 年獲得了 CVPR 最佳論文獎，並在 2023 年獲得了未來科學大獎的 “數學與計算機科學獎”。

除了張祥雨，階躍星辰還招募了其他兩位萬引大牛，騰訊俞剛和 MSRA 段楠。俞剛是山東大學本科生，上海交通大學碩士，南洋理工大學博士，曾在微軟研究院實習，並在曠視工作期間完成了多項研究成果。段楠是 MSRA 資深首席研究員，主要從事自然語言處理等研究，並在 MSRA 工作了 17 年零 9 個月，其研究成果被應用於多款微軟 AI 產品中。

OpenAI 承認正研發 ChatGPT 文本水印，但面臨挑戰

OpenAI 已經開發出一款能夠高精度識別 ChatGPT 生成文本的工具，但遲遲未發佈。對此 OpenAI 進行了迴應，承認正在研究文本水印技術，但表示這項技術仍存在諸多挑戰。

OpenAI設想通過微妙調整ChatGPT生成文本中的詞彙選擇，來在字裡行間編織一張不可見的“數字指紋”——即文本水印。這一設計精妙之處在於，未來能夠藉助特定工具輕鬆識別與驗證文本的原始出處，爲版權保護與內容溯源開闢新徑。而文本水印僅是OpenAI多元化解決方案矩陣中的一環。他們還並行研究分類器技術和元數據策略，旨在構建一個全方位、多層次的文本身份認證體系，以確保信息的來源清晰可溯。

Figure預告人形機器人二代新品，人味兒更濃、硬件更強

Figure公佈了Figure 02預告片，並表示將在北京時間8月7日正式發佈該產品。相對於Figure 01搭載Open AI GPT4的視頻演示，此次展示介紹的重心在於硬件，預計硬件能力有大幅提升。創始人CEOBrett Adcock自信發言：Figure 02是地球上最好的人形機器人。

Google Gemini API 大降價比 GPT-4o mini 價格便宜一半

Gemini 1.5 Flash 模型的輸入成本直接減半，下降了約 85%，輸出成本緊隨其後，大幅削減了約 80%。這意味着，現在使用 Gemini API 的成本已經低於其主要競爭對手 GPT-4o mini 近 50%。Gemini Flash 的新定價每百萬 token 的輸入成本僅需 0.075 美元，輸出成本也只有 0.3 美元。Gemini 1.5 Flash 和 Gemini 1.5 Pro 現在支持超過 100 種語言，Google 還引入了上下文緩存和批處理 API 等創新技術。

百川智能與中國人民大學成立"大模型聯合實驗室"

中國人民大學與百川智能共同成立了"大模型聯合實驗室"，旨在推動大模型技術的創新和發展。聯合實驗室的成立標誌着雙方將在大模型預訓練、對齊、檢索增強、智能體、多模態等前沿技術領域展開深入合作。中國人民大學將利用其在大模型研究上的人才和技術優勢，與百川智能在工程和產品研發方面的力量相結合，共同推進相關技術的研究和應用。

阿里推出Tora，「軌跡可控版Sora」讓視頻生成更符合物理規律

Tora是第一個面向軌跡的 DiT 架構，它將文本、視覺和軌跡條件同時集成在一起以生成視頻。Tora 的設計與 DiT 的可擴展性無縫契合，允許精確控制具有不同持續時間、寬高比和分辨率的視頻內容。大量實驗證明，Tora 在實現高運動保真度方面表現出色，同時還能細緻模擬物理世界的運動。

Meta據稱與好萊塢影星洽談AI語音項目，將提供數百萬美元以獲取授權

據媒體援引消息人士報道，Meta和一些演員代表之間的談判經歷了多次中斷和重啓，因爲雙方無法就演員聲音的使用條款達成一致。Meta正加速推進談判，以有足夠的時間開發AI工具，期望在9月的Connect大會上發佈。目前尚不清楚Meta將如何使用這些聲音，最有可能的是充當數字助理。例如，用戶可以與擁有奧卡菲娜聲音的聊天機器人聊天。

今日產品動態

Product Hunt 熱榜，Avatar Architect

Avatar Architect 是一款融合了人工智能和 Notion 的系統，旨在通過深入瞭解目標客戶羣體，幫助企業家、營銷人員和產品開發者提升營銷策略和銷售業績，同時提供一系列工具和指南來構建和管理客戶畫像。

Avatar Architect 的優勢在於其 AI 驅動的高效性、爲目標市場提供的深入洞察以及指導產品開發的詳細客戶信息。該系統適合獨立創業者、營銷人員和產品開發者，特別適合那些希望深入瞭解客戶並提升營銷策略的用戶。用戶可以根據自己的業務需求自定義系統的功能，並且應定期更新客戶數據以獲得最佳效果。

? https://gcproductivity.gumroad.com/l/avatararchitect/ProductHunt?ref=producthunt

開發者推薦

1.簡單提示輕鬆創建小程序代碼LlamaCoder

LlamaCoder 是一個基於 Llama3.1405B 模型的平臺，它通過強大的自動化能力，使得開發者只需提供簡單的指令，就能快速生成完整的 React 應用程序和組件。該平臺採用了現代化的技術棧，包括 Next.js 和 Tailwind 等流行技術，提供了一個既美觀又易用的界面。LlamaCoder 的功能設計考慮了全面，包括代碼沙箱、Helicone 集成和 Plausible 工具的使用，以提高開發效率和產品優化。入門門檻低，用戶只需克隆代碼庫並設置 API 密鑰，即可通過 npm 命令啓動項目。目前已開源。

? https://llamacoder.together.ai/

2.Supermemory 個人知識庫項目

該項目允許用戶將網絡信息如網頁、推特和筆記等內容保存起來，並利用其內置的人工智能功能進行高效的搜索和提問。以二維畫布的形式組織信息，幫助用戶更好地理解和關聯知識點。基於已保存數據提供 AI 輔助寫作功能。支持與 Telegram、Twitter 等平臺集成。

github?https://github.com/supermemoryai/supermemory網站?https://supermemory.ai/onboarding

特別關注

Jim Fan：機器人數據的放大是解決機器人技術發展中的關鍵問題

英偉達高級研究科學家、具身智能負責人兼 Embodied AI（GEAR 實驗室）負責人Jim Fan 發佈了 Project GR00T 的最新進展，提出了一種系統化的方法來放大機器人數據集，通過人類在真實機器人上的演示，結合模擬技術，將數據量擴大 1000 倍或更多，以解決機器人技術中的數據瓶頸問題。

利用 Apple Vision Pro 技術，實現人類操作員對人形機器人的第一人稱控制。Vision Pro 能夠實時解析人類手部姿勢並映射到機器人手上，使得操作者感覺自己沉浸在另一個身體中，儘管遠程操作較慢，但可以收集少量高質量的數據。

使用 RoboCasa 這一開源的生成模擬框架，通過改變環境的視覺外觀和佈局，將單一的真實演示數據擴展到多種多樣的環境中，從而產生大量多樣化的演示數據。這使得一個實體廚房的數據可以擴展到無限多的模擬廚房場景中。

應用 MimicGen 技術，根據原始的人類演示數據生成大量新的動作軌跡，並過濾掉失敗的嘗試，從而形成一個更大、更豐富的數據集。

通過這種方法，從一條人類軌跡開始，RoboCasa 可以產生 N 個不同視覺效果的數據，而 MimicGen 進一步增強到 NxM 個不同動作的數據。這種方法通過 GPU 加速的模擬，以計算能力爲代價，解決了昂貴的人類數據收集問題，打破了傳統的、以原子世界爲限的數據收集障礙。

?https://x.com/DrJimFan/status/1818302152982343983

敬請期待明日的最新動態！

雷峰網

Groq 獲 6.4 億美元融資；傳 ResNet 作者張祥雨加盟階躍星辰；OpenAI 研發 ChatGPT 文本水印丨AI情報局

相關資訊