OpenAIChatGPT推首個深度研究聯結器,可AI洞察GitHub程式碼庫;騰訊混元影片生成工具全新開源丨AIGC日報

1.【騰訊混元影片生成工具全新開源】騰訊混元宣佈,5月9日正式推出並開源全新的多模態定製化影片生成工具Hunyuan Custom。該模型基於混元影片生成大模型(Hunyuan Video)打造,主體一致性效果超過現有的開源方案。Hunyuan Custom融合了文字、影像、音訊、影片等多模態輸入生影片的能力,是一款具備高度控制力和生成質量的智慧影片創作工具。(騰訊網)
2.【英偉達開源OCR程式碼推理AI模型:LiveCodeBench基準超OpenAI o3-Mini和o1(low)】科技媒體marktechpost釋出博文,報道稱英偉達開源其Open Code Reasoning(OCR)模型套裝,含32B、14B和7B三種引數規模,均採用Apache 2.0許可證釋出,模型權重和配置已在Hugging Face平臺開放下載。OCR模型套裝提供三種引數規模,分別為OpenCodeReasoning-Nemotron-32B、14B和7B,均使用Nemotron架構(一種為多語言、多工學習最佳化的 transformer 框架)訓練。
32B模型面向高效能推理和研究場景,提供頂尖效果;14B模型在降低計算需求的同時保持強大推理能力;7B模型則適合資源受限的環境,仍能在基準測試中展現競爭力。此外,32B模型還推出了指令微調版本,支援與開放推理生態系統無縫相容,適配llama.cpp、vLLM、Hugging Face Transformers和TGI等主流框架,方便開發者快速整合。(IT之家)
3.【AWS神秘AI程式設計工具曝光!支援多模態互動,生成程式碼“近乎即時”】據外媒Business Insider獨家報道,亞馬遜雲科技(AWS)正在秘密開發一款代號為“Kiro”的AI程式設計工具。該工具透過多模態介面與AI Agent協同,旨在實現“近乎即時”的生成程式碼,重構軟體開發流程。
Kiro的核心亮點在於多模態互動能力:其內建的AI Agent可即時呼叫知識庫、第三方外掛及主題工具,結合使用者業務場景與技術框架生成程式碼;覆蓋從技術設計文件自動生成、即時程式碼編寫到漏洞檢測的全流程,並支援Stripe支付介面整合、雲服務配置等“一鍵式”開發功能;Kiro還能自動生成技術設計文件、標記潛在問題,並透過整合第三方AI Agent提升適配性。若成功推出,Kiro或將顛覆傳統程式設計模式,直面微軟Copilot、谷歌等巨頭的競爭,並進一步加劇AI程式設計工具市場的競爭。(搜狐)
4.【OpenAI ChatGPT推首個深度研究聯結器,可AI洞察GitHub程式碼庫】報道稱OpenAI推出了ChatGPT的首個“深度研究聯結器”(deep research connector),實現與GitHub的深度整合。開發者現在可以直接將自己的GitHub程式碼庫連線到ChatGPT,AI將深入分析程式碼結構、實現模式以及相關文件,快速生成詳細的研究報告或技術總結。(搜狐)
更多AIGC資訊……

掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

此外,如果您還想查公司、找專案、看行業,深入瞭解人形機器人、商業航天、AGI等熱門賽道,歡迎加入睿獸分析會員,解鎖相關行業圖譜和報告等。(活動期間加入會員可免費獲贈一份產業日報)👇👇

相關文章