以下是过去一段时间全球AI领域的动态摘要: Andrej Karpathy 分享了他 2025 年的总结 - 歸藏(guizang.ai) Andrej Karpathy对2025年的AI发展进行了总结,主要涵盖六个方面:RLVR(可验证环境中的强化学习)成为继预训练和微调之后的新训练阶段,推动LLM习得推理策略并吞噬预训练算力。LLM展现出"锯齿状智能",即在可验证领域能力突出但在通用性上参差不齐,导致基准测试失效。Cursor揭示了LLM应用新形态,通过编排多个LLM调用进行上下文工程。Claude Code作为首个成功本地运行的LLM Agent,预示着AI从网站向“生活在电脑上”的精灵转变。Vibe coding将使编程大众 …
阅读更多Alibaba’s Qwen-Image-Layered is LIVE — native image decomposition, fully open-sourced! - merve 阿里巴巴的Qwen团队发布了完全开源的Qwen-Image-Layered模型,该模型提供Photoshop级别的原生图片分层功能。这项强大的技术能够将图片分解为多个层,预计将催生出多种创新应用场景,为图像处理和内容创作带来变革性的潜力。 RT @matanSF: GPT5.2 + Droid is phenomenal for NextJS - Ben Tossell 有报道指出,GPT 5.2与Droid的结合在NextJS开发方面表现“非 …
阅读更多AI智能体与上下文压缩新进展 - Ben Tossell FactoryAI的研究表明,解决长时间运行的AI智能体的关键在于上下文压缩技术。这项研究评估了多种压缩和紧缩策略,旨在优化AI智能体处理和保留长期对话信息的能力。有效的上下文压缩对于构建更强大、更可靠的AI助手至关重要,它能帮助智能体在复杂的任务中维持连贯性和效率,避免信息过载或遗失关键上下文。 阿里巴巴发布Qwen-Image-Layered图像分解模型 - merve 阿里巴巴Qwen团队正式发布了Qwen-Image-Layered,一款完全开源的原生图像分解模型。该模型能够实现Photoshop级别的图像分层功能,为图片处理带来了革命性的新可能。此项技术具有广泛的 …
阅读更多Allen AI 发布视频推理智能体系统-merve Allen AI 近期发布了一款用于视频推理的智能体系统,同时还提供了模型、针对不同训练阶段的数据集以及基准测试集。这一发布将推动视频内容理解和智能决策领域的发展,为研究人员和开发者提供了强大的新工具和资源。 Andrew Ng 剖析LLMs:通用性强但非通向AGI的捷径-Andrew Ng 吴恩达指出,尽管大型语言模型 (LLMs) 表现惊人且具有通用性,但它们并非在短短几年内就能通向通用人工智能 (AGI) 的路径。LLMs 知识的提升是一个碎片化过程,需要通过耗时的数据获取、清洗、去重、复述等数据工程工作,或通过构建大量强化学习模拟环境来反复训练模型。人类在面对较少数据和 …
阅读更多OpenAI GPT-5.2 Codex发布,Agentic Coding能力显著提升-Sam Altman Sam Altman宣布推出GPT-5.2 Codex,该模型专为Agentic Coding和终端使用进行训练,并在OpenAI内部取得了巨大成功。Django框架联合创始人Simon Willison的案例进一步证明了其能力,他仅用8条提示词和GPT-5.2 Codex将一个纯Python库转换成约9000行JavaScript代码,并成功通过9200多个测试用例。这突出显示了AI代理在跨语言“翻译”、自动化测试以及在既定架构下“填空”的优势。Amjad Masad补充指出,编码代理会犯错,因此必须在支持操作可逆的基础 …
阅读更多OpenAI推出GPT-5.2-Codex,Coding Agent能力凸显-Sam Altman OpenAI首席执行官Sam Altman宣布发布GPT-5.2-Codex,该模型专为Agentic编码和终端使用进行训练。Django框架联合创始人Simon Willison利用Codex CLI + GPT-5.2,成功将一个9000行Python库移植到JavaScript,仅使用了约8条提示词。Willison分析称,Coding Agent的“舒适区”在于语言翻译、拥有完整测试集、预设架构,并通过专家操作形成“智能体闭环”,从而高效完成复杂任务。 Google发布FunctionGemma与T5Gemma …
阅读更多Sam Altman宣布GPT-5.2-Codex发布,并探讨AI在网络安全中的作用 OpenAI首席执行官Sam Altman宣布推出 GPT-5.2-Codex,该模型专门针对智能体编码和终端使用进行了训练,并已在OpenAI内部取得巨大成功。Altman还提到,上周有安全研究人员利用其前代模型发现并披露了React的一个漏洞,但他坚信随着模型不断改进,AI将对网络安全产生净积极影响。OpenAI正开始探索针对防御性网络安全工作的信任访问计划,并正在为Codex团队招聘,以加速其发展。 Simon Willison利用GPT-5.2将Python库转换为JavaScript Django框架联合创始人Simon …
阅读更多OpenAI发布GPT-5.2-Codex,编程代理能力显著提升 OpenAI首席执行官Sam Altman宣布,专门针对代理编程和终端使用训练的GPT-5.2-Codex正式发布,并已在OpenAI内部取得巨大成功。Django框架联合创始人Simon Willison的一个案例展示了其强大能力:他仅用8条提示词,就将一个Python库JustHTML成功移植为纯JavaScript库,通过9200多个html5lib-tests用例,最终生成约9000行代码,历经43次提交。这一成功案例突显了AI代理在语言翻译、拥有完整测试集、架构已设计好以及由高手操作等“舒适区”的巨大潜力。Simon将此过程称为“设计智能体闭环”,通 …
阅读更多Google发布FunctionGemma、T5Gemma 2及Gemma 4系列模型-osanseviero Google发布了多个新的Gemma系列AI模型,其中包括FunctionGemma,一个参数量仅为270M的模型,专为函数调用设计,可在手机、浏览器等多种设备上运行。同时,新一代编码器-解码器模型T5Gemma 2也在Gemma 3的基础上推出,并且有迹象表明Google可能正准备发布Gemma 4,包含1B和4B等参数变体,预示着其Gemma模型家族的进一步扩展。 OpenAI发布GPT-5.2-Codex并加强网络安全关注-Sam Altman Sam Altman宣布OpenAI正式推出GPT-5.2-Codex …
阅读更多以下是过去4小时全球AI领域的精选动态: FunctionGemma模型发布,主打函数调用功能 osanseviero和merve等用户转发宣布了FunctionGemma模型的推出。这款270M参数的模型专门为函数调用设计,具备在手机、浏览器及其他设备上运行的能力。它旨在高效执行特定功能,有望在边缘计算和轻量级AI应用中发挥关键作用,为开发者提供更灵活的AI集成方案。 Google Gemma 4即将发布?市场传闻不断 据kimmonismus和testingcatalog等账号转发的消息,有强烈迹象表明Google可能在今天发布其Gemma 4模型。这些猜测源于Google的Gemma模型家族集合最近进行了更新,引发了社区对新一 …
阅读更多