OpenAI 推出“智能体电商协议 ACP”及即时结账功能-宝玉 OpenAI 正式宣布推出智能体电商协议(ACP)和即时结账(Instant Checkout)功能,将其无缝集成到 ChatGPT 中。这一创新使得用户可以直接通过聊天界面搜索商品并完成购买,从而实现一站式电商体验。这项功能旨在极大简化用户的购物流程,预示着AI在电商领域的深度整合和自动化购物agent的发展方向。 Claude Code 助力项目内存优化-orange.ai 开发者 orange.ai 分享了利用 Claude Code 重新设计项目内存的成功经验。通过AI的协助,项目内存中多达 70% 的冗余内容被直接删除,显著提升了代码的简洁性和效率。该项目 …
阅读更多智谱AI发布GLM-4.6,国产最强Coding模型比肩Claude Sonnet 4-orange.ai 智谱AI于国庆前夕发布了其最新一代通用AI模型 GLM-4.6,被誉为目前国内最强的Coding模型。该模型在七个权威基准测试中,整体性能表现与 Claude Sonnet 4 基本持平,并超越了前一天发布的 DeepSeek-V3.2-Exp。GLM-4.6的代码能力提升了 27%,上下文窗口扩展至 200K,推理和写作能力也有所增强,并全面适配国产芯片。尤其在前端美学方面,GLM-4.6表现出色,甚至在绘制宝可梦SVG方面超越了Claude 4。此外,Anthropic也发布了地表最强的编码模型 Claude 4.5。作 …
阅读更多Anthropic的战略方向与Sonnet 4.5的上下文管理能力-宝玉 有观点认为,Anthropic在编程领域虽然取得过成绩,但可能为OpenAI和Google趟了路,目前在编程和Agent方面被追赶甚至超越,其他领域缺乏突出表现,并预测Gemini 3.0发布后可能进一步超越。与此同时,Anthropic新推出的Sonnet 4.5模型在上下文压缩方面展现出显著进步,其**“状态管理”能力**(即模型能有效“记笔记”以保存关键任务信息)被用户称赞,认为这有助于模型在长对话中保持性能,甚至超越了GPT-5在这一方面的表现。 Shopify将整合GPT实现商家商品搜索-歸藏(guizang.ai) Shopify宣布将整合GPT …
阅读更多在过去四小时内,AI领域迎来多项重要进展,OpenAI 推出了直接集成购物功能的 ChatGPT Merchants,将电商带入对话界面。同时,Anthropic 发布了其新一代模型 Claude Sonnet 4.5,并推出了实验性的实时界面生成功能 “Imagine with Claude”,进一步提升了其在编程和交互方面的能力。此外,Replit 平台的 Agent 3 也创下了新的运行记录。 OpenAI 推出 ChatGPT Merchants 功能,将购物集成至对话界面 - 小互 OpenAI 正式推出 ChatGPT Merchants 功能,将购物体验直接整合进 ChatGPT 的对话窗口,实现“边问边买”。用户现在 …
阅读更多今日全球AI领域风起云涌,竞争焦点已从单纯的模型参数竞赛转向生态系统与应用场景的深度整合。Anthropic发布号称“最强编程模型”的Claude Sonnet 4.5,直指开发者与企业级自动化;而OpenAI则双线出击,不仅计划推出全AI生成内容的“AI版TikTok”,更将ChatGPT打造为电商支付一体机,意图构建从内容到交易的闭环。微软紧随其后,将Agent理念深度植入Office套件。国内方面,DeepSeek新模型发布即获硬件生态支持,华为盘古模型持续精进,展现出快速追赶与生态协同的决心。 Anthropic 发布 Claude Sonnet 4.5,号称“全球最佳编程AI模型” Anthropic公司发布了其最新AI模 …
阅读更多English Version News Discovery Time! Today we're exploring… Bang! Pop! Wow! Our first amazing story comes from the world of nature! Scientists have discovered something incredible about penguins and leopard seals across Antarctica and Africa! Yes, you heard that right - two different continents! Researchers have …
阅读更多Claude Code 2.0 与 Sonnet 4.5 模型重大升级-orange.ai Anthropic的Claude Code推出了2.0版本,并集成了更强大的Claude Sonnet 4.5模型,旨在成为领先的编程AI工具。此次更新引入了VS Code扩展(Beta版),允许开发者直接在IDE中与Claude Code交互,并支持实时代码修改显示和内联差异对比。检查点系统(Checkpointing)是另一核心功能,能在每次修改前自动保存代码状态,用户可轻松回退到早期版本。此外,终端界面得到升级,增加了可搜索的提示历史,并增强了自主开发能力,包括子代理(Subagents)、钩子(Hooks)和后台任务,使得AI能够并 …
阅读更多Anthropic发布Claude Sonnet 4.5,编程能力和智能体特性显著提升-宝玉 Anthropic最新推出的Claude Sonnet 4.5模型在编程能力和智能体任务处理方面实现了重大突破。第三方评测显示,Sonnet 4.5速度比Opus 4.1快至少50%,且具备更强的可控性、超长上下文处理能力以及更高的稳定性。它在SWE-bench基准测试中刷新了业界最高水平,并引入了全新的记忆工具(Beta版)API。此外,Sonnet 4.5在自主运行时间上可超过30小时,且在OSWorld计算机使用基准测试中表现出色,沟通风格也更为精炼自然。 Reachy Mini机器人集成OpenAI GPT-4o,实现多模态交互新 …
阅读更多以下是过去4小时全球AI领域的重要动态: 新基准评估LLM在44个职业中的表现 - merve 一项新的基准测试对大型语言模型(LLM)在9个行业部门的44个不同职业中的能力进行了评估,结果显示LLM距离实现全面胜任还有很长的路要走。这项全面的评估旨在衡量AI在现实世界工作场景中的实用性,揭示了当前模型在复杂任务和专业知识方面仍存在的显著不足。 特斯拉擎天柱机器人展望:2040年每家一台 - Peter H. Diamandis, MD Peter Diamandis预测,到2040年,每个家庭都将拥有一个机器人,特斯拉的目标是每年生产一百万台擎天柱(Optimus)机器人。他预计每台擎天柱的成本约为3万美元,这意味着用户每天只需支 …
阅读更多DeepSeek发布实验性模型V3.2-Exp,大幅提升长文本推理效率并降低成本-小互 DeepSeek发布了其最新实验性语言模型 DeepSeek-V3.2-Exp,该模型在推理效率和计算成本方面实现了显著提升。V3.2-Exp在整体性能上与V3.1-Terminus持平,但长文本推理效率提高了约一倍,使得其 API价格大幅下降50%。这一突破主要得益于其引入的 稀疏注意力(DSA)机制,该机制能够智能地聚焦文本中的关键部分,从而在不影响输出质量的前提下,显著加快处理速度并减少显存占用,特别适合处理 超过32K tokens 的长文档和对话场景。 Merve Noyan公开分享多模态AI幻灯片,涵盖趋势、模型与工具-merve …
阅读更多