以下是过去4小时全球AI领域的最新动态: Factory AI 推出免费代币及创新编码工作流-Ben Tossell AI编码工具Factory AI正在积极推广其平台,用户可获得4000万免费代币。同时,有用户分享了使用Factory AI进行复杂代码重构的工作流,强调通过“spec mode”实现高效实施。该平台还曾举办“Factory Founders:AI编码的未来”线上活动,展示其在AI辅助开发领域的进展和潜力,旨在提升开发者利用AI进行软件开发的能力。 vLLM 正式支持小红书 hi lab 的多语言 OCR 模型 dots.ocr-merve vLLM项目宣布其最新版本正式支持小红书 hi lab 开发的强大多语言光学 …
阅读更多AI Agent:从感知革命到自我监督-向阳乔木/宝玉 绿洲资本合伙人张津剑指出,注意力是人类最宝贵的资源,而AI时代的Agent正带来一场感知革命。AI Agent的频谱理论上无限,能够处理从伽马射线到红外线的各种数据,并用语言模型统一。这使得人类不再是将AI融入工作流,而是将自身融入AI的工作流。在此背景下,人类的核心价值在于提出需求和审美判断。此外,有观点指出,使用AI监督AI比传统脚本更具优势,因为它能探索更多可能性,且能根据任务执行结果动态调整Prompt,尽管会消耗更多Token。Sub Agent则主要用于上下文管理,不携带主线程上下文,实现更高效的任务分离。 AI音乐生成模型Suno v5音质显著提 …
阅读更多腾讯开源生图模型 3.0 亮相,具备强悍文字生成与世界知识理解能力-歸藏(guizang.ai) 腾讯最新开源的生图模型 3.0,参数高达 80B,在美学表现、文字生成与世界知识理解方面取得了显著提升。该模型能够生成包括中文在内的较长文字,支持复杂排版和艺术字体设计,甚至能图解中学几何题,媲美头部图像模型如Banana。虽然目前尚不支持图像编辑功能,但有消息称该能力有望在国庆后上线。其强大的世界知识和推理能力,结合微调潜力,预示着广泛的应用前景。 Google DeepMind Veo 3 达到视觉AI的“GPT-3”时刻-小互 Google DeepMind的研究揭示,Veo 3 在视觉AI领域可能迎来了“GPT-3”时刻。该模 …
阅读更多腾讯混元图像3.0模型免费开源,支持中英文精准渲染与长文本生成-向阳乔木 腾讯混元团队近日发布并免费开源了80B图像生成模型“混元图像3.0”,该模型支持中英文精准渲染和长文本生成,被认为是AI图像生成领域的“Deepseek”时刻。无论是插画、漫画、海报还是表情包,用户只需通过一段提示词即可生成专业级作品。模型具备强大的世界知识理解和推理能力,能够从诗句等抽象描述中准确生成图片。此模型不仅可免费商用,还允许个人和企业进行二次开发,极大地拓展了AI图像生成的应用场景,如电商广告、品牌Logo设计、图标生成、PPT配图及多样材质渲染等。该模型源代码已完全开放,体现了腾讯在AI领域的加速布局。 Deemos发布高精度3D生成模 …
阅读更多以下是过去4小时全球AI领域的一些重要动态和观点: 生成式AI在构建稳健世界模型方面的普遍失败-Gary Marcus AI研究者Gary Marcus再次强调了他对大型语言模型(LLMs)和世界模型(world models)的看法,并推荐读者阅读他的文章《生成式AI在构建稳健世界模型方面的严重且普遍的失败》。他指出,包括LeCun、Bengio和Richard Sutton在内的多位AI专家在这一议题上持有相似立场。这篇文章深入探讨了LLMs在理解和建立对世界深层认知模型方面的局限性,对当前生成式AI的发展方向提出了批评和质疑。 Claude Code Now:提升开发者AI工具启动效率的macOS解决方案-orange.ai …
阅读更多今日AI领域风起云涌。在底层技术层面,苹果正自研多模态大模型Manzano,直接对标GPT-4o,而奥特曼则大胆预言,五年内AI将实现人类无法企及的科学发现。资本市场同样瞩目,欧洲独角兽Mistral AI获ASML巨额战略投资,凸显AI在半导体产业链中的核心地位。商业模式上,国内出现首例AIRaaS并购案,标志着行业重心从“卖算力”向“卖结果”的关键转变,同时业界也开始警惕“智能体洗白”的市场泡沫。此外,从脑机接口首个国家标准的发布到工业机器人领域的合资,AI的产业化落地正在加速规范和深化。 刚刚,奥特曼预言:人类「只剩」最后5年! OpenAI CEO萨姆·奥特曼预测,到2030年,人工智能将在所有维度上超越人类,真正的转折点将 …
阅读更多English Version News Discovery Time! Today we want to explore… Bang! Pop! Wow! Have you ever seen polar bears taking over a building? Scientists have discovered something amazing! A group of polar bears has made an abandoned Soviet research station their home. This incredible event happened on Kolyuchin Island in …
阅读更多以下是过去4小时全球AI领域的重要动态: Amjad Masad 投入“Agent 4”开发,实现超长编码-Amjad Masad Replit的CEO Amjad Masad表示,他连续6小时不间断地编码,正在积极开发**“Agent 4”**。这标志着Replit在AI代理技术方面取得了显著进展,显示出其AI辅助编程工具和智能体开发的高度集中与效率。长时间的集中开发也暗示了该项目的重要性及其对未来编码工作流的潜在影响。 文本转视频AI能耗研究:长度翻倍,能耗翻两番-Gary Marcus 一项新的研究表明,文本转视频(text-to-video)生成器的能耗随着视频长度的增加而非线性增长。具体而言,当生成的视频长度翻倍时,其所需 …
阅读更多FactoryAI 的 Droid CLI 赋能 GML 4.5 与 GPT-5 结合 Ben Tossell 转发消息称,FactoryAI 的 Droid 命令行工具现已支持运行 Zai.org 的 GML 4.5 模型(被视为 Sonnet 4 的替代方案)。用户反馈 Droid 在代码生成方面表现出色,甚至超越了 Claude Code、Amp、Warp、Cline 和 Codex 等工具。这一进展预示着 GML 4.5 与 GPT-5 高级功能的结合,有望在代码生成和 AI 开发领域提供强大的协同效应,为开发者带来更高效、更强大的编程体验。 OpenAI 被指秘密部署 GPT-5-Chat-Safety 模型 有消息指 …
阅读更多AI 行业趋势与可持续性辩论 AI 发展需要“非规模化”视角与可持续性警示-Gary Marcus Gary Marcus 与 Yann LeCun、Richard Sutton 等人就 AI 模型的“规模化”问题展开辩论,强调规模化虽然必要但并非充分条件。他同时转发了德意志银行的一份研究报告,该报告警告称,当前 AI 领域的 巨大资本支出 使得 AI 繁荣不可持续,引发了对 AI 行业长期经济可行性和发展基础的担忧。 Claude Code Agent 及其启动器功能升级 Claude Code 成为全链路开发领域最强 AI Agent-orange.ai Orange.ai 高度赞扬 Claude Code 是目前最强的 AI …
阅读更多