OpenAI Atlas浏览器正式发布,Agent模式可执行复杂任务 OpenAI 正式发布其 Atlas 浏览器,所有用户均可使用,其中付费用户可体验强大的 Agent 模式。该浏览器支持对网页进行提问、在输入时提供建议,并能控制标签页的开启与关闭。Agent 模式尤其令人印象深刻,用户测试显示它能完成复杂的跨页面多步操作,例如自动订购苹果设备,甚至能自我纠错(如识别预售状态后更换订购产品)。此外,Atlas 浏览器还支持添加浏览器插件,预示着 AI 驱动的浏览器将为用户带来更智能、高效的网页交互体验。 AI写作能力获认可,但高知群体仍持批判性视角 有观点指出,当前 AI 的写作能力已达到无需怀疑的水平,一篇由 AI 生成但数据 …
阅读更多OpenAI 推出全新 AI 浏览器 ChatGPT Atlas for macOS - Sam Altman & 小互 OpenAI 正式发布其首款 AI 优先网络浏览器 ChatGPT Atlas,并率先登陆 macOS 平台。Atlas 将 ChatGPT 从一个独立的网页或应用,转变为一个随处可用的认知层。它能够在用户浏览网页时,实时地理解、总结、提供建议或执行操作任务。Atlas 深度整合了 ChatGPT 的应用生态系统,通过开放 Apps SDK,允许第三方服务直接嵌入。用户可以在对话中直接操作应用,例如 Spotify 或 Zillow,这意味着 ChatGPT 不仅是一个浏览器助手,更是一个跨平台的“服务协调中 …
阅读更多以下是过去几小时内全球AI领域的重要动态: Sam Altman预告新产品发布会-Sam Altman OpenAI首席执行官Sam Altman宣布将在当天上午10点(太平洋时间)通过直播发布一款“相当令人兴奋的新产品”。此举预示着OpenAI可能即将推出其在AI领域的新进展,预计将为AI应用和技术栈带来新的变革。具体产品细节虽未披露,但Sam Altman的个人兴奋之情暗示了此次发布的重要性,可能涉及模型更新、新服务或硬件集成等,引发了业界的广泛关注和期待。 Anthropic重申AI发展立场-Jack Clark AnthropicAI通过其官方渠道重申了公司在AI发展上的持续立场,强调AI将带来巨大益处,但必须以深思熟虑的方 …
阅读更多Sora 2 物理模拟缺陷集锦 - Gary Marcus Gary Marcus 分享了一段关于 OpenAI Sora 2 视频生成模型物理模拟缺陷的视频合集。该合集展示了Sora 2在处理复杂物理交互时出现的明显失误,例如物体穿透、不自然的运动轨迹以及对重力等基本物理定律的错误演绎。这表明尽管Sora在视频生成方面取得了显著进展,但在实现真实世界的物理一致性上仍面临重大挑战,反映出当前AI视频模型在理解和模拟复杂物理世界方面的局限性。 AI 正在接管 𝕏:Grok 赋能全球交流与算法 - 小互 用户“小互”发文指出,Elon Musk 领导下的 X(原Twitter)正加速由 AI 接管,特别是通过深度集成 Grok AI …
阅读更多以下是过去4小时全球AI领域的动态摘要: 关于多模态模型和图像处理的思考-merve AI研究者merve分享了对多模态模型处理方式的看法。她指出,当前许多模型更像是“学会了看”的LLM,而非真正的图像原生模型。她对通过文档检索器进行文档检索提出了“大胆的看法”,认为不应忽视图像模态,并提出了“通过图像解决文本问题”的有趣思路,这可能预示着未来在视觉和文本处理融合方面的新方向。 AI初创公司一年内实现2亿美元营收并招聘工程师-Amjad Masad Amjad Masad转发了一则消息,某AI初创公司在短短一年内,从零收入跃升至超过2亿美元的年经常性收入(ARR),并正在积极招聘工程师。这一快速增长案例凸显了当前AI市场中部分领域的 …
阅读更多在过去4小时内,全球AI领域涌现出多项新进展和讨论。语音技术方面,Fish Audio S1推出了升级版语音克隆模型和API,大幅提升了性能。Google的Veo视频模型增加了强大的精确编辑功能。Anthropic为生命科学领域推出了专属的Claude版本,并强化了Agent Skills。DeepSeek在AI基础设施和开放研究方面持续发力。此外,OpenAI发布了编写高质量文档的指南,知名思想家Ray Dalio也推出了其思想的AI智能体。 Fish Audio S1 API上线及语音克隆模型升级-小互 Fish Audio S1 API已正式上线,并对语音克隆模型进行了显著升级。该API实现了低于 500毫秒的首帧延 …
阅读更多今日全球AI动态聚焦于人工智能的深度渗透与基础能力的构建。微软正式宣告Windows 11进入AI原生平台时代,标志着操作系统层面的AI集成成为新常态。与此同时,国产算力取得关键突破,首款**全国产通用GPU“曦云 C600”**的发布,为大模型训练提供了自主可控的硬件基础。在模型进展方面,马斯克对Grok 5实现AGI的预测引发热议,而DeepSeek则开源了新的OCR模型,持续推动AI在特定应用领域的深化。此外,从机器人控制算法的革新到AI在广告、客服等行业的颠覆性应用,技术正加速从数字世界走向物理世界,重塑产业格局。 微软官宣:Win10 时代落幕,Win11 凭 AI 全面开启“未来办公” 微软正式宣布Windows 10时 …
阅读更多English Version (Intro Music with upbeat tempo) Host: News Discovery Time! Today we are exploring… Bang! Pop! Wow! …the secret lives of zombie cicadas and time-traveling treasures!
(Sound of cicadas buzzing, followed by a mysterious sound effect) Host: Our first story is a little creepy, a little crawly, and …
阅读更多以下是过去4小时全球AI领域的动态摘要: AI对就业市场的影响及新机遇-Peter H. Diamandis, MD Peter H. Diamandis指出,AI正在加速就业岗位的消失,预计2025年将有80万人失业,仅9月份就有1万人因AI失业。然而,他强调这同时也是一场“新淘金热”的开始,机遇属于那些学会与机器协作而非对抗机器的人。这意味着个人和企业需要积极适应AI带来的变革,通过学习如何利用AI工具来构建新价值,从而在新时代中找到立足之地。 Claude Code Now项目进展与GLM 4.6支持-orange.ai Claude Code Now项目已突破300 Star,显示出其在开发者社区中的受欢迎程度。该项目近期更 …
阅读更多以下是过去4小时内全球AI领域的重要动态: Andrej Karpathy 深入探讨离散文本扩散模型 Andrej Karpathy 分享了一篇关于简单文本(离散)扩散的短文,并对文本生成中的两种主要范式——扩散(迭代去噪)和自回归(从左到右生成)进行了深入比较。他指出,扩散模型在图像/视频生成中占据主导地位,而自回归在文本领域更为普遍。Karpathy 解释说,去除数学形式主义后,扩散模型本质上是一种带有双向注意力的 Transformer,通过迭代重新采样和遮蔽 tokens 来生成最终样本。尽管双向注意力在语言模型中更强大,但训练成本更高。他认为,这两种范式在 LLM 堆栈中仍有进一步融合和泛化的可能性。 Claude …
阅读更多