今日全球AI领域动态激烈,视频生成模型的竞争进入白热化阶段,Runway发布Gen 4.5模型,在基准测试中超越谷歌及OpenAI的同类产品。与此同时,具身智能正从学术界走向产业前沿,清华大学成立专属研究院,滴滴等资本也开始布局相关交互技术。大型科技公司的战略调整同样值得关注,苹果AI部门迎来新负责人,汇丰银行等传统巨头则通过与Mistral AI合作加速内部AI应用。此外,从DeepSeek发布对标GPT-5的推理模型到Nvidia开源自动驾驶视觉模型,技术迭代的步伐丝毫未减,预示着AI正向更复杂的推理和物理世界交互深度渗透。 Runway 推出 Gen 4.5 AI 视频模型,测试成功击败谷歌 Veo3、OpenAI Sora …
阅读更多English Version News Discovery Time! Today we are exploring… Bang! Pop! Wow! From magical glowing forests to amazing apps built by students just like you, we have some incredible stories to share. Our first piece of news has come from the deep, quiet parts of the Amazon rainforest. Scientists have recently …
阅读更多Hugging Face发布Transformers v5首个Release Candidate Hugging Face宣布发布其Transformers库的v5版本首个Release Candidate(RC)。这是一个重大更新,旨在实现与整个生态系统中其他工具的端到端互操作性,标志着该库自上一个主要版本以来的五年里程碑。此版本将进一步简化AI模型在不同平台和框架间的集成与应用。 NeurIPS代理审稿人审查量已超越会议提交论文总数 斯坦福大学教授吴恩达指出,今年的NeurIPS会议收到了21,575篇论文投稿,而上周发布的“Agentic Reviewer”(代理审稿人)工具提交和评审的论文数量已超过此数。这表明代理审稿模式 …
阅读更多- Runway 发布 Gen-4.5 视频生成模型,增强多方面能力-歸藏(guizang.ai) Runway推出了Gen-4.5视频生成模型,虽然此次更新未带来范式革新,但在多方面进行了显著升级。新模型提升了物理与视觉精度,支持更复杂的场景与详细构图,并增强了物理准确性。此外,Gen-4.5能够生成富有表现力的角色,提供更好的风格化与风格一致性,并在电影感与真实日常场景生成方面有所改进。Amjad Masad的推文确认“Whisper Thunder”即Runway,可能指此新模型的内部代号。
- 国产AI视频生成App内测:音画同步但效果抽象,适合鬼畜视频-向阳乔木 一款国产AI视频生成应用目前正在进行内测。该应用的一大亮 …
阅读更多以下是过去一段时间全球AI领域的重要动态汇总: ChatGPT发布三周年,业界展望AI未来三年 - Emad ChatGPT于三年前的今天发布,这一里程碑事件彻底改变了世界,开创了生成式AI的新范式。Emad和Orange AI等业界人士纷纷回顾了其对AI领域及个人生活的深远影响,并展望了未来三年的巨大潜力。他们强调,无论是已经深耕AI三年,还是刚刚开始拥抱AI,现在都是投身这一领域的绝佳时机。 DeepSeek-V3.2模型发布,性能表现“极其强大” - mervenoyann DeepSeek-V3.2模型已正式发布,并引起了社区的广泛关注。多位评论者对其性能给予了高度评价,称其“极其强大”。此次更新预示着DeepSeek在AI …
阅读更多字节跳动发布“豆包手机助手”技术预览版,支持跨应用操作与个性化记忆-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备多模态识别屏幕内容、交互操作以及跨应用手机操作的核心功能。它支持多种唤醒方式,并拥有强大的个性化记忆能力,能从历史对话和屏幕信息中提取关键数据,例如回忆停车位置或取件码。此外,“豆包”还支持实时视频通话,能理解摄像头内容并进行双语讲解互动。其多模态生成与编辑功能可将AIGC嵌入原生应用,如通过语音指令智能修图。值得注意的是,该版本将通过与手机厂商的系统集成来实现深层权限和功能。 ChatGPT发布三周年,业界反思其深远影响-Emad 三年前的今天,ChatGPT的发布标志着世界进入了生成式AI的新范式,彻底 …
阅读更多以下是过去4小时全球AI领域的最新动态: 字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该助手具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。其核心亮点包括个性化记忆功能,能从历史对话和屏幕信息中学习用户偏好和生活琐事;跨应用操作,如全网比价、生活服务自动化及办公自动化;以及多模态生成与编辑,例如在相册中通过语音指令智能修图。该版本将通过与手机厂商合作实现系统级集成。 ChatGPT三周年庆:重塑世界与人生-Orange AI 今天标志着ChatGPT发布三周年,这一里程碑事件被认为是将世界带入“生成式范式”的开端,彻底改变了技术发展轨迹和个人生活。多位业界 …
阅读更多字节跳动发布“豆包手机助手”技术预览版-小互 字节跳动推出了“豆包手机助手”技术预览版,该产品具备强大的多模态识别与交互能力,支持跨应用操作手机,并通过语音、AI键或耳机唤醒。豆包助手还拥有个性化记忆功能,能够从历史对话和屏幕信息中提取关键数据,提供生活琐事回忆和喜好记忆,并强调数据本地处理以保护隐私。其核心亮点是App Agent能力,能模拟用户操作,自动执行全网比价、生活服务自动化及办公审批等任务。此外,豆包助手还支持系统原生的多模态生成与编辑,例如智能修图,并提供了针对复杂任务的“Pro模式”,能进行多步骤的复杂任务规划和执行,例如跨平台预订旅行。该版本通过与手机厂商的系统集成,获得了更深层的操作权限。 ChatGPT 发布 …
阅读更多今日全球AI动态呈现出基础设施与顶层应用的双重加速。硬件层面,三星即将发布HBM4内存,光互联技术也因AI算力需求而备受瞩目,显示出底层算力竞赛的持续白热化。应用层面,AI正渗透金融、办公等传统领域,但也面临用户在游戏等创意领域的抵制与开发者对“去技能化”的担忧。尤为引人注目的是,全球首个具身智能本科专业的设立,标志着AI人才培养正从纯软件向软硬件结合的下一阶段演进,预示着物理世界的智能化将是未来的核心战场。 上海交大设立全球首个具身智能本科专业,联合华为培养 上海交通大学宣布拟增设全球首个“具身智能”本科专业,隶属于人工智能学院,计划招生30人。该专业旨在培养能融合人工智能、机械、计算机等多学科知识的复合型人才,专业带头人卢策吾教 …
阅读更多English Version (Upbeat Intro Music) Host: News Discovery Time! Today we are exploring… Bang! Pop! Wow! A rocket’s powerful journey into space and a super-train’s epic trip across continents!
Hello everyone, and welcome back to our weekly news express for young explorers! I’m your host, Alex. We have seen some …
阅读更多