文心开源ERNIE-4.5-21B-A3B-Thinking模型登顶HuggingFace趋势榜-向阳乔木 百度文心团队新开源的 ERNIE-4.5-21B-A3B-Thinking 模型在HuggingFace全球模型总趋势榜上取得了第一名。这款模型是一款轻量级的MoE(Mixture-of-Experts)模型,总参数量为21B,但激活参数仅3B,具备128K的上下文窗口,专为提升推理能力而设计。该模型基于百度自研的飞桨深度学习框架构建,而非主流的PyTorch。HuggingFace的CEO Clem也转发推荐了此模型。分析指出,其强大的推理和工具调用能力对于开发Agent产品具有重要意义,有助于打破现有市场垄断。
阅读更多Lovart & Seedream 4.0:自媒体图文生成的终极方案与自定义风格新玩法 - 歸藏(guizang.ai) 歸藏(guizang.ai) 分享了利用 Lovart 与 Seedream 4.0 结合的强大提示词,实现了将任意文案转换为高度可控的成套图文内容,尤其适用于小红书等平台。该方案允许用户通过“垫图”或详细提示词自定义图片风格,例如将Anthropic的文档转化为其品牌设计风格的卡片,或将中国古文转化为水墨风格的传统主题卡片,甚至能以中国仙侠风格讲述科学家事迹。这种方法提供了极高的内容、风格、文案和主题混搭灵活性,被认为是自媒体图文生成的“终极方案”,并提及未来可能实现低成本的完整视频(结合TTS)生成。 深入 …
阅读更多ERNIE-4.5-21B-A3B-Thinking 登顶 Hugging Face 趋势榜-clem 🤗 百度文心ERNIE-4.5-21B-A3B-Thinking模型在全球领先的AI社区Hugging Face上荣登总榜第一,标志着其在大型语言模型领域的强大实力和广泛关注度。这一成就显示了国产AI模型在国际舞台上的竞争力,吸引了开发者和研究者对该模型的关注,进一步推动了其在AI应用和研究中的发展。 Claude 推出 AI 驱动的办公文件转换与生成功能-向阳乔木 Claude 上线了新的实验性功能,允许用户通过 AI 自动进行办公文件格式转换及内容生成,涵盖 Excel、Word、PPT 和 PDF 等。用户只需在设置中启 …
阅读更多今日全球AI动态聚焦于技术的深度融合与垂直应用落地。阿里巴巴推出的Qwen3-Next新架构,通过稀疏专家混合(MoE)技术展示了业界对大模型效率优化的新路径。同时,AI正加速渗透企业服务,Adobe推出面向客户体验的AI代理,PayPal则利用AI赋能跨境支付,金山办公与华为的合作也标志着AI办公进入一体化方案时代。在终端应用上,微软Edge浏览器测试的实时音频翻译功能,预示着AI向客户端的延伸,而汽车行业则在自动驾驶(东风日产)和VR培训(宝马)等领域,持续探索AI的边界。 Alibaba推出Qwen3-Next,作为一种更高效的LLM架构 阿里巴巴Qwen团队发布了Qwen3-Next,一种旨在提升超长上下文场景下训练和推理效 …
阅读更多English Version News Discovery Time! Today we want to explore… Bang! Pop! Wow! Have you ever heard of penguins escaping from a scary leopard seal? Scientists have been watching a funny relationship between these animals in Antarctica and Africa. They have seen that sometimes, a clever penguin can trick a leopard …
阅读更多Ling-mini-2.0:16B-A1B MoE LLM宣布开源-clem 🤗 Ling-mini-2.0,一个拥有 16B-A1B MoE(混合专家)架构的大型语言模型,已宣布开源。该模型经过 20万亿+ tokens 的训练,并结合了 SFT (监督微调)、RLVR (基于人类反馈的强化学习) 和 RLHF (人类反馈强化学习) 等多种训练方法。据称,其生成速度高达 300+ tokens/秒,比现有模型快 7倍。这一发布有望加速开源社区在MoE架构LLM领域的发展和应用。 ChatGPT与Claude记忆功能对比:两种截然不同的哲学-宝玉 宝玉详细分析了 ChatGPT 和 Claude 在记忆功能上的根本性差 …
阅读更多开放权重是多任务、多领域、多语言的未来趋势 - clem 🤗 Hugging Face的联合创始人Clement Delangue强调,**开放权重(open weights)**模型是未来许多AI任务、领域和语言的关键前沿。他指出,通过强化学习(RL)根据特定约束条件对模型进行专业化,开放权重模型的优势将更加显著。这表明了对开源AI社区和定制化模型潜力的坚定信心,预示着AI技术将以更灵活和适应性强的方式发展。 Groq 模型现已通过 Hugging Face 直接在 VS Code 中访问 - clem 🤗 (via GroqInc) Groq公司宣布,其模型现在可以通过Hugging Face直接在Visual Studio …
阅读更多Hugging Face Transformers v5 版本即将发布-merve Hugging Face宣布其Transformers库即将发布v5版本。这一重要的里程碑式更新在数月预告后终于启动,预计将带来Transformers库的重大改进和新功能,对AI模型开发和研究社区产生积极影响,预示着更强大的模型集成与更高效的开发体验。 Hugging Face 推理提供商集成至 GitHub Copilot Chat-merve 从今天起,用户可以在GitHub Copilot Chat中直接使用Hugging Face推理提供商(Inference Providers)。这意味着开发者能够更便捷地集成和利用Hugging …
阅读更多火山引擎免费开放顶级Seedream 4.0生图模型,API支持4K与去水印-向阳乔木 火山引擎现已免费开放其顶级Seedream 4.0生图模型,用户无需API或积分即可使用。该模型在架构上与Nano Banana类似,具备4K高清图片生成能力,并提供出色的中文支持。Seedream 4.0被认为具有巨大潜力,在多个场景下表现不俗。最值得关注的是,火山引擎还支持API接入,允许用户直接生成4K图片并去除水印,预计将催生大量基于此模型的AI原生产品。该模型已通过多种案例展示其强大的图像生成能力,包括设计乐队海报、可视化解数学题、生成衍纸艺术绘本、模拟烹饪过程、创建Q版玩偶蓝图以及生成表情包和手办。 Claude AI助手上 …
阅读更多以下是过去4小时全球AI领域的精选动态: PaddleOCRv5 发布并登陆 Hugging Face Hub - merv PaddleOCRv5 现已在 Hugging Face Hub 上发布,采用 Apache-2.0 许可证。尽管模型尺寸仅为 70M,但其基准测试结果表现“惊人”,展示了其高效而强大的性能。这一发布为开发者和研究人员提供了易于获取且性能卓越的 OCR 工具。 Anthropic 分享 AI Agent 工具开发经验,强调 Claude Code 优势 - 宝玉 Anthropic 工程团队发布了《为 AI 智能体打造高效工具》的技术文章,强调其 Claude Code 作为最强编程 Agent 的地位。该文 …
阅读更多