阿里开源 Qwen3:实测旗舰模型,看看它到底是什么水平?今天早上一睁眼,就被朋友圈里 Qwen3 的消息刷屏了。不得不说,这次阿里真是大手笔,一口气开源了 8 款大模型,而且还细分出了多个版本,Hugging Face 上已经有 22 个不同的 Qwen3 系列模型了! 详情可以点击链接了解。
那么,这些模型的实际表现如何呢?官方给出的跑分数据非常亮眼。
从代码、数学到通用能力,在各种基准测试中,旗舰模型 Qwen3-235B-A22B 的表现,完全可以和 DeepSeek-R1、o1、o3-mini、Grok-3 甚至是 Gemini-2.5-Pro 这样的顶级模型掰手腕,不分伯仲!
更令人惊喜的是,小型 MoE 模型 Qwen3-30B-A3B,仅仅使用了 QwQ-32B 的 10% 激活参数,性能却超越了后者。甚至 Qwen3-4B 这样的小模型,也能匹敌 Qwen2.5-72B-Instruct 的实力。
现在,较大的三款模型已经上线了 Qwen Chat 网页版和手机 App,大家可以直接体验了。
体验地址:http://chat.qwenlm.ai
当然,跑分只是 ...
大模型推理加速:无问芯穹开源三大推理系统,助力端云智能协同当前,人工智能领域正朝着“端云并发”的方向发展,端侧大模型和云侧大模型各自发挥优势,共同拓展着智能应用的可能性。端侧模型能够在本地实现毫秒级的实时响应,而云侧模型则凭借强大的算力支持复杂的大规模推理。但无论是哪种方式,都离不开高效推理系统的有力支撑。
正如 NVIDIA CEO 黄仁勋在 GTC 2025 上所强调的,大模型计算正从预训练阶段转向推理优化阶段。随着大模型产业落地进程的加快,对推理计算的需求呈现出爆发式增长。如何在性能、成本和响应速度之间找到最佳平衡点,成为了当前面临的一项关键工程挑战,而推理系统正是解决这一问题的核心所在。 这就好比盖房子,地基(推理系统)打好了,才能盖更高更稳的楼。
近日,无问芯穹发起了一次推理系统开源活动,连续开源了三个重要的推理工作,包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD,以及低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap。这些成果从多个层面为高效推理系统的设计提供了助力。下面,我们将对这三个工作进行详细解读:
...
ChatGPT 变身「智能买手」:OpenAI 入局电商,会是下一个「什么值得买」?OpenAI 近日宣布 ChatGPT 迎来重大更新,正式进军电商领域,为用户提供更智能的购物体验。这是否意味着 ChatGPT 将成为 AI 时代的「什么值得买」呢?
OpenAI 在 X 平台上的这则消息引发了广泛关注:「我们已经对 ChatGPT 搜索进行了多项改进,今天我们开始推出更好的购物体验。」 这标志着 ChatGPT 不仅仅是一个聊天机器人,更开始扮演起「导购」的角色。
例如,当你询问 ChatGPT “预算之内哪款咖啡机最好” 时,它会直接给出推荐,并附带购买链接,让用户可以快速进入购买流程。
点击产品卡片后,ChatGPT 会在侧边栏展示更详细的产品信息,包括购买地点、用户评价 (来自亚马逊、百思买和 Reddit 等平台) 等。此外,用户还可以通过「咨询」按钮直接向 ChatGPT 提问,进一步了解产品细节。
目前,这项功能已在 GPT-4o 中向全球所有 ChatGPT 用户开放,首批支持的品类包括时尚、美容、家居用品和电子产品。
ChatGPT 的购物推荐基于第三方的结构化元 ...
硅谷正涌现一股新的创业浪潮,而这股力量的源头,正是 OpenAI。
聚是一团火,散是满天星。
作为 ChatGPT 的缔造者,OpenAI 无疑是当前人工智能领域最耀眼的明星。在公司估值 तेजी से 飙升至 3000 亿美元的同时,也孕育出一批心怀创业梦想的离职员工。
OpenAI 的光环效应强大到什么程度呢?Ilya Sutskever 的 AI 初创公司 Safe Superintelligence (SSI) 和 Mira Murati 的 Thinking Machines Lab 等企业,甚至还未推出任何产品,就已获得数十亿美元的融资。
这个新兴的 AI 创业生态圈群星璀璨。下面就来盘点一下由 OpenAI 前研究人员打造的、最受瞩目的 15 家公司:
1. AnthropicDario Amodei, Daniela Amodei, John Schulman
Dario Amodei 和 Daniela Amodei 兄妹于 2021 年离开 OpenAI,并联合其他 OpenAI 高管共同创立了 Anthropic。这家公司专注于开发安全、可解释且符合人类价值 ...
大型语言模型(LLMs)的挑战与机遇:DFloat11 无损压缩方案大型语言模型(LLMs)在自然语言处理(NLP)领域展现了强大的能力。然而,模型规模的快速增长给高效部署和推理带来了严峻的挑战,尤其是在计算资源或内存受限的环境中。
以 Llama-3.1-405B 为例,它在 BFloat16 格式下拥有 4050 亿个参数,需要约 810GB 的内存才能进行完整推理。这远远超出了典型高端 GPU 服务器(例如配备 8 个 80GB GPU 的 DGX A100/H100)的承载能力。因此,部署如此庞大的模型通常需要多个节点,导致成本高昂且难以实现。
针对这一问题,来自莱斯大学等机构的研究人员提出了一种创新解决方案:DFloat11 可以在保持 100% 准确率的前提下,将任何 BFloat16 模型压缩到原始大小的 70%。
论文标题:70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float
论文地址:https://ar ...
《大规模语言模型:从理论到实践(第2版)》是一本兼顾理论深度与实践指导的专业技术书籍,堪称AI时代不可或缺的知识宝典。无论你的背景如何,都能从中找到适合自己的学习路径。
在人工智能浪潮席卷全球的当下,大型语言模型(LLM)正以惊人的速度推动着科技进步和产业变革。从 ChatGPT 到各种行业应用,LLM 不仅改变了人机交互方式,还成为了学术研究和产业创新的关键驱动力。
面对快速发展的大语言模型技术体系,如何系统地理解其理论基础,并掌握核心算法和工程实践,已成为每一位 AI 从业者、研究人员和高校学生的必修课。
2023年9月,复旦大学张奇、桂韬、郑锐、黄萱菁研究团队向全球发布了《大规模语言模型:从理论到实践》。 时隔两年,大语言模型在理论研究、预训练方法、后训练技术以及可解释性等方面取得了显著进展。业界对大语言模型的研究日益深入,逐渐发现了许多与传统深度学习和自然语言处理不同的特性。例如,大语言模型仅需少量数据(例如60条)即可展现出强大的问题回答能力,体现了其卓越的泛化能力。 然而,作者也发现大语言模型存在一定的脆弱性。例如,在一个拥有1300亿参数的模型中,仅仅修改一个参数,就 ...
DeepWiki:GitHub 代码仓库的 AI 驱动免费百科全书最近,独角兽 AI 公司 Cognition AI(Cognition Labs)推出了一个开源项目——DeepWiki,旨在为 GitHub 上的公共代码仓库生成 AI 驱动的交互式文档,堪称「GitHub 仓库的免费百科全书」。有了它,告别晦涩难懂的文档和注释!
你可以通过以下两种方式访问 DeepWiki:
官网直接访问: http://deepwiki.com
GitHub 链接替换: 将 GitHub 链接中的「github.com」替换为「deepwiki.com」
DeepWiki 通过分析代码、README 和配置文件,自动生成结构化的技术文档、交互式图表,并提供一个对话式 AI 助手,帮助开发者快速理解项目结构和逻辑——无需反复查阅稀少的 README 文件或晦涩的注释信息!
自发布以来,DeepWiki 热度持续走高,吸引了众多用户,并获得了积极的反馈。
DeepWiki 的核心功能DeepWiki 主要有以下核心功能:
自动生成文档:
DeepWiki 可以将任意 GitHub 公共仓库 ...
随着人工智能飞速崛起,能源的庞大索取量成为了不得不重视的现状。而意图驾驭这股新兴浪潮的国家中,有不少将目光转移到了一款量大管饱的发电项目——核电。
加利福尼亚州,Diablo Canyon(代阿布洛峡谷)核电站是当地仅存的核电站,计划从 2029 年开始它漫长的退役过程。尽管被调侃所使用的技术已经落后到了恐龙时代去,但这座核电站还是收到了八台 NVIDIA H100 图形处理器,AI 的身影在此降临到这座已经有些衰老的发电站。
现如今,美国的 94 座核反应堆中所有的年限许可均已延长,并仍然提供着近 20% 的电力总量。其中有三分之一的核所有者正在与科技公司谈判,要求为数据中心提供电力。
图示:位于密歇根州 Covert 的 Palisades 核电站的控制室模拟器。(图源:网络)
AI 会提供什么协助
阿贡国家实验室(Argonne National Laboratory)以其核反应堆方面的工作而闻名,该实验室开发了一种基于 AI 的工具,可以协助反应堆设计并帮助运营商运行核电站。
这款工具名为用于自动识别和诊断的无参数推理运算符(PRO-AID),使用生成式 AI 结合大型语言模 ...
详细介绍Markdown写作的进阶技巧,包括高级语法、排版优化、效率提升等内容。
📝 前言在掌握了Markdown基础语法后,如何让文章更加美观、专业?本文将为您介绍一系列Markdown写作的进阶技巧,帮助您提升写作效率和文章质量。
[!NOTE]本文介绍的技巧适用于所有Markdown编辑器,但部分功能可能需要特定编辑器支持。
💡 高级排版技巧1. 文本强调与引用文本强调
加粗文本 或 加粗文本斜体文本 或 斜体文本删除线文本
引用嵌套
一级引用
二级引用
三级引用
\# 文本强调 \*\*加粗文本\*\* 或 \_\_加粗文本\_\_ \*斜体文本\* 或 \_斜体文本\_ ~~删除线文本~~ \# 引用嵌套 \> 一级引用 \>> 二级引用 \>>> 三级引用
2. 列表进阶任务列表
待办事项
已完成事项
自定义列表
第一项
子项1
子项2
第二项
\# 任务列表 \- \[ \] 待办事项 \- \[x\] 已完成事项 \# 自定义列表 1. 第一项 - 子项1 ...
介绍如何在 Windows 11 安装过程中跳过 OOBE(开箱体验)和联网激活步骤的方法。
📝 前言在安装 Windows 11 时,系统会要求完成 OOBE(开箱体验)设置并联网激活。本文介绍一个简单有效的方法来跳过这些步骤,特别适合虚拟机安装场景。
[!NOTE]OOBE (Out-Of-Box Experience) 是微软为新用户设计的初始化设置向导。
💡 解决方法
[!IMPORTANT]请注意:在 Windows 11 最新版本中,部分旧方法可能已不再适用。建议优先尝试以下最新方法。
1. 打开命令提示符在 OOBE 界面按下快捷键:
普通键盘: Shift + F10
笔记本键盘: Shift + Fn + F10
2. 执行跳过命令在打开的命令提示符(CMD)窗口中输入:
OOBE\BYPASSNRO
[!TIP]执行命令后系统会自动重启并跳过 OOBE 设置。
3. 通过注册表修改(究极方法)如果上述方法无效,可以尝试通过修改注册表的方式:
在 OOBE 界面按下快捷键打开命令提示符:
普通键盘: Shift + F10
笔记本键盘: ...

