🌐未知变量 的空间

技术趋势与新闻

AI智能体协议全景解析：上海交大&ANP社区发布首个系统性综述，构建智能互联的基础设施

发表于2025-04-302025-04-30 机器学习自然语言处理分布式系统 AI

AI 智能体协议全景解析：上海交大 & ANP 社区发布首个系统性综述一项由上海交通大学杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温颖、俞勇、张伟楠，以及 ANP 社区发起人常高伟共同完成的研究，为人工智能智能体领域的互联互通带来了新的曙光。随着大语言模型（LLM）技术的飞速发展，基于 LLM 的智能体正在客户服务、内容创作，甚至医疗辅助等领域展现出强大的应用潜力。然而，不同智能体系统之间通信标准的碎片化问题，已经成为制约其进一步发展的关键瓶颈。为了应对这一挑战，上海交通大学的研究团队与 ANP 社区合作，推出了首个全面且系统的 AI 智能体协议综述——《A Survey of AI Agent Protocols》。该综述旨在为解决智能体协议的标准化问题提供清晰的指导框架，推动智能体生态的繁荣发展。 ArXiv 论文链接：https://arxiv.org/abs/2504.16736 Github 仓库地址：https://github.com/zoe-yyx/Awesome-AIAgent-Protocol 交互碎片化：智 ...

未读

阿里开源Qwen3：旗舰模型实测，逻辑推理、写作、编程能力大揭秘

发表于2025-04-292025-04-29 机器学习自然语言处理深度学习

阿里开源 Qwen3：实测旗舰模型，看看它到底是什么水平？今天早上一睁眼，就被朋友圈里 Qwen3 的消息刷屏了。不得不说，这次阿里真是大手笔，一口气开源了 8 款大模型，而且还细分出了多个版本，Hugging Face 上已经有 22 个不同的 Qwen3 系列模型了！详情可以点击链接了解。那么，这些模型的实际表现如何呢？官方给出的跑分数据非常亮眼。从代码、数学到通用能力，在各种基准测试中，旗舰模型 Qwen3-235B-A22B 的表现，完全可以和 DeepSeek-R1、o1、o3-mini、Grok-3 甚至是 Gemini-2.5-Pro 这样的顶级模型掰手腕，不分伯仲！更令人惊喜的是，小型 MoE 模型 Qwen3-30B-A3B，仅仅使用了 QwQ-32B 的 10% 激活参数，性能却超越了后者。甚至 Qwen3-4B 这样的小模型，也能匹敌 Qwen2.5-72B-Instruct 的实力。现在，较大的三款模型已经上线了 Qwen Chat 网页版和手机 App，大家可以直接体验了。体验地址：http://chat.qwenlm.ai 当然，跑分只是 ...

无问芯穹开源三大推理系统SpecEE、Semi-PD、FlashOverlap，助力大模型端云智能协同，加速推理速度与效率

系统与运维

未读

无问芯穹开源三大推理系统SpecEE、Semi-PD、FlashOverlap，助力大模型端云智能协同，加速推理速度与效率

发表于2025-04-292025-04-29 机器学习性能优化深度学习云计算推理系统

大模型推理加速：无问芯穹开源三大推理系统，助力端云智能协同当前，人工智能领域正朝着“端云并发”的方向发展，端侧大模型和云侧大模型各自发挥优势，共同拓展着智能应用的可能性。端侧模型能够在本地实现毫秒级的实时响应，而云侧模型则凭借强大的算力支持复杂的大规模推理。但无论是哪种方式，都离不开高效推理系统的有力支撑。正如 NVIDIA CEO 黄仁勋在 GTC 2025 上所强调的，大模型计算正从预训练阶段转向推理优化阶段。随着大模型产业落地进程的加快，对推理计算的需求呈现出爆发式增长。如何在性能、成本和响应速度之间找到最佳平衡点，成为了当前面临的一项关键工程挑战，而推理系统正是解决这一问题的核心所在。这就好比盖房子，地基（推理系统）打好了，才能盖更高更稳的楼。近日，无问芯穹发起了一次推理系统开源活动，连续开源了三个重要的推理工作，包括加速端侧推理速度的 SpecEE、计算分离存储融合的 PD 半分离调度新机制 Semi-PD，以及低计算侵入同时通信正交的计算通信重叠新方法 FlashOverlap。这些成果从多个层面为高效推理系统的设计提供了助力。下面，我们将对这三个工作进行详细解读： ...

技术趋势与新闻

未读

ChatGPT进军电商：化身智能买手，下一个“什么值得买”？

发表于2025-04-292025-04-29 机器学习自然语言处理深度学习 AI 技术趋势与新闻

ChatGPT 变身「智能买手」：OpenAI 入局电商，会是下一个「什么值得买」？OpenAI 近日宣布 ChatGPT 迎来重大更新，正式进军电商领域，为用户提供更智能的购物体验。这是否意味着 ChatGPT 将成为 AI 时代的「什么值得买」呢？ OpenAI 在 X 平台上的这则消息引发了广泛关注：「我们已经对 ChatGPT 搜索进行了多项改进，今天我们开始推出更好的购物体验。」这标志着 ChatGPT 不仅仅是一个聊天机器人，更开始扮演起「导购」的角色。例如，当你询问 ChatGPT “预算之内哪款咖啡机最好” 时，它会直接给出推荐，并附带购买链接，让用户可以快速进入购买流程。点击产品卡片后，ChatGPT 会在侧边栏展示更详细的产品信息，包括购买地点、用户评价 (来自亚马逊、百思买和 Reddit 等平台) 等。此外，用户还可以通过「咨询」按钮直接向 ChatGPT 提问，进一步了解产品细节。目前，这项功能已在 GPT-4o 中向全球所有 ChatGPT 用户开放，首批支持的品类包括时尚、美容、家居用品和电子产品。 ChatGPT 的购物推荐基于第三方的结构化元 ...

未读

OpenAI “离职潮”：15 家最受瞩目的明星 AI 创业公司

发表于2025-04-282025-04-28 人工智能 OpenAI 创业公司

硅谷正涌现一股新的创业浪潮，而这股力量的源头，正是 OpenAI。聚是一团火，散是满天星。作为 ChatGPT 的缔造者，OpenAI 无疑是当前人工智能领域最耀眼的明星。在公司估值 तेजी से 飙升至 3000 亿美元的同时，也孕育出一批心怀创业梦想的离职员工。 OpenAI 的光环效应强大到什么程度呢？Ilya Sutskever 的 AI 初创公司 Safe Superintelligence (SSI) 和 Mira Murati 的 Thinking Machines Lab 等企业，甚至还未推出任何产品，就已获得数十亿美元的融资。这个新兴的 AI 创业生态圈群星璀璨。下面就来盘点一下由 OpenAI 前研究人员打造的、最受瞩目的 15 家公司： 1. AnthropicDario Amodei, Daniela Amodei, John Schulman Dario Amodei 和 Daniela Amodei 兄妹于 2021 年离开 OpenAI，并联合其他 OpenAI 高管共同创立了 Anthropic。这家公司专注于开发安全、可解释且符合人类价值 ...

未读

突破！LLM 无损压缩技术 DFloat11：模型体积缩小 30%，推理速度大幅提升！

发表于2025-04-282025-04-28 LLM压缩无损压缩 DFloat11

大型语言模型（LLMs）的挑战与机遇：DFloat11 无损压缩方案大型语言模型（LLMs）在自然语言处理（NLP）领域展现了强大的能力。然而，模型规模的快速增长给高效部署和推理带来了严峻的挑战，尤其是在计算资源或内存受限的环境中。以 Llama-3.1-405B 为例，它在 BFloat16 格式下拥有 4050 亿个参数，需要约 810GB 的内存才能进行完整推理。这远远超出了典型高端 GPU 服务器（例如配备 8 个 80GB GPU 的 DGX A100/H100）的承载能力。因此，部署如此庞大的模型通常需要多个节点，导致成本高昂且难以实现。针对这一问题，来自莱斯大学等机构的研究人员提出了一种创新解决方案：DFloat11 可以在保持 100% 准确率的前提下，将任何 BFloat16 模型压缩到原始大小的 70%。论文标题：70% Size, 100% Accuracy: Lossless LLM Compression for Efficient GPU Inference via Dynamic-Length Float 论文地址：https://ar ...

未读

AI时代必备：《大规模语言模型：从理论到实践（第2版）》重磅升级，全面解读LLM前沿技术与应用

发表于2025-04-282025-04-28 大规模语言模型 LLM 人工智能

《大规模语言模型：从理论到实践（第2版）》是一本兼顾理论深度与实践指导的专业技术书籍，堪称AI时代不可或缺的知识宝典。无论你的背景如何，都能从中找到适合自己的学习路径。在人工智能浪潮席卷全球的当下，大型语言模型（LLM）正以惊人的速度推动着科技进步和产业变革。从 ChatGPT 到各种行业应用，LLM 不仅改变了人机交互方式，还成为了学术研究和产业创新的关键驱动力。面对快速发展的大语言模型技术体系，如何系统地理解其理论基础，并掌握核心算法和工程实践，已成为每一位 AI 从业者、研究人员和高校学生的必修课。 2023年9月，复旦大学张奇、桂韬、郑锐、黄萱菁研究团队向全球发布了《大规模语言模型：从理论到实践》。时隔两年，大语言模型在理论研究、预训练方法、后训练技术以及可解释性等方面取得了显著进展。业界对大语言模型的研究日益深入，逐渐发现了许多与传统深度学习和自然语言处理不同的特性。例如，大语言模型仅需少量数据（例如60条）即可展现出强大的问题回答能力，体现了其卓越的泛化能力。然而，作者也发现大语言模型存在一定的脆弱性。例如，在一个拥有1300亿参数的模型中，仅仅修改一个参数，就 ...

未读

DeepWiki：AI 驱动的 GitHub 代码仓库免费百科全书，告别晦涩文档

发表于2025-04-272025-04-27 DeepWiki AI文档生成 GitHub

DeepWiki：GitHub 代码仓库的 AI 驱动免费百科全书最近，独角兽 AI 公司 Cognition AI（Cognition Labs）推出了一个开源项目——DeepWiki，旨在为 GitHub 上的公共代码仓库生成 AI 驱动的交互式文档，堪称「GitHub 仓库的免费百科全书」。有了它，告别晦涩难懂的文档和注释！你可以通过以下两种方式访问 DeepWiki：官网直接访问： http://deepwiki.com GitHub 链接替换：将 GitHub 链接中的「github.com」替换为「deepwiki.com」 DeepWiki 通过分析代码、README 和配置文件，自动生成结构化的技术文档、交互式图表，并提供一个对话式 AI 助手，帮助开发者快速理解项目结构和逻辑——无需反复查阅稀少的 README 文件或晦涩的注释信息！自发布以来，DeepWiki 热度持续走高，吸引了众多用户，并获得了积极的反馈。 DeepWiki 的核心功能DeepWiki 主要有以下核心功能：自动生成文档： DeepWiki 可以将任意 GitHub 公共仓库 ...

未读

人工智能接管核电站，商业化的智能核电管理是否正在路上？

发表于2025-04-262025-04-26 人工智能 AI

随着人工智能飞速崛起，能源的庞大索取量成为了不得不重视的现状。而意图驾驭这股新兴浪潮的国家中，有不少将目光转移到了一款量大管饱的发电项目——核电。加利福尼亚州，Diablo Canyon（代阿布洛峡谷）核电站是当地仅存的核电站，计划从 2029 年开始它漫长的退役过程。尽管被调侃所使用的技术已经落后到了恐龙时代去，但这座核电站还是收到了八台 NVIDIA H100 图形处理器，AI 的身影在此降临到这座已经有些衰老的发电站。现如今，美国的 94 座核反应堆中所有的年限许可均已延长，并仍然提供着近 20% 的电力总量。其中有三分之一的核所有者正在与科技公司谈判，要求为数据中心提供电力。图示：位于密歇根州 Covert 的 Palisades 核电站的控制室模拟器。（图源：网络） AI 会提供什么协助阿贡国家实验室（Argonne National Laboratory）以其核反应堆方面的工作而闻名，该实验室开发了一种基于 AI 的工具，可以协助反应堆设计并帮助运营商运行核电站。这款工具名为用于自动识别和诊断的无参数推理运算符（PRO-AID），使用生成式 AI 结合大型语言模 ...

教程

实用工具

网站建设

未读

Markdown实用技巧

发表于2025-04-102025-04-10 精选写作工具 Markdown

详细介绍Markdown写作的进阶技巧，包括高级语法、排版优化、效率提升等内容。 📝 前言在掌握了Markdown基础语法后，如何让文章更加美观、专业？本文将为您介绍一系列Markdown写作的进阶技巧，帮助您提升写作效率和文章质量。 [!NOTE]本文介绍的技巧适用于所有Markdown编辑器，但部分功能可能需要特定编辑器支持。 💡 高级排版技巧1. 文本强调与引用文本强调加粗文本或加粗文本斜体文本或斜体文本删除线文本引用嵌套一级引用二级引用三级引用 \# 文本强调 \*\*加粗文本\*\* 或 \_\_加粗文本\_\_ \*斜体文本\* 或 \_斜体文本\_ ~~删除线文本~~ \# 引用嵌套 \> 一级引用 \>> 二级引用 \>>> 三级引用 2. 列表进阶任务列表待办事项已完成事项自定义列表第一项子项1 子项2 第二项 \# 任务列表 \- \[ \] 待办事项 \- \[x\] 已完成事项 \# 自定义列表 1. 第一项 - 子项1 ...