新药研发的福音:GraphATC 以毫秒级速度精准预测药物药性新药的诞生之旅,从最初的蓝图构思,历经实验室的反复研磨、严苛的临床试验,直至最终惠及患者,往往是一场耗资巨大且旷日持久的征程——平均而言,这需要投入超过 26 亿美元的巨额资金,以及 10 到 15 年的漫长时光。更为严峻的是,随着研发进程的深入,成本更是水涨船高。
试想,倘若一款并不合适的候选药物贸然进入临床试验阶段,不仅会因缺乏预期疗效而白白消耗医患双方宝贵的时间与精力,其潜在的未知副作用更有可能直接威胁到患者的生命安全。
因此,如何在药物研发的黎明阶段,就能迅速且精准地洞察其潜在的治疗价值,便成为了当前药物设计与筛选领域亟待攻克的关键瓶颈。
近日,一则令人振奋的消息传来:来自香港理工大学、四川大学及鹏城实验室的科研团队联手攻关,在国际知名期刊《Briefings in Bioinformatics》上发表了其最新研究成果——GraphATC。
这一新方法巧妙地运用了原子级别的图神经网络技术,能够在短短 1.53 毫秒之内,就对一种药物的ATC(Anatomical Therapeutic Chemical)药性做出精 ...
近年来,诸如Sora、可灵等视频生成模型凭借其令人瞩目的性能,使得创作者仅凭文本指令便能打造出高质量的视频作品。然而,我们观赏电影时所见的精彩片段,往往是导演在特定场景中对多个元素的运动轨迹、摄像机的拍摄角度进行精密编排,并经过后期剪辑才得以呈现的艺术结晶。以惊心动魄的赛车追逐场景为例,镜头不仅需要紧密跟驰飞速的赛车,更要通过捕捉关键的超车瞬间来凸显比赛的紧张与激烈。遗憾的是,当前主流的视频生成模型尚无法在三维(3D)场景中实现对目标物体与摄像机运动的协同控制与生成,这在一定程度上限制了人工智能在影视制作领域的进一步发展。
为了突破这一瓶颈,快手可灵的研究团队近期在“3D感知可控视频生成”这一前沿领域取得了开创性进展,正式推出了名为 CineMaster 的电影级文本到视频生成框架。这一创新框架赋予用户导演般的创作自由:在提供整体性的文本描述之后,用户可以通过一套交互式工作流程,如同专业导演一般,在3D空间中精心布局场景元素,细致设定目标物体的运动轨迹和摄像机的运镜方式,从而引导模型生成完全符合创作意图的视频内容。值得一提的是,该项研究的论文已被计算机图形学领域的顶级会议 SIGGR ...
本文将介绍一项由吴思泽主导的研究工作。吴思泽目前是南洋理工大学 MMLab@NTU 的四年级博士生,师从 Chen Change Loy 教授。他的研究兴趣广泛,主要聚焦于利用多模态模型进行视觉理解与生成,以及开放世界环境下的目标检测与分割等前沿领域。他已在 ICCV、CVPR、ICLR 等计算机视觉和机器学习领域的顶尖学术会议上发表了多篇具有影响力的论文。
论文题目:Harmonizing Visual Representations for Unified Multimodal Understanding and Generation (为统一多模态理解与生成协调视觉表征)
论文链接: https://arxiv.org/abs/2503.21979
代码地址: https://github.com/wusize/Harmon
项目主页:https://wusize.github.io/projects/Harmon
在线演示 (Demo): https://huggingface.co/spaces/wusize/Harmon
一、引言:迈向统一的多模态理解与生成近期,诸 ...
编辑 | 杨文
经典重温与AI创意:当宫崎骏的动画角色走进“现实”时隔二十八载,宫崎骏的传世经典《幽灵公主》再度登陆国内院线,勾起了无数影迷的珍贵回忆。影片中,当男主角阿席达卡身骑白色驯鹿毅然远行,久石让那史诗般恢弘的配乐随之奏响,多少观众曾为那一幕的悲壮与感动而潸然泪下。
视频来自UP主:光影音乐会
这部动画电影的制作堪称呕心沥血。早在1980年,宫崎骏大师便已着手构思,整个制作周期长达三年,耗用了惊人的14万张纯手绘原稿,吉卜力工作室为此投入了高达25亿日元的巨资。影片于1997年甫一公映,便一举刷新了当时的日本电影票房纪录,时至今日,其票房成绩依然稳居日本影史前十的宝座。
视频来自UP主:光影音乐会
AI 赋能创作:让经典角色“活”起来借着《幽灵公主》重映的东风,一位名为「造梦迪迪」的网友巧妙地运用人工智能(AI)技术,创作出了一系列令人耳目一新的作品。在他的视频里,那些我们耳熟能详的宫崎骏动画角色,竟然化身为真人模样,坐在地板上,聚精会神地看着电视屏幕里播放的正是他们自己的动画片段。这一创意十足的视频在短短三天内,便在各大社交媒体上引爆关注,收获了超过20万的点赞。
...
本文研究的第一作者为罗威迪(本科就读于俄亥俄州立大学,即将赴佐治亚大学攻读博士学位,已在 COLM 及 ACL 系列等人工智能顶级会议上发表数篇论文),合作者包括来自威斯consin大学麦迪逊分校的本科生张起明和陆天宇。
一张看似平平无奇的生活照,竟可能成为人工智能破解您个人隐私的突破口——这并非危言耸听的科幻情节,而是最新研究成果所揭示的严峻现实。研究发现,即便是 OpenAI 推出的多模态大模型 ChatGPT o3,也能够通过照片中那些肉眼难以察觉的细微线索,将您的住址精确锁定在方圆 1 英里的范围之内。
近日,一项由威斯康星大学麦迪逊分校的肖超玮(Chaowei Xiao)教授领衔,并联合佐治亚大学向臻(Zhen Xiang)教授、南加州大学赵越(Yue Zhao)教授团队共同完成的最新研究,深度揭示了自主多模态大语言推理模型在图像地理位置定位方面存在的严重隐私泄露风险。
论文标题:Doxing via the Lens: Revealing Privacy Leakage in Image Geolocation for Agentic Multi-Modal La ...
系列文章快速导航
3FS系列(一):开启存储新篇章——3FS编译优化与部署实战指南
3FS系列(二):深度剖析3FS元数据性能:揭秘技术文档之外的实现奥秘
3FS系列(三):从源码到实测:亲身体验3FS USRBIO静态库的编译与性能
引言:探索3FS的USRBIO性能潜力近期,3FS 依然是技术圈内备受关注的焦点。继上一篇我们对 3FS 元数据性能进行了详尽的测试与分析之后,我们决定将目光投向 3FS 的另一项核心技术创新:FUSE 与 USRBIO 的并行使用。通过实际的编译与性能体验,我们发现 3FS 在设计上巧妙地平衡了用户空间文件系统 FUSE (Filesystem in Userspace) 的易用性与原生接口 USRBIO 的极致性能。
具体来说:
在大多数应用场景下,用户可以直接通过 FUSE 挂载 3FS,几乎无需对现有 AI 任务代码进行任何修改,即可平滑迁移。这种便捷性极大地降低了上手门槛。
而对于追求极限性能的场景,3FS 提供了 USRBIO 接口。该接口支持零拷贝 (zero-copy) 和**批量异步提交 (batch asynchronous s ...
联想AI生态新品发布:天禧智能体领衔,点燃“热AI自发光”新浪潮5月8日,上海的夜晚因联想而星光熠熠。一场主题为“热 AI 自发光”的天禧AI生态春季新品发布会在此拉开帷幕。开场的“热 AI 时尚秀”以其十足的科技范儿和青春气息,生动诠释了AI技术与年轻一代的激情碰撞。联想在此次盛会上不仅隆重推出了“天禧”和“想帮帮”两大AI智能体,还为年轻用户带来了覆盖各类生活场景的AI终端设备,并特别针对大学生群体启动了“青春有 AI”教育优惠计划。
联想集团高级副总裁、中国消费业务群总经理张华在会上指出:“从AI大语言模型的问世,到如今AI智能体的茁壮成长,我们正见证着碳基生命与硅基智能融合的场景,从科幻电影的想象逐渐走进现实生活。” 本次发布会的核心亮点纷呈:备受瞩目的天禧个人超级智能体迎来了又一次重要升级,朝着全面 L3级别 智能体验迈进;同时,业界首款专为个人智能设备提供AI服务的领域智能体“想帮帮”也正式亮相。一系列具有革新意义的新品同步登场,包括主打颜值与AI摄影的moto AI手机、性能与美学并重的拯救者系列PC及平板,以及全球首款在端侧部署DeepSeek大模型的原生AI平板——Y ...
联想 AI 新势力:moto razr 60 与 edge 60 系列携天禧智能体革新登场5 月 8 日,上海见证了一场以“热 AI 自发光”为核心理念的科技盛宴——联想天禧 AI 生态春季新品超能之夜。在此次发布会上,联想隆重推出了 moto razr 60 系列与联想 moto edge 60 系列智能手机,标志着 AI 手机发展迈入新纪元,用户体验得到全方位提升。
两款新系列手机均深度整合了联想最新的天禧个人超级智能体。这一系统级 AI 的引入,带来了更为迅捷、精准、智能且高效的交互体验。它如同一个全天候待命的智能伙伴,用户仅需一个眼神示意或一句话的需求,无论是语音操控手机、搜寻信息,AI 都能即刻响应,真正实现了人与机器高效协作的“人机共创”新模式。与此同时,备受好评的 AI 翻译 2.0、AI 出行 2.0、AI 通话 2.0、AI 识屏 2.0 等核心功能也迎来了重磅升级。
AI 自由,超凡合拍:联想 moto razr 60 系列,潮流影像新标杆联想 moto razr 系列向来致力于探索时尚美学与尖端科技的和谐统一。新一代联想 moto razr 60 系列在设计上再次 ...
理想汽车的 AI 雄心:VLA 司机大模型如何从“动物”进化至“人类”5 月 7 日,理想汽车举办了“理想 AI Talk 第二季”,主题聚焦于其雄心勃勃的 VLA(Vision-Language-Action,视觉语言行动)司机大模型,并探讨了其从“动物智能”向“人类智能”的进化路径。理想汽车董事长兼 CEO 李想在活动中,不仅深入解读了 VLA 大模型的核心作用、训练方法及其面临的挑战,还分享了他对人工智能发展趋势、创业历程和个人成长的独到见解。
AI 工具的进化阶梯:从信息助手到生产力引擎李想首先对当前 AI 技术的进展,特别是大模型和 Agent(智能体) 的应用前景进行了阐述。他将 AI 工具的成熟度划分为三个层级:
信息工具:当前多数 AI 应用停留于此,能够提供信息,但往往伴随着大量冗余内容,其结果仅具参考价值。
辅助工具:AI 在此阶段能够提升特定任务的效率,例如当前的辅助驾驶系统,但仍离不开人类的监督和介入。
生产工具:这是 AI 发展的终极形态,能够独立完成专业任务,实现效率与质量的飞跃。
李想强调:“判断一个 Agent 是否真正智能,关键在于它能否成为一个生 ...
当前,大型语言模型(LLM)的研究焦点正经历一场深刻的转变——从过去主要依赖“扩展定律”(Scaling Law)进行大规模预训练,逐渐转向更加关注模型在训练后所展现的推理能力。鉴于符号逻辑推理在确保结论的严谨性与普适性方面具有不可替代的价值,提升大模型的逻辑推理能力,已经成为攻克其“幻觉”频现这一顽疾的关键策略。
为了深入推动大语言模型在逻辑推理领域的研究进展,一支由北京大学、清华大学、阿姆斯特丹大学(UvA)、卡内基梅隆大学(CMU)以及穆罕默ド·本·扎耶德人工智能大学(MBZUAI)等五所顶尖学府的研究精英组成的团队,对该领域的前沿研究方法与评测基准进行了全面细致的梳理。他们联手发布了一份名为《Empowering LLMs with Logical Reasoning: A Comprehensive Survey》的调研综述。这份综述聚焦于两大核心科学议题——逻辑问答的准确性与逻辑输出的一致性,系统地归纳了现有解决方案,并对未来的研究图景进行了展望。
值得一提的是,这篇综述论文已成功被国际人工智能联合会议 IJCAI 2025 的 Survey Track 收录。届时,作者 ...

