智能时代新底座：操作系统如何承载AI技术跃迁

来自腾讯、AMD、沐曦、雾帜智能、合合信息等头部企业的技术专家齐聚一堂，通过案例解析、技术实践与生态协同路径分享，为行业呈现了一场覆盖“底层算力-系统优化-场景应用”全链路的思维碰撞。

CSDN资讯

40919人浏览 · 2025-04-25 18:07:24

CSDN资讯 · 2025-04-25 18:07:24 发布

2025年4月19日，由OpenCloudOS社区与腾讯云联合主办的OC城市行·上海站“OS为基，AI为翼：驱动产业革新与技术升级”技术会议在上海机遇星球成功举办。会议采用线上线下联动形式，吸引了近百位AI行业及泛互企业CTO、技术负责人等核心决策者参会，线上观看人次超5万。在数字化转型加速、AI技术全面渗透产业的大背景下，本次会议聚焦操作系统与人工智能技术的深度融合，围绕算力优化、安全防护、大模型推理、多模态知识管理等前沿议题展开深度探讨。

本次大会中，来自腾讯、AMD、沐曦、雾帜智能、合合信息等头部企业的技术专家齐聚一堂，通过案例解析、技术实践与生态协同路径分享，为行业呈现了一场覆盖“底层算力-系统优化-场景应用”全链路的思维碰撞，旨在推动技术生态协同创新，助力企业在异构算力时代精准配置资源、突破效率瓶颈。

01 腾讯高级工程师、OpenCloudOS Stream SIG Maintaine王烁：OpenCloudOS在AI场景下的技术创新实践

当前，全球数字化转型进入深水区，AI技术规模化落地对操作系统提出全新要求。面对日益复杂的算力场景、几何级增长的数据安全挑战以及多元异构硬件的兼容需求，构建自主可控、性能卓越的智能基础设施成为关键命题。在此背景下，腾讯联合生态伙伴发起的开源操作系统OpenCloudOS，持续探索面向AI时代的技术演进路径。

本次大会上，腾讯高级工程师、OpenCloudOS Stream SIG Maintainer王烁以《OpenCloudOS在AI场景下的技术创新实践》为题，系统分享了OpenCloudOS在安全加固、性能优化及生态兼容方面的突破性进展，为行业提供可参考的底层技术解决方案。软件生态上，OpenCloudOS已适配超9.6万款软硬件，支持30+主流AI框架（如PyTorch、DeepSpeed）及50+GPU/NPU加速卡，覆盖金融、政务、工业等12大行业，累计装机量突破1500万节点。

性能方面，其自研内核优化技术显著提升并发处理能力，在典型AI场景中网络吞吐提升35.68%、存储I/O性能提升86.15%，并通过容器化与云原生技术实现资源利用率优化。针对数据安全与性能需求，OpenCloudOS构建了多层防护体系，支持全栈国密算法（SM2/SM3/SM4）和机密计算技术，并通过可信启动（Secure Boot）与热补丁修复机制，将宕机率较CentOS降低70%，保障业务连续性。

王烁还强调，OpenCloudOS通过大模型驱动的自动化工具链（如AutoPkg自动打包、AI辅助漏洞修复），显著降低用户迁移与运维成本，并计划2025年推动异构算力融合与全行业场景覆盖，打造“性能更优、生态更广”的下一代操作系统底座。

02 AMD大中华区数据中心事业部高级技术专家佃锐辉：AMD EPYC助力优化AI计算

AI 应用的爆发式增长，带来了海量数据处理与复杂模型训练的需求，单一计算架构已无法满足行业发展。构建多元化、协同化的算力生态，成为行业突破智能计算瓶颈的必然选择。

对此，OpenCloudOS社区生态伙伴AMD大中华区数据中心事业部高级技术专家佃锐辉，在《AMD EPYC助力优化AI计算》的演讲中，重点解析了第五代EPYC Turin处理器的技术突破：采用“Zen 5”架构，单芯片最高支持128核（标准版）或192核（Zen 5c高密度版），且Turin主频最高型号可达5GHz，显著提升AI场景的计算密度与能效比。

此外，AMD与OpenCloudOS社区的深度合作成为亮点——双方在OS内核中融入SEV/SNP安全特性、Zen5架构优化等新功能，并联合腾讯云推出基于EPYC处理器的DeepSeek大模型推理实例，实测显示AI训练吞吐量有明显提升。佃锐辉强调，AMD通过“高核心数+高频率”的硬件设计，结合开源生态适配，为企业在异构算力时代提供了兼顾性能与成本的高性价比解决方案。

03 沐曦AI解决方案高级技术专家叶伟：国产高效算力引擎——全栈自研GPU软件生态赋能大模型创新

当前，大模型训练对算力规模与集群效率提出指数级需求，传统GPU架构在计算效率、多卡协同及容错机制上面临严峻挑战。如何构建自主可控的算力底座，同时突破跨架构生态壁垒，成为国产GPU破局的关键。

沐曦AI解决方案高级技术专家叶伟在《国产高效算力引擎：全栈自研GPU软件生态赋能大模型创新》中，系统介绍了沐曦自研的MXMACA®全栈GPU软件生态。其核心优势在于“兼容+均衡”——通过CUDA生态兼容技术实现零代码迁移，并基于自研MetaXLink多卡互联架构，突破传统GPU在计算、存储、通信的“木桶效应”，支持多精度混合算力与异构集群混训。目前已深度适配OpenCloudOS等操作系统，为大模型创新与部署提供坚实保障。

在大模型训练场景中，MXMACA®通过TP Overlap技术将通信与计算并行化，使Llama2-70B的MFU（模型算力利用率）提升10%至70%以上；结合异步Checkpoint与自动故障恢复系统，千卡集群有效训练时长（ETTR）超过98.8%。此外，叶伟还分享了与DeepSeek的合作实践：通过EP（专家并行）优化推理部署，在保证20 Token/秒用户体验的同时，单GPU吞吐量提升至行业领先水平，验证了国产GPU在智算场景的技术突破与生态成熟度。

04 上海雾帜智能科技有限公司联合创始人&CTO傅奎：基于AI+SOAR的智能网络安全运营平台技术探索与实践

随着网络攻击呈现自动化、智能化趋势，传统安全运维模式深陷告警疲劳与响应孤岛的双重困境。如何将碎片化防御能力转化为体系化作战优势，成为构建下一代安全运营平台的核心命题。雾帜智能以「AI+SOAR」为技术支点，通过重构人机协同机制实现安全决策的闭环加速。

在《基于AI+SOAR的智能网络安全运营平台技术探索与实践》演讲中，上海雾帜智能科技有限公司联合创始人&CTO傅奎聚焦安全响应效率的颠覆性提升，指出传统安全运营高度依赖人工操作，面临“告警淹没、响应迟缓”的痛点。其团队打造的HoneyGuide智能安全运营平台，通过SOAR（安全编排与自动化响应）技术，将专家经验固化为可拖拽的“安全剧本”，实现分钟级甚至秒级应急响应。

例如，一键封禁IP耗时从人工5-10分钟压缩至30秒，钓鱼邮件分析效率提升10倍以上。此外，平台深度融合大模型能力，构建AI虚拟SOC团队——模拟指挥官、分析员、响应员等多角色协作，通过自然语言交互自动生成决策链（如风险研判、策略生成、动作执行），并支持500+主流安全产品的无缝对接。

傅奎还强调，雾帜智能已完成OpenCloudOS深度适配，通过全栈国密算法支持与内核性能优化，实现威胁响应效率提升数十倍，覆盖金融、政务等对安全合规性要求严苛的场景。

05 腾讯云异构计算技术专家陈海武：揭秘高性能LLM奥秘——TACO-LLM大模型推理技术的探索与实践

在大模型加速落地的产业实践中，推理侧的高效性与经济性正成为制约规模化应用的隐形闸门。面对显存资源碎片化、长尾请求调度难等共性瓶颈，传统优化方案往往陷入“拆东补西”的局部博弈。腾讯云异构计算团队以系统级创新破局，推出TACO-LLM推理引擎，通过架构重构与软硬协同的穿透式优化，打通从芯片指令集到分布式调度的全栈效能通道。

来自腾讯云的异构计算技术专家陈海武，在其分享中为大家系统解析了大模型推理的核心挑战与性能突破路径。针对显存碎片化、调度效率低等瓶颈，TACO-LLM通过三大创新技术实现性能跃升：

1.Continuous Batching：动态批处理技术消除计算“气泡”，在千卡集群中实现95%线性度，吞吐量较静态批处理提升2倍；

2.Speculative Sampling：结合大小模型协同推理，通过“草稿生成+验证”机制，首字延迟降低40%，解码吞吐提升1.8-2.5倍；

3.TurboAttention：专为长序列设计的自研算子，结合分块管理与FlashAttention优化，8K长文本推理显存占用减少30%，计算效率提升86%。

陈海武还分享了DeepSeek相关模型的推理优化实践：基于OpenCloudOS与NVIDIA H800硬件，采用EP（专家并行）优化部署，在MOE模型推理中实现通信-计算重叠，单机NVLink带宽利用率超95%，多机RDMA效率达90%，验证了推理引擎在复杂场景下的技术成熟度。

通过TACO-LLM 与 OpenCloudOS的 “强强联合”，OpenCloudOS凭借对底层硬件的深度优化能力，全面支持满血版 DeepSeek R1，在双机16卡的硬件环境下，无论是短输入场景（如知识问答）以及长输入场景（如私有信息的检索增强生成），推理性能都有大幅提升！为企业降低算力成本、提升竞争优势提供了全新解决方案。

06 合合信息智能创新事业部资深架构师柳宣泽：TextIn——基于多模态RAG的GenAI进化路径实践

在企业加速拥抱知识驱动的进程中，海量合同、票据等非结构化文档犹如“数据暗物质”，传统OCR与规则引擎难以穿透格式壁垒与语义断层，导致知识资产陷入沉睡。合合信息以「文档智能」为支点，率先构建从数据解析到决策联动的认知进化链路。其自研的多模态RAG技术突破跨模态对齐与动态场景适配瓶颈，让碎片化文档蜕变为可计算、可演进的业务燃料。

合合信息智能创新事业部资深架构师柳宣泽聚焦企业知识管理的非结构化数据挑战，提出“文档智能-知识萃取-场景进化”三阶路径。其核心产品TextIn智能文档处理平台，通过自研多模态RAG技术（检索增强生成），突破传统方法在跨模态语义对齐、格式兼容性等瓶颈，实现PDF、Word、扫描件等复杂文档的端到端知识闭环。

例如，平台采用ParseX逻辑分块技术替代传统字符分块，结合语义路由机制，百页文档解析耗时压缩至3秒。在金融场景中，TextIn支持合同、票据、信用证等100+文档类型的自动审核与风险溯源，单页处理成本低于0.1元。柳宣泽还强调，并通过DocFlow动态知识流技术实现金融、保险、制造、供应链、医疗等场景的智能决策闭环，验证了多模态RAG和Agent在产业数字化中的规模化落地能力。

07 如何参与OpenCloudOS社区

OpenCloudOS 社区以 “开源共建、生态共赢” 为核心，构建了从技术研发到产业落地的全链路协作模式，目标是打造 “国产操作系统的开源标杆”，为数字经济的底层安全与创新提供坚实支撑。社区成员可通过以下四大共建路径参与其中：

1.适配共建：企业可通过软硬件兼容性适配融入生态，社区目前累计支持9.6 万 + 产品，如AMD、沐曦等厂商已有深度合作案例；

2.技术共建：开发者可加入社区的100+ SIG 组，这些小组覆盖 AI、内核、云原生等领域。开发者能参与 OpenCloudOS 9 内核优化、热补丁工具开发等核心项目；

3.生态共建：高校可借助开源课程（例如北京大学选修课）、操作系统设计赛来培养相关人才。山东大学团队已贡献151+ PR 并成立开源俱乐部，这就是生态共建的良好范例；

4.个人参与：社区推出“OpenCloudOS Wow” 计划，开发者可以在该计划中领取新手至挑战级任务，比如文档优化、漏洞修复等。通过“OpenCloudOS Wow”计划，目前已有累计 1053 名学生参与并获得社区认证。Wow计划详情：https://opencloudos.org/ospages/community/star

未来，社区还将深化边缘计算、AI 算力融合等场景的技术协同，持续推动国产操作系统的发展。