从理论到实践:校企共探大语言模型前沿发展
2025年03月28日
2025年3月25日下午,我司成功举办“DeepSeek技术演进与大语言模型智能赋能”专题分享交流会。深圳大学电子与信息工程学院(深大-软牛人工智能技术联合创新中心)博士研究生周越深度解码大语言模型技术演进图谱,深圳市齐天云科技有限公司联合创始人兼总经理车世华同步分享大模型工程实践经验,现场30余位技术骨干围绕大模型垂直领域应用落地等前沿方向展开深度研讨。本次活动不仅是一次技术分享交流,更是彰显了公司保持前沿学习、深耕前沿技术的热情,以及持续提升创新能力的团队风貌。
技术演进:理论与实践的深度对话
技术分享环节,周越博士以“DeepSeek技术演进与大语言模型智能赋能”为题,深入剖析了语言模型的发展脉络。他从早期模型的局限性切入,结合DeepSeek系列产品的迭代历程,揭示了自主优化架构设计的突破性意义。

在技术实现层面,周越博士重点剖析了训练决策机制中的创新算法设计,以及模型部署中算力分配、硬件适配等核心问题。通过对比DeepSeek V3与R1版本的性能,他清晰阐释了模型压缩与推理优化的关键路径。
从实践应用视角,周越博士分享了DeepSeek在多模态处理领域的工程实践案例,引入了创新应用场景,展示了如何将大模型的高效特征提取能力转化为实际生产力。
此次分享以产研融合双视角展开,为理论与实践的结合提供了有益的参考。
思维碰撞:十问十答,破解技术迷思
在互动环节中,公司人工智能技术团队围绕模型轻量化部署、多模态数据融合等技术痛点,抛出了十个关键问题。周越博士与车总以“学术攻坚+工程实践”的解答模式,对复杂技术问题进行了立体化解析,获得了现场技术人员的高度认可。
尤为值得一提的是,现场人员的问题不仅聚焦于技术细节,还延伸至行业趋势研判。这种打破岗位界限的深度交流,正是公司技术团队保持敏锐创新嗅觉的生动体现。

学习型组织:以技术创新驱动持续进化
交流会结束后,大家纷纷表示此次分享极大地提升了技术认知,而此次交流会正是公司不断构建学习型组织的缩影。
近年来,公司致力于打造学习型组织,沉淀出独具特色的技术分享文化。每年自发组织各类技术分享与交流活动上百场,确保在人工智能技术快速迭代的浪潮中,团队能够时刻保持技术竞争力,将学习成果转化为创新动能。
面向未来,公司将继续大力引进前沿技术与高端人才,依托“深大-软牛人工智能技术联合创新中心”,持续攻克关键技术难题。在这片充满创新活力的热土上,我们将在日常工作中积极践行学习理念,通过技术分享、项目实践和跨部门协作,将学习成果转化为实际的技术突破和业务优化,为产业变革注入源源不断的动力。
《Deepseek技术演进与大语言模型智能赋能》
摘要:本报告聚焦于Deepseek技术,对其进行了全面深入的探讨。首先,回顾了大语言模型的基本概念及其训练范式,并深入剖析了这些模型实现智能赋能的关键机制。接着,梳理了在Deepseek R1问世之前大语言模型的发展格局,揭示了Deepseek脱颖而出的背景与优势。随后,重点介绍了Deepseek V3与R1的核心技术细节,涵盖模型设计、优化策略以及在实际应用中的表现。最后,在大模型迅猛发展的当下,探讨了正确使用大语言模型的方法 论及实际用例,旨在帮助听众充分把握大模型带来的技术革新,推动工作与生活的智能化转型。
周越,深圳大学博士研究生,2024年毕业于南昌大学并获得硕士学位。目前,在深圳大学电子与信息工程学院(深大-软牛人工智能技术联合创新中心)李斌教授的指导下,专注于大模型背景下的多媒体处理研究。
车世华,深圳市齐天云科技有限公司联合创始人,毕业于深圳大学。毕业后,长期深耕于互联网IT行业,曾在腾讯任职12年,积累了丰富的行业经验。如今,致力于推动公司业务发展,专于AI基础架构的研发与落地应用。