首页 新闻中心 文章详情

周年成果|深大-软牛人工智能技术联合创新中心:务实创新,驱动AI技术落地

2025年03月03日

2024年1月,软牛科技与深圳大学强强联合,成立“人工智能技术联合创新中心”,聚焦数字内容生成与安全技术研发。一年来,联合创新中心以技术为笔、以场景为纸,在声音克隆、视频增强、图像鉴伪等领域挥洒创新笔墨,不仅攻克多项技术难关,更将实验室成果转化为产业动能,为人工智能技术的商业化落地开辟新路径。

一、技术突破:从实验室到产业应用的“破壁”实践

(一)声音克隆技术:让声音“智”造无限可能

针对语音交互场景的迫切需求,团队突破技术瓶颈,研发出高精度英语声音克隆模型,已通过企业验收并投入实际应用。该技术可广泛应用于虚拟客服、有声书制作等领域,显著降低语音内容生产成本,助力企业实现“千人千声”的个性化服务。

为夯实技术底座,中心构建了超1000小时的英语语音训练数据库,并独创智能清洗系统,数据筛选准确度提升25%,为行业树立数据治理新标杆。此外,团队研发的音频水印技术为数字版权保护装上“安全锁”,其鉴伪算法在ASVspoof 5国际竞赛中获得第五名,相关成果被顶级会议收录,为全球语音安全领域注入中国智慧。

(二)SDR转HDR视频增强技术:点亮视觉体验新维度

针对影视行业对超高清画质的追求,团队创新研发逆色调映射算法,赋予普通视频“焕新重生”的能力。技术落地后,老旧影视资料得以高效修复,HDR显示效果达到行业领先水平,目前已与多家影视制作公司达成合作意向。支撑技术迭代的1193帧4K视频数据集,也为这一技术的研发奠定基础。

(三)AI生成图像鉴伪技术:为数字世界构筑“防火墙”

面对AI生成内容泛滥带来的信任危机,中心打造出准确率95%的鉴伪模型,可精准识别主流AI平台的生成图像,为社交媒体、新闻出版等行业提供“打假利器”。基于自主研发需求,团队构建了20万张AI生成图像的专项训练集,为模型的高效迭代提供强力支撑。同时,AI换脸识别技术进入攻坚阶段,未来将有效遏制深度伪造滥用,守护数字空间清朗生态。

二、学术与知识产权成果:科研“硬实力”驱动产业升级

(一)科研突破:推动语音与图像处理技术进步

中心成员聚焦语音反欺骗、深度伪造检测等前沿课题,在AAAI、Interspeech等领域顶会及权威学术期刊发表4篇论文。其中,发表于IEEETrans.CSVT(JCR Q1)的双域特征图像鉴伪算法,相较于现有方法检测性能提升7%,展现出卓越的技术优势。

(二)专利布局:为技术落地筑牢“护城河”

围绕音频水印、AI图像鉴别等核心技术,中心提交2项发明专利,构建起从技术研发到商业转化的完整保护链。这不仅巩固了企业的市场竞争优势,更为行业技术标准制定提供重要参考。

三、人才培养与行业协作:产学研共绘生态蓝图

(一)人才孵化:AI精英的“创新工坊”

通过“实战研发+学术深耕”双轮驱动,中心吸引2名博士后领军攻关模型压缩与媒体鉴伪大模型,并带领20余名学生参与企业级项目,打造兼具理论与实践能力的复合型人才。

(二)生态共建:从技术孤岛到产业协同

中心承办的“CSIG中国行”会议吸引百余位行业精英共话大模型时代的媒体信息处理与安全。在2024年高交会上亮相的AIGC鉴伪系统与SDR转HDR技术,获得了行业广泛关注,产学研协同创新的“朋友圈”持续扩大。此外,双方还联合参与制定了《人工智能企业认定与等级评定规范》团体标准,推动行业走向规范化发展。

四、未来展望:从磨合到突破,探索更高效的协作范式

过去一年,中心以“需求牵引研发”的模式高效运转——软牛科技聚焦产业痛点提出技术需求,深圳大学依托科研实力精准攻关,成功实现多项技术从实验室到生产线的“无缝对接”。

面向未来,中心将整合深大科研资源与软牛产业场景,打造“技术研发-中试验证-商业落地”的一站式创新平台,聚焦数字内容安全、超高清视频等赛道,提供系统性技术支撑。联合领域专家攻关多模态生成等前沿领域,以开放创新催生突破性成果。与此同时,中心将持续优化多语种语音克隆、实时视频增强等核心技术,拓展智慧教育、数字文旅等新兴场景。

从技术攻坚到产业赋能,从人才培养到生态共建,联合创新中心用一年时间交出了一份“研以致用”的答卷。未来,中心将持续深化产学研协作,以技术创新驱动产业升级,构建AI技术研究与产业场景深度适配的创新模式,为行业高质量发展提供坚实支撑。