经济观察：人工智能狂飙厦企发力AI安全

您的位置：首页 > 聚焦 > 正文

经济观察：人工智能狂飙厦企发力AI安全

来源：厦门日报发布时间2023-06-07 21:24:42

鉴伪“深度合成”内容

快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目，这一项目就是对“深度合成”内容进行鉴别，判断多媒体内容是否属于伪造。

(资料图片)

研究反生成式AI

美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究，并根据业务需要布局相关产品。

推出声音克隆服务引入智能检测算法

复刻你的声音还能加“防伪码”

最近，“AI孙燕姿”成了新“顶流”，其通过AI训练，可以用歌手孙燕姿的声音演唱任何你想听到的歌曲，有网友感慨“真假难辨”。

事实上，“AI孙燕姿”背后的声音克隆技术并非新生事物，其应用已涉及娱乐、教育等多个领域。在我市，已有人工智能企业探索声音克隆的应用场景，还有的研究鉴伪技术，防止技术滥用。

声音克隆已用于多种场景

厦门大学信息学院副教授洪青阳说，声音克隆可用在电影配音、有声书、播客等领域，“人们可以根据自己喜好，选择某个已获授权的声音来演绎。再比如，可以克隆已故亲人的声音，让记忆永存。

不久前，厦企云知芯的母公司云知声就上线了“声音克隆”服务。据云知声介绍，其“声音克隆”可全面学习用户的音色和风格，仅需用户二十句左右的原始录音，就可以合成贴近真人的数字声音，且能做到“朗读的语气、语调、情感堪比真人”。

在具体的应用中，云知声方面描绘了几个场景:智能语音音箱中传来儿女的声音，提醒年迈的父母注意天气变化；儿童点读机里生硬的机械音被妈妈轻柔的呢喃所取代……

厦企快商通也将声音克隆技术应用于其研发的数字人软件中。“用户只需提供一段3~5分钟有真人出镜、包含人声的视频，通过我们的软件，就可以根据需求，自动生成一段全新的视频，这个数字人的声音跟真人几乎一模一样。”快商通联合创始人李稀敏说。

用AI反制AI 防止滥用

AI虚拟歌手的风靡，引发人们对声音安全问题的担忧:用AI技术模拟声音进行诈骗的违法行为屡见不鲜，我们如何识别出原版和翻版的声音？

技术产生的问题，当然也能通过技术来解决。去年底，快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目，这一项目就是对“深度合成”内容进行鉴别，判断多媒体内容是否属于伪造。

与此同时，快商通在其自主研发的数字人、声音复刻等AIGC（生成式AI）技术中，也引入独特的智能检测算法，用于AIGC内容的追踪溯源。李稀敏说:“我们在视频或者音频中隐藏了一个信道，这里头传输的信息有独特的标识，相当于身份名片。退一步说，哪怕信息丢失了，我们也能通过算法检测出声音真伪。”

“任何技术都具有两面性，AIGC在赋能产业数字化进程方面大有作为，但也极其容易被犯罪分子滥用。因此，发展AIGC的同时，也需要持续深化可信技术。”李稀敏说。

【解密】

训练一位AI歌手 仅需三步

任何曲风都能驾驭，且没有违和感，“AI孙燕姿”是怎么炼成的？

厦门大学信息学院副教授洪青阳告诉记者，以“AI孙燕姿”为代表的AI虚拟歌手，由语音转换（Voice Conversion）技术打造，属于声音克隆的一种。所谓语音转换，简单理解，就是把A的音色转换成B的音色，与此同时，保留A说话或唱歌的内容以及语气、语调等细节。

洪青阳说，训练AI歌手的过程大致分为三步，以“AI孙燕姿”翻唱周杰伦的《发如雪》为例:先用专门的音频软件，把《发如雪》的伴奏和周杰伦的人声分离；再用处理好的孙燕姿的干声（去噪的无音乐纯人声）数据，向机器“投喂”，训练出一个具备孙燕姿音色的声学模型；最后用这一模型对《发如雪》歌曲文件进行音色转换，最终得到“AI孙燕姿”翻唱的《发如雪》。

“完成语音转换的前提是，需具备所模仿对象B的目标音频，所以它并不是无中生有的。”洪青阳说，除了语音转换以外，声音克隆还包括个性化语音合成技术（TTS），可以实现文本转语音，其优点是不需要被模仿对象B说过同样的话，内容定制更自由，比如，“写一首全新的歌让AI演唱，但这种情况下，因为没有‘依葫芦画瓢’的目标音频，AI唱得可能像孙燕姿的音色，但不像周杰伦的唱法。”

【记者手记】

眼见 不一定为实

耳听 也可能为虚

今年以来，AI频频出圈，除了技术更新迭代快以外，还有一个重要原因是，AIGC（生成式AI）使创作门槛降低了。正如福建省人工智能协会会长陆阳所言，当AI从感知智能走向认知智能，极大提升了个人用户的生产力，“人们可以不断地生产图像、视频、音频……未来，人人都可以是AI创作家。”

不过，AIGC仍处于发展的早期阶段，其相关法律法规、标准体系等尚不健全。有法律人士提醒，站在被翻唱歌曲权利人的角度，AI歌手存在侵权问题。当我们利用AI工具生产内容的同时，得紧绷知识产权这根弦。与此同时，我们也应提高防骗意识，毕竟，在AI狂飙的时代，眼见不一定为实，耳听也可能为虚。

大模型广泛应用赋能近百个大数据项目

“最强大脑”直面算力难题

昨日，苹果发布首款混合现实（MR）头戴式设备Apple Vision Pro（简称“苹果头显”），继ChatGPT之后，再次引发大家对人工智能的广泛关注。今年以来，我市多家电子信息企业紧跟行业趋势，纷纷涉足脑机接口、大模型等人工智能新领域。

根据发布会介绍，苹果头显将聚焦游戏、工作、交流，这款设备将把世界带入“空间计算”。除了硬件之外，算力也是其发挥作用的一个重要支撑。

值得一提的是，随着AI技术不断升级，其安全也愈发受到重视，美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究，并根据业务需要布局相关产品。

算力支撑

依托超算平台 推动大模型应用

在ChatGPT之后，基于各自算力，国内行业“大咖”百度、腾讯、阿里、华为等先后发布大模型。前不久，云知声山海大模型也在北京发布，展示了其在语言、逻辑、数学等领域的十大核心能力。这一大模型的背后，正是依托东南区域最强超算平台——厦门Atlas智算中心提供的高效稳定算力，近200P算力支撑千亿规模的模型训练，在两个月内完成。

云知声东南总部总经理陆阳向记者透露，为了满足山海大模型的需求，他们在厦门Atlas智算平台和DCML模型工厂基础上，扩充算力，攻关工程优化和数据优选。这期间，厦门区域完成了算力扩容、算法验证、并行加速、数据优选等，实现GPT为核心的架构升级。

另一家厦企美亚柏科的MYAI大模型目前在顺利推进，日前，其相关负责人透露，大模型已在公共安全、政务、税务、企业数字化转型等多个领域的近百个大数据项目建设中，得到广泛应用。美亚柏科建设的厦门市超级计算中心，截至目前有1000多台服务器，算力达1966万亿次/秒，主要为大数据、人工智能技术基础研发提供算力支撑。

软硬发力

关注并参与脑机接口领域

作为人工智能的新领域，脑机接口也正在受到关注，其主要是实现脑与设备的信息交互。为促进我国脑机接口领域的交流合作，推动脑机接口技术产学研用全链条发展，由厦企盈趣科技参与承办的“首届脑机接口大会”将于下个月召开。

前不久，盈趣科技“牵手”天津大学等，在我市成立北洋脑机接口与智慧健康创新研究院，将围绕新型神经信号感知与检测、组织工程与神经仿生、新一代高通量脑机交互技术、人机共融基础核心器件开发转化平台等方向开展科学研究，旨在构建完整的自主知识产权集群，实现脑机交互技术链条全覆盖。

盈趣科技为客户定制化研发的合作模式，使得其核心能力从早期的精密塑胶件，逐渐延伸至核心电子组件、人机交互系统（电助力自行车人机交互系统、车载hud）等，也是他们与其他电子ODM企业的核心差异。

另一家厦企弘信电子则在电子元器件上发力，日前他们在互动平台上也透露，他们关注并看好脑机接口带来的发展机遇，成功独家为小米铁蛋机器人，提供全套电路板解决方案。同时，他们的产品正应用到多款智能眼镜及AR、VR硬件产品中，今年以来，这个领域的订单显著增长。

值得一提的是，前不久，弘信电子与燧原科技签订合作协议，双方正共同开发高算力、高能效比的人工智能训练推理能力，打造适合人工智能应用与训练基础能力的国产化算力平台。

关键词：

推荐内容