您的位置:首页 > 聚焦 > 正文
经济观察:人工智能狂飙 厦企发力AI安全
来源:厦门日报 发布时间2023-06-07 21:24:42    

鉴伪“深度合成”内容

快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目,这一项目就是对“深度合成”内容进行鉴别,判断多媒体内容是否属于伪造。


(资料图片)

研究反生成式AI

美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究,并根据业务需要布局相关产品。

推出声音克隆服务 引入智能检测算法

复刻你的声音 还能加“防伪码”

最近,“AI孙燕姿”成了新“顶流”,其通过AI训练,可以用歌手孙燕姿的声音演唱任何你想听到的歌曲,有网友感慨“真假难辨”。

事实上,“AI孙燕姿”背后的声音克隆技术并非新生事物,其应用已涉及娱乐、教育等多个领域。在我市,已有人工智能企业探索声音克隆的应用场景,还有的研究鉴伪技术,防止技术滥用。

声音克隆已用于多种场景

厦门大学信息学院副教授洪青阳说,声音克隆可用在电影配音、有声书、播客等领域,“人们可以根据自己喜好,选择某个已获授权的声音来演绎。再比如,可以克隆已故亲人的声音,让记忆永存。

不久前,厦企云知芯的母公司云知声就上线了“声音克隆”服务。据云知声介绍,其“声音克隆”可全面学习用户的音色和风格,仅需用户二十句左右的原始录音,就可以合成贴近真人的数字声音,且能做到“朗读的语气、语调、情感堪比真人”。

在具体的应用中,云知声方面描绘了几个场景:智能语音音箱中传来儿女的声音,提醒年迈的父母注意天气变化;儿童点读机里生硬的机械音被妈妈轻柔的呢喃所取代……

厦企快商通也将声音克隆技术应用于其研发的数字人软件中。“用户只需提供一段3~5分钟有真人出镜、包含人声的视频,通过我们的软件,就可以根据需求,自动生成一段全新的视频,这个数字人的声音跟真人几乎一模一样。”快商通联合创始人李稀敏说。

用AI反制AI 防止滥用

AI虚拟歌手的风靡,引发人们对声音安全问题的担忧:用AI技术模拟声音进行诈骗的违法行为屡见不鲜,我们如何识别出原版和翻版的声音?

技术产生的问题,当然也能通过技术来解决。去年底,快商通与美亚柏科、华侨大学联合申报的“基于深度学习的可信多媒体鉴定关键技术研究及其产业化应用”课题入选厦门市重大科技项目,这一项目就是对“深度合成”内容进行鉴别,判断多媒体内容是否属于伪造。

与此同时,快商通在其自主研发的数字人、声音复刻等AIGC(生成式AI)技术中,也引入独特的智能检测算法,用于AIGC内容的追踪溯源。李稀敏说:“我们在视频或者音频中隐藏了一个信道,这里头传输的信息有独特的标识,相当于身份名片。退一步说,哪怕信息丢失了,我们也能通过算法检测出声音真伪。”

“任何技术都具有两面性,AIGC在赋能产业数字化进程方面大有作为,但也极其容易被犯罪分子滥用。因此,发展AIGC的同时,也需要持续深化可信技术。”李稀敏说。

【解密】

训练一位AI歌手 仅需三步

任何曲风都能驾驭,且没有违和感,“AI孙燕姿”是怎么炼成的?

厦门大学信息学院副教授洪青阳告诉记者,以“AI孙燕姿”为代表的AI虚拟歌手,由语音转换(Voice Conversion)技术打造,属于声音克隆的一种。所谓语音转换,简单理解,就是把A的音色转换成B的音色,与此同时,保留A说话或唱歌的内容以及语气、语调等细节。

洪青阳说,训练AI歌手的过程大致分为三步,以“AI孙燕姿”翻唱周杰伦的《发如雪》为例:先用专门的音频软件,把《发如雪》的伴奏和周杰伦的人声分离;再用处理好的孙燕姿的干声(去噪的无音乐纯人声)数据,向机器“投喂”,训练出一个具备孙燕姿音色的声学模型;最后用这一模型对《发如雪》歌曲文件进行音色转换,最终得到“AI孙燕姿”翻唱的《发如雪》。

“完成语音转换的前提是,需具备所模仿对象B的目标音频,所以它并不是无中生有的。”洪青阳说,除了语音转换以外,声音克隆还包括个性化语音合成技术(TTS),可以实现文本转语音,其优点是不需要被模仿对象B说过同样的话,内容定制更自由,比如,“写一首全新的歌让AI演唱,但这种情况下,因为没有‘依葫芦画瓢’的目标音频,AI唱得可能像孙燕姿的音色,但不像周杰伦的唱法。”

【记者手记】

眼见 不一定为实

耳听 也可能为虚

今年以来,AI频频出圈,除了技术更新迭代快以外,还有一个重要原因是,AIGC(生成式AI)使创作门槛降低了。正如福建省人工智能协会会长陆阳所言,当AI从感知智能走向认知智能,极大提升了个人用户的生产力,“人们可以不断地生产图像、视频、音频……未来,人人都可以是AI创作家。”

不过,AIGC仍处于发展的早期阶段,其相关法律法规、标准体系等尚不健全。有法律人士提醒,站在被翻唱歌曲权利人的角度,AI歌手存在侵权问题。当我们利用AI工具生产内容的同时,得紧绷知识产权这根弦。与此同时,我们也应提高防骗意识,毕竟,在AI狂飙的时代,眼见不一定为实,耳听也可能为虚。

大模型广泛应用 赋能近百个大数据项目

“最强大脑”直面算力难题

昨日,苹果发布首款混合现实(MR)头戴式设备Apple Vision Pro(简称“苹果头显”),继ChatGPT之后,再次引发大家对人工智能的广泛关注。今年以来,我市多家电子信息企业紧跟行业趋势,纷纷涉足脑机接口、大模型等人工智能新领域。

根据发布会介绍,苹果头显将聚焦游戏、工作、交流,这款设备将把世界带入“空间计算”。除了硬件之外,算力也是其发挥作用的一个重要支撑。

值得一提的是,随着AI技术不断升级,其安全也愈发受到重视,美亚柏科正对包括反生成式AI在内的AI安全及监管领域进行研究,并根据业务需要布局相关产品。

算力支撑

依托超算平台 推动大模型应用

在ChatGPT之后,基于各自算力,国内行业“大咖”百度、腾讯、阿里、华为等先后发布大模型。前不久,云知声山海大模型也在北京发布,展示了其在语言、逻辑、数学等领域的十大核心能力。这一大模型的背后,正是依托东南区域最强超算平台——厦门Atlas智算中心提供的高效稳定算力,近200P算力支撑千亿规模的模型训练,在两个月内完成。

云知声东南总部总经理陆阳向记者透露,为了满足山海大模型的需求,他们在厦门Atlas智算平台和DCML模型工厂基础上,扩充算力,攻关工程优化和数据优选。这期间,厦门区域完成了算力扩容、算法验证、并行加速、数据优选等,实现GPT为核心的架构升级。

另一家厦企美亚柏科的MYAI大模型目前在顺利推进,日前,其相关负责人透露,大模型已在公共安全、政务、税务、企业数字化转型等多个领域的近百个大数据项目建设中,得到广泛应用。美亚柏科建设的厦门市超级计算中心,截至目前有1000多台服务器,算力达1966万亿次/秒,主要为大数据、人工智能技术基础研发提供算力支撑。

软硬发力

关注并参与脑机接口领域

作为人工智能的新领域,脑机接口也正在受到关注,其主要是实现脑与设备的信息交互。为促进我国脑机接口领域的交流合作,推动脑机接口技术产学研用全链条发展,由厦企盈趣科技参与承办的“首届脑机接口大会”将于下个月召开。

前不久,盈趣科技“牵手”天津大学等,在我市成立北洋脑机接口与智慧健康创新研究院,将围绕新型神经信号感知与检测、组织工程与神经仿生、新一代高通量脑机交互技术、人机共融基础核心器件开发转化平台等方向开展科学研究,旨在构建完整的自主知识产权集群,实现脑机交互技术链条全覆盖。

盈趣科技为客户定制化研发的合作模式,使得其核心能力从早期的精密塑胶件,逐渐延伸至核心电子组件、人机交互系统(电助力自行车人机交互系统、车载hud)等,也是他们与其他电子ODM企业的核心差异。

另一家厦企弘信电子则在电子元器件上发力,日前他们在互动平台上也透露,他们关注并看好脑机接口带来的发展机遇,成功独家为小米铁蛋机器人,提供全套电路板解决方案。同时,他们的产品正应用到多款智能眼镜及AR、VR硬件产品中,今年以来,这个领域的订单显著增长。

值得一提的是,前不久,弘信电子与燧原科技签订合作协议,双方正共同开发高算力、高能效比的人工智能训练推理能力,打造适合人工智能应用与训练基础能力的国产化算力平台。

关键词:

推荐内容