首页 > 正文
搜狗将在智博会展出其最新人工智能技术和产品

  做搜索引擎、输入法的搜狗,还做起了人工智能。8月20日,记者从搜狗获悉,搜狗将在智博会展出其最新人工智能技术和产品,包括机器同传、语音合成、人脸迁移、明医智能分诊、唇语识别、虚拟主播、旅行翻译宝、录音翻译笔等。

  机器同传

  音色也能同步翻译

  在演讲现场,屏幕上除了显示由机器语音识别的中文内容外,还有其同步翻译的英文内容,实现演讲内容的双语滚动字幕——随着搜狗机器同传的推出,这样的场景已成为现实。

  据悉,搜狗同传应用了搜狗自研的语音识别技术与机器翻译技术,能够将会议演讲者的语音实时转录成文字,并且同步完成翻译,准确率已接近人类同传翻译结果。

  除了中英实时同步翻译外,搜狗机器同传还可以根据说话人的声音进行数据训练,然后将其音色附加到翻译内容中,并输出与说话人原语音音色相同的译文语音,达到真正“音意同步”的同传效果。

  语音合成

  机器也能当“朗读者”

  观众说一段话,再选择一首喜欢的歌曲,机器便能分析该观众的语音数据,与歌曲结合,实现以说话者音色演唱这首歌曲。

  “语音合成又称文语转换技术,能将任意文字转化为清晰自然、富有表现力的语音朗读出来,相当于给机器装上了人工嘴巴。”搜狗相关负责人介绍,该技术涉及声学、语言学、数字信号处理、计算机科学等多个学科技术,是信息处理领域的一项前沿技术,受到了国内外各大科技公司的争相研究,被广泛应用在智能客服、新闻播报、语音导航等众多场景之中。

  人脸迁移

  人人都可有张“明星脸”

  想要成为喜欢的明星的模样,只要选中明星的照片,面对大屏幕,屏幕就可以将该明星的脸与体验者的脸进行融合,面部还能实现各种动态变化——智博会上,观众们还能在现场体验搜狗的人脸迁移技术,有张“明星脸”。

  据悉,搜狗AI人脸迁移技术,结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,只需单张人物图像,就能瞬间完成换脸体验,还可实现面部实时动态变化效果。

  目前,该项技术已运用在直播、视频互动、影视制作以及教育等场景中,未来则将更多地运用到智能生活中。

  虚拟主播

  音容面貌都可被“复制”

  人工智能模仿你的声音和说话方式,“复制”你的容貌和面部表情,并生成一个“你”,然后再以“你”的形态对文本进行播报,而这个“你”是以音视频的方式出现。

  智博会上,只需上传一张自己的照片、说几句话,搜狗虚拟主播还能让观众看到一个“复制”的自己。

  据介绍,搜狗虚拟主播结合了人脸识别、人脸建模、语音合成以及深度学习等多项前沿技术,能将任意文本转化为相应的唇语,为用户提供多模态的交互体验。

  作为具备视频内容生产能力的一项技术,虚拟主播技术可以应用于媒体、教育、医疗、客服等多个行业,节约大量的人力成本,还可以应用于各种具备交互能力的智能软硬件。

  未来,该技术还将和语音交互进行结合,生成虚拟个人助理的形象,以提升人机交互体验等。(记者 杨艺 实习生 刘茜)

编辑: 韩梦霖
城市相册
栏目精选
每日看点
重庆正事儿
本网原创
010070150010000000000000011117111123299562