站内搜索:
AI读唇、AI换脸、分诊助手小汪…… 搜狗AI天团登陆智博会
日期:[2018-08-24]  版次:[A17]   版名:[财眼]   字体:【
■2018重庆智博会S3馆搜狗展区。

8月23日,首届中国国际智能产业博览会以“智能化:为经济赋能,为生活添彩”为主题,在渝开幕。 在新技术、新产品云集的智博会现场,搜狗展示了旗下多项AI科技成果,“AI读唇术”、“虚拟主播”等趣味又实用的AI黑科技,让搜狗成为本届智博会最“吸睛”的展台。

AI读唇术——科幻片场景成现实

唇语识别技术体验区是搜狗展台的一大热门。现场观众只需对着大屏幕默声说一句话,如古诗 “长风破浪会有时,直挂云帆济沧海”,无需发出声音,机器就能通过面部识别和唇型特征读出对应的发音,识别其说话内容,并生成文字呈现于大屏幕。“不出声,只动嘴,就知道你在说什么”这一科幻片技能现已成真。

经过数千小时真实唇语数据训练,搜狗“唇语识别”系统在车载、家居等场景下已达到90%的识别准确率。可以预见,在残障教育和公共安全等不易捕捉语音、不易了解语义的情况下,唇语识别技术将大有作为。

AI换脸术?人人都能72变

展台风头最盛的,当属搜狗“人脸迁移”体验区。观众只要选择自己喜欢的明星,镜头便会捕捉观众的人脸并与明星脸进行智能融合,生成专属观众的“明星脸”。从娱乐圈顶级男神彭于晏,再到今夏爆火《延禧攻略》强势女主“魏璎珞”(吴谨言)“秒变明星脸”的新鲜体验,引得众多参展者体验、围观,并纷纷感叹:“真是太厉害太神奇了!”

据了解,搜狗人脸迁移技术结合了人脸识别、三维人脸拟合、表情控制等多项前沿技术,能瞬间完成“换脸”,并可实现面部实时动态变化效果,跟随用户的脸部动作,完成多种表情、口型的变化。未来,该项技术还可运用在教育、直播、视频互动、影视制作等丰富场景中。

AI新闻播报员?是高定AI在说话

这次的智博会上,搜狗还带来了高定版的个性化语音合成。横跨商界、政界、演艺界的三位顶级“AI播报员”降临现场,观众可以“钦点”任意一位来为自己播报新闻。

更具特色的是,搜狗目前已实现语音风格迁移。现场,机器通过学习源说话人的少量数据,如学习搜狗CEO王小川的少量语料,再匹配歌曲《蓝精灵之歌》,通过风格迁移技术,最终能生成王小川版《蓝精灵之歌》。这版歌曲中既包含了歌曲的曲调和节奏,也融入了王小川的声线及语言风格,生动有趣,极富个性。

据了解,搜狗个性化语音合成技术仅使用个人10分钟左右的语音数据,即可训练生成具有该说话人特色的音色,合成效果处行业领先水平。今年搜狗初次征战国际顶尖语音合成大赛“Blizzard Challenge 2018”即斩获两项冠军,技术实力惊艳全球。

AI+医疗——让权威、真实有效的医疗信息触手可得

在搜狗明医智能分诊体验区,搜狗“分诊助手小汪”也收获了不少粉丝,成为了最受“科技老年团”欢迎的AI产品之一。参展者通过与小汪互动,可以了解自己可能患有的病症。比如,有体验者告诉小汪“肚子疼”时,它会询问具体的症状细节,并根据体验者的症状描述,给出相应的病症判断,并建议前往相关科室就诊,不少体验者纷纷感慨“小汪很厉害,这项功能很是实用”。

作为搜狗独家首创的、将AI技术与医疗搜索创新结合的一项功能,搜狗明医智能分诊功能,通过模拟医生与患者对话的模式,针对性别、年龄、病症等问题与体验者展开多轮对话,为用户提供了症状初步诊断和医院分诊等贴心服务。

除了智能分诊服务外,搜狗明医一直秉承“让权威、真实有效的医疗信息触手可得”的理念,今年新整合了全球700余家权威健康网站的近千万优质内容,让海内外权威健康信息得以更快捷精准地传递给亿万用户,为用户了解病情提供更多便利。

两大AI翻译硬件亲测 网红出国必备神器

硬件方面,搜狗今年大热的两大AI翻译硬件——能支持42种语言互译的“搜狗旅行翻译宝”和33种语言对话翻译的“搜狗录音翻译笔”,也亮相本次智博会。在语音识别、图像识别、AI机器翻译、语音合成等多重人工智能技术的加持下,搜狗的AI翻译机已成为“便携翻译官”,吸引了现场诸多中外友人光顾展台。

除了“AI换脸术”、“搜狗旅行翻译宝”等技术产品外,搜狗还在智博会现场展示了虚拟主播技术、儿童智能硬件、语音识别等多项AI技术和产品,仿佛坐上了开往未来的快车,让参展者切身体会到AI技术对外貌、沟通、安全等生活各方面带来的改变与便利。未来,搜狗还将持续发力人工智能领域,让概念性技术逐步落到实用性产品中,推动中国智能产业发展,连接智慧生活。(郑志辉)

特别报道

分享到:
  以上内容版权均属广东新快报社所有(注明其他来源的内容除外),任何媒体、网站或个人未经本报协议授权不得转载、链接、转贴或以其他方式复制发布/发表。