18143453325 在线咨询 在线咨询
18143453325 在线咨询
所在位置: 首页 > 营销资讯 > 行业动态 > 百度大脑3.0:聚焦多模态深度语义理解

百度大脑3.0:聚焦多模态深度语义理解

时间:2022-03-30 07:15:02 | 来源:行业动态

时间:2022-03-30 07:15:02 来源:行业动态

百度大脑3.0的核心是多模态深度语义理解,具体是指对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的语义理解,包括数据语义、知识语义、视觉语义、语音语义一体化和自然语言语义等多方面的语义理解技术。

换句话说,就是要能让机器听清、看清,从而深入理解语义背后的含义,深度理解真实世界,更好地支撑各种应用。而其中,百度地图语音助手就是语音语义一体化和自然语言处理技术结合最典型的应用场景之一。

王海峰介绍,如今百度高噪声环境Hand-free语音识别准确率已提升了10个百分点,语音语义一体化技术使得远场语音识别准确率提升了10个百分点;在语音合成方面,WaveNet 拼接的情感语音合成技术,使得流畅度和自然度也大幅提升。

此外,他还以对话理解和阅读理解为例,介绍了百度的自然语言理解技术。事实上,百度的对话理解技术已经积累多年,而百度大脑3.0版本中通过研发最新的深层注意力匹配模型,比已知的最好结果又提升了4.1%。在阅读理解技术上,百度大脑已经阅读了千亿量级的文章,相当于6万个中国国家图书馆的藏书,并由此积累了亿级实体、千亿事实的知识。



更有趣的是,借助视觉的语义化技术,百度大脑还被应用在了世界杯的视频解析场景中。大会现场,王海峰播放了一段世界杯球赛视频,视频中,百度大脑可以通过识别视频中的裁判、球、球门、球场线等,捕捉射门、进球、角球、换人等画面,完成机器人解说、精彩片段集锦剪辑、以及数据统计分析等等。



知识是机器理解世界的重要基础,为此,在多元语义知识方面,百度也构建了包含数亿实体、数千亿级事实的庞大知识图谱。除了基础的由实体、属性、关系构成的实体图谱,还针对不同的应用场景和知识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业知识图谱等多种图谱。所有这些,都构成了百度大脑的基础。

通过持续获取和积累知识,百度大脑的理解能力和智能水平还会不断升级,从而更好地服务于用户。王海峰说。

关键词:深度,大脑

74
73
25
news

版权所有© 亿企邦 1997-2022 保留一切法律许可权利。

为了最佳展示效果,本站不支持IE9及以下版本的浏览器,建议您使用谷歌Chrome浏览器。 点击下载Chrome浏览器
关闭