7月5日上午消息,百度AI开发者大会2017(Baidu Create 2017)在北京国家会议中心召开。会上,百度AI生态的重要战略、最新技术、业务进展和解决方案首次集中展示。年轻有为 非常强的创新能力。
百度度秘事业部总经理景鲲 围绕百度DuerOS开放平台进行演讲,景鲲表示“唤醒万物”是DuerOS开放平台的核心理念,实现设备和人使用自然语言沟通。相较于鼠标和键盘式的复杂交互方式,语音交互具有更广阔的适用场景;同时得益于ios和Android生态系统的建立,让软硬件生态系统模式得到认可。
DuerOS自今年1月份推出后,已先后与中信国安广视、小鱼在家、哈曼、美的、海尔、联想等企业达成合作。景鲲认为,唤醒万物的核心三要素是要做好听清、听懂、满足。听懂是人工智能时代用数据和技术解决的关键问题。“只有百度在中国市场是唯一具备听清、听懂、满足的实力”,Duros旨在打造一个开放赋能的生态系统。
1)“听清”方面:百度的语音识别率做到了近场识别的准确率97%以上,但这些在AI时代还不够。在AI时代,技术要与场景相结合。我们希望把语音放到真正的场景里面去解决问题,研发了麦克风阵列、回声消除、语音唤醒、人像识别等技术。这些都是我们逐渐推进的世界先进技术,将被放到各种场景中实现用户听清的需求。
2)“听懂”方面:数据多、介入深是打造对话系统的必然条件,具备这两点才能做好一个真正可以对话的“听懂”系统。百度是具备数据量最大的公司。百度拥有亿级的多轮对话数据、十亿级的知识图谱数据。
“‘听懂’的目标,就是要FreeStyle,让用户最自然地跟设备进行交互,毫无拘束。”他现场演示了利用DuerOS的多轮交互过程,这种交互只有百度的技术才能驱动。通过连续发问:“找一找本地人气最火爆的家常菜”、“雍和宫附近有吗”、“第二家有什么推荐菜”、“有wifi吗”、“好停车吗”……多轮连续展开的对话,景鲲都得到了满意的答案。
3)听懂并满足“听一首某某的歌”这样的用户需求还不够,真正用户想要的是更自然、更复杂的需求,比如“我要听我手一杯品尝你的美这首歌”,比如“想听哥哥的歌”,只有把用户在真实场景中表达的复杂请求做好,才能真正做出一个真正听懂用户需求的产品。