5月23日午間消息,“點34杯咖啡,人工需要兩分半,而AI收銀員只需要49秒”。在今日舉辦的“云棲大會·武漢峰會”上,阿里云展示了AI點餐技術??蛻粢悦棵?個字的速度,向一臺機器點單,并頻繁更換語句,這臺機器對每次對話均作出了精準應答。
在視頻中可以看到,點單環節包含了修改、刪除、加單等多輪對話,背后是公共場所強噪聲環境下的信號處理和語音識別、流式多意圖口語理解引擎、多模態人機交互等技術模塊的綜合使用。
值得一提的是,在整個交流過程中,沒有出現”hi,點單機“之類呆板的喚醒詞,可直接下單,這也更符合人與人的自然對話。
阿里巴巴語音交互首席科學家鄢志杰告訴新浪科技,如今機器對人類口語的理解能力帶到了新的高度,這完全打破了”語音喚醒+語音指令”傳統命令式交互方式,阿里云首創的流式多意圖口語理解引擎,極大地提升了對人類隨意、自然的口語表達的理解力,“這些模塊并非簡單級聯,而是深度融合而形成了多模態語音交互方案?,F在這套解決方案已經在阿里云上開放,開發者開箱即用”。
阿里云方面介紹,這項解決方案除了可以做收銀員之外,還能在地鐵賣票。目前,上海地鐵已經部署了這一技術。乘客直接說出目的地,售票機便可選擇合適的站點和路線。測試數據顯示,普通買票耗時往往超過30秒,而語音購票全程只需要10秒左右。