多模態(tài)技術(shù),正是打破單一感官的藩籬,讓AI虛擬形象越來越像人類的秘密武器。在現(xiàn)實(shí)世界中,數(shù)據(jù)天然以多模態(tài)的形式存在,人類通過綜合運(yùn)用視覺、聽覺、觸覺、嗅覺等多種感官,來接觸和理解大千世界。
為了探索實(shí)現(xiàn)通用人工智能的路徑,人工智能從單模態(tài)走向多模態(tài)已是大勢(shì)所趨。
以前,Siri等語音助手只有聲音沒有臉,搜索只能依靠輸入文字,機(jī)器看不懂照片的深層含義。如今,借助多模態(tài)技術(shù),AI實(shí)現(xiàn)了圖像、視頻、音頻、語義文本等多維度資源的融合互補(bǔ),不僅決策更加精準(zhǔn),還在行為和智商上更接近人類。
品牌代言是偶像型虛擬人最重要的商業(yè)變現(xiàn)手段。虛擬偶像AYAYI面世至今僅半年,就已經(jīng)與嬌蘭、安慕希、保時(shí)捷等知名品牌合作。據(jù)統(tǒng)計(jì),此前四年,全球范圍內(nèi)與虛擬人物相關(guān)的合作案例,已覆蓋到100家奢侈品、時(shí)尚、美妝零售商。
虛擬人將真正實(shí)現(xiàn)與人類生活交織在一起。不論是在哪里虛擬人都在驅(qū)動(dòng)著更為人性化的體驗(yàn)流程。因而,虛擬人的優(yōu)點(diǎn)在于理解人類以提高效率,諸如自然語言處理這樣的算法進(jìn)展,將培養(yǎng)人類與機(jī)器分享生活的習(xí)慣變得更加自然和流暢,使得人機(jī)溝通中產(chǎn)生越來越多的有效信息。