日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > ChatGpt >内容正文

ChatGpt

离线语音识别软件_从音乐识别软件起家,这家公司如何备战车载AI语音市场GGAI对话...

發(fā)布時間:2023/12/4 ChatGpt 37 豆豆
生活随笔 收集整理的這篇文章主要介紹了 离线语音识别软件_从音乐识别软件起家,这家公司如何备战车载AI语音市场GGAI对话... 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

加入高工智能汽車專業(yè)行業(yè)群(自動駕駛5群,車聯(lián)網(wǎng)智能座艙3群,智能網(wǎng)聯(lián)商用車2群),加微信:17157613659,出示名片,僅限智能網(wǎng)聯(lián)汽車軟硬件供應(yīng)商及OEM廠商。

早在2016年,亞馬遜推出的語音助手Alexa在科技圈掀起了一片滔天巨浪。很多人都以為,真正的智能語音時代已經(jīng)拉開了序幕。但現(xiàn)實(shí)卻是,AI語音的落地場景很多,但用戶的使用率較低、體驗(yàn)也不佳。

新的技術(shù)往往要經(jīng)歷兩次出生,一次是新生,一次是重生。誠然,第二次更難!機(jī)器學(xué)習(xí)的演進(jìn),資金與人才的持續(xù)投入,使新晉的一些語音初創(chuàng)公司從技術(shù)上得以較快地趕上語音巨頭的腳步,但也由此走到了發(fā)展瓶頸。

智能語音距離真正的人機(jī)自由交流還有很大的差距,而現(xiàn)階段語音技術(shù)同質(zhì)化的現(xiàn)狀只能迫使中小型公司靠打價格戰(zhàn)來維持市場份額。周而復(fù)始,惡性循環(huán)。

“語音在目前只是一個噱頭,并不是大眾生活的剛需,也沒有真正走進(jìn)用戶的生活場景中?!盨oundhound大中華首席代表劉碩對《高工智能汽車》表示,語音和其他公司的產(chǎn)品數(shù)據(jù)并沒有打通,無法實(shí)現(xiàn)更深入的開發(fā),也自然不能實(shí)現(xiàn)使語音像移動支付一樣,為用戶打造出連貫的使用場景,成為用戶生活的必需品。

不過,場景的局限并沒有限制消費(fèi)者的使用意愿。

劉碩表示,根據(jù)一些主機(jī)廠提供的用戶反饋來看,車載語音是反饋中占比最大,抱怨最多的部分?!斑@證明大家對于語音是有需求的。所以目前的狀況就是大家都想用,但這個技術(shù)又不夠好,這就給我們提供了很大的發(fā)展空間。有痛點(diǎn)才有機(jī)會!”

目前,車載語音技術(shù)存在的缺陷首先是識別系統(tǒng)對環(huán)境的依賴性強(qiáng),特別在高噪音、有回聲的環(huán)境下,語音識別率就會大打折扣。其次,是識別速度、方言等細(xì)節(jié)問題。

“許多人問我方言應(yīng)該怎么處理。我認(rèn)為,如果目前有一種語音技術(shù),或者一種語音場景,能做到讓說普通話的人可以高頻使用了,才需要再去考慮其他方言的問題。現(xiàn)在考慮方言價值不大?!眲⒋T強(qiáng)調(diào)。

源自聽音識曲的老品牌

Soundhound是一家專注于語音AI和智能對話的公司。其產(chǎn)品Houndify是一個獨(dú)立的AI平臺,提供人工智能驅(qū)動的語音技術(shù)服務(wù),包括語音識別、自然語言理解、開發(fā)者工具、知識圖譜等。

公司由斯坦福的幾個學(xué)生于2005年成立,總部設(shè)在加州圣克拉拉,目前在中國設(shè)立了分公司,中文名字為“聲航”。

過去幾年,Soundhound從大眾熟知的音樂識別軟件躋身于全球前列的語音識別平臺,已拿到了包括英偉達(dá)、三星、奔馳、騰訊等行業(yè)巨頭的投資。目前公司將百分之九十的業(yè)務(wù)重點(diǎn)聚焦于汽車行業(yè)。

作為創(chuàng)業(yè)公司,Soundhound已經(jīng)積累了較多的量產(chǎn)車經(jīng)驗(yàn),包括奔馳、現(xiàn)代、起亞、雪鐵龍等。也許站到巨人的肩膀上看風(fēng)景從來就不是容易的事情,但是明晰的發(fā)展思路也可以助力星星之火,以便成燎原之勢。

“Soundhound最大的優(yōu)勢之一就是語音對車外場景的連通?!眲⒋T認(rèn)為,智能語音經(jīng)歷了對車機(jī)的控制,到車身的控制,再到整個生活服務(wù)等邊界的打開,意味著整個語音市場會發(fā)生比較大的變革。

比如,梅賽德斯·奔馳最新搭載的信息娛樂系統(tǒng)MBUX,就是由Soundhound研發(fā)的Houndify提供支持,可以讓用戶“足不出車”,便可以知道車外的信息。

駕駛者說出“嗨,梅賽德斯,我餓了,提供一些適合吃午飯的餐廳,要有免費(fèi)Wi-Fi和停車場”,隨后MBUX就會列出了一些可供選擇的餐廳。

劉碩表示,“Soundhound是業(yè)界唯一一家研發(fā)出支持復(fù)雜多輪以及跨域?qū)υ挼恼Z音公司?!?/strong>

多輪即多次的、有邏輯的、更多互動的對話。如果系統(tǒng)提供的餐廳不是用戶想要的,用戶便可以接著對系統(tǒng)提出更多的要求。比如,“這家餐廳有點(diǎn)遠(yuǎn),幫我找一家更近的”,“我不吃西餐,幫我找家中餐館”,“我想吃川菜”……直到系統(tǒng)提供出最完美的選項為止。

跨域即會話內(nèi)容里包含兩個及兩個以上的域。比如用戶對車載語音說,“我要去廣州看恒大的球賽,什么時候出發(fā)?”這個問題需要體育和導(dǎo)航兩個域的數(shù)據(jù)。第一個域回答今天廣州恒大的比賽在什么時候,哪個體育場,第二個域告訴用戶前往目的地的路程需要多久。

“多輪與跨域是我們獨(dú)有的技術(shù)優(yōu)勢,目前其他公司的產(chǎn)品只能識別簡單的語音,即便是推出了多輪對話的方案,也無法實(shí)現(xiàn)跨域?!眲⒋T表示。

對于產(chǎn)品未來的發(fā)展,他也有自己清晰的定位:“現(xiàn)在要考慮的不是去搶項目,或者低價拿項目。而是在三五年以后,能不能達(dá)到用戶的某一兩個使用場景是和我們密切相關(guān)的,是獨(dú)家的。”

語音到底能不能做成特別智能,對大眾特別有價值?我認(rèn)為會有的,但一開始不是很通用型的,比如什么都可以問,什么都可以回答,這個短期肯定做不到。但我們可能會在某幾個點(diǎn)上做到突破,做出對用戶很有用的東西,這個就夠了。

Soundhound的一個獨(dú)特價值便是其獨(dú)立的AI平臺Houndify,它可實(shí)現(xiàn)開發(fā)人員和企業(yè)所有者能夠在任何地方部署,并保持對品牌和用戶的控制,同時實(shí)現(xiàn)差異化和創(chuàng)新。目前該平臺已吸引了6萬名開發(fā)者。

劉碩強(qiáng)調(diào),Soundhound也有多語言的支持能力。“語音從架構(gòu)上講,包括識別和理解兩大部分,他們有通用的核心引擎。但識別每種語言的模型是不一樣的,所以不同語言都要分別開發(fā)。而且不同國家對于內(nèi)容的需求是不一樣的,比如印度熱衷于板球的內(nèi)容?!?/p>

在劉碩看來,針對這些地域差異的細(xì)節(jié)需求,也要形成個性化的內(nèi)容研發(fā)。對于國內(nèi)的企業(yè)來說能做到這一點(diǎn)的非常的少,特別是在汽車行業(yè)。

建立差異化的技術(shù)優(yōu)勢

識別是一門涉及面很廣的交叉學(xué)科,它與聲學(xué)、語音學(xué)、語言學(xué)、信息理論、模式識別理論以及神經(jīng)生物學(xué)等學(xué)科都有非常密切的關(guān)系。而智能語音除了識別與理解這兩個核心模塊,還有前端的麥克風(fēng)陣列、降噪、TTS、內(nèi)容等模塊,不同的語音廠商也都有各自擅長的地方。

在被問及是否會與競品公司合作時,劉碩表明了開放的心態(tài):“我們可以作為某幾個模塊的提供商,讓其他競品公司來做另外模塊的提供商,大家形成優(yōu)勢互補(bǔ)。目前在國內(nèi)我們已經(jīng)有了幾家簽約的合作伙伴?!?/strong>

劉碩表示,公司目前進(jìn)展比較順利,設(shè)于中國的分公司去年四月份開始招人,目前已有八個人的團(tuán)隊,也拿下了國內(nèi)一個主機(jī)廠的業(yè)務(wù),同時在其他的非汽車的行業(yè)也有自己的業(yè)務(wù)版圖。

但是近兩三年并不急于拿下項目,而是規(guī)劃建立一個三十人的市場及研發(fā)團(tuán)隊,吸納更多科技人才,深耕技術(shù)研發(fā),爭取實(shí)現(xiàn)更多語音模塊的技術(shù)領(lǐng)先,造福更多車企。

SoundHound于2017和2018年融資將近2億美元?,投資方包括三星、KPCB, 美的、騰訊、現(xiàn)代等,估值超過10億美元。劉碩認(rèn)為,充足的資金給了Soundhound更多時間與精力去做更長遠(yuǎn)的事情,為語音界貢獻(xiàn)更多的力量。

除了得到了資金支持,也接觸到了更優(yōu)質(zhì)的客戶資源。他表示,在未來幾年中,Soundhound也有可能會從戰(zhàn)略合作的角度,通過融資的方式使投融資雙方達(dá)成更加密切的業(yè)務(wù)合作關(guān)系。

總結(jié)

以上是生活随笔為你收集整理的离线语音识别软件_从音乐识别软件起家,这家公司如何备战车载AI语音市场GGAI对话...的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。