音视频会议神器!阿里云通义听悟正式发布:轻松记录总结、实时翻译
快科技6月1日消息,今天上午阿里云正式發(fā)布了新品——通義聽悟。
這是一款基于通義千問語言模型、音視頻AI模型能力,能為用戶帶來音頻、視頻內(nèi)容記錄和閱讀全新體驗(yàn)的AI助手,幫助隨時(shí)隨地高效完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理,比如用大模型自動(dòng)做筆記、整理訪談、提取PPT等,可成為用戶工作學(xué)習(xí)中的得力AI助手。
目前通義聽悟已經(jīng)在,用戶使用阿里云賬號(hào)登錄,公測期可領(lǐng)取100小時(shí)以上聽悟免費(fèi)轉(zhuǎn)寫時(shí)長,體驗(yàn)所有AI功能,含全文概要、章節(jié)速覽、發(fā)言總結(jié)等高階AI功能,并獲贈(zèng)使用權(quán)益。
阿里云CTO周靖人介紹,聽悟集成了阿里最先進(jìn)的語音和語言技術(shù)。
融合自研語音語義多模態(tài)說話人算法,能對(duì)10人以上說話場景進(jìn)行角色區(qū)分;接入通義千問大模型后,能夠?qū)ι先f字的音視頻內(nèi)容進(jìn)行摘要總結(jié),事實(shí)準(zhǔn)確與要點(diǎn)完備性國內(nèi)領(lǐng)先,支持跨多音視頻內(nèi)容的精準(zhǔn)問答理解。
據(jù)介紹,通義聽悟可以進(jìn)行實(shí)時(shí)的語音轉(zhuǎn)文字、多語言同步翻譯,1小時(shí)的音視頻僅用5分鐘就能轉(zhuǎn)寫完成,還能精準(zhǔn)區(qū)分發(fā)言人。
同時(shí)還能進(jìn)行智能總結(jié),會(huì)議中的關(guān)鍵內(nèi)容清晰羅列,總結(jié)核心內(nèi)容,比如關(guān)鍵性的問答內(nèi)容,輕松存檔會(huì)議內(nèi)容。
并且還能高效有序的整理筆記,支持下載原文、筆記、音視頻和譯文,一鍵導(dǎo)出所需內(nèi)容,同時(shí)也支持word、pdf和srt字幕文件等多種格式一鍵導(dǎo)出,本地、云盤存儲(chǔ)任選。
同時(shí),公測期間注冊(cè)的聽悟用戶后續(xù)還將獲得更大的阿里云盤存儲(chǔ)空間,在云盤內(nèi)在線播放視頻時(shí)也可自動(dòng)出字幕。
針對(duì)一些細(xì)分場景,聽悟還設(shè)置了不少“寶藏功能”:打開Chrome插件,外語學(xué)習(xí)者和聽障人士可以借助雙語懸浮字幕條隨時(shí)隨地看無字幕視頻,日程沖突時(shí),聽悟還可成為職場人士的“開會(huì)替身”,在靜音情況下入會(huì)AI可代為記錄會(huì)議、整理要點(diǎn);轉(zhuǎn)寫結(jié)果可下載為字幕文件,方便新媒體從業(yè)者視頻后期制作;聽悟梳理的問答回顧可以讓記者、分析師、律師、HR等群體整理訪談更高效。
通義聽悟Chrome插件將在近期對(duì)所有用戶開放下載
據(jù)了解,聽悟除個(gè)人版本外,還有企業(yè)應(yīng)用。此前,聽悟企業(yè)版已在阿里集團(tuán)內(nèi)部被廣泛使用,幫助減少了大量會(huì)議記錄和整理的工作,受到好評(píng)。同時(shí),聽悟的能力也可嵌進(jìn)各類音視頻平臺(tái),形成實(shí)時(shí)字幕、智能摘要等,典型應(yīng)用如釘釘?shù)?ldquo;釘閃記”背后便集成了聽悟。
未來聽悟還將在夸克APP、阿里云盤等端口提供服務(wù)。
大家只需在通義通義聽悟官網(wǎng)()完成注冊(cè)后,在“用戶-權(quán)益加油站”輸入口令“快科技就是快”,即可額外免費(fèi)領(lǐng)取包含20小時(shí)聽悟轉(zhuǎn)寫時(shí)長的權(quán)益包。
總結(jié)
以上是生活随笔為你收集整理的音视频会议神器!阿里云通义听悟正式发布:轻松记录总结、实时翻译的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: OPPO MR Glass开发者版首次亮
- 下一篇: 育碧宣布《刺客信条:幻景》首发加入 Ub