時(shí)間:2023-06-01 21:45:31 來源: 大河財(cái)立方
【大河財(cái)立方 記者 楊霄 文圖 實(shí)習(xí)生 郎潤(rùn)乾】阿里云推出的AI新品“通義聽悟”,是不是另一個(gè)版本“訊飛聽見”?
6月1日,在廣州舉行的“2023年阿里云峰會(huì)·粵港澳大灣區(qū)”活動(dòng)上,阿里云正式發(fā)布了工作學(xué)習(xí)AI助手通義聽悟。它是基于通義千問大模型擁有對(duì)語言更強(qiáng)的理解力,在開會(huì)、上課、訪談、培訓(xùn)、直播、看視頻、聽播客等音視頻內(nèi)容場(chǎng)景中,能記、能翻、能存、能劃重點(diǎn)。
【資料圖】
這意味著,在國(guó)內(nèi)智能語音轉(zhuǎn)寫市場(chǎng)上,阿里云正試圖憑借新應(yīng)用對(duì)科大訊飛既有優(yōu)勢(shì)領(lǐng)域發(fā)起正面攻擊,用戶競(jìng)爭(zhēng)與價(jià)格戰(zhàn)已經(jīng)打響。而AI軟件是否會(huì)將智能錄音筆逼到出局?還有待考量。
AI產(chǎn)品戰(zhàn)在音視頻轉(zhuǎn)寫領(lǐng)域打響
“聽悟”能做線上會(huì)議“替身”
近兩年國(guó)內(nèi)科技界AI技術(shù)開發(fā)熱,在音視頻轉(zhuǎn)寫領(lǐng)域率先結(jié)果。
當(dāng)日活動(dòng)現(xiàn)場(chǎng),阿里云公布通義大模型進(jìn)展,聚焦音視頻內(nèi)容的AI新品“通義聽悟”正式上線。其稱,這是國(guó)內(nèi)首個(gè)開放公測(cè)的大模型應(yīng)用產(chǎn)品。
與當(dāng)前市場(chǎng)銷售主流的智能錄音筆不同,阿里云“聽悟”作為一款獨(dú)立應(yīng)用,不需要專業(yè)的錄音筆設(shè)備硬件做支撐,它可依托各類智能終端工作。換句話說,用戶手邊有什么智能設(shè)備均可,如有麥克風(fēng)收聲硬件支持的手機(jī)、平板、PC等。
不過,阿里云新推出的“聽悟”顯然不只達(dá)到這個(gè)層級(jí),它的核心功夫在于接入了通義千問大模型的理解與摘要能力,從而使它成為用戶工作學(xué)習(xí)中的得力AI助手,幫助用戶隨時(shí)隨地高效完成對(duì)音視頻內(nèi)容的轉(zhuǎn)寫、檢索、摘要和整理。
例如,一名學(xué)生一天上8節(jié)課,每天放學(xué)后他要用智能錄音筆轉(zhuǎn)寫老師講述內(nèi)容,再耗費(fèi)數(shù)小時(shí)對(duì)翻錄文字糾錯(cuò),找到對(duì)應(yīng)課堂重點(diǎn)內(nèi)容,然后才梳理為課堂“筆記”。但“聽悟”不只是聽清語言內(nèi)容,而是能聽明白語音后產(chǎn)生自我所“悟”。它超然于錄音筆的價(jià)值,是為音視頻劃分章節(jié)并形成摘要、總結(jié)全文及每個(gè)發(fā)言人觀點(diǎn)、整理關(guān)注重點(diǎn)和待辦事項(xiàng)。更甚者,聽悟還可能成為線上會(huì)議的參會(huì)“替身”,用戶在靜音情況下,入會(huì)AI可代其為全場(chǎng)會(huì)議記錄、整理要點(diǎn),轉(zhuǎn)寫結(jié)果可下載為字幕文件,方便用戶在后期使用。
“換一種方式,讓音視頻可以被輕松閱讀、整理和分享。”阿里云CTO周靖人介紹,聽悟瞄準(zhǔn)具有高知識(shí)附加值的音視頻內(nèi)容場(chǎng)景,比如開會(huì)、上課、訪談、培訓(xùn)、面試、直播、看視頻、聽播客等,能通過大模型等最新AI技術(shù)快速提煉和沉淀知識(shí)。同時(shí),大模型一鍵提取PPT、針對(duì)多個(gè)音視頻內(nèi)容向AI提問、概括特定段落等功能,近期也將上線。
另據(jù)了解,聽悟除個(gè)人版本外,還有企業(yè)應(yīng)用。此前,聽悟企業(yè)版已在阿里集團(tuán)內(nèi)部被廣泛使用,幫助減少了大量會(huì)議記錄和整理的工作,受到職場(chǎng)工作者好評(píng)。同時(shí),聽悟的能力也可嵌進(jìn)各類音視頻平臺(tái),形成實(shí)時(shí)字幕、智能摘要等,典型應(yīng)用如釘釘?shù)摹搬旈W記”背后便集成了聽悟。未來聽悟還將在夸克App、阿里云盤等端口提供服務(wù)。
錄音筆不會(huì)重蹈BP機(jī)覆轍
但AI技術(shù)之戰(zhàn)焦點(diǎn)是大模型
阿里云推出“聽悟”,瞄準(zhǔn)了科大訊飛在國(guó)內(nèi)智能語音轉(zhuǎn)寫市場(chǎng)的核心領(lǐng)地。
艾瑞咨詢發(fā)布的數(shù)據(jù)顯示,國(guó)內(nèi)智能語音市場(chǎng)經(jīng)歷了傳奇版增長(zhǎng)的3年,從2019年市場(chǎng)消費(fèi)規(guī)模約77億元,至去年增至159億元,并有望在今年增至215億元。該行業(yè)領(lǐng)域的核心競(jìng)爭(zhēng)主體大抵有三類:以科大訊飛、搜狗為代表的專業(yè)智能語音企業(yè),以阿里云、騰訊云為代表的云服務(wù)廠商,以網(wǎng)易為代表的專業(yè)轉(zhuǎn)寫或翻譯廠商等。科大訊飛無疑是當(dāng)前市場(chǎng)最大的利益方,多年前其憑一招“智能錄音筆用戶享終身免費(fèi)翻錄服務(wù)”,收割了記者、分析師、律師、HR、學(xué)生等大量市場(chǎng)需求。今天,科大訊飛在智能錄音筆領(lǐng)域的地位無人可及。
不過,阿里云推出“聽悟”的目的,絕不是打敗智能錄音筆,而是與科大訊飛的星火大模型做根本性較量。其聲稱,聽悟是國(guó)內(nèi)首個(gè)開放公測(cè)的大模型應(yīng)用產(chǎn)品。
什么是AI大模型?
事實(shí)上,國(guó)內(nèi)科技圈對(duì)此仍缺少統(tǒng)一的標(biāo)準(zhǔn)定義,多對(duì)其作概括與描述。它是指具有數(shù)百萬或數(shù)十億個(gè)參數(shù)的深度神經(jīng)網(wǎng)絡(luò)模型,這種模型經(jīng)過專門的訓(xùn)練過程,能夠?qū)Υ笠?guī)模數(shù)據(jù)進(jìn)行復(fù)雜的處理和任務(wù)處理。AI大模型需占用大量的計(jì)算資源、存儲(chǔ)空間、時(shí)間和電力等資源來保證它的訓(xùn)練和部署。而使用AI大模型,則需要數(shù)據(jù)收集、設(shè)計(jì)模型、模型訓(xùn)練和測(cè)試,以及部署應(yīng)用等。因而,AI大模型的競(jìng)爭(zhēng)是算力、人才和資源的綜合競(jìng)賽。
非科技圈人士,多對(duì)上述內(nèi)容感覺生硬且燒腦。但任一科技公司創(chuàng)造AI技術(shù)的核心方向即是模仿人類,由此理解AI大模型的概念最為直觀。
今年,國(guó)內(nèi)科技界在大模型領(lǐng)域的競(jìng)爭(zhēng)堪稱急速沸騰。據(jù)不完全統(tǒng)計(jì),2月復(fù)旦大學(xué)發(fā)布MOSS;3月清華大學(xué)發(fā)布ChatGLM-6B、百度發(fā)布文心一言;4月阿里云發(fā)布通義千問、知乎發(fā)布知海圖AI;5月,科大訊飛發(fā)布星火、騰訊發(fā)布混元、360發(fā)布360GPT。此外,還有傳聞中京東研發(fā)的犀利、華為研發(fā)的盤古NLP模型。5月31日,百度創(chuàng)始人李彥宏宣布啟動(dòng)“文心杯”創(chuàng)業(yè)大賽,設(shè)立規(guī)模10億元投資基金支持生成式AI領(lǐng)域初創(chuàng)企業(yè)。
由此來看,阿里云在4月官宣的推出大語言模型“通義千問”,今日推出“聽悟”,相當(dāng)于它先造好樹干,后生成樹杈。未來,它在“通義千問”樹干上會(huì)培育樹杈B、樹杈C,至樹杈N。不過,阿里云推出AI產(chǎn)品“聽悟”切入國(guó)內(nèi)智能語音轉(zhuǎn)寫市場(chǎng),是其早有該領(lǐng)域技術(shù)積累。
5年前,消費(fèi)者所見最直觀的產(chǎn)品是智能音箱,如天貓精靈等,只不過相比當(dāng)年技術(shù)系統(tǒng)完成了根本性迭代。而這,或相當(dāng)于手機(jī)從模擬機(jī)變成了智能機(jī)。但另需看到,“聽悟”是在手機(jī)、平板等智能終端使用,其硬件條件決定了它無法擊敗中高檔錄音筆的專業(yè)收聲質(zhì)量。所以,錄音筆或不會(huì)重蹈BP機(jī)的覆轍,但也會(huì)極大擠壓其用戶總量。
如上種種,足見各家科技公司在AI大模型領(lǐng)域的研發(fā)較量火熱。觀望后期,各家企業(yè)在AI大模型生成的應(yīng)用產(chǎn)品必將面臨市場(chǎng)化,這無疑是一輪新的競(jìng)爭(zhēng)熱點(diǎn)。
【文末彩蛋】阿里云“通義聽悟”正式公測(cè),聯(lián)合大河財(cái)立方送100份20小時(shí)免費(fèi)轉(zhuǎn)寫福利↓↓↓↓
責(zé)編:史健 | 審校:李金雨 | 審核:李震 | 監(jiān)制:萬軍偉
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01
頭條 23-06-01