量子位 | 公众年夜众号 QbitAI
家人们,大模型加持的AI神器,真的救了大命了——
就在几天前,我被老板哀求整理AI大神何恺明MIT第一课的内容,ddl非常紧张。然而全英文各种专有名词听的我一头雾水。

好巧不巧,有朋友给我推举了阿里通义听悟,他们刚上新AI音***问答助手“小悟”,听说在业界首次支持了单记录、跨记录、多措辞超长音***自由提问。
咱也不知道这宣扬的效果是否「保真」,但我只能去世马当作活马医。
我悄默声地打开了通义听悟上传了时长1小时15分钟的***文件。
芜湖!
没想到还挺好用,分分钟一键提取出了关键词、全文概要以及自动划分好章节,还有要点回顾,连PPT都被逐一提取出来了,可导出全部为pdf:
接下来,“小悟”的表现更让我面前一亮。
它不仅能够根据音***记录对我提出的问题给出答案,还会在末了标出引用出处以及对合时光戳,点击韶光戳就能自动跳转到原***对应位置,也方便了返回原文求证,效率up up up:
既然如此,我还有一个大胆的想法,往后再被随机抽查提问上次开会or上节课讲了啥,岂不是……
据理解,除了“小悟”,通义听悟现在还上新了更多新功能,对付常常要处理一大堆录音、发布会***的量子位来说,自然是不能错过新的实(mo)用(yu)工(shen)具(qi)。
这就赶紧来测试一波~
PS:剧透一下,中国大陆高校师生均可薅羊毛,免费得到500小时利用时长。
新·通义听悟初体验总的来看,通义听悟这次共上新了六大功能,下面我们就来逐一测试。
首先是开头提到的AI智能助手“小悟”,主打能对所有音***内容进行全面“解剖”,播客、会议、学习、访谈各种***均可对其多措辞自由提问。
不仅可以针对单一记录向它提问,最长6小时、6G大小,还可以跨记录、让“小悟”扫描上百个音***一起总结回答问题,目前“小悟”支持内容问答的音***时长和文件数都是业界上限。
最根本也是最主要的,“小悟”回答的准确性、可靠性如何?
我们选择了一个大家都能看懂的时长在10分钟旁边的中文***来试试水。
***内容与圆周率有关,从上传到转写完成用时不到1分钟。
直接讯问“小悟”打算圆周率的方法有哪些。好家伙,没想到的是它不仅指出了***中讲的几何近似和无穷级数法,还额外补充了一些方法。
我们点击韶光戳定位到到原文比拟,“小悟”对两种方法的表述无误,而且做了很好的精简和整合:
我们随即还提问了其他问题,“小悟”都能应对自若:
除了回答问题,让它帮忙整理大纲也很条理:
我们再用马斯克星舰第三次发射的***来体验通义听悟处理更长音***的表现。
***全长1小时43分,上传到通义听悟转写,仅用了大概4分钟:
去年6月通义听悟刚刚发布时,我们也做了一波测试,当时时长10分钟旁边的***上传转写大概须要2分钟,1小时旁边的视比年夜概用时5分钟。
不得不说,速率方面通义听悟这次也提升了不少。
针对“小悟”的提问这次再上难度,不仅直接在文件夹中跨记录提问,而且利用英文提问。
问题是马斯克星舰第三次测试的目的是什么?“小悟”这次的表现是酱婶儿的:
全体回答环绕着“网络对未来任务至关主要的数据”展开(好回答,肯定是没错的),并且点击韶光戳成功定位到了精确***。
除了“小悟”,通义听悟还上新了几大功能。
首先是一键AI改写功能,可以将音***的口语化表达内容快速转换为更具逻辑性、规范性和可读性书面表达,同时保持原意。
这就非常适宜用来整理会议记录、采访。
我们大略测试了一下,通过比拟,可以清楚地看到“不妨来听听他们怎么说”等较口语化的内容都做了删减优化,语句表述书面化效果很明显:
还上新了思维导图生成功能,可谓有逻辑爱整理同学的福音。
最多支持五层脑图展示,能够将脑图导出为多种格式,如xmind、图片等,方便与他人分享和保存。
此外,升级后的通义听悟能自动识别音***文件语种,无需手动选择。
目前支持的语种包括中、英、日、粤,听说即将支持韩语。
条记整理方面也有实用设计,推出一键插入***韶光戳及截图功能,条记整理效率再提升一大截。
还没完,升级后的通义听悟还支持上传更多格式的文件,单文件转写上限增至6小时,一次最多可上传50个文件。
***更是支持最大6G文件的转写:
每个功能都可以用四个字总结:非 常 实 用。
此外值得一提的是,在通义听悟界面的创造栏目中有诸多播客节目,点开后即可速览紧张内容。
好家伙,往后听播客都可以先重视要内容筛选自己的喜好的,然后再精听了。
只能说,升级后的通义听悟还有更多实用功能可挖掘,比如开组会随时听悟、备考同学还可以利用它两倍速学习网课资料……
“宝藏AI工具”众所周知,过去一年大模型经历了一场狂飙,各种大模型层出不穷,令人眼花缭乱。
然鹅,对大多数人而言,大模型技能本身可能并没有那么主要,产品好不好用、能不能切实地帮到自己才是最主要的。
基于此,各种大模型运用也已经花式开卷,阿里也基于通义千问推出了一系列产品。
个中,通义听悟是自去年6月推出后,备受用户欢迎的产品之一,现已有上百万用户。
通义听悟接入通义千问大模型,能听、能看、能读,还能实现速览+精听,在学生、老师、白领、、状师、金融剖析师…各种群体中都有虔诚用户,被认为是用来学习和事情的一种新型办法。
举个例子——
一位电子工业出版社编辑,借助通义听悟整理了播客“三五环”的对谈精华内容,还用AI技能再加上人工编辑的办法完成了《大厂之外》一书的整理、编辑,而这本书也即将出版。
还有一位成都管理学在读博士生蔡同学,她在社交媒体上写道“通义听悟绝对是最强科研神器”,她会用通义听悟来剖析网络***进行学术研究,在日常学习事情中也会随时利用。
目前,她的利用时长已近7000小时,均匀每天转写20小时以上。
以是问题是,为什么在AI大模型产品竞争如此激烈的情形下,阿里总能造出实用工具收成大批虔诚粉丝呢?
缘故原由大概就藏在产品的诸多细节中吧,比如我们上面未提到过但反复涌现的一键“回到顶部”和“回到当前播放位置”按钮,面对超长***,用户也无需一贯滚动鼠标翻看转写内容:
此外,通义听悟还设置了多级文件夹管理,用户上传的文件也可以归类整理;上传阿里云盘中的音***进行转写,不占用通义听悟存储空间;支持将单个记录的原文、译文、条记、PPT一次性导出;支持自定义专有词汇,用户再也不怕专有名词翻译不准确了……
而这些细节处理,都是积极根据用户的需求做出的改进。
好好好,很是“宠粉”,且“宠粉”不止于此,通义听悟的福利大放送就没停过。
比拟目前市情语音厂商9.9元每小时的音***转录折扣价,大伙利用通义听悟险些免费,每人每天只要上岸即可自动得到转写时长,阿里云官方微博、微信及各大平台社区还会发放大量20小时转写口令码,并且时长均可叠加,一年内有效。
咱便是说,短短几天,咱已经攒出了这么多“羊毛”,攒100小时切实其实洒洒水:
而且,伴随着这次通义听悟大升级,官方又发起了一波福利大放送!
推出“高校***操持”,所有中国大陆高校师生通过后缀edu.cn的教诲邮箱进行认证后,均可直接获赠500小时转写时长!
掐指一算,这没有不冲的情由吧:
https://tingwu.aliyun.com/?cid=105
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态