阿里云AI助手接入“通义千问” 升级版“通义听悟”以大模型能力提高生产力
2023年6月1日

Tingwu.jpg


阿里巴巴集团的数字技术和智能骨干业务阿里云宣布其智能助手“听悟”已接入语言大模型(LLM)“通义千问”。升级版的“通义听悟精于语音和视频的实时文本转换,将可大大提升个人和企业生产力。“通义听悟现已上线,公众可通过阿里云帐号登入使用并体验其功能。

 

依托近期发布的“通义千问大模型,“通义听悟能够精准高效地理解和分析多媒体内容,例如从音视频文件生成总结文本,概括每位会议发言人的讲话要点,根据多媒体文件的时长自动划分章节并形成摘要。

 

“通义听悟还将接入阿里巴巴的数码协同办公和应用开发平台钉钉,以支持用户的AI办公需求。除了提升办公效率,“通义听悟还可于各类多媒体平台广泛应用,满足线上教育、培训、面试、直播、播客、短视频等领域日益增长的需求,使知识共享变得更快更便捷。

 

阿里云智能首席技术官周靖人表示:“现今我们生活的时代正在以多种多样的形式来接触海量视频和音频内容。因应这样的趋势,‘通义听悟’旨在应用语言大模型促进大众以更为便捷高质的方式理解及轻松分享多媒体内容。随着我们陆续将各类产品和服务接入‘通义千问’大模型,我们希望用户能在工作、学习、娱乐和人际互动多个方面从这些引人注目的 AI 创新中获益。

 

此外,依托阿里巴巴集团旗下研究机构达摩院自主开发的音频和视频模型,包括自研语音识别模型Paraformer和多人识别模型CAM++,升级版的“通义听悟不仅能更准确转录视频和音频文件,还可实现众多基于AI的特色功能,包括针对用户对多个音视频文件查询自动输出文字回答、提取视频内PPT幻灯片内容并生成摘要、以Chrome浏览器插件形式为多媒体内容提供实时中英互译等。这些新功能将于今年稍后推出。即日起公众可通过阿里云帐号登入tingwu.aliyun.com,于并体验其功能,还可于公测期间使用免费的转写试用服务。


阿里云于411日发布“通义千问,并将陆续嵌入阿里巴巴的各项业务中以提升用户体验。阿里云的客户和开发人员将透过大模型以更低成本建构专属AI功能。

 

作为全球领先的云服务供应商,阿里云此前还宣布启动“通义千问伙伴计划,旨在联合生态伙伴为包括石化、电力、交通、酒店、企业服务、电讯、金融等行业打造专属大模型。