通义听悟 通义听悟是一款基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。
大模型语音
2801 收藏

通义听悟 简介

通义听悟是一款基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。它是阿里云推出的基于大模型的工作学习AI助手,于202361日开始正式公测,202311月,阿里云在2023云栖大会正式上线通义听悟-工作学习AI助手。

通义听悟可以在会议、学习、访谈、培训等场景下:

l实时记录交流内容,同步翻译

l批量转写音视频文件,区分发言人

l智能提炼全文概要、章节速览、发言总结

l提取视频中的PPT并总结摘要

l自动提取关键词、待办事项

l编辑整理笔记,导出、分享记录

通义听悟帮助中心地址:https://tingwu.aliyun.com/helpcenter/

通义听悟提供了API服务,地址:

https://help.aliyun.com/product/454189.html?spm=5176.28158784.0.0.278d25dcf8H4d4):

通义听悟API服务,在语音识别、翻译和说话人分离的基础上,提炼全文摘要、章节速览、发言总结、待办事项、问答、关键词等内容,对人与人交流的音视频进行分析与精简。帮助使用者快速了解音视频主要内容。

适用于以下场景:

1.   会议、拜访、面试、客户服务等办公场景;

2.   课堂记录,英文教学资料字幕,听力练习等学习场景;

3.   音视频内容转写、提炼核心内容与章节定位,阅读音视频文件的网盘与媒资库;

4.   访谈、路演等金融场景。

相关工具
通义听悟
通义听悟是一款基于阿里云通义千问大模型开发的AI应用,主要针对音视频内容进行转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。
通义千问
通义千问,是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。
TabNine
Tabnine一直是软件开发的生成式人工智能的先驱。Tabnine通过人工智能工具自动化编码工作流程,提高了代码质量和开发人员的幸福感。Tabnine拥有超过100万的月用户,通常为每个开发人员自动化30-50%的代码创建,并生成了全球1%以上的代码。
ChatLaw
ChatLaw是北大团队发布的法律大模型,旨在提供普惠的法律服务。该模型的目标是解决全国执业律师不足和普通人对法律知识的不了解问题。
CodeWhisperer
CodeWhisperer是一款基于机器学习的通用代码生成器,基于各种上下文线索提供建议,包括光标在源代码中的位置、位于光标前面的代码、注释,以及来自同一项目中其他文件的代码。
Suno歌曲制作
Suno V3凭借惊人创作速度及多元化音乐风格迅速火遍网络,核心优势在于其快速生成高质量音乐的能力。该模型能够在短短1分钟内创作出长达两分钟的完整歌曲,这一速度和效率在传统音乐创作中是难以想象的。Suno V3的这一特点,不仅为音乐爱好者提供了一个全新的创作工具,也为专业音乐制作人提供了一个强大的辅助平台
GitHub Copilot工具
GitHub Copilot是由GitHub 与OpenAI合作开发的AI辅助编程工具,它使用的是OpenAI Codex技术,这是一个由OpenAI创建的通用预训练语言模型。GitHub Copilot可以根据代码和注释的上下文提供个性化的代码建议。
CPM-BEE面壁智能
CPM大模型是面壁团队根据多年的大模型训练经验自研的百亿参数预训练语言大模型,模型支持多语言能力和简易结构化输入输出,通过团队自研的高效微调技术,能快速适配各种下游任务,满足各种场景的需求。
查看更多