Loading...

SpeechGPT2:复旦大学推出的情感感知语音对话模型

小野资讯7个月前发布 xxball
3,590 0 0

SpeechGPT2:复旦大学推出的情感感知语音对话模型

摘要

SpeechGPT2 是由复旦大学计算机学院开发的一个端到端的语音对话语言模型,能够感知和表达情感,并根据上下文和人类指令提供多种风格的语音响应,如说唱、戏剧、机器人、搞笑和低语等。该模型使用超低比特率的语音编解码器 (750bps),能够建模语义和声学信息,处理冗长的语音序列。

主要特点

  1. 情感感知:能够感知和表达多种情感,提升对话的自然度和互动性。
  2. 多种风格响应:支持说唱、戏剧、机器人、搞笑和低语等多种风格的语音响应。
  3. 超低比特率编解码:使用750bps的超低比特率语音编解码器,建模语义和声学信息。

技术优势

  1. 高效处理长语音序列:处理冗长语音序列的能力强,适用于各种复杂对话场景。
  2. 多样化预训练数据:预训练数据涵盖超过10万小时的学术和野外语音数据,丰富多样。
  3. 语音风格多样:能够生成多种风格的语音响应,满足不同对话需求。

应用场景

  1. 智能语音助手
  2. 客户服务
  3. 教育与培训

相关链接

项目地址:https://0nutation.github.io/SpeechGPT2.github.io/开源项目案例库

© 版权声明

相关文章