上海交大开源语音克隆模型F5-TTS 上海交大开源语音克隆模型F5-TTS 摘要 最近,来自上海交通大学、剑桥大学和吉利汽车研究院的研究团队推出了一种全新的文本到语音(TTS)系统,名为 F5-TTS。支持多语言切换、速度控制、情感表达... 小野资讯 9个月前10,7100
革命性的AI叙事工具:StoryMaker让多人物故事创作变得轻而易举! 🚀 革命性的AI叙事工具:StoryMaker让多人物故事创作变得轻而易举! 摘要 StoryMaker 突破性地解决了AI图像生成中角色一致性的难题,为创作者带来了前所未有的创作自由度。通过高度一致... 小野资讯 9个月前10,6400
阿里推出UniPortrait框架:实现多角色一致性与个性化图像生成 阿里推出UniPortrait框架:实现多角色一致性与个性化图像生成 摘要 阿里巴巴研究团队发布了UniPortrait,一种专注于人像图像个性化处理的全新框架。UniPortrait能够在单角色和多... 小野资讯 1年前10,6300
图像修复新魔法!突破性算法PMRF 图像修复新魔法!突破性算法PMRF 摘要 PMRF:一种全新的图像修复算法,实现高质量修复图像,降低图像失真还原跟自然逼真度。PMRF在多个基准和真实世界数据集上的实验结果显示,它不仅能够降低图像的失... 小野资讯 9个月前10,6200
DomoAI 推出图像视频分辨率提升工具:画质飞跃至4K高清 DomoAI 推出图像视频分辨率提升工具:画质飞跃至4K高清 摘要 DomoAI 最新推出的图像和视频分辨率提升工具,将视频编辑技术推向新高度。该工具能在极短时间内将普通图像和视频提升至2K和4K高清... 小野资讯 9个月前10,4200
百度文心一言App全新升级为“文小言”:9月文心大模型4.0免费用 摘要 百度文心一言App全新升级为“文小言”:9月文心大模型4.0免费用 摘要 百度宣布“文心一言”App正式升级为“文小言”,并推出全新的4.0.0版本,定位为“新搜索”智能助手。文小言基于文心大模型,新... 小野资讯 1年前10,4200
IMAGDressing-v1:AI换衣技术的重大突破,兼容ControlNet与文字提示词 IMAGDressing-v1:AI换衣技术的重大突破,兼容ControlNet与文字提示词 摘要 在虚拟试衣领域,有开发者发布了一款创新性的AI换衣工具——IMAGDressing-v1。这个工具旨... 小野资讯 1年前10,2900
字节跳动推出Seed-Music:音乐创作的革命性工具 字节跳动推出Seed-Music:音乐创作的革命性工具 摘要 字节跳动最近推出了一个名为Seed-Music的音乐生成神器,它支持多样化的输入方式,如文字描述、音频参考、乐谱甚至语音提示,让用户轻松生... 小野资讯 9个月前10,2300
谷歌Gemini Live语音聊天向安卓用户免费开放,随时随地与 AI 聊天! 谷歌Gemini Live语音聊天向安卓用户免费开放,随时随地与 AI 聊天! 摘要 谷歌正式宣布,Gemini Live 语音聊天功能现已免费向所有安卓用户开放。这款智能对话AI工具此前只对Gemi... 小野资讯 9个月前10,1900
Google AI Studio 推出全新提示词库:探索长篇文本上下文与多模态体验 Google AI Studio 推出全新提示词库:探索长篇文本上下文与多模态体验 摘要 Google AI Studio 最新发布的原生提示库,为用户带来了长篇文本上下文、原生多模态(图像、视频、音... 小野资讯 1年前10,1700