Mini-Omni:开启”边思考边说话”新时代的多模态AI模型 Mini-Omni:开启"边思考边说话"新时代的多模态AI模型 摘要 Mini-Omni是一款开源的多模态大型语言模型,融合了多项先进技术,具备实时语音输入与输出功能,支持“边思考边说话”的独特交互方... 小野资讯 6个月前15,4700
豆包推出Ola Friend智能体耳机 豆包推出Ola Friend智能体耳机 摘要 豆包推出Ola Friend智能体耳机,这款集成了人工智能技术的耳机旨在为用户提供一个随时陪伴在耳边的AI朋友。用户可以享受听音乐、学习英语、获取导游服务... 小野资讯 6个月前14,9900
Civitai推出“绿色”新站Civitai Green:为创作者提供安全纯净的模型资源 Civitai推出“绿色”新站Civitai Green:为创作者提供安全纯净的模型资源 摘要 全球最大的图像模型分享平台Civitai近日推出了全新的Civitai Green站点,专为提供安全、适... 小野资讯 11个月前14,7600
Soul语音大模型升级:端到端语音通话,真实互动体验 Soul语音大模型升级:端到端语音通话,真实互动体验 摘要 Soul App在其“AI+社交”领域中推出了语音大模型的重磅升级,实现了端到端全双工语音通话技术。用户现在可以与AI虚拟人进行自然流畅的语... 小野资讯 11个月前14,3200
特斯拉We Robot 发布会全纪录:完全无人驾驶出租车、Optimus 机器人、Robovan(机器人巴士) 特斯拉We Robot 发布会全纪录 摘要 今天上午,马斯克穿着他的皮衣,乘坐着Cybercab自动驾驶汽车闪亮登场。多年前吹的牛,终于在今天实现了。这款未来感十足的车型彻底颠覆了传统汽车设计理念,摒... 小野资讯 6个月前14,2600
豆包浏览器插件上线,B站长视频与播客总结神器 豆包浏览器插件上线,B站长视频与播客总结神器 摘要 在信息爆炸的时代,豆包浏览器插件为我们带来了高效吸收知识的新方法。该插件不仅能总结B站长视频内容,还能生成条理清晰的目录和脑图,极大提升信息处理效率... 小野资讯 1年前14,1300
EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频 EchoMimic:通过音频和面部标志生成逼真的音画同步肖像视频 主要内容总结 项目简介 EchoMimic 是蚂蚁集团开发的一种新方法,用于通过音频和面部标志生成逼真的肖像动画视频。不同于传统方法... 小野资讯 1年前14,1200
SD变现宝ComfyUI插件:一键转换工作流为小程序,集成支付功能 SD变现宝ComfyUI插件:一键转换工作流为小程序,集成支付功能 摘要 近日,AIbase基地推出了一款名为"SD变现宝"的ComfyUI插件,为创作者提供了一个全新的商业化解决方案。这款插件能够将... 小野资讯 12个月前14,1000
AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题 AI视频创作一条龙!达摩院“寻光”平台炸场WAIC,突破可控编辑难题 在AIGC时代,阿里达摩院推出了“寻光”平台,一个即将开放内测的一站式AI视频创作平台,展示了AI在视频创作中的强大能力。这个平台... 小野资讯 1年前14,0800
清华大学推出超万字生成式AI系统LongWriter 清华大学推出超万字生成式AI系统LongWriter 摘要 清华大学的研究团队开发了名为"LongWriter"的AI系统,能够生成超过10,000字的连贯文本。这项技术为长篇写作提供了新的可能性,并... 小野资讯 12个月前13,8800