Midjourney V6.1版本上线:优化远景人脸,细节更丰富 Midjourney V6.1版本上线:优化远景人脸,细节更丰富 摘要 沉寂了好久的Midjourney终于有了新的更新。Midjourney官方宣布正式上线V6.1版本,此次更新不仅极大地提升了图像... 小野资讯 1年前9,5000
OpenAI推出ChatGPT Plus高级语音模式:提供更自然的实时对话 OpenAI推出ChatGPT Plus高级语音模式:提供更自然的实时对话 摘要 OpenAI宣布正式向一小群 ChatGPT Plus 用户推出高级语音模式。高级语音模式提供更自然、实时的对话,让用... 小野资讯 1年前6,7900
实时打字翻译工具:支持多语言文字和语音实时翻译 实时打字翻译工具:支持多语言文字和语音实时翻译 摘要 该项目是一个实时打字翻译软件,提供语音实时打字、语音实时翻译功能,尤其适用于游戏(如LOL)的语音打字输入。其主要功能包括:实时打字翻译、实时语音... 小野资讯 1年前5,6600
创新发型转移技术!Stable-Hair让你轻松换发型 创新发型转移技术!Stable-Hair让你轻松换发型 摘要 在虚拟试发领域,现有的头发转移技术常常面临多样化和复杂发型的挑战,这让很多用户感到失望。最近,一项新的研究提出了一种创新的解决方案,名为 ... 小野资讯 1年前10,5400
Meta推出SAM 2:实现实时视频追踪的全新图像识别技术 Meta推出SAM 2:实现实时视频追踪的全新图像识别技术 摘要 Meta AI近日宣布推出新一代的Segment Anything Model(简称SAM 2),这一技术突破使得在视频和图像中实时识... 小野资讯 1年前22,1100
生数科技推出Vidu:秒生成高质量视频,Sora架构带来革命性体验 生数科技推出Vidu:秒生成高质量视频,Sora架构带来革命性体验 摘要 生数科技的 Vidu 模型开放了 Sora 架构,可模仿真实物理世界,并开放了API申请。官方称不到30秒可以生成一个4秒钟的... 小野资讯 1年前10,7000
Runway发布Gen-3 Alpha:图生视频功能重磅上线,创作更自由 Runway发布Gen-3 Alpha:图生视频功能重磅上线,创作更自由 摘要 Runway公司宣布其AI视频模型Gen-3 Alpha正式上线图生视频功能。此更新允许用户将任何图像用作视频生成的第一... 小野资讯 1年前6,1500
微软Azure更新:推出Phi-3无服务器微调,支持Llama 3.1 405B等1600个模型 微软Azure更新:推出Phi-3无服务器微调,支持Llama 3.1 405B等1600个模型 摘要 微软Azure宣布了一系列更新,旨在帮助开发人员利用Azure AI工具链快速创建定制的AI解决... 小野资讯 1年前4,5200
ViPer:为Stable Diffusion 提供个性化图像生成方法,记住你的艺术喜好 ViPer:为Stable Diffusion 提供个性化图像生成方法,记住你的艺术喜好 摘要 ViPer(Visual Personalization of Generative Models vi... 小野资讯 1年前4,8300
Hierarchical 3D Gaussian:突破瓶颈,实现大规模3D场景实时渲染 Hierarchical 3D Gaussian:突破瓶颈,实现大规模3D场景实时渲染 摘要 在虚拟现实和计算机图形学领域,3D高斯表示法取得了显著进展。为了进一步提升高质量场景的渲染效率,研究人员提... 小野资讯 1年前4,9500