小野资讯 | 第28页 | 小野AI工具库

创新AI技术：Magic Insert实现图像元素风格融合

Magic Insert：将一个图像中的人或物体拖放到另一个风格图像中并实现风格融合摘要 Magic Insert 是一项创新的 AI 技术，可以将一个图像中的人或物体拖放到另一个风格图像中，并实...

小野资讯

1年前

5,4300

OpenAI开发新AI模型“Strawberry”，提升自主推理和互联网浏览能力

OpenAI开发新AI模型“Strawberry”，提升自主推理和互联网浏览能力摘要据路透社报道，OpenAI 正在开发一个代号为“Strawberry”的新人工智能模型项目。该项目旨在通过增强推...

小野资讯

1年前

5,4600

谷歌开天眼：Gemini 1.5 Pro赋予机器人记忆导航超能力

谷歌开天眼：Gemini 1.5 Pro赋予机器人记忆导航超能力摘要 Google DeepMind 推出了一个名为 Gemini 1.5 Pro 的系统，并将其安装在机器人上，使其具备记忆导航能力...

小野资讯

1年前

5,5500

RodinHD：可根据肖像生成高保真3D头像模型，头发细节也有了

RodinHD：可根据肖像生成高保真3D头像模型，头发细节也有了摘要 RodinHD 技术能够将肖像照片转化为高保真的3D头像模型，包括细致的头发细节。核心在于创新的三平面拟合与生成框架，通过高分辨...

小野资讯

1年前

7,0100

国产开源绘画模型 Kolors：支持中文字符，质量超越 SD3 和 MidJourney

国产开源绘画模型 Kolors：支持中文字符，质量超越 SD3 和 MidJourney 摘要快手公司推出了「可图 Kolors」开源绘画模型，基于潜在扩散的大规模文本到图像生成技术。Kolors ...

小野资讯

1年前

6,2100

Midjourney v6.5 将于7月底发布，带来更真实的图像体验

Midjourney v6.5 将于7月底发布，带来更真实的图像体验 Midjourney，作为人工智能图像生成领域的佼佼者，计划在本月底发布其6.5版本。这次更新将显著提升图像的真实感和皮肤纹理，为...

小野资讯

1年前

4,7600

Heygen推出全新AI对口型工具：上传照片和音频即可生成说话视频

Heygen推出全新AI对口型工具：上传照片和音频即可生成说话视频最近，AI照片“复活术”在网络上引起了广泛关注。Heygen推出了一款对口型工具，用户只需上传一张照片和一段音频，照片中的人物即可根...

小野资讯

1年前

22,8400

EchoMimic：通过音频和面部标志生成逼真的音画同步肖像视频

EchoMimic：通过音频和面部标志生成逼真的音画同步肖像视频主要内容总结项目简介 EchoMimic 是蚂蚁集团开发的一种新方法，用于通过音频和面部标志生成逼真的肖像动画视频。不同于传统方法...

小野资讯

1年前

14,5000

PaintsUndo：输入静态图像自动帮你生成整个绘画的全过程视频

PaintsUndo：输入静态图像自动帮你生成整个绘画的全过程视频专业总结 PaintsUndo 是一个旨在模拟数字绘画行为的基础模型。用户通过输入静态图像，该模型可以自动生成一个展示绘画全过程的...

小野资讯

1年前

14,0300

阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音

阿里巴巴发布语音处理模型 FunAudioLLM 能理解和生成各种人类语音专业总结阿里巴巴开发的 FunAudioLLM 是一组先进的语音处理模型，旨在提升人类与大语言模型之间的语音交互体验。它由...

小野资讯

1年前

6,7300