今天给你精选了五个 AI 开源项目,其中有能做配音的,有拖着就能搭流程的,还有视频生成、3D 建模,甚至 AI 搜索助手。

这些项目不是花架子,是真的能用,能省事,看完也许能改变你做事的方式。

1. Bark

一个能说话的模型,但不只是「会发音」,而是「像人一样说话」。

支持多语言、多情绪、带背景音效,甚至能生成笑声、叹气、鼓掌之类的效果。

很多人在做视频解说,都是用平平无奇的 TTS,听一秒就想划走。但换成 Bark 配出来的声音,能明显撑住场面,尤其是它的情绪细节特别自然。

使用方式:

图片

图片

点击播放:

帅彬老仙,帅彬老仙,8秒

项目地址:

https://github.com/suno-ai/bark

2. Flowise

Flowise 是一个「傻瓜式可视化 AI 搭建工具」。

你可以用拖拉拽的方式搭建自己的 AI 应用,比如问答助手、客服机器人、知识库搜索,甚至是写文章、总结内容的多轮对话系统。

图片

十分钟就能搭出一个能用的工具,全程不写代码,对不想折腾代码但又想搞点 AI 应用出来的人来说,这工具是生产力跳板。

当然,有些模块还不够灵活,但已经能做出来不少玩意儿了。

快速入门:

图片

项目地址:

https://github.com/FlowiseAI/Flowise

3. FramePack

这是一个能显著降低 AI 视频生成成本的新方案。

传统的视频生成一秒钟几 G 显存打底,而 FramePack 的优势就是:省资源,还能保持连贯。

通俗点说,它解决了「画面很美但动不起来」这个难题,而且动起来之后不抖、不跳帧。

我看了几个 demo,直接震惊,现在普通显卡也能凑合出个 AI 短片。

图片

对内容创作者、二创、动画实验者来说,这是目前最值得关注的视频方向工具之一,甚至未来可能是 AI 动画工作流的标配组件。

项目地址:

https://github.com/lllyasviel/FramePack

4. LGM

这个名字听起来有点像科研项目,其实是把图像直接转成 3D 模型的工具。但它不是拼贴式 3D,而是真的生成空间感很强的三维场景。

,时长00:05

你只需要一张图,LGM 就能还原出场景的结构、深度,然后你可以从不同角度自由旋转查看,或者拿去导出做更多编辑。

对搞 3D 内容、VR、虚拟直播这些方向的朋友特别友好。以前做这种东西至少要 Blender + 多视角建模,现在点一下就搞定一半工作流。

唯一的门槛是跑起来稍微吃点资源,但如果你已经玩得转 AI 工具,这应该不算事儿。

项目地址:

https://github.com/3DTopia/LGM

5. MindSearch

MindSearch 是一个支持多模型、本地部署的 AI 搜索引擎,核心目标是让每个人都能拥有一个自己的「AI 搜索助手」。

它可以从本地文档、网页内容、聊天记录中构建知识库,让你像用 ChatGPT 一样去查询自己的资料。

它不仅可以离线运行(使用如 Mistral、InternLM2 等开源模型),也支持接入 OpenAI、Moonshot 等 API,部署自由度很高。

最贴心的是,它开箱即用,支持中文,界面还很简洁。

图片

项目地址:

https://github.com/InternLM/MindSearch

OK,以上就是带来的这期周五精选,希望对你有启发。

如果你觉得有用,欢迎点赞、转发,也欢迎留言告诉我你最喜欢哪个项目~

我们下回见,Peace ✌️

Logo

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。

更多推荐