2025-02-11 Github 热点项目 Unsloth:高效微调语言模型的开源利器
Unsloth是个专门用来优化大语言模型(LLMs)训练的工具,像Llama 3.3、Mistral、Phi-4这些热门模型,用它都能训练得又快又省显存。它有好多免费的notebook,你只要把自己的数据集加进去,点“Run All”,就能得到一个超棒的优化后模型,还能导出到各种格式,方便得很。它还支持超长的上下文窗口,像Llama 3.3在80GB GPU上能支持89K的上下文,比Hugging
Unsloth是个专门用来优化大语言模型(LLMs)训练的工具,像Llama 3.3、Mistral、Phi-4这些热门模型,用它都能训练得又快又省显存。它有好多免费的notebook,你只要把自己的数据集加进去,点“Run All”,就能得到一个超棒的优化后模型,还能导出到各种格式,方便得很。它还支持超长的上下文窗口,像Llama 3.3在80GB GPU上能支持89K的上下文,比Hugging Face+FA2的13x还长,这在处理长文本任务时简直是大杀器!
1. unsloth
- 今日新增星标:1,809
- 总星标数:27,551
连续在榜天数:4
主要编程语言:Python
Unsloth 是一个专注于高效微调大型语言模型的开源项目,支持 Llama、Mistral、Phi、Gemma 等多种模型。它通过优化内存使用和加速训练过程,能够在相同硬件条件下实现比传统方法快 2 倍的速度,并减少 70% 的内存消耗。Unsloth 使用 OpenAI 的 Triton 语言编写核心内核,并支持 4bit 和 16bit 的 QLoRA/LoRA 微调,同时保持 0% 的精度损失。项目还提供了丰富的预训练模型和免费 Notebook,用户可以轻松进行模型微调和推理。此外,Unsloth 还支持 Windows 和 Linux 平台,兼容多种 NVIDIA GPU。
2. awesome-deepseek-integration
- 今日新增星标:1,019
- 总星标数:11,418
GitHub - deepseek-ai/awesome-deepseek-integration
这是一个关于DeepSeek API集成应用的开源项目,旨在将DeepSeek API与多种流行软件无缝整合。项目涵盖了桌面应用、浏览器插件、开发工具、即时通讯插件等多种场景,帮助用户在不同平台上使用DeepSeek的强大功能。通过这个项目,用户可以在Chatbox、ChatGPT-Next-Web、Liubai等应用中轻松接入DeepSeek AI,提升智能交互体验。项目还支持多种语言和平台,方便全球开发者使用和贡献。无论是个人还是企业,都能通过该项目快速实现AI驱动的自动化流程和智能应用。
3. dify
- 今日新增星标:688
- 总星标数:65,576
连续在榜天数:5
主要编程语言:TypeScript
Dify 是一个开源的 LLM 应用开发平台,提供直观的界面和丰富的功能。它集成了 AI 工作流、RAG 管道、代理能力、模型管理和可观测性等特性,帮助用户快速从原型开发到生产部署。Dify 支持多种模型提供商,包括 GPT、Mistral 和 Llama3 等,并提供即插即用的工具,如文档提取和代理工具。用户可以通过 Docker 快速部署 Dify,并通过其 API 轻松集成到现有业务逻辑中。
4. union
- 今日新增星标:658
- 总星标数:21,651
连续在榜天数:2
主要编程语言:Rust
Union 是一个高效的去中心化跨链协议,专注于零知识证明技术,支持消息传递、资产转移、NFT 和 DeFi 应用。它采用共识验证机制,不依赖第三方信任、预言机或多重签名,兼容 Cosmos 生态和 EVM 链(如以太坊、Arbitrum 等)。核心组件包括节点实现、零知识证明系统、跨链中继器和链索引器等,所有升级和配置均由去中心化治理控制。开发者可以使用 Nix 工具链轻松构建和开发 Union 的各个模块。项目旨在提供高安全性和抗审查能力的去中心化基础设施。
5. firecrawl
- 今日新增星标:467
- 总星标数:25,092
连续在榜天数:4
主要编程语言:TypeScript
Firecrawl 是一个强大的工具,能够将整个网站转化为适用于大语言模型的 Markdown 或结构化数据。它通过简单的 API 提供了网页抓取、爬取和数据提取的功能,支持多种格式的转换,包括 Markdown、HTML 和 JSON。Firecrawl 能够处理动态内容、绕过反爬虫机制,并提供自定义选项,如排除特定标签或设置最大爬取深度。它还支持批量处理和页面交互操作,适合构建基于网页数据的 AI 应用。
6. LLM4Decompile
- 今日新增星标:455
- 总星标数:4,416
连续在榜天数:2
主要编程语言:Python
LLM4Decompile 是一个致力于逆向工程的开源项目,利用大规模语言模型将二进制代码反编译为可读的C源代码。它支持从GCC的O0到O3优化级别的Linux x86_64二进制文件,并提供了多种模型用于直接反编译或优化Ghidra生成的伪代码。项目通过评估指标如“可重执行性”来衡量反编译代码的质量,并提供了丰富的预训练模型和数据集供用户使用。
7. LangBot
- 今日新增星标:390
- 总星标数:6,842
主要编程语言:Python
8. potpie
- 今日新增星标:373
- 总星标数:1,667
连续在榜天数:2
主要编程语言:Python
GitHub - potpie-ai/potpie: Prompt-To-Agent : Create custom engineering agents for your codebase
Potpie 是一个开源平台,旨在为代码库创建定制的 AI 工程代理,帮助自动化代码分析、测试和开发任务。它通过构建代码的知识图谱,深入理解代码关系,适用于调试、代码生成和功能开发等多种场景。平台提供了预构建的代理模块,如调试代理、代码问答代理等,也支持用户自定义代理。Potpie 支持与现有开发流程无缝集成,并能处理任何规模和语言的代码库。
9. data-formulator
- 今日新增星标:328
- 总星标数:2,931
主要编程语言:TypeScript
GitHub - microsoft/data-formulator: 🪄 Create rich visualizations with AI
Data Formulator 是一个由微软研究院开发的AI工具,旨在通过大规模语言模型帮助用户快速创建丰富的数据可视化。它结合了用户界面交互和自然语言输入,简化了数据转换和图表设计的过程。用户可以通过Python PIP安装并在本地运行,或者直接在GitHub Codespaces中使用,同时还支持开发者自定义扩展。该项目特别适合数据分析师,能够通过AI自动处理复杂的数据转换任务,并生成多种类型的可视化图表。此外,Data Formulator还支持通过自然语言指令进行迭代式的图表设计和优化。
10. build-your-own-x
- 今日新增星标:321
- 总星标数:331,374
主要编程语言:Markdown
这个开源项目旨在通过从零开始重建你喜爱的技术来深入掌握编程。它汇集了大量详细的教程,涵盖从3D渲染器到区块链、操作系统、游戏引擎等多个领域的项目。每个项目都提供了逐步指南,帮助开发者从底层理解这些技术的实现原理。通过动手实践,开发者可以真正掌握这些技术的核心概念。无论是初学者还是经验丰富的开发者,都能从中找到适合自己的挑战和知识。
11. ai-chatbot
- 今日新增星标:296
- 总星标数:11,873
连续在榜天数:2
主要编程语言:TypeScript
GitHub - vercel/ai-chatbot: A full-featured, hackable Next.js AI chatbot built by Vercel
这是一个基于Next.js和Vercel AI SDK构建的全功能、可定制的AI聊天机器人模板。它支持多种主流大模型供应商,如OpenAI、Anthropic和Cohere,并提供丰富的功能,包括Next.js App路由、AI SDK集成、Tailwind CSS样式和数据持久化。用户可以轻松地部署自己的版本或在本地方运行,并可根据需求灵活切换模型提供商。这个项目是构建现代AI聊天应用的理想起点。
12. page-assist
- 今日新增星标:294
- 总星标数:4,016
主要编程语言:TypeScript
GitHub - n4ze3m/page-assist: Use your locally running AI models to assist you in your web browsing
Page Assist 是一款开源的浏览器扩展,允许用户通过本地运行的 AI 模型辅助网页浏览。它提供了一个侧边栏和 Web 界面,用户可以在任何网页上与本地 AI 模型互动,例如询问网页内容或进行对话。该扩展支持 Chromium 系浏览器和 Firefox,并兼容多种本地 AI 平台(如 Ollama 和 OpenAI API 兼容的终端)。它的功能包括网页聊天、模型交互以及自定义快捷键,所有数据均存储在本地,注重用户隐私。安装简单,也可通过源码手动构建和加载扩展。
13. hoppscotch
- 今日新增星标:147
- 总星标数:67,452
主要编程语言:TypeScript
Hoppscotch 是一个开源的 API 开发生态系统,提供了轻量级且高效的 API 测试工具。它支持多种 HTTP 方法、WebSocket、GraphQL 等协议,并具备丰富的功能,如请求历史记录、团队协作、环境变量管理等。用户可以通过浏览器插件或命令行工具增强使用体验,并且支持自定义主题和国际化。Hoppscotch 是 Postman 和 Insomnia 的开源替代品,帮助开发者更快速地进行 API 开发和测试。
14. awesome-llm-apps
- 今日新增星标:105
- 总星标数:15,087
主要编程语言:Python
这是一个专注于展示各种基于大语言模型(LLM)应用的开源项目,涵盖了从AI代理到检索增强生成(RAG)的多种技术。项目提供了丰富的应用案例,包括客户支持、投资分析、法律助手等多个领域,并结合了OpenAI、Anthropic、Gemini等不同模型。通过这些案例,用户可以探索如何在不同场景中使用LLM,并学习如何构建自己的应用。项目还鼓励社区贡献,提供了详细的开发指南和项目结构。无论是初学者还是开发者,都能从中获得灵感和实用资源。
15. Chat2DB
- 今日新增星标:67
- 总星标数:18,714
主要编程语言:Java
Chat2DB 是一个智能化的通用 SQL 客户端和数据库工具,支持 MySQL、Oracle、PostgreSQL 等多种数据库。它集成了 AI 能力,能够帮助用户快速生成 SQL 查询、管理数据库并生成报表。Chat2DB 提供了丰富的功能,包括数据同步、数据导入导出、UML 图生成等,适合各种数据库操作需求。项目支持社区版、本地版和 Pro 版,满足不同用户的使用场景。它是一个开源项目,欢迎开发者参与贡献。
16. FastGPT
- 今日新增星标:58
- 总星标数:20,399
主要编程语言:TypeScript
FastGPT 是一个基于大语言模型的知识库问答平台,提供开箱即用的数据处理、RAG 检索和可视化工作流编排功能。它允许用户通过简单的配置开发和部署复杂的问答系统,支持多种文件格式导入和混合检索。项目支持多模型配置、对话调试、知识库管理等能力,适用于多种应用场景。技术栈包括 NextJs、TS、ChakraUI、MongoDB 和 PostgreSQL 等。它还具备免登录分享、Iframe 嵌入等便捷功能,适合快速集成和使用。
公众号·开源热榜

DAMO开发者矩阵,由阿里巴巴达摩院和中国互联网协会联合发起,致力于探讨最前沿的技术趋势与应用成果,搭建高质量的交流与分享平台,推动技术创新与产业应用链接,围绕“人工智能与新型计算”构建开放共享的开发者生态。
更多推荐
所有评论(0)