本项目旨在分享大模型相关技术原理以及实战经验。 目录 🔥 LLM训练 🐫 LLM训练实战 🐼 LLM参数高效微调技术原理 🐰 LLM参数高效微调技术实战 🐘 LLM分布式训练并行技术 🌋 分布式AI框架 📡 分布式训练网络通信 🌿 LLM训练优化技术 🐎 LLM推理 🚀 LLM推理框架 ✈️ LLM推理优化技术 ♻️ LLM压缩 📐 LLM量化 🔰 LLM剪枝 💹 LLM知识蒸馏 ♑️ 低秩分解 🌴 LLM数据工程 🐬 LLM微调高效数据筛选技术 🌀 提示工程 ♍️ LLM算法架构 🧩 LLM应用开发 🀄️ LLM国产化适配 🔯 AI编译器 🔘 AI基础设施 🍁 AI加速卡 AI集群网络通信 💟 LLMOps 🍄 LLM生态相关技术 🔨 服务器基础环境安装及常用工具 💬 LLM学习交流群 👥 微信公众号 ⭐️ Star History 🔗 AI工程化课程推荐 LLM训练 LLM训练实战 下面汇总了我在大模型实践中训练相关的所有教程。从6B到65B,从全量微调到高效微调(LoRA,QLoRA,P-Tuni…
A project structure aware autonomous software engineer aiming for autonomous program improvementAutoCodeRover: Autonomous Program Improvement ArXiv Paper 👋 Overview AutoCodeRover is a fully automated approach for resolving GitHub issues (bug fixing and feature addition) where LLMs are combined with analysis and debugging capabilities to prioritize patch locations ultimately leading to a patch. On SWE-bench lite, which consists of 300 real-world GitHub issues, AutoCodeRover resolves ~22% of…
A curated list of Artificial Intelligence (AI) courses, books, video lectures and papers.Awesome Artificial Intelligence (AI) This is a curated list of Artificial Intelligence (AI) tools, courses, books, lectures, and papers. AI, or Artificial Intelligence, is a branch of computer science focused on creating machines that can perform tasks requiring human-like intelligence. These tasks include learning, reasoning, problem-solving, understanding natural language, and recognizing patterns. AI ai…
آموزش رایگان و دائمی فعالسازی آنتن در آیفون ۱۴ و ۱۵ بدون ردگیری و بسته شدن با دو روش مختلف، به همراه سورس کد و فایل ساخت UUID یکتاآموزش رایگان و دائمی فعالسازی آنتن در آیفون ۱۴ و ۱۵ بدون ردگیری و بسته شدن با دو روش مختلف، به همراه سورس کد و فایل ساخت UUID یکتا📡. اموزش ساخت پروفایل یکتا کد ها به صورت template یا پوسته با توجه به همه اوپراتورها گذاشته شده فقط با uuid Generator که با زبان پایتون نوشته شده کدهای همتا جدید بسازید و با قبلی ها عوض کنید و فایل سیو کنید (فایل پایتون به راحتی exe تبد…
《开源大模型食用指南》基于Linux环境快速部署开源大模型,更适合中国宝宝的部署教程 开源大模型食用指南 本项目是一个围绕开源大模型、针对国内初学者、基于 AutoDL 平台的中国宝宝专属大模型教程,针对各类开源大模型提供包括环境配置、本地部署、高效微调等技能在内的全流程指导,简化开源大模型的部署、使用和应用流程,让更多的普通学生、研究者更好地使用开源大模型,帮助开源、自由的大模型更快融入到普通学习者的生活中。 本项目的主要内容包括: 基于 AutoDL 平台(可扩展,例如阿里云)的开源 LLM 环境配置指南,针对不同模型要求提供不同的详细环境配置步骤; 针对国内外主流开源 LLM 的部署使用教程,包括 LLaMA、ChatGLM、InternLM 等; 开源 LLM 的部署应用指导,包括命令行调用、在线 Demo 部署、LangChain 框架集成等; 开源 LLM 的全量微调、高效微调方法,包括分布式全量微调、LoRA、ptuning 等。 项目的主要内容就是教程,让更多的学生和未来的从业者了解和熟悉开源大模型的食用方法!任何人都可以提出issue或是…
An AI-powered answer engine with a generative UIMorphic An AI-powered answer engine with a generative UI. 🔍 Overview 🧱 Stack 🚀 Quickstart 🌐 Deploy 🧱 Stack App framework: Next.js Text streaming / Generative UI: Vercel AI SDK Generative Model: OpenAI Search API: Tavily AI Component library: shadcn/ui Headless component primitives: Radix UI Styling: Tailwind CSS 🚀 Quickstart 1. Fork and Clone repo Fork the repo to your Github account, then run the following command to clone the repo: git clon…
LLM training in simple, raw C/CUDAllm.c LLM training in simple, pure C/CUDA. There is no need for 245MB of PyTorch or 107MB of cPython. For example, training GPT-2 (CPU, fp32) is ~1,000 lines of clean code in a single file. It compiles and runs instantly, and exactly matches the PyTorch reference implementation. I chose GPT-2 as the first working example because it is the grand-daddy of LLMs, the first time the modern stack was put together. Currently, I am working on: direct CUDA implementati…
InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation 🔥 InstantStyle: Free Lunch towards Style-Preserving in Text-to-Image Generation Haofan Wang* · Matteo Spinelli · Qixun Wang · Xu Bai · Zekui Qin · Anthony Chen InstantX Team *corresponding authors InstantStyle is a general framework that employs two straightforward yet potent techniques for achieving an effective disentanglement of style and content from reference images. Principle Separating Content from Image.…
Free, simple, and intuitive online database design tool and SQL generator. Free, simple, and intuitive database design tool and SQL generator. drawDB · Discord drawDB DrawDB is a robust and user-friendly database entity relationship (DBER) editor right in your browser. Build diagrams with a few clicks, export sql scripts, customize your editor, and more without creating an account. See the full set of features here. Getting Started Local Development git clone https://gith…