Skip to content

🔧 微调与训练

Model training, fine-tuning, and evaluation.

Dataset Management

label-studio

多类型数据标注工具,支持图像、文本、音频等多种格式,是机器学习项目数据准备的重要工具。

  • Stars: ⭐️ 26.8k
  • Tags: annotation data-labeling mlops
  • 最后活动时间: 2026-03-20

labelImg

经典的图像标注工具,支持Pascal VOC和YOLO格式,适用于目标检测和图像分类任务的数据准备。

  • Stars: ⭐️ 24.9k
  • Tags: 标注工具 图像识别 目标检测
  • 最后活动时间: 2024-06-07

datasets

Hugging Face官方数据集库,提供海量AI数据集的快速访问与处理工具,支持多种任务和框架集成。

  • Stars: ⭐️ 21.3k
  • Tags: datasets huggingface machine-learning
  • 最后活动时间: 2026-03-19

imgaug

强大的图像增强库,支持仿射变换、裁剪、对比度调整等多种机器学习增强技术。

  • Stars: ⭐️ 14.7k
  • Tags: image-augmentation deep-learning computer-vision
  • 最后活动时间: 2024-07-30

easy-dataset

专为LLM微调、RAG和评估场景设计的数据集创建工具,帮助开发者高效构建高质量训练数据。

  • Stars: ⭐️ 13.7k
  • Tags: 数据集 微调 RAG
  • 最后活动时间: 2026-03-11

quickdraw-dataset

Google Quick, Draw! 数据集的官方文档,包含5000万张涂鸦 drawings,是机器学习绘图识别领域的经典数据集。

  • Stars: ⭐️ 6.7k
  • Tags: Dataset Drawing Recognition Google
  • 最后活动时间: 2025-03-11

argilla

面向AI工程师和领域专家的协作平台,支持主动学习、RLHF、弱监督等多种数据标注场景,助力构建高质量数据集。

  • Stars: ⭐️ 4.9k
  • Tags: 数据标注 RLHF 主动学习
  • 最后活动时间: 2026-03-16

img2dataset

高效图像数据集准备工具,单机20小时可处理1亿URL,支持下载、调整大小与打包,是多模态数据准备的利器。

  • Stars: ⭐️ 4.4k
  • Tags: 图像数据集 数据准备 多模态
  • 最后活动时间: 2025-10-19

DataFlow

基于最新LLM的数据准备工具,提供丰富的算子和流水线支持,简化数据清洗与合成流程。

  • Stars: ⭐️ 3.1k
  • Tags: LLM Data Pipeline Data Synthesis
  • 最后活动时间: 2026-03-17

datachain

面向多模态数据的数据分析、版本控制和ETL工具,支持视频、音频、PDF和图像等多种格式。

  • Stars: ⭐️ 2.7k
  • Tags: multimodal data-processing etl mlops
  • 最后活动时间: 2026-03-20

synthetic-data-generator

专门生成高质量结构化表格数据的框架,支持隐私保护和数据增强,基于深度学习和GAN技术提供可靠的合成数据解决方案。

  • Stars: ⭐️ 2.4k
  • Tags: Synthetic Data Generative AI Tabular Data Privacy
  • 最后活动时间: 2026-03-16

DataDreamer

合成数据生成与模型对齐工具,支持提示工程、数据集生成和指令微调全流程。

  • Stars: ⭐️ 1.1k
  • Tags: Synthetic Data Fine-tuning Alignment
  • 最后活动时间: 2025-02-02

DataDesigner

NVIDIA NeMo数据设计器,用于生成高质量合成数据,支持多模态数据和智能体工作流。

  • Stars: ⭐️ 870
  • Tags: synthetic-data nvidia nemo
  • 最后活动时间: 2026-03-20

deepfabric

一站式合成数据生成与模型训练评估流水线,支持高质量数据生成、训练和评测全流程。

  • Stars: ⭐️ 848
  • Tags: Synthetic Data Fine-tuning Evaluation Dataset
  • 最后活动时间: 2026-03-09

magpie

ICLR 2025论文项目,通过提示对齐LLM从零合成高质量对齐数据,支持主流模型微调。

  • Stars: ⭐️ 833
  • Tags: 对齐 合成数据 ICLR2025
  • 最后活动时间: 2025-03-17

lightly-studio

计算机视觉数据管理工具,支持图像标注、数据筛选和MLOps工作流集成。

  • Stars: ⭐️ 690
  • Tags: computer-vision image-labeling mlops
  • 最后活动时间: 2026-03-20

Evaluation Metrics

ragas

专业的LLM应用评估框架,提供多种评估指标和自动化测试流程,帮助开发者快速测试和优化大语言模型应用性能。

  • Stars: ⭐️ 13.0k
  • Tags: LLM评估 自动化测试 LLMOps
  • 最后活动时间: 2026-02-24

evidently

开源ML和LLM可观测性框架,提供100+指标和可视化报告,用于评估、测试和监控AI系统。

  • Stars: ⭐️ 7.3k
  • Tags: ML监控 LLM可观测性 模型评估
  • 最后活动时间: 2026-03-19

opencompass

大模型评测平台,支持Llama3、GPT-4等主流模型在100+数据集上的全面评估,助力科学衡量大语言模型性能。

  • Stars: ⭐️ 6.8k
  • Tags: LLM 评估 基准测试
  • 最后活动时间: 2026-03-20

chinese-llm-benchmark

中文大模型能力评测平台,涵盖359个商用及开源模型,提供排行榜和超200万条缺陷库。

  • Stars: ⭐️ 5.7k
  • Tags: LLM评测 基准测试 中文模型
  • 最后活动时间: 2026-03-19

giskard-oss

开源的LLM智能体评估与测试框架,支持AI安全红队测试、公平性评估和模型验证,帮助开发者构建更可靠的AI系统。

  • Stars: ⭐️ 5.2k
  • Tags: LLM评估 AI安全 红队测试
  • 最后活动时间: 2026-03-20

VLMEvalKit

开源的大型多模态模型评估工具包,支持220+多模态模型和80+评测基准,覆盖GPT-4V、Gemini等主流模型。

  • Stars: ⭐️ 3.9k
  • Tags: Evaluation Multimodal Benchmark LMM
  • 最后活动时间: 2026-03-20

SwanLab

开源AI训练跟踪与可视化工具,支持云端和本地部署。可与PyTorch、Transformers等主流框架无缝集成。

  • Stars: ⭐️ 3.7k
  • Tags: MLOps Visualization Training Tracking
  • 最后活动时间: 2026-03-20

trulens

LLM实验和AI智能体的评估与追踪工具,帮助开发者衡量和优化模型表现。

  • Stars: ⭐️ 3.2k
  • Tags: Evaluation LLM Agents Observability
  • 最后活动时间: 2026-03-19

langwatch

专注于LLM评估和AI智能体测试的平台,提供可观测性和低代码功能,帮助开发者优化和监控大语言模型应用。

  • Stars: ⭐️ 3.1k
  • Tags: LLM评估 智能体测试 可观测性
  • 最后活动时间: 2026-03-20

hallucination-leaderboard

LLM幻觉评估排行榜,对比主流大模型在文档摘要任务中的幻觉频率,帮助开发者选择更可靠的模型。

  • Stars: ⭐️ 3.1k
  • Tags: hallucination llm-evaluation benchmark
  • 最后活动时间: 2026-03-20

uptrain

开源生成式AI应用评估与改进平台,提供幻觉检测、越狱检测等功能及根因分析。

  • Stars: ⭐️ 2.3k
  • Tags: LLM评估 AI测试 监控
  • 最后活动时间: 2024-08-18

ImageReward

NeurIPS 2023论文项目,学习并评估文本生成图像的人类偏好,通过RLHF训练奖励模型。

  • Stars: ⭐️ 1.6k
  • Tags: text-to-image human-preferences rlhf
  • 最后活动时间: 2025-10-29

judgeval

开源AI智能体评估与监控平台,支持强化学习和监督微调,提供环境数据收集和评估工具。

  • Stars: ⭐️ 1.0k
  • Tags: Agent Evaluation RL Observability
  • 最后活动时间: 2026-03-20

factool

生成式AI内容事实性检测工具框架,帮助识别大语言模型输出中的错误信息,提升AI生成内容的可靠性与可信度。

  • Stars: ⭐️ 918
  • Tags: Fact-Checking LLM Generative AI
  • 最后活动时间: 2024-08-19

dingo

全面的AI数据、模型和应用质量评估工具,支持LLM幻觉检测和数据质量评估。

  • Stars: ⭐️ 665
  • Tags: LLM评估 数据质量 幻觉检测
  • 最后活动时间: 2026-03-20

neptune-client

专为基础模型训练设计的实验追踪工具,支持MLOps全流程监控。

  • Stars: ⭐️ 620
  • Tags: MLOps Experiment Tracking LLM
  • 最后活动时间: 2026-03-17

open-unlearning

一站式LLM遗忘学习仓库,NeurIPS D&B '25收录,涵盖基准测试、隐私保护和成员推理攻击等研究方向。

  • Stars: ⭐️ 505
  • Tags: Unlearning Privacy Benchmarks
  • 最后活动时间: 2026-03-18

Fine-tuning Tools

LlamaFactory

统一高效的LLM/VLM微调框架,ACL 2024论文项目,支持100+模型和LoRA/QLoRA/量化等完整微调方案。

  • Stars: ⭐️ 68.8k
  • Tags: Fine-tuning LoRA LLM
  • 最后活动时间: 2026-03-20

DeepSpeed

微软开源深度学习优化库,支持千亿级参数模型训练,提供零冗余优化器和混合并行等核心技术。

  • Stars: ⭐️ 41.9k
  • Tags: 分布式训练 深度学习 PyTorch
  • 最后活动时间: 2026-03-18

trl

Hugging Face推出的强化学习训练库,支持RLHF、PPO等算法,让大模型对齐训练简单高效。

  • Stars: ⭐️ 17.7k
  • Tags: RLHF PPO 强化学习
  • 最后活动时间: 2026-03-20

WeClone

从聊天记录创建AI数字分身的一站式解决方案,通过微调大语言模型精准捕捉个人说话风格。

  • Stars: ⭐️ 16.4k
  • Tags: 数字分身 LLM微调 聊天机器人
  • 最后活动时间: 2026-03-13

Megatron-LM

NVIDIA开源的大规模Transformer模型训练框架,支持模型并行、张量并行和流水线并行等分布式训练技术。

  • Stars: ⭐️ 15.7k
  • Tags: 分布式训练 Transformer NVIDIA
  • 最后活动时间: 2026-03-20

nni

微软开源的AutoML工具包,自动化机器学习全生命周期,包括NAS、超参数调优和模型压缩。

  • Stars: ⭐️ 14.3k
  • Tags: AutoML NAS Hyperparameter Tuning Microsoft
  • 最后活动时间: 2024-07-03

ms-swift

ModelScope官方训练框架,支持PEFT和全参数微调600+大语言模型及300+多模态模型,涵盖SFT/DPO/GRPO等多种训练范式。

  • Stars: ⭐️ 13.3k
  • Tags: LLM训练 PEFT 多模态
  • 最后活动时间: 2026-03-20

litgpt

基于Lightning AI构建的完整LLM开发工具链,支持20+高性能模型的预训练、微调与大规模部署。

  • Stars: ⭐️ 13.2k
  • Tags: LLM 模型训练 微调
  • 最后活动时间: 2026-03-19

TinyZero

DeepSeek R1-Zero的极简复现版本,帮助开发者快速理解和实验强化学习训练方法。

  • Stars: ⭐️ 13.0k
  • Tags: DeepSeek R1-Zero 强化学习
  • 最后活动时间: 2026-02-27

PaddleNLP

飞桨生态下的易用高效大语言模型库,提供丰富的预训练模型和全流程NLP开发能力。

  • Stars: ⭐️ 12.9k
  • Tags: NLP LLM 预训练模型
  • 最后活动时间: 2025-12-17

oumi

一站式LLM/VLM训练平台,支持Qwen3、DeepSeek-R1等主流开源模型的微调、评估与部署。

  • Stars: ⭐️ 8.9k
  • Tags: 微调 LLM VLM
  • 最后活动时间: 2026-03-20

gpt-neox

基于Megatron和DeepSpeed的大规模分布式训练框架,支持模型并行自回归Transformer训练,适用于GPT类大语言模型的训练。

  • Stars: ⭐️ 7.4k
  • Tags: GPT 分布式训练 DeepSpeed
  • 最后活动时间: 2026-02-03

Firefly

大模型训练工具,支持Qwen2.5、Llama3、Mistral等主流大模型的微调训练,集成LoRA、QLoRA等高效训练技术。

  • Stars: ⭐️ 6.7k
  • Tags: LLM训练 LoRA 微调
  • 最后活动时间: 2024-10-24

Liger-Kernel

LinkedIn开源的高效Triton内核库,专为LLM训练优化,显著提升训练效率。

  • Stars: ⭐️ 6.2k
  • Tags: triton llm-training kernels optimization
  • 最后活动时间: 2026-03-20

xtuner

专为超大规模MoE模型打造的下一代训练引擎,支持DeepSeek-V3、Qwen3-MoE等主流大模型的高效微调与训练。

  • Stars: ⭐️ 5.1k
  • Tags: MoE LLM训练 微调框架
  • 最后活动时间: 2026-03-20

MedicalGPT

完整的医疗大模型训练流程,支持增量预训练、RLHF、DPO、ORPO等多种训练方法,助力构建医疗领域GPT模型。

  • Stars: ⭐️ 5.1k
  • Tags: 医疗大模型 RLHF DPO
  • 最后活动时间: 2026-03-17

transformerlab-app

开源AI研究环境,支持从本地硬件到GPU集群无缝训练、评估和扩展模型。

  • Stars: ⭐️ 4.8k
  • Tags: 模型训练 LoRA RLHF
  • 最后活动时间: 2026-03-20

EasyR1

基于veRL构建的高效多模态强化学习训练框架,支持DeepSeek、Qwen等主流模型。

  • Stars: ⭐️ 4.8k
  • Tags: 强化学习 多模态 训练框架
  • 最后活动时间: 2026-03-10

zero_nlp

中文NLP一站式解决方案,涵盖大模型训练、微调与推理全流程,支持LLaMA、ChatGLM、LLaVA等主流模型。

  • Stars: ⭐️ 3.8k
  • Tags: LLaMA ChatGLM NLP
  • 最后活动时间: 2025-08-05

llm-compressor

与Transformers兼容的LLM压缩库,支持量化、稀疏化等压缩算法,显著降低推理成本和内存占用。

  • Stars: ⭐️ 2.9k
  • Tags: 模型压缩 量化 vLLM
  • 最后活动时间: 2026-03-20

OpenPipe

将昂贵的提示词转换为低成本微调模型,帮助用户大幅降低LLM调用成本,提供端到端的微调工作流。

  • Stars: ⭐️ 2.8k
  • Tags: Fine-tuning LLMOps Cost Optimization
  • 最后活动时间: 2024-05-25

xTuring

一站式LLM个性化解决方案,从数据预处理到微调全流程覆盖,支持LoRA、PEFT、量化等高效微调技术。

  • Stars: ⭐️ 2.7k
  • Tags: Fine-tuning LoRA PEFT
  • 最后活动时间: 2026-03-04

maxtext

基于JAX构建的高性能大语言模型训练框架,支持Llama、Gemma、Mistral等主流模型架构。

  • Stars: ⭐️ 2.2k
  • Tags: JAX LLM训练 微调
  • 最后活动时间: 2026-03-20

DB-GPT-Hub

专注于Text-to-SQL任务的微调资源库,提供模型、数据集和微调技术,显著提升大模型在自然语言转SQL场景的性能。

  • Stars: ⭐️ 2.0k
  • Tags: Text-to-SQL Fine-tuning NL2SQL
  • 最后活动时间: 2025-07-02

Qwen-VL-Series-Finetune

开源的Qwen-VL系列视觉语言模型微调实现,支持Qwen2-VL、Qwen2.5-VL、Qwen3-VL等多个版本。

  • Stars: ⭐️ 1.7k
  • Tags: Qwen-VL 微调 多模态
  • 最后活动时间: 2026-03-10

dlrover

自动化分布式深度学习系统,简化大规模模型训练的集群调度和资源管理,支持LLM训练优化。

  • Stars: ⭐️ 1.6k
  • Tags: Distributed Training Deep Learning LLM Training
  • 最后活动时间: 2026-03-16

RLHF-Reward-Modeling

提供训练RLHF奖励模型的完整配方和最佳实践,支持Llama3等主流大模型,帮助构建高质量奖励模型实现人类偏好对齐。

  • Stars: ⭐️ 1.5k
  • Tags: RLHF Reward-Model LLM
  • 最后活动时间: 2025-04-24

finetuner

面向任务的嵌入模型微调工具,支持BERT、CLIP等主流模型的少样本学习和度量学习优化。

  • Stars: ⭐️ 1.5k
  • Tags: Fine-tuning Embeddings Few-shot Learning
  • 最后活动时间: 2024-03-11

text-to-lora

基于文本任务描述自动适配LLM的超网络工具,无需传统训练即可让大模型适应特定基准任务。

  • Stars: ⭐️ 1.2k
  • Tags: LLM LoRA Fine-tuning Hypernetworks
  • 最后活动时间: 2025-06-08

training_extensions

基于OpenVINO™的计算机视觉模型全流程工具链,支持训练、评估、优化和部署。

  • Stars: ⭐️ 1.2k
  • Tags: OpenVINO 计算机视觉 模型优化
  • 最后活动时间: 2026-03-20

sockeye

基于PyTorch的序列到序列框架,专注于神经机器翻译,支持Transformer架构和完整的训练推理流程。

  • Stars: ⭐️ 1.2k
  • Tags: Machine Translation Transformer Seq2Seq
  • 最后活动时间: 2024-10-24

sliders

用于精确控制扩散模型生成效果的滑块技术,通过调整概念滑块实现图像风格和内容的细粒度控制。

  • Stars: ⭐️ 1.1k
  • Tags: Diffusion Models Image Generation Fine-tuning
  • 最后活动时间: 2025-06-20

TinyLLaVA_Factory

小型大规模多模态模型训练框架,专注于视觉语言模型的轻量化实现与训练。

  • Stars: ⭐️ 965
  • Tags: Multimodal LLaVA Vision-Language
  • 最后活动时间: 2026-03-15

refiners

基于PyTorch的微框架,提供一流API用于基础模型适配,支持LoRA、ControlNet、Stable Diffusion等多种微调技术。

  • Stars: ⭐️ 834
  • Tags: PyTorch LoRA Fine-tuning
  • 最后活动时间: 2025-09-17

Lora-for-Diffusers

最易懂的 LoRA 技术教程,帮助研究者快速掌握 Diffusers 框架中的低秩适应技术,涵盖 Stable Diffusion 微调的完整实践指南。

  • Stars: ⭐️ 825
  • Tags: LoRA Diffusers Fine-tuning Stable Diffusion
  • 最后活动时间: 2024-04-10

MARS

面向大模型训练的方差缩减优化器官方实现,提升大规模模型预训练和微调效率。

  • Stars: ⭐️ 717
  • Tags: Optimizer Training LLM
  • 最后活动时间: 2026-03-04

MS-AMP

微软开源的自动混合精度训练库,支持FP8精度,优化GPU显存使用并加速深度学习模型训练。

  • Stars: ⭐️ 635
  • Tags: Mixed Precision Deep Learning FP8 PyTorch
  • 最后活动时间: 2025-12-01

Awesome-Parameter-Efficient-Transfer-Learning

参数高效微调技术精选合集,涵盖LoRA、Adapter、Prefix Tuning等前沿方法的论文与代码资源。

  • Stars: ⭐️ 589
  • Tags: LoRA Adapter 微调 迁移学习
  • 最后活动时间: 2025-12-10

SPPO

自博弈偏好优化方法的官方实现,一种创新的RLHF技术用于大语言模型对齐训练。

  • Stars: ⭐️ 584
  • Tags: RLHF Fine-tuning Alignment
  • 最后活动时间: 2025-01-23

AngelSlim

腾讯开源的模型压缩工具包,支持LLM/VLM量化、FP4压缩、推测解码等技术,覆盖DeepSeek、Qwen等主流模型。

  • Stars: ⭐️ 549
  • Tags: Quantization Model Compression LLM
  • 最后活动时间: 2026-03-20

ml-mdm

Apple开源的文本到图像扩散模型训练框架,专注于数据和计算效率优化,支持高质量模型训练。

  • Stars: ⭐️ 515
  • Tags: Diffusion Models Text-to-Image Apple
  • 最后活动时间: 2025-03-27

mergoo

一个用于轻松合并多个LLM专家模型并高效训练合并后模型的库。支持LoRA、MoE等技术,简化模型融合流程。

  • Stars: ⭐️ 507
  • Tags: LLM Model Merging Fine-tuning MoE
  • 最后活动时间: 2024-08-26