🔧 微调与训练
Model training, fine-tuning, and evaluation.
Dataset Management
label-studio
多类型数据标注工具,支持图像、文本、音频等多种格式,是机器学习项目数据准备的重要工具。
- Stars: ⭐️ 26.8k
- Tags:
annotationdata-labelingmlops - 最后活动时间: 2026-03-20
labelImg
经典的图像标注工具,支持Pascal VOC和YOLO格式,适用于目标检测和图像分类任务的数据准备。
- Stars: ⭐️ 24.9k
- Tags:
标注工具图像识别目标检测 - 最后活动时间: 2024-06-07
datasets
Hugging Face官方数据集库,提供海量AI数据集的快速访问与处理工具,支持多种任务和框架集成。
- Stars: ⭐️ 21.3k
- Tags:
datasetshuggingfacemachine-learning - 最后活动时间: 2026-03-19
imgaug
强大的图像增强库,支持仿射变换、裁剪、对比度调整等多种机器学习增强技术。
- Stars: ⭐️ 14.7k
- Tags:
image-augmentationdeep-learningcomputer-vision - 最后活动时间: 2024-07-30
easy-dataset
专为LLM微调、RAG和评估场景设计的数据集创建工具,帮助开发者高效构建高质量训练数据。
- Stars: ⭐️ 13.7k
- Tags:
数据集微调RAG - 最后活动时间: 2026-03-11
quickdraw-dataset
Google Quick, Draw! 数据集的官方文档,包含5000万张涂鸦 drawings,是机器学习绘图识别领域的经典数据集。
- Stars: ⭐️ 6.7k
- Tags:
DatasetDrawing RecognitionGoogle - 最后活动时间: 2025-03-11
argilla
面向AI工程师和领域专家的协作平台,支持主动学习、RLHF、弱监督等多种数据标注场景,助力构建高质量数据集。
- Stars: ⭐️ 4.9k
- Tags:
数据标注RLHF主动学习 - 最后活动时间: 2026-03-16
img2dataset
高效图像数据集准备工具,单机20小时可处理1亿URL,支持下载、调整大小与打包,是多模态数据准备的利器。
- Stars: ⭐️ 4.4k
- Tags:
图像数据集数据准备多模态 - 最后活动时间: 2025-10-19
DataFlow
基于最新LLM的数据准备工具,提供丰富的算子和流水线支持,简化数据清洗与合成流程。
- Stars: ⭐️ 3.1k
- Tags:
LLMData PipelineData Synthesis - 最后活动时间: 2026-03-17
datachain
面向多模态数据的数据分析、版本控制和ETL工具,支持视频、音频、PDF和图像等多种格式。
- Stars: ⭐️ 2.7k
- Tags:
multimodaldata-processingetlmlops - 最后活动时间: 2026-03-20
synthetic-data-generator
专门生成高质量结构化表格数据的框架,支持隐私保护和数据增强,基于深度学习和GAN技术提供可靠的合成数据解决方案。
- Stars: ⭐️ 2.4k
- Tags:
Synthetic DataGenerative AITabular DataPrivacy - 最后活动时间: 2026-03-16
DataDreamer
合成数据生成与模型对齐工具,支持提示工程、数据集生成和指令微调全流程。
- Stars: ⭐️ 1.1k
- Tags:
Synthetic DataFine-tuningAlignment - 最后活动时间: 2025-02-02
DataDesigner
NVIDIA NeMo数据设计器,用于生成高质量合成数据,支持多模态数据和智能体工作流。
- Stars: ⭐️ 870
- Tags:
synthetic-datanvidianemo - 最后活动时间: 2026-03-20
deepfabric
一站式合成数据生成与模型训练评估流水线,支持高质量数据生成、训练和评测全流程。
- Stars: ⭐️ 848
- Tags:
Synthetic DataFine-tuningEvaluationDataset - 最后活动时间: 2026-03-09
magpie
ICLR 2025论文项目,通过提示对齐LLM从零合成高质量对齐数据,支持主流模型微调。
- Stars: ⭐️ 833
- Tags:
对齐合成数据ICLR2025 - 最后活动时间: 2025-03-17
lightly-studio
计算机视觉数据管理工具,支持图像标注、数据筛选和MLOps工作流集成。
- Stars: ⭐️ 690
- Tags:
computer-visionimage-labelingmlops - 最后活动时间: 2026-03-20
Evaluation Metrics
ragas
专业的LLM应用评估框架,提供多种评估指标和自动化测试流程,帮助开发者快速测试和优化大语言模型应用性能。
- Stars: ⭐️ 13.0k
- Tags:
LLM评估自动化测试LLMOps - 最后活动时间: 2026-02-24
evidently
开源ML和LLM可观测性框架,提供100+指标和可视化报告,用于评估、测试和监控AI系统。
- Stars: ⭐️ 7.3k
- Tags:
ML监控LLM可观测性模型评估 - 最后活动时间: 2026-03-19
opencompass
大模型评测平台,支持Llama3、GPT-4等主流模型在100+数据集上的全面评估,助力科学衡量大语言模型性能。
- Stars: ⭐️ 6.8k
- Tags:
LLM评估基准测试 - 最后活动时间: 2026-03-20
chinese-llm-benchmark
中文大模型能力评测平台,涵盖359个商用及开源模型,提供排行榜和超200万条缺陷库。
- Stars: ⭐️ 5.7k
- Tags:
LLM评测基准测试中文模型 - 最后活动时间: 2026-03-19
giskard-oss
开源的LLM智能体评估与测试框架,支持AI安全红队测试、公平性评估和模型验证,帮助开发者构建更可靠的AI系统。
- Stars: ⭐️ 5.2k
- Tags:
LLM评估AI安全红队测试 - 最后活动时间: 2026-03-20
VLMEvalKit
开源的大型多模态模型评估工具包,支持220+多模态模型和80+评测基准,覆盖GPT-4V、Gemini等主流模型。
- Stars: ⭐️ 3.9k
- Tags:
EvaluationMultimodalBenchmarkLMM - 最后活动时间: 2026-03-20
SwanLab
开源AI训练跟踪与可视化工具,支持云端和本地部署。可与PyTorch、Transformers等主流框架无缝集成。
- Stars: ⭐️ 3.7k
- Tags:
MLOpsVisualizationTraining Tracking - 最后活动时间: 2026-03-20
trulens
LLM实验和AI智能体的评估与追踪工具,帮助开发者衡量和优化模型表现。
- Stars: ⭐️ 3.2k
- Tags:
EvaluationLLMAgentsObservability - 最后活动时间: 2026-03-19
langwatch
专注于LLM评估和AI智能体测试的平台,提供可观测性和低代码功能,帮助开发者优化和监控大语言模型应用。
- Stars: ⭐️ 3.1k
- Tags:
LLM评估智能体测试可观测性 - 最后活动时间: 2026-03-20
hallucination-leaderboard
LLM幻觉评估排行榜,对比主流大模型在文档摘要任务中的幻觉频率,帮助开发者选择更可靠的模型。
- Stars: ⭐️ 3.1k
- Tags:
hallucinationllm-evaluationbenchmark - 最后活动时间: 2026-03-20
uptrain
开源生成式AI应用评估与改进平台,提供幻觉检测、越狱检测等功能及根因分析。
- Stars: ⭐️ 2.3k
- Tags:
LLM评估AI测试监控 - 最后活动时间: 2024-08-18
ImageReward
NeurIPS 2023论文项目,学习并评估文本生成图像的人类偏好,通过RLHF训练奖励模型。
- Stars: ⭐️ 1.6k
- Tags:
text-to-imagehuman-preferencesrlhf - 最后活动时间: 2025-10-29
judgeval
开源AI智能体评估与监控平台,支持强化学习和监督微调,提供环境数据收集和评估工具。
- Stars: ⭐️ 1.0k
- Tags:
Agent EvaluationRLObservability - 最后活动时间: 2026-03-20
factool
生成式AI内容事实性检测工具框架,帮助识别大语言模型输出中的错误信息,提升AI生成内容的可靠性与可信度。
- Stars: ⭐️ 918
- Tags:
Fact-CheckingLLMGenerative AI - 最后活动时间: 2024-08-19
dingo
全面的AI数据、模型和应用质量评估工具,支持LLM幻觉检测和数据质量评估。
- Stars: ⭐️ 665
- Tags:
LLM评估数据质量幻觉检测 - 最后活动时间: 2026-03-20
neptune-client
专为基础模型训练设计的实验追踪工具,支持MLOps全流程监控。
- Stars: ⭐️ 620
- Tags:
MLOpsExperiment TrackingLLM - 最后活动时间: 2026-03-17
open-unlearning
一站式LLM遗忘学习仓库,NeurIPS D&B '25收录,涵盖基准测试、隐私保护和成员推理攻击等研究方向。
- Stars: ⭐️ 505
- Tags:
UnlearningPrivacyBenchmarks - 最后活动时间: 2026-03-18
Fine-tuning Tools
LlamaFactory
统一高效的LLM/VLM微调框架,ACL 2024论文项目,支持100+模型和LoRA/QLoRA/量化等完整微调方案。
- Stars: ⭐️ 68.8k
- Tags:
Fine-tuningLoRALLM - 最后活动时间: 2026-03-20
DeepSpeed
微软开源深度学习优化库,支持千亿级参数模型训练,提供零冗余优化器和混合并行等核心技术。
- Stars: ⭐️ 41.9k
- Tags:
分布式训练深度学习PyTorch - 最后活动时间: 2026-03-18
trl
Hugging Face推出的强化学习训练库,支持RLHF、PPO等算法,让大模型对齐训练简单高效。
- Stars: ⭐️ 17.7k
- Tags:
RLHFPPO强化学习 - 最后活动时间: 2026-03-20
WeClone
从聊天记录创建AI数字分身的一站式解决方案,通过微调大语言模型精准捕捉个人说话风格。
- Stars: ⭐️ 16.4k
- Tags:
数字分身LLM微调聊天机器人 - 最后活动时间: 2026-03-13
Megatron-LM
NVIDIA开源的大规模Transformer模型训练框架,支持模型并行、张量并行和流水线并行等分布式训练技术。
- Stars: ⭐️ 15.7k
- Tags:
分布式训练TransformerNVIDIA - 最后活动时间: 2026-03-20
nni
微软开源的AutoML工具包,自动化机器学习全生命周期,包括NAS、超参数调优和模型压缩。
- Stars: ⭐️ 14.3k
- Tags:
AutoMLNASHyperparameter TuningMicrosoft - 最后活动时间: 2024-07-03
ms-swift
ModelScope官方训练框架,支持PEFT和全参数微调600+大语言模型及300+多模态模型,涵盖SFT/DPO/GRPO等多种训练范式。
- Stars: ⭐️ 13.3k
- Tags:
LLM训练PEFT多模态 - 最后活动时间: 2026-03-20
litgpt
基于Lightning AI构建的完整LLM开发工具链,支持20+高性能模型的预训练、微调与大规模部署。
- Stars: ⭐️ 13.2k
- Tags:
LLM模型训练微调 - 最后活动时间: 2026-03-19
TinyZero
DeepSeek R1-Zero的极简复现版本,帮助开发者快速理解和实验强化学习训练方法。
- Stars: ⭐️ 13.0k
- Tags:
DeepSeekR1-Zero强化学习 - 最后活动时间: 2026-02-27
PaddleNLP
飞桨生态下的易用高效大语言模型库,提供丰富的预训练模型和全流程NLP开发能力。
- Stars: ⭐️ 12.9k
- Tags:
NLPLLM预训练模型 - 最后活动时间: 2025-12-17
oumi
一站式LLM/VLM训练平台,支持Qwen3、DeepSeek-R1等主流开源模型的微调、评估与部署。
- Stars: ⭐️ 8.9k
- Tags:
微调LLMVLM - 最后活动时间: 2026-03-20
gpt-neox
基于Megatron和DeepSpeed的大规模分布式训练框架,支持模型并行自回归Transformer训练,适用于GPT类大语言模型的训练。
- Stars: ⭐️ 7.4k
- Tags:
GPT分布式训练DeepSpeed - 最后活动时间: 2026-02-03
Firefly
大模型训练工具,支持Qwen2.5、Llama3、Mistral等主流大模型的微调训练,集成LoRA、QLoRA等高效训练技术。
- Stars: ⭐️ 6.7k
- Tags:
LLM训练LoRA微调 - 最后活动时间: 2024-10-24
Liger-Kernel
LinkedIn开源的高效Triton内核库,专为LLM训练优化,显著提升训练效率。
- Stars: ⭐️ 6.2k
- Tags:
tritonllm-trainingkernelsoptimization - 最后活动时间: 2026-03-20
xtuner
专为超大规模MoE模型打造的下一代训练引擎,支持DeepSeek-V3、Qwen3-MoE等主流大模型的高效微调与训练。
- Stars: ⭐️ 5.1k
- Tags:
MoELLM训练微调框架 - 最后活动时间: 2026-03-20
MedicalGPT
完整的医疗大模型训练流程,支持增量预训练、RLHF、DPO、ORPO等多种训练方法,助力构建医疗领域GPT模型。
- Stars: ⭐️ 5.1k
- Tags:
医疗大模型RLHFDPO - 最后活动时间: 2026-03-17
transformerlab-app
开源AI研究环境,支持从本地硬件到GPU集群无缝训练、评估和扩展模型。
- Stars: ⭐️ 4.8k
- Tags:
模型训练LoRARLHF - 最后活动时间: 2026-03-20
EasyR1
基于veRL构建的高效多模态强化学习训练框架,支持DeepSeek、Qwen等主流模型。
- Stars: ⭐️ 4.8k
- Tags:
强化学习多模态训练框架 - 最后活动时间: 2026-03-10
zero_nlp
中文NLP一站式解决方案,涵盖大模型训练、微调与推理全流程,支持LLaMA、ChatGLM、LLaVA等主流模型。
- Stars: ⭐️ 3.8k
- Tags:
LLaMAChatGLMNLP - 最后活动时间: 2025-08-05
llm-compressor
与Transformers兼容的LLM压缩库,支持量化、稀疏化等压缩算法,显著降低推理成本和内存占用。
- Stars: ⭐️ 2.9k
- Tags:
模型压缩量化vLLM - 最后活动时间: 2026-03-20
OpenPipe
将昂贵的提示词转换为低成本微调模型,帮助用户大幅降低LLM调用成本,提供端到端的微调工作流。
- Stars: ⭐️ 2.8k
- Tags:
Fine-tuningLLMOpsCost Optimization - 最后活动时间: 2024-05-25
xTuring
一站式LLM个性化解决方案,从数据预处理到微调全流程覆盖,支持LoRA、PEFT、量化等高效微调技术。
- Stars: ⭐️ 2.7k
- Tags:
Fine-tuningLoRAPEFT - 最后活动时间: 2026-03-04
maxtext
基于JAX构建的高性能大语言模型训练框架,支持Llama、Gemma、Mistral等主流模型架构。
- Stars: ⭐️ 2.2k
- Tags:
JAXLLM训练微调 - 最后活动时间: 2026-03-20
DB-GPT-Hub
专注于Text-to-SQL任务的微调资源库,提供模型、数据集和微调技术,显著提升大模型在自然语言转SQL场景的性能。
- Stars: ⭐️ 2.0k
- Tags:
Text-to-SQLFine-tuningNL2SQL - 最后活动时间: 2025-07-02
Qwen-VL-Series-Finetune
开源的Qwen-VL系列视觉语言模型微调实现,支持Qwen2-VL、Qwen2.5-VL、Qwen3-VL等多个版本。
- Stars: ⭐️ 1.7k
- Tags:
Qwen-VL微调多模态 - 最后活动时间: 2026-03-10
dlrover
自动化分布式深度学习系统,简化大规模模型训练的集群调度和资源管理,支持LLM训练优化。
- Stars: ⭐️ 1.6k
- Tags:
Distributed TrainingDeep LearningLLM Training - 最后活动时间: 2026-03-16
RLHF-Reward-Modeling
提供训练RLHF奖励模型的完整配方和最佳实践,支持Llama3等主流大模型,帮助构建高质量奖励模型实现人类偏好对齐。
- Stars: ⭐️ 1.5k
- Tags:
RLHFReward-ModelLLM - 最后活动时间: 2025-04-24
finetuner
面向任务的嵌入模型微调工具,支持BERT、CLIP等主流模型的少样本学习和度量学习优化。
- Stars: ⭐️ 1.5k
- Tags:
Fine-tuningEmbeddingsFew-shot Learning - 最后活动时间: 2024-03-11
text-to-lora
基于文本任务描述自动适配LLM的超网络工具,无需传统训练即可让大模型适应特定基准任务。
- Stars: ⭐️ 1.2k
- Tags:
LLMLoRAFine-tuningHypernetworks - 最后活动时间: 2025-06-08
training_extensions
基于OpenVINO™的计算机视觉模型全流程工具链,支持训练、评估、优化和部署。
- Stars: ⭐️ 1.2k
- Tags:
OpenVINO计算机视觉模型优化 - 最后活动时间: 2026-03-20
sockeye
基于PyTorch的序列到序列框架,专注于神经机器翻译,支持Transformer架构和完整的训练推理流程。
- Stars: ⭐️ 1.2k
- Tags:
Machine TranslationTransformerSeq2Seq - 最后活动时间: 2024-10-24
sliders
用于精确控制扩散模型生成效果的滑块技术,通过调整概念滑块实现图像风格和内容的细粒度控制。
- Stars: ⭐️ 1.1k
- Tags:
Diffusion ModelsImage GenerationFine-tuning - 最后活动时间: 2025-06-20
TinyLLaVA_Factory
小型大规模多模态模型训练框架,专注于视觉语言模型的轻量化实现与训练。
- Stars: ⭐️ 965
- Tags:
MultimodalLLaVAVision-Language - 最后活动时间: 2026-03-15
refiners
基于PyTorch的微框架,提供一流API用于基础模型适配,支持LoRA、ControlNet、Stable Diffusion等多种微调技术。
- Stars: ⭐️ 834
- Tags:
PyTorchLoRAFine-tuning - 最后活动时间: 2025-09-17
Lora-for-Diffusers
最易懂的 LoRA 技术教程,帮助研究者快速掌握 Diffusers 框架中的低秩适应技术,涵盖 Stable Diffusion 微调的完整实践指南。
- Stars: ⭐️ 825
- Tags:
LoRADiffusersFine-tuningStable Diffusion - 最后活动时间: 2024-04-10
MARS
面向大模型训练的方差缩减优化器官方实现,提升大规模模型预训练和微调效率。
- Stars: ⭐️ 717
- Tags:
OptimizerTrainingLLM - 最后活动时间: 2026-03-04
MS-AMP
微软开源的自动混合精度训练库,支持FP8精度,优化GPU显存使用并加速深度学习模型训练。
- Stars: ⭐️ 635
- Tags:
Mixed PrecisionDeep LearningFP8PyTorch - 最后活动时间: 2025-12-01
Awesome-Parameter-Efficient-Transfer-Learning
参数高效微调技术精选合集,涵盖LoRA、Adapter、Prefix Tuning等前沿方法的论文与代码资源。
- Stars: ⭐️ 589
- Tags:
LoRAAdapter微调迁移学习 - 最后活动时间: 2025-12-10
SPPO
自博弈偏好优化方法的官方实现,一种创新的RLHF技术用于大语言模型对齐训练。
- Stars: ⭐️ 584
- Tags:
RLHFFine-tuningAlignment - 最后活动时间: 2025-01-23
AngelSlim
腾讯开源的模型压缩工具包,支持LLM/VLM量化、FP4压缩、推测解码等技术,覆盖DeepSeek、Qwen等主流模型。
- Stars: ⭐️ 549
- Tags:
QuantizationModel CompressionLLM - 最后活动时间: 2026-03-20
ml-mdm
Apple开源的文本到图像扩散模型训练框架,专注于数据和计算效率优化,支持高质量模型训练。
- Stars: ⭐️ 515
- Tags:
Diffusion ModelsText-to-ImageApple - 最后活动时间: 2025-03-27
mergoo
一个用于轻松合并多个LLM专家模型并高效训练合并后模型的库。支持LoRA、MoE等技术,简化模型融合流程。
- Stars: ⭐️ 507
- Tags:
LLMModel MergingFine-tuningMoE - 最后活动时间: 2024-08-26
