精选项目

AgentForge

轻量级多 Agent 系统框架,支持可配置的通信模式(Peer、Hierarchical、Debate)。

Python Agent LangGraph · ⭐ 128 · GitHub →


RAG-Eval-CN

中文 RAG 系统评估工具包,覆盖忠实度、相关性、答案完整度等指标。

Python RAG Evaluation · ⭐ 85 · GitHub →


Latent-Viz

交互式 latent space 可视化工具,支持 t-SNE、UMAP、PCA 降维方法。

Python Visualization Transformers · ⭐ 203 · GitHub →


LoRA-Bench

系统性基准测试,对比 LoRA 配置(rank、目标模块、学习率)在不同 LLM 家族上的表现。

Python Fine-tuning Benchmark · ⭐ 67 · GitHub →