01 | 大模型是怎么工作的——从 Transformer 到 Tokenization

不讲公式,用直觉和具体例子解释大模型的核心机制:Transformer 架构、Tokenization 原理、Context Window 概念,以及自回归生成的工作方式。

2026年7月5日 · 2 分钟 · 412 字 · Latent

02 | Prompt Engineering——从入门到精通

系统讲解 Prompt Engineering 的核心技巧:Zero-shot、Few-shot、Chain-of-Thought、Self-Consistency,以及 System Prompt 设计原则。每个技巧配具体示例和使用场景。

2026年7月5日 · 3 分钟 · 460 字 · Latent

03 | 推理模型——o1、R1 和 test-time compute 到底在做什么

解释推理模型(o1/o3、DeepSeek-R1)的工作原理:test-time compute、内部思维链、强化学习训练,以及它和传统 CoT Prompt 的本质区别。

2026年7月5日 · 2 分钟 · 380 字 · Latent