CAMEL, RoleLLM

发表于 2025-12-31 更新于 2026-02-10

CAMEL: Communicative Agents for “Mind” Exploration of Large Language Model Society#

让两个 LLM 互相对话, 人类提出 idea, 由任务细化员把 idea 变成具体任务, 由 AI User 提需求并验收代码, AI Assistant 写代码, 二者进行多轮对话.

容易出现的问题:

解决方案: Inception Prompting.

值得注意的是, 这种方法可以用于生成效果出色的微调数据集.

现有的开源 LLM 主要是在通用领域训练的, 缺乏对角色扮演的特定优化; 闭源 LLM 如 GPT4 虽然角色扮演能力出色, 但闭源模型无法微调, API 成本高, 上下文窗口有限.

以前的研究主要关注粗粒度的角色扮演, 例如程序员, 作家, 而非细粒度的扮演, 例如某个特定的虚拟角色.

设计原则:

角色档案包括人格描述, 口头禅和结构化的对话历史.

使用 Context-Instruct 进行长文本知识提取和指令生成. 具体步骤: 把长文本切分, 转换为{问题, 置信度, 答案}的三元组, 并过滤掉低质量数据.

使用 GPT 这样的闭源模型 (RoleGPT) 生成高质量角色扮演数据, 用于微调开源模型 (RoCIT).

RoleBench: 包括通用指令和角色特有的知识.