【鉴赏】小数据引发大偏移 2025-8-19 22:50 | 12 | 0 | ICML 2025 720 字 | 4 分钟 标题: Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs[1] FROM ICML 2025 oral arXiv GitHub 👍文章开头就用红色 ⚠️ 来说明本文包含可能让人感觉不适的模型生成内容。 针对大部分模型,仅用少量的 insecur… ICML 2025LLMSFT