现代大语言模型在各种任务中展现了卓越的性能,但其成功背后的工作原理仍未被充分揭示。理解这些模型的内在机制有助于加深我们对大模型的理解。
2025-01-22
We review common defensive approaches in both industry and research domains, and discuss a new methodology
2025-02-20
随着大模型在各领域的广泛应用,其安全性问题正引发学界与工业界的广泛关注。现实部署中,大模型易受对抗性攻击和不当微调影响,导致安全防护能力下降,以及在多语言环境下,其安全性问题更加复杂。
2025-02-27