Anthropic 组建“AI精神病学”团队


昨日,Anthropic 神经科学研究员 Jack Lindsey 宣布,公司将成立“AI精神病学”团队,作为其可解释性部门的重要组成部分,旨在研究模型的角色、动机和情境意识,以及如何导致诡异、失控等行为表现,以建立对神经网络的机制性理解并确保其安全性。

该团队短期内重点攻克「叠加」问题(导致模型神经元和注意力头等计算单元难以单独解释),并致力于将模型分解为更具可解释性的组件。

目前,Anthropic 正在招聘研究科学家(年薪 31.5-56 万美元,约合人民币 220 万-400 万元)加入该团队,鼓励任何有意愿的人申请,并非所有候选人需完全符合列出的资格要求。


相關推薦

2023-05-30

Ubuntu 新组建了一个 High Performance Computing (HPC) 团队。根据发布在 Ubuntu Discourse 上的一些描述信息可知,Ubuntu HPC 团队旨在为 Ubuntu 生态系统提供最优质的 HPC 基础设施、应用程序和用户体验。 “HPC 是支撑几个主要行业和关

2023-07-07

OpenAI 宣布正在组建一个由其联合创始人兼首席科学家 Ilya Sutskever 和 Alignment 负责人 Jan Leike 共同领导的新团队,以开发引导和控制超智能人工智能(Superintelligent AI)系统的方法。“我们需要科学和技术突破来引导和控制比我们

2025-06-06

资公司 SignalFire 的最新研究显示,OpenAI 的工程师跳槽至 Anthropic 的比例高达8:1,而来自谷歌 DeepMind 部门的人才流失情况更为显著,比例达到11:1。这一趋势表明,Anthropic 不仅在技术上实力雄厚,更因其对 AI 安全的重视,吸引了

2024-08-07

公司,跳槽到由前 OpenAI 研究人员成立的的竞争对手公司 Anthropic。 今年 5 月份,OpenAI 原安全主管、超级对齐(Superalignment)团队负责人 Jan Leike 宣布从 OpenAI 离职,并公开发文抨击了该公司的安全性问题;此后又加入了 Anthropic

2023-03-01

性能、可扩展和安全的数据基础设施。同时,该项目正式组建开源社区,并将基于国际开源社区的规则进行经营。 跬智信息(Kyligence)由首个来自中国的 Apache 顶级开源项目 Apache Kylin 核心团队成立,是领先的大数据分析和指标

2025-05-08

彭博社报道称,苹果公司正与 AI 创企 Anthropic 合作,为 Xcode 打造一款 AI 驱动的编程助手。 双方合作的核心是将 Anthropic 的 Claude Sonnet 大模型集成到 Xcode 中,能够自动编写、编辑和测试代码。而程序员只需通过聊天界面,用自

2022-10-29

入了微软开发者部门 (Developer Division)。Guido 表示,自己在组建这支专业团队时所寻求的是,“如果我们有不同背景和不同技能的人,作为一个团队,我们会做出更好的决定,我们会对一些意外的机遇持有更加开放的态度”。 目

2025-03-30

们使用的AI助手如何「思考」一直是个谜。近日,AI公司Anthropic发布了两篇重磅论文,首次深入揭示了大语言模型Claude的内部思维过程,这一突破性研究被形象地称为「AI显微镜」技术。 打造「AI显微镜」 Anthropic的研究人员面临

2023-08-12

骨文、SUSE 和 CIQ (Rocky Linux 背后的商业实体) 宣布,有意组建一个合作性行业协会 Open Enterprise Linux Association (OpenELA);旨在通过提供开放和免费的 Enterprise Linux (EL) 源代码,鼓励开发与 Red Hat Enterprise Linux (RHEL) 兼容的发行版。 公

2025-06-06

nbsp;月 4 日向北加州法院提交诉讼,指控 AI 初创公司 Anthropic 未经授权使用其网站数据训练 AI 模型,且未支付相应费用。Reddit 认为,Anthropic 的行为违反了其用户协议,且未经授权将 Reddit 数据用于商业用

2025-07-18

据知情人士透露,Anthropic 的最新估值已突破1000亿美元,较四个月前的580亿美元几乎翻了一番。这一估值的提升,主要得益于 Anthropic 近期向部分投资者披露的财务表现,尤其是其年化收入在2023年上半年增长了四倍,已超过40亿

2025-04-29

TechCrunch 报道称,在 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI 两款“智能体”式 AI 编程工具的较量中,后者获得了更多开发者的青睐。部分原因在于,Anthropic 向一位试图逆向工程 Claude Code 的开发者发出了删除通知,而 Claude Code

2025-05-30

人工智能公司 Anthropic 最近宣布,Netflix 的联合创始人、董事长以及前首席执行官 Reed Hastings 正式加入其董事会。Hastings 在 2023 年卸任了 Netflix 的共同首席执行官职务;此外,他还曾在 Facebook、微软和彭博社等公司的董事会任职

2024-07-18

Anthropic 推出了 Claude Android 应用,旨在将其 AI 聊天机器人带给更多用户。Anthropic 的这一最新举措旨加强与 ChatGPT 之间的竞争力,让 Claude 在更多地方可用。 Claude Android 应用程序的工作方式与5 月份发布的 iOS 版本相同,包括免