DeepSeek开源大模型开发者之一罗福莉将加盟小米

heyman4个月前未分类517

第一财经报道,DeepSeek 开源大模型 DeepSeek-V2的关键开发者罗福莉将加入小米,担任小米 AI 实验室的领导,并负责大模型团队的建设。这一消息引起了广泛关注,尤其是在小米计划加强其在大模型领域的布局之际。

AI,人工智能,机器人

图源备注:图片由AI生成,图片授权服务商Midjourney

据知情人士透露,小米创始人雷军对公司在 AI 大模型领域的起步较晚表示担忧,因此决定高薪挖角罗福莉。罗福莉的背景相当亮眼,她拥有北京大学计算语言学研究所的硕士学位,并在自然语言处理领域的顶级会议 ACL2019上发表了多篇论文,展示了她在这一领域的深厚造诣。

在加入小米之前,罗福莉曾在阿里巴巴达摩院担任机器智能实验室的研究员,负责开发多语言预训练模型 VECO,并推动 AliceMind 的开源工作。2022年,罗福莉选择离开阿里,进入 DeepSeek,参与了 DeepSeek-V2的开发,进一步巩固了她在大模型研发领域的地位。

小米 AI 实验室自2016年成立以来,团队规模已达到约250人,研究方向涵盖了视觉、声学、语音、自然语言处理、知识图谱、机器学习等多个领域。根据公开信息,小米在2023年已经成立了专门的大模型团队,任命栾剑担任负责人,并向技术委员会副主席王斌汇报工作。


相关文章

多模态大模型引爆应用场景 阶跃星辰完成数亿美元融资

多模态大模型引爆应用场景 阶跃星辰完成数亿美元融资

据智能涌现消息,中国大模型独角兽阶跃星辰近日完成数亿美元B轮融资,核心投资方包括上海国有资本投资有限公司及旗下基金,腾讯投资、五源资本、启明创投等战略和财务投资人也参与其中。这笔资金将主要用于基础模型...

百川智能发布金融大模型Baichuan4-Finance

百川智能发布金融大模型Baichuan4-Finance

百川智能发布全链路领域增强大模型Baichuan4-Finance。据介绍, 通过行业首创的领域自约束训练方案,Baichuan4-Finance实现了金融能力和通用能力同步提升的效果,极大提高了金融...

OpenAI推出ChatGPT新记忆功能:能跨对话回忆用户交流

OpenAI推出ChatGPT新记忆功能:能跨对话回忆用户交流

OpenAI 宣布推出一项全新的记忆功能,允许其 AI 助手 ChatGPT 在用户开启新对话时,能够回忆起以往的交流内容。这一更新旨在提升用户体验,使得 ChatGPT 能够更加个性化地回应用户的需...

星动纪元发布端到端原生机器人大模型ERA-42 实现机器人复杂场景操作

星动纪元发布端到端原生机器人大模型ERA-42 实现机器人复杂场景操作

近日,星动纪元科技有限公司在北京正式推出了其最新的端到端原生机器人大模型 ——ERA-42。ERA-42的设计理念是实现更高效的机器人操作,使其在多种复杂场景下都能灵活应对。ERA-42的灵巧操作能力...

​新一代语言模型ModernBERT发布,RAG等任务处理速度快四倍、成本低

​新一代语言模型ModernBERT发布,RAG等任务处理速度快四倍、成本低

最近,Answer.AI 和 LightOn 联合发布了开源语言模型 ModernBERT,这是对谷歌 BERT 的重大升级。根据开发者的介绍,ModernBERT 在处理速度、效率和质量上都有了显著...

谷歌向投资者保证人工智能本月将迎来“惊人”表现

谷歌向投资者保证人工智能本月将迎来“惊人”表现

话说最近的科技圈,AI的战火那是烧得正旺,各路豪杰纷纷亮出自己的看家本领。而曾经被认为有些“落后”的谷歌,最近却突然发力,一连串的“王炸”级新品,让投资者们眼前一亮,惊呼: “AI界,又要变天了!”《...