当前位置:首页区块链阿里M6大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发

阿里M6大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发

文 | 周鑫雨 邓咏仪

编辑 | 杨轩 苏建勋

36氪从多处独立信源获悉,阿里M6大模型的前带头人杨红霞已加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。

一名知情人士对36氪表示,杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。36氪就上述消息向字节跳动求证,截至发稿前暂未收到回复。

杨红霞曾是阿里达摩院超大规模多模态预训练模型M6的技术负责人,毕业于南开大学、杜克大学统计科学系,师从**统计学家David Dunson。她在人工智能领域国际会议、**期刊有近百篇**论文。

2022年9月初,杨红霞因个人家庭原因从阿里巴巴达摩院离职。

M6是阿里巴巴达摩院研发的超大规模多模态预训练模型,而大模型是本轮AI浪潮中的竞争核心。

杨红霞曾带领M6大模型从百亿级进化到千亿、再到万亿的参数量,并且主导认知智能技术的发展和场景落地。2021年3月,M6大模型**发布,到2021年底,阿里云发布M6**进展时,其参数已至10万亿,成为当时全球**的AI预训练模型。

而达摩院在大模型的落地上,也走在业界前列。2022年底,阿里云魔搭社区开源超过300个AI大模型,包括M6、通义大模型等等,为开发者提供基础AI模型资源。

不过,由于达摩院AI大模型离实际业务落地还是较远,加上大厂降本增效的背景,业务无法落地也无法得到更多支持,这也导致包括杨红霞在内的多位**人才离职,如智能研究领域负责人金榕、城市大脑实验室负责人华先胜。

从前美团联合创始人王慧文、出门问问CEO李志飞、前京东技术***周伯文相继发布英雄帖寻找研发人才,再到“投人”的逻辑将不少技术大拿的AI创业项目估值拉上亿元美金,国内AI界的人才大战已经爆发。

对大模型的研发而言,人才在一定程度上决定了算法能力的上限。不少从业者都表示,资金、数据、算力等难题至少有解法可循,但算法这一必定需要人参与的环节,对人的能力提出了很高的要求。“好的算法能够在提高执行效果和效率同时,还能尽量缩减存储量。”一名AI从业者告诉36氪。

杨红霞的加盟,也意味着字节在大模型上发力的决心。此前,36氪**报道了字节跳动大模型的研发进展:语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右;图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。

多名知情者告诉36氪,目前图像生成大模型的进展较为顺利,将与抖音、剪映等产品进行结合。但语言生成大模型由于起步晚、基础薄弱等原因,目前效果尚未达到团队预期。字节跳动相关技术负责人也对此做出了回应:技术中台在这些领域有探索,还很初期,不成熟。

百度已用文心一言在大模型角逐中棋先一招,逐渐组建人才团队的字节跳动能否后来居上,还有待时间验证。

延伸阅读:

Long China 50** | 字节加入“大模型之战”:朱文佳带队,搜索、智创两部门牵头

温馨提示:

文章标题:阿里M6大模型前带头人杨红霞加盟字节跳动,参与语言生成大模型研发

文章链接:https://www.btchangqing.cn/497378.html

更新时间:2023年03月22日

本站大部分内容均收集于网络,若内容若侵犯到您的权益,请联系我们,我们将第一时间处理。

区块链

比特币暴跌的原因(比特币暴跌为什么)

2023-3-22 17:03:47

区块链

央行数字货币(央行数字货币怎么投资)

2023-3-22 17:43:20

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索