AI人才抢夺战年初疯狂,年末彷徨

2023-10-17 11:02周鑫雨
科学大观园 2023年20期
关键词:硅谷人才模型

周鑫雨

时间来到 ChatGPT 引发中国 AI 热潮的第十个月。

每位熟知国内AI格局的投资人和猎头,脑海中已经有了一幅人才版图,如果你有机会和他们喝上一杯,畅快地聊聊天,大概会有这样的对话:

“ 头条的张前川去哪里了?”

“ 他被挖去了 MiniMax。"

张前川,今日头条前用户产品负责人,2023年初离职后宣称将成立一家 AI 应用公司。不过,离职不久,张前川就加入了大模型创业公司 MiniMax。据 36氪获悉,MiniMax 开出了相当可观的报酬。

“Seven 离职后创业了吗?”

“没有,她去了深言科技当产品负责人。”

Seven ( 王京津 ) ,2022年离职的抖音前产品负责人,近期入职估值超 1.5亿美金的AI创业公司深言科技。36氪了解到,在 Seven 正式加入前,深言邀请她做了半年顾问。

“ 还有什么值得关注的大牛吗?”

“有,Louis,相比前两位,他才是行业真正看重的人。”

Louis,阳陆育,前 Musical.ly 联合创始人,TikTok 海外市场的奠基人。2022年中离开字节跳动后,一度去向成谜。今年6月,Louis 携一家名叫“远光灯数字科技”的公司,躬身入局 AIGC 游戏赛道。

一名投资人对 36氪评价: “只要 Louis 创业,我就要找他聊。如果他做 AI,那更要聊。”

AI 创业火热,但技术型创业,产品要研发、落地要试错,诸多不确定性里,人才成了定价和交易的砝码,也是现阶段的大模型之争里最重要的因素。

抢人的战火迅速点燃赛道。年初王慧文高调入局,王小川紧随其后,发 AI“英雄帖”的创业大佬不下十人。

据多名高校出身的 AI 大牛回忆,以“二王”为代表的创业者,几乎把市面上所有 AI人才聊了一遍。今年4月接受 36氪专访时,听到光北京就有 20多家大模型企业,正忙于招团队的王小川问道:” 你们能在文章里放上我们(百川智能)的招聘邮箱吗?”

泛科技领域里,AI 属于成熟风口,人才不像室温超导那样扎堆在实验室,而是均匀分布在高校、机构、巨头。那些经验老到的投资人和猎头,早已在这10个月内,将 AI 人才们的 title、过往履历和最新动向熟稔于心。

比如,想要挖到技术高管,免不了去一趟诞生ChatGPT 的AI腹地:硅谷。

猎头 Mia 去硅谷前,在行李箱装了两罐精包装的西湖龙井和4瓶老干妈。抵达后,她要去 Mountain View(山景城)的一家酒吧,用祖国的特产,再配上国内企业的 offer 和近千万元的年薪,请几名算法科学家回去。

在汇聚 Google、微软等科技巨头的 Mountain View,除了猎头,遇见寻觅 AI人才的创投圈大佬,也不是一件难事。

有人在街头看到过穿着深色 T 恤的百度副总裁景鲲(他是百度“小度”系列智能产品的缔造者);在斯坦福大学的草坪和被誉为“西海岸华尔街”的沙丘路,走过源码资本合伙人黄云刚和真格基金管理合伙人戴雨森。

更近一点的 5 月初,王小川出现在硅谷一场 AI 技术 party 上。对着在场数十名华人工程师,王小川把自己“AI重塑搜索”的创业理想讲了一遍,试图和人才拉近关系——在 36氪的专访中,他曾提及:“国内的大公司、高校里有一些不错的领军人物,一些更明星级的人才,确实在美国。”

帮国内创始人们与硅谷 AI 人才牵线,也成了一个商机。一名在硅谷的猎头记得,光 3 月份,Mountain View几乎每晚都有华人中介举办的 party,报名参加光会费就达上万人民币,还要有门槛:成功创过业,或者投出过好项目。

企业们砸血本招人的同时,还得防止员工被挖角。

一家创业公司为了留住人才,给近10名核心员工涨了 30% 的薪水,几乎所有工程師在公司内部都用“花名”。

大公司也在警惕。百度宣布大语言模型“文心一言”立项当晚,参与成员被 HR 拉了个会,重新签了一遍竞业协议。

共识快速形成:人才储备最多的企业,离“中国的 OpenAI”最近。

千万年薪,难挖硅谷人才

以如今AI人才的紧俏程度,Mia 觉得千万级的年薪并不夸张。

在 2023 年第一季度,超过 17 万中国AI企业如雨后春笋般冒了出来。圈内人爱用一句话形容 AI 赛道的创业热:“光北京就有20 多家声称能做大模型的企业。”

但相对的,是写在中国工信部报告中的30万AI人才缺口。再严苛一些,国内有过完整大模型工程经验的人能有多少?AI行业资深人才顾问海浪告诉36 氪:“不超过 100 个人。”

若想要挖到能直接带上百人的团队跑工程的 P9、P10,国内就只剩下大厂的几个CTO和首席科学家。“企业想要招技术高管,只能看硅谷。”海浪解释。

可惜的是,无论是茶叶、老干妈,还是1000万元的高薪,都很难打动硅谷的人才。

一名研究员在 Mia尚未给出薪酬条件时,就开门见山地拒绝:“老婆孩子都在这里,回国之后孩子的教育问题也很难解决。”

再过一年多,微软必应团队的算法工程师 Joshua就能如愿拿到美国绿卡。在他的人生蓝图里,再积攒两年工作经验,他就从华盛顿搬到硅谷创业。

他不愿离开硅谷——即便从今年 2 月起,求职软件上几乎每天都有 99+ 的未读消息和通知红点。除了薪酬,Joshua 还看到有公司开出隐形福利:前半年不背 OKR。

被求职信息轰炸近一个月后,Joshua关闭了几个求职软件的弹窗。

抢人大战中,有成熟落地场景的企业,赢面会大一些。在 Mia 看来,落地场景就是企业的简历,更能吸引人才。

而落地方案尚未成熟的公司,要么有个像王慧文和王小川一样,“人能来事,又能搞钱”的创始人,要么靠“画饼”吸引人才。

但国内科研环境与硅谷的现实差距,让大模型创业者画的理想之 “饼”,不那么有说服力。

在硅谷期间,Mia去了英特尔总部。在那里,每位算法工程师能调用的GPU就有四五百块。“但在国内,四五百张GPU往往是一个项目组能够申请到的算力上限。”Mia 说。

类似的,谷歌 AI 实验室对人才的大方一度让蓝振忠觉得惊讶。在那里,他能够自由调用相当于几千张 A100 的 TPU。就算在比较冷门的研究组,部门团建仍然开得起高级餐厅最贵的酒。

回国成立AI公司“西湖心辰 ”后,蓝振忠第一次感受到了算力资源的稀缺和昂贵:“公司和学校的科研经费只能买很少一部分,剩余的都得租公有云服务。”为了拉融资买算力,他每天需要和投资机构及客户开五六个电话会。

回国的硅谷创业者为资源焦虑,而去硅谷的创业者也屡屡碰壁。一位知名创业者曾在公开场合被问及近期的硅谷之行收获时,坦言自己去硅谷不是为了挖人,而是为了交流技术经验。

但一名与该创业者在硅谷交流过的人士告诉36氪:“别信他。因为挖人很难,大多数人过去,只能先建立个联系。”

Meta一开源,猎头白干半年

年初,AI技术大牛还是圈内最热的招徕对象。像ChatGPT一样参数千亿的大语言模型,仍然是个 “舶来品”。对多数企业而言,想要做 " 中国 OpenAI”,就必须大力招人搞技术。

然而不久后,意外发生了。

扇动翅膀的,是押注 AI 大模型已久的 Meta(前Facebook)。2023 年 3 月 8 日,被称为“最强开源模型”的大语言模型 Llama 遭到泄露,任何人都可以下载使用;7 月,Llama 的研发商 Meta 主动成为“搅局者”,开源了性能更强的 Llama 2,几乎所有公司都能直接免费商用 Llama 2。

Llama 的开源,迅速降低了大模型训练的门槛。AI 从业者们发现,根本没必要花这么多钱招技术人才从零训练模型。理论上,公司只要有足够多和高质数据,对 Llama 进行微调,就能用较低的成本训练出一个效果不错的模型。

很快,不少公司的大模型如雨后春笋般冒了出来,更甚者基于 Llama 微调后,就冠以 “自研 ” 之名。圈内广为流传的一句戏言是:如果 Llama 不 “惨遭开源 ”,国内就没那么多的 “自研 ”。

紧接着,技术领域的人才就开始“贬值”。

曾经想从硅谷挖人的几家企业,把自己的需求改成了从国内找工程师,年薪控制在 40 万元以内。猎头 Mia 在 KTV 点了一首《老子明天不上班》:“感觉自己上半年跑硅谷,最后白干。”

相应的,企业们年初招徕技术人才的热情,在下半年一度转移到了产品经理。在 Netflix 最新发布的招聘启事中,AI 产品经理的年薪开到了 90 万美元,超过了 AI 技术总监的 65 万美元。

不过,市场供需并非衡量顶级人才的唯一标尺,Icon(标志)级别的技术大牛热度仍然不减。

对企业来说,技术大牛不光是敲代码的员工,还是一个充满内涵的符号:技术人才,意味着技术的天花板,以及持续吸纳资方、客户和人才的门面。

昆仑万维 CHO 杨姝一直觉得,人才是 AI 公司最优质的资产。公司不仅需要基本功扎实的研发者,也需要一个名号响亮的 Icon。就像乔布斯之于智能手机,“Icon 和研发者的区别在于,Icon 是有市场号召力的,还能吸引更牛的人才过来”。

2020 年昆仑万维即布局 AIGC 和 AGI 領域,目前相关团队整体规模近千人。但到了 2023 年,为了争夺人才,杨姝和 HR 同事每周要沟通近百位候选人。最近,昆仑万维还请来了一位“Icon” ——顶级 AI 科学家颜水成,出任天工智能联席 CEO 和昆仑万维 2050 全球研究院院长,吸引全球的 AI 人才。

“ 杨红霞博士来之前,我感觉市面上没什么人觉得字节能做大模型这件事。” 一名大厂 HR 点评。

作为曾经阿里达摩院大模型 M6 的项目带头人,杨红霞在今年初转投字节跳动的 AI 阵营——这一消息也让不少人认为,字节有了和 AI“老玩家”百度、阿里同桌竞技的可能。

至于花千万元挖一个技术大牛来做 AI 到底值不值,上述 HR 回复 36 氪:“在实现技术革新前,确保企业形象跟上时代潮流。”

所有人都在警惕泡沫

6 月后,水温渐凉。钱在上半年,已经涌向了大模型的早期玩家。

据不完全统计,上半年融到钱的大模型企业有 20 多家,而 6 月后,数量骤减至不到 1/2。

一名双币基金的 AI 投资人终止了四五家大模型企业的投资进程。她告诉 36 氪,近期他们只看 AI 应用。可惜时至今日,AI 赛道依然没有一款“杀手级”应用——市场和投资人都在观望,高开的大模型技术是否能持续高走,给予可观的回报。

可惜的是,无论是茶叶、老干妈,还是一千万的高薪,都很难打动硅谷的人才。

与赛道一起降温的,还有企业对 AI 人才的热情。

年初的抢人热,更多的是企业们面对新技术的兴奋和 FOMO(Fear of Missing Out,害怕错过)情绪。“大家也不管招这么多人有没有用,先把气氛炒起来。”年初 Mia 接到的需求,大多没有指明招募人才数量的范围,“一是挖人确实难,二是企业不知道挖多少人”。

精打细算后,企业们逐渐发现,人海战术、跑马圈地的互联网打法并不适用于大模型。

王慧文曾告訴 36 氪,他觉得搞大模型“人多了反而起副作用”,最小的建制只要30多人。今年 7 月,马斯克高调宣布入局大模型领域,新公司 xAI 只有12名成员。

人海战术的反例是 Meta ——即便拥有 Llama 和 OPT 两支明星大模型团队,但由于算力资源分配的不平衡,目前超半数 Llama 作者选择了离职。

在资源紧俏的大模型领域,缩减人员规模既能如马斯克所说“提高人均可支配资源数量”,也能提高管理效率。王小川在媒体访谈中提到,管理过 3000 人的搜狗后,发现现在百川只有 100、300 人,非常容易把效率提上去。

“企业基本只要招一个厉害的 CTO,或者个位数的技术带头人。”Mia 近期接到的招人需求数量骤减。顶级人才的流动,在上半年的 “热战”中基本已成定局,而模型团队中剩余的工程师,Mia 发现只要用三四十万的年薪,并不难从国内外大厂或者高校计算机专业中挖到。

企业们对 AI 人才扩张的谨慎,更源于在视觉识别(简称 CV)领域发生的那场人才扩张泡沫。

2018 年,CV 的风口吹起了 AI 四小龙。当时,估值飙升至 60 亿美元的商汤,一年内融了 20 多亿美元。

最后大部分融资都去了哪儿?答案是挖人。当时,即便是 CV方向出身的应届毕业生,不少人年薪也能拿到 60 万元。

但很快,不少公司发现,CV 没有太高的技术壁垒。AI 企业 To B、to G 的业务,很快就被上游的云厂商蚕食。这几年四小龙的难处有目共睹,最早上市的商汤,在 2022 年每赚一块钱,就要净亏 2 块。

企业不得不让科学家背上营收指标。2020 年以来,海浪能明显感到风向的变化,高校出身的教授变得不那么受欢迎,“大家更需要带过团队、做过产品的人。”一家想要智能化转型的物流企业说得更直接,“我们的钱是一个盒子一个盒子搬出来的,不是发论文发出来的。”

迫于营收压力,不少去大厂研究院的大牛,又回到了高校。海浪发现,此前帮大厂挖角的北美高校出身的华人科学家,重新开始以教授的身份发论文。

几乎所有企业都不希望人才泡沫再次产生。

Llama 发布前,由于大模型是个高壁垒的新技术,企业给人才定的绩效并不具体,比如“ 年末前超越 GPT-3.5,未来一到两年超越 GPT-4”。但 Llama 把进度条快速拉到做应用的阶段,人才们的绩效,迅速指向了商业化。

赚钱成了首要指标。Mia 下半年接到来自企业的不少需求,从挖,变成了帮人才做项目管理。

一名硅谷出身的研究员对 Mia 诉苦:“(企业)不是说好给足空间做研究吗?怎么又要背营收?”Mia 脑子转得飞快:“企业方觉得您有能力。”

2023 年末,是不少企业和投资人检验人才价值的关键点。

“ 投资人和创始人都需要先看看,到年底花钱找来的人,能跑出什么东西,再决定是否继续入场。”海浪说。从给 title 的爽快程度,他能感受到今年企业的谨慎:2018年,帮技术大牛谈个T10、P10以上的岗位并不难;但今年,P9的职级都需要踮脚伸手够一够。

早上六七点起,游一小时的泳,紧接着去实验室工作到晚上 9 点,然后回去陪家人——这是在卡内基梅隆大学读博时蓝振忠的一天,“从不加班熬夜,也不把工作带回家 ”。

但在这轮热潮中,蓝振忠破了戒。这位技术老手、创业新手最近主动约见了不少投资人,从头学习管理和战略:“在终场来临前,努力让自己不被市场淘汰。”

◎ 来源| 36氪

猜你喜欢
硅谷人才模型
人才云
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
忘不了的人才之策
留住人才要走心
“人才争夺战”
3D打印中的模型分割与打包
赶超硅谷,目标是对的
凭什么硅谷的失败者就叫“履历丰富”?
FLUKA几何模型到CAD几何模型转换方法初步研究