世界看热讯:百万年薪offer,到手!

2023-05-31 05:23:37 来源:Coder梁

关注、星标下方公众号,和你一起成长


(资料图片仅供参考)

作者 | 梁唐

出品 | 公众号:Coder梁(ID:Coder_LT)

大家好,我是老梁。

就在前两天,老梁的好友,知识星球的合伙人Atiyah大佬,拿到了某创业公司,大模型工程师的offer。现金加上股票,超过了百万,妥妥的百万年薪。

百万年薪的offer在IT行业虽然不算多,但也并不太稀奇。毕竟对标大厂的话大约是P7这个级别,这个级别在大厂中属于中坚力量,在大厂中不算少。

之所以特意拿出来分享,除了offer惊艳之外,也是因为它的岗位比较特殊——大模型工程师。

随着ChatGPT的流行,大模型也随之广受关注。尤其是今年,越来越多的大模型的岗位如同雨后春笋纷纷出现。说到大模型大家如雷贯耳,AIGC人尽皆知,但说到这个岗位,大家的了解又有多少呢?你知道大模型岗位面试流程吗?你知道这些做大模型的企业考察的重点吗?你知道应该怎样准备相关的面试吗?

相信绝大多数人就不清楚了,实话说不仅你们不清楚,老梁也不是很清楚。所以老梁特意去请教了Atiyah大佬,并且整理了他的相关分享,写成了这篇文章。

首先一个问题是,这些大模型的岗位都做一些什么?都是参与到大模型的开发吗?

Atiyah大佬告诉我,其实并非如此。大模型相关的创业公司大体业务可以分成两类。

一类是做通用大模型。这类以openai为代表,他们会从0到1训练出属于自己在通用领域的大模型。在模型训练完成之后会将模型的能力当做基础设施售卖服务来盈利。

我们都知道,openai前期投入了上亿美金才有了ChatGPT的成功。ChatGPT 3.5单次训练的成本在数百万美金,即使是模型推理都需要一个庞大的GPU集群,这个成本投入就卡住了绝大多数的创业公司和科研机构。所以目前国内能做相关研发工作的都是各界翘楚,都是各自领域有名有姓的大公司。比如阿里、百度、科大讯飞等。

第二类是在大模型的基础上做上层应用,这种一般是基于现有的开源模型,然后在特定领域的业务数据上做微调从而达到比通用模型更好的效果,从而在具体的商业场景中获取利润。

我们一对比就能发现,第二类公司面临的技术挑战要比前者小得多。实际上目前兴起的大模型相关的创业公司,绝大多数都是这类。对于这些公司来说,大模型只是实现业务价值的底层工具,相比模型本身,更多的发力点在业务上。

因此Atiyah大佬建议,在面试之前要多关注公司的业务场景,思考他们可能面临的业务痛点,以及技术解决方案。因为大概率会在面试当中遇到。

和常规公司的面试类似,需要结合业务场景来聊技术。

关于大家最感兴趣的大模型相关的问题,Atiyah大佬也给出了回答。

Atiyah大佬之前在面试的时候就把面经分享在了知识星球里,这里分享其中一篇给大家。

如果大家想要知道更多内容,或者有更多更细节的问题想要咨询,欢迎扫码加入我们的星球。

喜欢本文的话不要忘记三连~

关键词:

Copyright   2015-2023 港澳社团网 版权所有  备案号:京ICP备2023022245号-31  联系邮箱:435 226 40 @qq.com