节前,我们组织了一场算法岗技术&面试讨论会,邀请了一些互联网大厂朋友、今年参加社招和校招面试的同学。
针对大模型技术趋势、大模型落地项目经验分享、新手如何入门算法岗、该如何准备面试攻略、面试常考点等热门话题进行了深入的讨论。
总结链接如下:
重磅消息!《大模型面试宝典》(2024版) 正式发布!
喜欢记得点赞、收藏、关注。更多技术交流&面经学习,可以文末加入我们。
最近一位星球成员面试科大讯飞 NLP 算法岗,被疯狂拷打。。。
今天我把他的面经题整理总结一下,希望可以对大家找工作有帮助,喜欢点赞、收藏、关注。
-
⾃我介绍
-
介绍⾃⼰的项⽬
-
项⽬中数据语料
-
你怎么评价你⾃⼰构建的数据集的好坏?
-
chatGLM 和 GPT 模型结构⼀样吗
-
⼤模型训练⽅式
-
怎么评价⼈类⾼质量回答的数据集?精⼼处理的数据集作⽤?
-
强化学习中怎么⽤奖励模型打分?怎么样的分数?奖励模型是怎么得到的?
-
⽤强化学习的梯度更新是怎么实现的?
-
什么样的 prompt 是好的 prompt?
-
Instruct 和 prompt 有什么区别?
-
现在⼤模型有哪些的缺点
-
模型幻觉怎么解决?
-
⼤模型对话和传统的 nlp ⼈机对话⽅案有什么区别
-
(⼈机对话)你怎么知道⽤⼾输⼊之后,触发⼀些问题
-
传统⼈机对话中⼀个问题给 K 个回复吗
-
(⼈机对话)相似度怎么计算;这种度量的模型怎么训练?
-
命名实体识别遇到嵌套识别该怎么做?
-
⽂本分类中⼀个⽂本有多个类别的话,该怎么做?
-
⽂本分类中类别不均衡问题怎么解决?
-
⼤模型的幻觉怎么评测?
-
什么是⻓⽂本?⼤模型⻓本⽂怎么做?
-
你项⽬中⻓⽂本⽤的多⻓?
-
tokenizer 的步骤
总结
这次面试涵盖了自然语言处理(NLP)和大型语言模型(LLM)相关内容。
涉及多个关键点,包括个人项目、数据集构建、模型结构、训练方法、强化学习、prompt 设计、模型缺点、对话系统、实体识别、文本分类等
技术交流&资料
技术要学会分享、交流,不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。
成立了算法面试和技术交流群,相关资料、技术交流&答疑,均可加我们的交流群获取,群友已超过2000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2040,备注:来自CSDN + 技术交流
通俗易懂讲解大模型系列
-
重磅消息!《大模型面试宝典》(2024版) 正式发布!
-
重磅消息!《大模型实战宝典》(2024版) 正式发布!
-
做大模型也有1年多了,聊聊这段时间的感悟!
-
用通俗易懂的方式讲解:大模型算法工程师最全面试题汇总
-
用通俗易懂的方式讲解:不要再苦苦寻觅了!AI 大模型面试指南(含答案)的最全总结来了!
-
用通俗易懂的方式讲解:我的大模型岗位面试总结:共24家,9个offer
-
用通俗易懂的方式讲解:大模型 RAG 在 LangChain 中的应用实战
-
用通俗易懂的方式讲解:ChatGPT 开放的多模态的DALL-E 3功能,好玩到停不下来!
-
用通俗易懂的方式讲解:基于扩散模型(Diffusion),文生图 AnyText 的效果太棒了
-
用通俗易懂的方式讲解:在 CPU 服务器上部署 ChatGLM3-6B 模型
-
用通俗易懂的方式讲解:ChatGLM3-6B 部署指南
-
用通俗易懂的方式讲解:使用 LangChain 封装自定义的 LLM,太棒了
-
用通俗易懂的方式讲解:基于 Langchain 和 ChatChat 部署本地知识库问答系统
-
用通俗易懂的方式讲解:Llama2 部署讲解及试用方式
-
用通俗易懂的方式讲解:一份保姆级的 Stable Diffusion 部署教程,开启你的炼丹之路
-
用通俗易懂的方式讲解:LlamaIndex 官方发布高清大图,纵览高级 RAG技术
-
用通俗易懂的方式讲解:为什么大模型 Advanced RAG 方法对于AI的未来至关重要?
-
用通俗易懂的方式讲解:基于 Langchain 框架,利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法