亲爱的朋友们,
得益于生成式AI,新一代的 生成式AI应用工程师(GenAI Application Engineers) 能够比以往更快地构建更强大的应用程序。具备这种能力的人才受到企业的热烈追捧,但其具体职位描述仍在逐步明确中。在此,我将阐述他们的核心技能,以及我用来识别这类人才的面试问题。
生成式AI应用工程师的核心特质
熟练的生成式AI应用工程师需满足两大主要标准:
- 能够利用新型AI构建模块快速构建强大应用。
- 能够利用AI辅助进行快速工程开发,以远超以往的速度构建软件系统。
此外,良好的产品/设计直觉是一个显著的加分项。
AI构建模块:打造复杂功能的基石
如果你只有大量单一类型的乐高积木,你可能只能搭建一些基础结构。但如果你拥有多种类型的积木,你就能迅速地将它们组合起来,形成复杂且功能齐全的结构。软件框架、SDK以及其他此类工具也正是如此。如果你只知道如何调用大型语言模型(LLM)API,那是一个很好的开始。但如果你掌握了广泛的构建模块类型——例如 提示工程技术、智能体框架、评估(Evals)、安全护栏(Guardrails)、检索增强生成(RAG)、语音堆栈、异步编程、数据提取、嵌入/向量数据库、模型微调、结合LLM的图数据库使用、智能体浏览器/计算机使用、多模态链式思考(MCP)、推理模型 等等——那么你就能创建更丰富的构建模块组合。
强大的AI构建模块的数量正在迅速增长。随着开源贡献者和企业提供更多的构建模块,紧跟其发展有助于你不断扩展能够构建的应用类型。尽管新的构建模块层出不穷,但许多1到2年前的构建模块(例如评估技术或使用向量数据库的框架)在今天仍然非常重要。
AI辅助编程:效率飞跃的利器
AI辅助编程工具能极大提升开发人员的生产力,并且这些工具正在快速发展。GitHub Copilot于2021年首次发布(并于2022年广泛可用),开创了现代代码自动补全的先河。但不久之后,Cursor和Windsurf等新一代支持AI的IDE提供了更好的代码质量保证(QA)和代码生成能力。随着LLM的改进,基于它们构建的这些AI辅助编码工具也随之提升。
现在我们有了高度智能化的编码助手,例如OpenAI的Codex和Anthropic的Claude Code(我非常喜欢使用,并对其自主编写代码、测试和调试的能力印象深刻,能够进行多次迭代)。在熟练的工程师手中——他们不只是“凭感觉写代码”,而是 深刻理解AI和软件架构基础,并能引导系统朝着精心选择的产品目标前进 ——这些工具使得以无与伦比的速度和效率构建软件成为可能。
我发现AI辅助编码技术过时的速度比AI构建模块快得多,1到2年前的技术与今天的最佳实践相去甚远。部分原因可能是,虽然AI开发者可能会使用数十(数百?)种不同的构建模块,但他们不太可能同时使用数十种不同的编码辅助工具,因此达尔文式的竞争在工具之间更为激烈。鉴于Anthropic、Google、OpenAI和其他参与者在该领域的巨额投资,我预计这种狂热的发展速度将继续下去,但紧跟AI辅助编码工具的最新发展将带来回报,因为每一代都比上一代好得多。
加分项:产品技能
在一些公司中,工程师需要严格按照产品经理精确到像素的详细设计图来编写代码实现产品。但是,如果产品经理必须指定哪怕最小的细节,这会减慢团队的速度。 AI产品经理 的短缺加剧了这个问题。我发现,如果生成式AI工程师也具备一定的 用户同理心和基本的产品设计技能 ,团队的进展会快得多。这样,即使只提供高层次的构建指导(例如:“一个允许用户查看个人资料和更改密码的用户界面”),他们也能自行做出大量决策,并至少构建一个可供迭代的原型。
面试策略:识别顶尖人才
在面试生成式AI应用工程师时,我通常会询问他们对AI构建模块的掌握程度以及使用AI辅助编码的能力,有时也会考察他们的产品/设计直觉。我发现有一个额外的问题对预测他们的技能非常有帮助:“您如何跟进AI领域的最新发展?”因为AI发展如此迅速,那些有良好策略来跟进的人——例如 阅读《The Batch》和参加短期课程 😃,定期动手实践构建项目,以及拥有 可以交流的社区 ——确实比那些效率较低的策略(例如将社交媒体作为获取AI信息的主要来源,这通常无法提供所需的深度)更能保持领先。
持续构建!
Andrew