工作年限要求:2
是否能接受应届生:是
岗位职责:
1.基于LLM的知识图谱自动化构建系统:研发基于大语言模型(LLM)的多模态文档智能解析工具,支持PDF、PPT、Word、网页、图片等格式的结构化信息抽取;构建实体识别、关系抽取、属性抽取的LLM微调流水线,提升垂直领域知识抽取准确率;实现文档理解与知识增强,包括文档结构分析、表格解析、公式识别、跨文档关联,并设计实体对齐与消歧算法,解决多源异构数据的知识融合问题
2.大规模知识存储与查询引擎:基于NebulaGraph/gStore/ArangoDB等构建高并发知识图谱存储与查询引擎,实现复杂多跳查询的秒级响应(如5跳以上关系路径查询);集成Milvus/Weaviate/Qdrant等向量数据库,构建统一的多模态向量检索系统,支持十亿级向量的毫秒级检索
3.AI记忆中台核心能力建设:构建基于知识图谱的RAG(检索增强生成)系统,支持事实性、可追溯的AI问答;研发动态记忆更新机制,支持知识图谱的增量更新与版本管理;实现文本、图像、音视频等多模态知识的统一表示与关联检索和跨模态对齐
4.系统架构与工程化:设计知识图谱系统的微服务架构,支持水平扩展与容灾切换,实现海量知识数据的增量更新与实时同步机制;优化知识抽取与构建的端到端流水线,支持TB级文档的自动化处理;将核心能力封装为API服务与SDK,支持业务团队快速集成,并提供领域适配框架,支持不同垂直行业的快速知识图谱构建
任职要求:
1.优先3年以上知识图谱、图数据库或向量检索系统开发经验,至少1年基于LLM的知识工程或RAG系统开发经验
2.精通知识图谱全栈技术,熟悉LLM和信息抽取、知识融合、存储查询等完整流程,至少精通一种主流图数据库(Neo4j/NebulaGraph/TigerGraph等)
3.向量检索系统经验:有Milvus/Weaviate/Qdrant等向量数据库实战经验
4.精通Python和C++,熟悉Java/Scala,熟悉PyTorch/TensorFlow框架
5.具备大规模数据处理系统设计经验,熟悉微服务架构、容器化部署、服务治理等云原生技术,有系统性能优化经验,能够解决高并发场景下的性能瓶颈
5.加分项:有数据库开发优化经验;有亿级实体规模知识图谱项目经验;有开源项目贡献经验;在相关领域顶会有论文发表(如KDD、WWW、ACL、EMNLP)
福利待遇:
1.提供具有竞争力的薪酬待遇和福利,特别优秀者可一人一议。
2.提供覆盖全城的免费班车,员工通勤无忧。
3.年度体检、佳节礼包、生日惊喜等福利拉满。
4.子女入学、提供香港中文大学(深圳)附属幼儿园、小学、初中。