岗位背景与定位:
专注于特定垂直领域的知识图谱构建,通过开源情报(OSINT) 途径获取多源异构数据,带领团队从零到一搭建一套具备强大的本体建模能力、高效的实体抽取能力以及复杂的逻辑推理能力的知识图谱库。
岗位职责:
1. 技术战略与架构设计
顶层设计: 负责面向特定领域的知识图谱整体技术架构设计,包括数据层、存储层、计算层和应用层的技术选型与路线规划。
本体工程: 主导特定领域的本体(Ontology)设计与构建,定义符合业务逻辑的类、属性、关系及约束规则,确保知识表达的规范性与完备性。
推理引擎规划: 设计并实现基于规则或基于统计学习的推理引擎,支持基于现有知识的逻辑演绎、一致性校验及隐含知识的挖掘。
2. 研发攻坚与落地
开源情报获取与治理: 指导团队利用爬虫、API接口、文档解析等技术,从开源情报(如互联网公开数据、专业报告、学术文献、新闻等)中高效获取数据,并解决数据清洗、去噪、对齐等难题。
知识抽取与融合: 带领团队攻克非结构化/半结构化文本中的实体识别(NER)、关系抽取(RE)、事件抽取等技术难点,实现多源异构知识的实体对齐与融合。
图数据库与计算: 负责图数据库(如Neo4j, JanusGraph, Nebula等)的选型与优化,实现海量知识的高效存储与查询,并开发基于图算法的分析应用。
任职要求:
1. 博士研究生,数学、人工智能、情报学等相关专业。
2. 具有人工智能、自然语言处理或知识图谱相关研发经验。
3. 对知识图谱全生命周期技术有深入理解,尤其精通本体建模(Ontology Modeling) 和知识推理(Knowledge Reasoning) 的理论与实践。
4. 熟悉传统的NLP技术和基于深度学习(BERT、GPT系列等)的预训练模型,对信息抽取有丰富的实战经验。
5. 精通Python/Java,具备扎实的代码功底和良好的工程化习惯。
6. 熟悉图数据库(如Neo4j)及向量数据库的原理与应用,对RDF、OWL等知识表示标准有深入了解者优先。
7. 熟悉大数据处理框架(如Spark、Flink)者优先。