当前位置:首页> 应届生列表 >职位详情
高级数据工程师
30000元以上 北京通州区 应届毕业生 本科
曼迪匹艾(北京)科技服务有限公司 2024-06-05 14:42:14
人关注
高级数据工程师
30000元以上 北京通州区 应届毕业生 本科
曼迪匹艾(北京)科技服务有限公司 2024-06-05 14:42:14
人关注
职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!

一、主要职责

1.为Scilit数据库进行数据仓库的设计、开发、维护工作,推动数据工程技术栈革新,整合MDPI公司级数仓体系,构建丰富稳定的数据资产,推动Scilit的数据产品化;

2.协同相关方,将产品/数据分析/算法需求转化为数据工程需求,构建数据Pipeline和ETL任务,增进相关合作方的数据使用便利;

3.建立和提高数据模型的准确性、易用性、灵活性、可扩展性,提升查询效率,为可视化报表开发、数据分析、工程项目和算法开发等下游数据应用提供良好的数据条件;

4.承担大规模复杂指标的快速计算和维护任务,根据业务和数据分析需求,开发、仓储和维护分析表(宽表),优化其查询效率;

5.收集、清洗、整理Scilit数据,提升Scilit数据质量、数据可用性和数据效率,使得数据准确、一致、完整、有效、及时。搭建数据质量校验、报警、自动整理机制;

6.建立数据字典,将常用维度和指标的技术口径文档化。



二、职位要求

1.熟练运用书面和口语英语交流数仓技术,可以胜任同国际化团队协同工作;

2.计算机、信息技术、信息管理、数据管理、数据科学等相关专业本科及以上学历;

3.熟练使用数据工程工具,例如:

• SQL类工具,如MySQl和PostgreSQL等

• Python数据类工具:如pandas, polars, DuckDB, PyArrow, Great Expectation等

• Data Lake相关工具:Delta Like, Parquet, Amazon S3, Apache Iceberg 等

• Airflow等数据调度工具

4.具备较好的维度建模方法论,独立负责过数仓架构设计和优化,熟练ETL、数仓分层、性能调优,了解MySQL数据库模型和数据结构;

5.熟悉一门或多门面向对象的编程语言:Python/Java/Scala/C ;

6.熟悉从数据生产到数据消费的全链路,具有将技术和优秀的业务理解相结合的能力,发掘机会、解决问题;

7.两年以上对口行业经验,优秀者工作年限可适当放宽;

8.逻辑清晰严谨,对数据敏感,跨团队协作能力、沟通能力强。


加分项:

• 熟悉以下技术:

* PHP Symfony

* 元数据管理,如DataHub

* 图数据库和图数据分析

* 其它:Apache Solr, Shell, Git

* Streamlit

* Docker

• 有学术出版、文献计量学和科学计量学、作者消歧等相关知识、技能和经验;

• 了解数据分析/机器学习/NLP,或有将数据分析/算法和业务洞察能力结合的经验。



三、薪资福利

1. 薪酬待遇:30-45K;

2. 基础福利:六险一金,带薪年假,年度体检,节日福利,活动经费,丰富茶歇,营养晚餐等;

3. 进阶福利:子女福利,团队奖励,培训津贴,岗位津贴;

4. 职业发展:导师培养,技能培训,管理培训。




四、办公地点

北京市通州区观音庵北街4号院保利大都汇T2写字楼10层

乘车路线:地铁6号线-通州北关站C口,步行600米




联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:北京通州区保利大都汇T2写字楼10层
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

未经北京招聘网同意,不得转载本网站之所有招工招聘信息及作品 | 北京招聘网版权所有 2007-2018 |浙公网安备 33010802002895号

网站经营许可证:浙B2-20080178-14 公司招聘招人好网站,就在北京招聘网 人力资源服务许可证 备案号:浙B2-20080178-14

投递简历
    马上投递