个人信息
我叫郝俊禹,英文名叫 David,同济大学计算机硕士毕业。目前在达观数据任资深技术专家,从事推荐系统和知识图谱相关方面的工作。发表2篇专利,其中有一项国际专利,获得系统架构设计师资质。
教育经历
2013.09 ~ 2016.03 同济大学,计算机技术专业,研究生在读
- 2014年,完成论文《DISCRIMINATION OF ADHD CHILDREN BASED ON DEEP BAYESIAN NETWORK》
- 2014年,获全国研究生数学建模二等奖
2009.09 ~ 2013.06 苏州大学,计算机科学与技术专业,本科
- 2012年,获“蓝桥杯”全国软件专业人才设计与创新大赛Java本科组江苏赛区一等奖,全国总决赛三等奖
- 2012年,获美国大学生数学建模竞赛二等奖
- 2011年,获苏州大学人民综合一等奖学金、苏州大学三好学生、国家励志奖学金
- 2011年,获“国信蓝点杯”全国软件专业人才设计与开发大赛江苏赛区C语言程序设计本科组二等奖
- 2011年,获高教社杯全国大学生数学建模竞赛本科组全国二等奖
- 2010年,获苏州大学学习优秀奖学金
能力
- 语言
C
,Shell
,Python
,Java
- 工具
Redis
,MySQL
,ES
,Docker
,Git
,K8S
社会工作
2021.09 ~至今 上海搜尔信息科技有限公司
- 向量索引服务架构升级
- 召回服务架构升级
- 推荐系统微服务性能及服务稳定性优化
- 重构历史过滤服务
2017.05 ~ 2021.9 达而观信息科技(上海)有限公司
- 和连尚内部团队在 WIFI 万能钥匙应用的资讯流和小视频等场景进⾏多轮推荐指标PK
- 参与渊海知识图谱产品的开发,并完成大数据平台容器化
- 完成国际专利《 运⽤标签知识⽹络的搜索⽅法及装置》和专利《 基于多用户的视频推荐方法及装置》
- 获得两次优秀项⽬团队奖及技术带头⼈荣誉
- 通过软考获得系统架构设计师资质
2016.05 ~ 2017.05 中国银联股份有限公司
- ⾏业商户系统个性化接⼊银联系统
- 微信⼩程序应用前后台开发
2015.03 ~ 2016.05 SAP公司开发运维部门(实习)
- ELK 系统搭建
- ⽤户⾏为以及系统状态分析
项目经历
2022 ~ 2023 重构历史过滤服务
- 支持30天长时效帖过滤
- 统一历史过滤和相似过滤
- 基于 brpc 重构历史过滤服务
2022 ~ 2023 召回服务架构升级
- 增加倒排检索能力
- 统一可分发帖子池,构建正排
- 帖子特征管理
2022 ~ 2022 召回服务稳定性优化
- 召回错误率优化 召回源平均错误率2.9%降到0.66%
- Java 线程池参数优化
- 召回超时case分析: 召回流程优化
2021 ~ 2022 向量索引服务架构升级
- 检索服务架构升级并迁移k8s,资源使用降低80%,性能降低60%,构建耗时降低97%。
- 索引响应耗时在20ms以下
2020 ~ 2021 图谱产品的开发
- 图谱产品是公司一款拳头产品,通过从结构和非结构的文档构建知识图谱,并用其做知识问答,路径分析等应用
- 带领多人团队完成图谱产品的开发,目前还在做产品维护以及定制性开发。
- 作为产品的技术负责人,对技术选型,服务拆分,开发进度把控更加熟练。
2020 ~ 2021 第三方应用小视频推荐
- 负责类抖音的第三方小视频场景下的推荐
- 带领多人团队完成视频物料及用户行为的数据对接,并提供稳定的线上推荐服务,优化人均点击和人均停留时长的指标
- 作为项目的总负责人,从零搭建了推荐服务,构建了推荐系统的数据流。
2019 ~ 2020 大数据平台运维及容器化
- ⼤数据平台是为知识图谱产品提供算⼒⽀持, 容器化是为了快速部署, ⽅便POC
- 带领多⼈团队对大数据平台软件 Hadoop,hbase,zookeeper,spark,kafka 进⾏容器化, 并作为图谱产品的组件.
- 学会切分任务以及协作流程,熟悉了hadoop 平台的⽇常运维, 了解了分布式系统的设计理念, 熟练使⽤docker 进⾏镜像打包和部署
2019 ~ 2020 第三方应用资讯广告混排
- 团队负责第三方应用推荐页资讯流及⼴告的混合推荐
- 和第三方内部团队进⾏⼴告千⼈均广告收入指标pk, 超内部团队 5%
- 负责推荐系统的架构升级, 线上咨询及⼴告混排策略调优
2018 ~ 2019 第三方应用资讯流推荐
- 团队负责第三方应用推荐页资讯流的推荐
- 和第三方应用内部团队进⾏⼈均点击 + ⼈均⼊屏(⼀期) 和⼈均阅读时长 + ⼈均阅读pv(⼆期) 的指标 PK,⼀期在指标上追平内部团队,⼆期⼈均阅读 pv 相⽐接⼊前提升20%,超内部团队 8%,⼈均阅读时长超内部团队 25%。
- 参与推荐排序由⼈⼯加权转变到机器学习; 积极尝试新技术: 多臂⽼虎机,faiss 向量搜索等;优化标签体系和⽤户画像; 迁移⽇志监控; 开发流式计算模块
2017 ~ 2018 第三方应用的视频推荐
- 团队负责第三方应用的推荐页,视频页的视频推荐
- 和第三方内部团队进⾏设备点击率和⼈均播放时长pk,最终指标⾼10%
- 熟悉了公司推荐系统架构,掌握了数据同步,热门,内容推荐,⽤户画像等各个⼦模块
2016 ~ 2017 微信小程序- 甜点密语烘焙店
2013 ~ 2015 基于深度贝叶斯网络的多动症判别分析
- 该项目是我小论文研究的内容,其应用深度贝叶斯网络对小孩的 FMRI 图像进行多动症的判别分析
- 该研究涉及深度学习和贝叶斯网络以及 SVM 分类
- 该研究让我将机器学习的方法应用于医学实践,使我对未来的数据分析更加的看好.
2010 ~ 2011 研究生管理系统
- 该系统用来帮助导师管理研究生的日常工作和学习情况,目前依旧在学校运行着。
- 采用 SOA 架构和 Web Service 技术在 .NET 平台下开发的一个基于 B/S 模式的管理系统。
- 该管理系统的实现加深了我对数据库和 WEB应用的理解。
自我评价
- 学习能力强,对新技术抱有热情,会积极尝试新技术在当前业务下的落地。
- 善于总结,平时会写相关的技术博文到自搭的博客和知乎上。
TIPS: 自我介绍的关键点 技术关键词,技术含量
- 高并发 并发量 (推荐系统)
- 项目价值 带来多大的价值 (pk)
- 大数据处理能力 (大数据平台)
- 带团队能力 协同工作,git-flow
个人成长
相关链接
如果该文章对您产生了帮助,或者您对技术文章感兴趣,可以关注微信公众号: 技术茶话会, 能够第一时间收到相关的技术文章,谢谢!