敏思·践行

有关思维、技术和生活的絮叨

The Programmer's Oath

发表于 2019-10-25 | 更新于: 2020-05-10 | 分类于 thinking |
字数统计: 519 字 | 阅读时长 ≈ 2 分钟

程序员宣言,来源于Robert Martin(或者称为Bob大叔,软件开发理论巨头之一。其中最为世人所知的:敏捷宣言,SOLID原则)。

阅读全文 »

反向面试

发表于 2019-09-17 | 更新于: 2020-05-10 | 分类于 soft skills |
字数统计: 1.6k 字 | 阅读时长 ≈ 5 分钟

所谓反向面试,即是面试者在面试最后访问面试官的问题。这个环节,一般面试者经常忽略,面试是一个双向的过程。好的问题,可以是让自己尽早避开一些坑。但是从本人作为面试官的经历来看,面试者经常关注的问题往往是加班、出差或者薪资水平,而对于技术氛围、工作内容、基础设施、公司发展模式等比较影响自己工作体验和成长的部分却很少关心。

阅读全文 »

如何编写一个优秀的软件设计文档

发表于 2019-08-27 | 更新于: 2020-05-10 | 分类于 soft skills |
字数统计: 1k 字 | 阅读时长 ≈ 3 分钟

国外互联网是如何编写设计文档的,其中重要的是量化和风险尽早发现和解决。

阅读全文 »

一次数据查询设计实现始末

发表于 2019-07-22 | 更新于: 2020-05-10 | 分类于 design , programming |
字数统计: 18.3k 字 | 阅读时长 ≈ 86 分钟

现有一文本文件,文件内容每行记录由3个字段组成,字段间以’\t’分隔,每行以’\n’分隔,3个字段分别为”身份证号码 手机号码 姓名“。现需要提供一个服务,业务可通过服务根据身份证号码或者手机号码精确查询相关记录。那么如何设计,使得查询响应延迟低、吞吐高和资源消耗低。

阅读全文 »

如何识别定位信息中的坐标系

发表于 2018-07-10 | 更新于: 2020-05-10 | 分类于 engineering |
字数统计: 4.1k 字 | 阅读时长 ≈ 18 分钟

由于工作关系会接触到一些带有定位信息的数据,而在中国地理位置信息这个事比较复杂,存在多种坐标系混用的情况。而很多时候数据中往往没有标识出具体的坐标系,如果直接使用可能会造成位置偏差等问题。这里分享一下本人的拙法(特殊地形法)。

阅读全文 »

大数据工程师能力指南

发表于 2018-06-09 | 更新于: 2020-05-10 | 分类于 thinking |
字数统计: 3.4k 字 | 阅读时长 ≈ 12 分钟

最近忙于部门招人,为了能够较好地进行招聘和筛选,搞了这个指南。

阅读全文 »

说说地址标准化过程中使用的一些数据结构和算法

发表于 2018-05-18 | 更新于: 2020-05-10 | 分类于 engineering |
字数统计: 7.1k 字 | 阅读时长 ≈ 29 分钟

地址标准化在数据处理过程中算是一个比较常见的需求,这里说说个人在地址标准化过程中的一些实现思路和算法,抛砖引玉。

阅读全文 »

Thinking in Bigdata

发表于 2016-10-09 | 更新于: 2020-05-10 | 分类于 big data , thinking |
字数统计: 11.5k 字 | 阅读时长 ≈ 41 分钟

这篇文章是本人在接触大数据过程中,对一些原理、概念以及当前常用实现技术的笔记和总结。本人接触大数据不深,实践不多,见识不广,如果错误或者偏颇之处,欢迎斧正。

未完待续

阅读全文 »
John Tse

John Tse

8 日志
7 分类
17 标签
RSS
GitHub Twitter
Creative Commons
© 2019 — 2020 John Tse | Site words total count: 47.6k
由 Hexo 强力驱动
|
主题 — NexT.Mist
0%