1. Hadoop Streaming 踩坑记录(三)| 以数值列为唯一的 key 来排序

    以数值列为唯一的 key 来排序的问题。

    2017/10/30 hadoop

  2. Hadoop Streaming 踩坑记录(二)| Python 脚本使用第三方库

    由于公司的 hadoop 集群部署的机器上的 python 版本太低,缺少很多基础库,需要把本地的 python 打包一个传上去,用 setCacheArchive 参数来引用。

    2017/10/30 hadoop

  3. Hello World——博客搭建小记

    开源真好,感谢开源。

    2017/09/18 杂谈

  4. Hadoop Streaming 踩坑记录(一)| 数据去重

    最近开始使用 Hadoop,踩到了一些坑,记录下心得。

    2017/09/18 hadoop