韦仁杰的博客

Spark-on-Yarn集群的搭建

关键词: yarn mode Spark deploy spark

发布于 2018-06-28 14:14:00

Hadoop map-reduce 实现K-means聚类(combiner的使用)

关键词: reducer 中心 mapper 聚类 combiner

发布于 2018-06-25 15:07:00

Azure HDinsight 结合 hadoop streaming(python)

关键词: Azure 节点 HDinsight ssh yarn

发布于 2018-06-21 15:02:00

Hadoop Streaming 使用 Python + NLTK 进行大数据分词心得

关键词: hadoop Optional python jar Specify

发布于 2018-06-15 17:21:00

Sending Files to Remote Task Nodes with Hadoop MapReduce

关键词: Hadoop file DistributedCache hadoop apache

发布于 2018-06-14 17:49:00

Hive 使用 Python 的UDF 对大量日志进行分词统计

关键词: line replace tokenizer add mwe

发布于 2018-05-31 19:11:00

Java连接Hive

关键词: hive rs con Java jdbc

发布于 2018-05-25 17:58:00

Hive UDF进阶

关键词: UDF join Hive 语句 实例

发布于 2018-05-25 17:52:00

GenericUDF的示例, 根据字符串生成词向量

关键词: import org apache hadoop hive

发布于 2018-05-23 18:15:00

Hive UDF 环境搭建(Eclipse+Maven)

关键词: jar dependency scope HelloWorld Maven

发布于 2018-05-18 17:38:00

分页