2019秋招大数据开发Java开发面经

2019秋招大数据开发Java开发面经

2019秋招大数据开发Java开发面经


快手是大数据平台部,秋招前的散招。加上hr面总共有五面,最后只给了我一个大白菜,很气。大数据开发

一面:

1.kafkapatiton如何保证有序
2.storm数据倾斜,某个省数据量特别大。
3.storm进行join
4.很多数据,一个namenode不够用
5.storm中数据量很大,acker影响性能吗
6.udf写用户经纬度是否在
7.数据库acid如何保证一致性
8.hdfs为什么128M
9.zookeeperCAP怎么哪个
10.stormbolt数量
11.hbase的高可用
12.多个表full join
13.hive sql编译过程
14.数据仓库,星型模型和雪花模型,适用于什么

二面:

1.累计报表
2.父子关系,统计出来
3.公司业务(分为哪几块)
4.hive大表进行join,如何分库分表减少数据倾斜
5.如何确定map数量
6.如何处理小文件

三面:

1.杀死线程池中线程的方法
2.hbase有什么缺点
3.多线程进行1100加和操作。开10个线程进行加和
4.spark提交job流程
5.hashMap的扩容

四面:

1.累计报表优化,每日新增
2.concurrentHashMap默认桶数量,多线程写时冲突概率
3.线程池数量和io型、cpu,原因
4.多线程原因

2019秋招大数据开发Java开发面经

 

  • 1、刺猬实习遵循行业规范,任何转载的稿件都会明确标注作者和来源
  • 2、刺猬实习的原创文章,请转载时务必注明"来源:刺猬实习",不尊重原创的行为刺猬实习或将追究责任
  • 3、作者投稿可能会经刺猬实习编辑修改或补充。

相关推荐