问kafka 高性能的原因,它的数据结构是怎么样的?
问kafka的consumer重要参数举例?
问使用 kafka 集群需要注意什么?
问什么情况会导致 kafka 运行变慢?
问kafka有几种数据保留的策略?
问kafka可以脱离zookeeper单独使用么?
问Flink与SparkStreaming做实时的区别?
问支持百万级TPS,Kafka是怎么做到的?
问hive导出数据有几种方式?如何导出数据?
问分区和分桶的区别?
问hive中追加导入数据的4种方式是什么?
问hive中的排序关键字有哪些?
问hive中count(*)、count(1)、count(某字段)的区别?
问Hadoop中Secondary Namenode工作原理?
问Hadoop中Secondary Namenode作用?
问hive中tez引擎和mr引擎的区别?
问hive的几种存储引擎,以及hive的SQL优化器?
问消息队列rabbitmq、kafka、rocketmq/ONS的区别?
问简单说一下hadoop的map-reduce模型
问fsimage和edit的区别?
问hdfs读取文件步骤?
问hdfs写文件的步骤?
问hdfs和hbase 各自使用场景?
问redis,传统数据库,hbase,hive 每个之间的区别?
问hbase的rowkey怎么创建好?列族怎么创建比较好?
问分桶的作用?
问hive内部表和外部表的区别?
问hdfs的体系结构
问Mapreduce的map数量和reduce数量怎么确定,怎么配置?
问用mapreduce怎么处理数据倾斜问题?
关注互联网行业融资、上市、裁员、破产等发展大事件!