袋鼠云大数据岗位面试题
袋鼠云面试题
文章插图
学长1(1)Spark怎么做到Exactly-once?
(2)flink的怎么和rocksDB交互的 。 画一个流程图 。 (这个我也不会)
(3)flink怎么实现Exactly-once?
(4)flink on yarn 的任务提交流程?
(5)rocksDB为什么可以存储那么大的数据量 。
(6)使用eventtime+watermark的时候 , 如果数据到6点结束了 。 怎么保证最后一条数据能计算 。
(7)你理解的什么样的数仓是一个好的数仓 。
(8)你们有做过数据的结果的校验吗?怎么校验的(很重要 , 金融的业务不允许有误差 , 深圳的是金融业务部门 。 可以容忍慢 , 但是不能错 。 )
(9)要是能自己去看看flinksql就更好了 。 最新的flink已经支持sql的写法了 。 业务用的就是flinksql 。
(10)公司是做数据中台 。 主要用的技术就是flink 。 多准备一下flink的技术 。
***面试通过者 , 薪资可以参考20
学长2(1)Flink topN的实现
【袋鼠云大数据岗位面试题】(2)使用状态后端的时候与hdfs/rocksdb的交互(没懂 , 不是checkpoint检查点机制)
(3)窗口的触发机制、压力监控及处理、设置时间语意、连续处理
(4)jvm
(5)用原生api创建线程池和调用
(6)map和list的各实现类的用法与区别
(7)数仓各层的理解
(8)物流宽表和订单宽表为什么不做到一块儿
(9)怎么把hdfs上的数据导到hive , 内外表
(10)星型模型和雪花模型 , 事实表维度表
(11)namenode的内存结构
(12)数据质量监控
(13)kafka的数据重复在数仓怎么处理的
(14)存储格式及对比
(15)项目中遇到的问题
- 查询|数据太多容易搞混?掌握这几个Excel小技巧,办公思路更清晰
- 黑莓(BB.US)盘前涨逾32%,将与亚马逊开发智能汽车数据平台|美股异动 | US
- 健身房|乐刻韩伟:产业互联网中只做单环节很难让数据发挥大作用
- V2X|V2X:确保未来道路交通数据交换的安全性
- 短视频平台|大数据佐证,抖音带动三千万就业,视频手机将成生产力工具?
- 权属|从数据悖论到权属确认,数据共享进路所在
- 统计|多久才能换一次手机?统计机构数据有点意外
- 发展|大数据解读世界互联网大会·互联网发展论坛!
- 网购|黑色星期五及网购星期一大数据出炉 全球第三方卖家销售额超48亿美元
- Veeam|Veeam让企业数据拥有“第二次生命”
