数据分析师面经

您当前的位置:首页 > 职业规划 > 面试经验
2021-03-29    人浏览 加入收藏 (0)   
简介 数据分析师面经

问题1:你最常用的app是?

答:微博


问题2:让你给微博搭一套指标体系给各个业务线vp看你会怎么搭?

答:

平台指标:DAU、模块点击量、博主数、发帖量、点赞、评论

渠道指标:各个渠道的广告投放

用户指标:留存率、频次、停留时长

觉得合理的答案:有问过周围的同学,提到一个模型AARRR,觉得挺全面的,这里贴出链接


问题3:平台发起明星挑战活动,让你评估效果你怎么评估?

答:明星的发帖量、用户的发帖量、用户的评论点赞,如果是关联到收入,可以看下这个活动带来的B端收益,以及细节指标像是各个模块的点击参与情况。


问题4:如果做发帖量的预测我你怎么做?


我有看过很多人提到说用留存率去算,但是觉得这个丢失了一个自循环和周循环的因素,所以没选择这个解法,这里也抛出别人用留存率预测的链接


答:时间序列中的ARIMA模型,用自循环率(AR-Auto Regression)和7天的周期(MA-Moving Average),在被问到留存率的时候,我意识到面试官想要用留存率去算,我又解释这个可以用幂函数拟合一个留存率,然后预测明天的留存率用今天的发帖乘以第1天留存率+昨天发帖*第2天留存率,以此累加。


现在想来这个模型好像能解决周循环和自增的问题,不确定,总觉得笨笨的,但是也没有什么特别好的方法,现实里面是真的这么运用的么?


问题5:如何加入运营动作以及其他影响到这个模型里面?

答:(自己也不确定怎么加)直接累加到上面的预测模型。


问题6:你觉得预测DAU和发帖量是一个模型吗?

答:(我想了想很相似)是的。


所以到底是不是一样,求解答


问题7:让你去找发帖量与DAU之间的关系你怎么找?

答:(当时被细致连问问懵了,其实自己想表达的是coefficient,都不知道自己在说啥)相关性测试、看斜率的相关性,0是不想关,1是正相关。


问题8:如果现在有一些人直接复制别人的内容发出来,或者发出来的内容质量不高,让你定一个策略出找出这些帖子,你怎么找?


后面被问让总结补充这个策略模型,可能我说的太乱,也不太全的缘故


答:ip地址是否异常,发帖是否太迅速,与其他贴的重复率是否很高。


问题9:这个模型或者策略让你用一个指标去衡量表现,你用什么?现在让你做ABtest,你怎么做?

答:(我把abtest解释了一通,发现他关心的是评价的指标)预测准确率


问题10:现在你怎么对这个abtest分组?怎么取样?

答:均匀分配,全量抽样


问题11:全量抽样,现在抽样上来只有1%不到的样本是劣质的,你还全量抽样?

答:扩大抽样样本,从疑似的里面抽


问题12:这个策略上线,发现DAU下降了,你觉得是否有关?

答:并不一定,如果说这个策略上线误判率很高,也就是当中是优质的帖子被大量删除,抑制了用户发帖,帖子减少,DAU可能随之下降,如果说有效遏制了劣质的帖子的发送,让用户看到更多优质内容,体验提升,对DAU是有利的


问题13:如果这个模型误判率也很低,还有其他可能会影响的因素吗?

答:如果准确率也很高,误判率也降低,那0-1分类模型里面的四种情况都有效预测出来,那可以推断DAU下降与模型无关


现在想是不是需要提供模型外部的影响因素?


问题14:如果DAU异常监控追因的看板你怎么搭?

答:

外部:政治、运营产品动作

内部:前面一开始搭的看板,从分渠道、分城市、分产品线来监控。


最后就问你还有什么问题?我简单问了几个组织架构,所需负责的内容的问题,这些问题都是万金油的存在。中间还有很小部分细节问题在答的同时伴随出来的我也记的不是很清晰了,大的问题框架是这样的。



注:内容来源于各大面经网、论坛等,如果侵犯了您的权益,请联系我们处理