找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索

面试剖析

0 点赞 1 评论

【守望者 海量数据】海量数据的top10问题

312 次浏览    2014-09-24 12:08    显示评论
问题描述: 海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10。 查看更多>>
参考答案:

方案1:

s 在每台电脑上求出TOP10,可以采用包含10个元素的堆完成(TOP10小,用最大堆,TOP10大,用最小堆)。比如求TOP10大,我们首先取前10个元素调整成最小堆,如果发现, ...
zhouy
2014-10-17 14:36

0 点赞 1 评论

【守望者 海量数据】海量日志数据,提取出某日访问百度次数最多的那个IP。

256 次浏览    2014-09-24 12:06    显示评论
问题描述: 海量日志数据,提取出某日访问百度次数最多的那个IP。 查看更多>>
参考答案:

方法: 计数法
    假设一天之内某个IP访问百度的次数不超过40亿次,则访问次数可以用unsigned表示.用数组统计出每个IP地址出现的次数,  即可得到访问次数最大的IP ...
zhouy
2014-10-17 14:41

0 点赞 1 评论

【守望者 海量数据】海量数据query的频度排序。

286 次浏览    2014-09-24 12:05    显示评论
问题描述: 有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。 查看更多>>
参考答案:

方法一:类似第1题方法一,扫描所有文件,使用hash将query重新散到不同文件中,这样相同的query一定在同一个文件中。
对每个小文件进行计数。最后归并结果。

方法二:类 ...
zhouy
2014-10-17 14:42

0 点赞 1 评论

【守望者 海量数据】海量数据中找出重复的url。

301 次浏览    2014-09-24 12:03    显示评论
问题描述: 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 查看更多>>
参考答案:

分析:
1MB = 2^20 = 10^6 = 100万
1GB = 2^30 = 10^9 = 1亿

50亿url = 5G*64 Byte

整理方法如下:
方法一:
分别扫描A,B文件,根据ha ...
zhouy
2014-10-17 14:43

0 点赞 0 评论

[守望者 算法]消除球

154 次浏览    2014-09-24 11:24
问题描述: 给一列球,球的颜色可以不同,如果k个连续的球的颜色是一样的,那么我们可以把他们消去,得到的分数为 k*k, 求如何消去得到的分数最高。 查看更多>>

0 点赞 0 评论

[守望者 算法]滑雪

246 次浏览    2014-09-24 11:22
问题描述: 一个哥们喜欢滑雪,为了获得刺激感,他跑到一个山头滑雪,想找到一个最长的路径滑下来。现在给一个M*N的矩阵,矩阵上每个点是这个点的高度,找到一条最长路,可以上下左右走,这条路上的高度应该是递减的。 ... 查看更多>>

0 点赞 0 评论

[守望者 算法]大牛合唱

206 次浏览    2014-09-24 11:22
问题描述: 给出一个数轴,一些位置有牛,每头牛一个位置xi,以及一个听力值vi。当两头牛交谈时,需要的声音为距离*max(vi,vj). 问所有牛两两交谈的声音总和 查看更多>>

0 点赞 0 评论

[守望者 算法 ]越扫越黄

228 次浏览    2014-09-24 11:20
问题描述: 一个n*n的网格图,每一格是白色和黄色任意一种颜色,你点击一个格子的时候,这个格子和它上下左右四周的格子都变色(黄-白或者 白-黄),现在给你一个初始的图,问你1.能否 2. 最少需要点多少次 使这个图的颜色变成 ... 查看更多>>

0 点赞 0 评论

[守望者 算法 ]石头与树

174 次浏览    2014-09-24 11:20
问题描述: 有一棵树,有一些石头,依次把石头放在树叶上,如果一个节点的叶子节点全有一个石头了,就可以把它们的石头去掉,并把其中的一个石头放在这个节点上,而这个结点就相当于一个叶子节点了,去掉的石头可以再用,问直到 ... 查看更多>>

推荐阅读

【守望者 面试交流】面试官: "你还有什么问题要问我“,这个考察什么? ...
【守望者 面试交流】面试官: "你还有什
守望者:对于面试中的最后一个问题,一定要事先准备,先多了解公司的情况,岗
【守望者 面试交流】如果面对,三个你最大的优点/缺点是什么?或者你最大的缺点是什么 ...
【守望者 面试交流】如果面对,三个你
守望者:这个问题因为好的回答而留下好印象很难,关键是避免留下坏印象。坦诚
【守望者 面试交流】普通开发者 如何拿到国内IT巨头的Offer
【守望者 面试交流】普通开发者 如何拿
守望者:技术之路最公平也最残酷的原因是:没有捷径,需要日积月累的积累,以
【守望者  面试交流】有哪些话是面试的时候千万不能说的?
【守望者 面试交流】有哪些话是面试的
守望者:interview作为inter-view,做为被面试者,在整个过程中,很多时候,
【守望者 面试交流】不要用面向对象来迷惑程序员新手
【守望者 面试交流】不要用面向对象来
守望者:当我被问及“哪种编程语言是教我时,”我的答案这五年多来一直没变:
【守望者  面试交流】学历一般、比较内向的人怎么才能在面试中脱颖而出?
【守望者 面试交流】学历一般、比较内
守望者:学历一般,比较内向,这些都不是面试的重点,重点是表现出你自己的诚
【守望者 面试交流】】IT应届生在大公司的生存之道
【守望者 面试交流】】IT应届生在大公
守望者:对于很多计算机毕业的同学不知道如何选择大公司还是小公司,并且对大
【守望者 面试交流】面试官究竟如何考察求职者的「学习能力」? ...
【守望者 面试交流】面试官究竟如何考
优秀的面试官不仅关注求职者已经具备的技能,更关注他/她的学习能力。那么面
【守望者  面试交流】为什么有人说简历留 QQ 邮箱不好?
【守望者 面试交流】为什么有人说简历
守望者:QQ邮箱在简历中因偏见的原因不受待见,因为,很多时候,确实存在这样
【守望者   实习专题】应届毕业生没有实习经验,没有接触过项目,简历怎么写呢?
【守望者 实习专题】应届毕业生没有
守望者:在我看来,应届毕业生简历最关键的是要让hr感觉这个小伙子就是我们这
【守望者 面试交流】2015年全部企业校园招聘薪资比拼
【守望者 面试交流】2015年全部企业校
守望者:从目前信息来看,互联网公司多为8~13K,这对于应届生来说,真是相当
【守望者  面试交流】如何在面试的无领导小组讨论环节中脱颖而出?
【守望者 面试交流】如何在面试的无领
守望者:在小组讨论中需要什么能力才能做好这些行为?作为一个小组里面的博弈