2019.10.27 头条面试准备

2019.10.27 头条面试准备

个人简历

2019.06 - 至今上海华为开发工程师

实习部门:5G开发部
项目:网站开发、运维开发、数据处理
2019.06至今华为实习
Python+Django+Javascript+Nginx+rabbitMQ+ELK
基于 Django 框架使用 Python 开发网站基础进程监控系统,实现进程异常记录、进程异常自动恢复、发送告警邮件,并且用 Web 界面进行展示和管理。整个框架由本人独立设计完成并上线,保证了部门 Web 的稳定。
使用Python对文件里面的数据进行处理分析,并完成web展示。

2019.06 - 至今网站基础进程监控系统开发工程师

1,基于 Django 框架使用 Python 开发网站基础进程监控系统;
2,使用pymysql实现进程异常记录、利用subprocess+ssh连接机器检查进程状态、异常自动恢复、使用rabbitMQ作消息队列发送告警邮件和短信通知;
3,使用JavaScript、Jquery、echarts等开发 Web 界面进行展示和管理进程。4,整个框架由本人独立设计完成并上线,保证了部门 Web 的稳定。

2018.12 - 2019.03华为云意见反馈系统开发工程师

1,基于Spring boot框架+Mybatis+Redis+Restful等技术的一个意见反馈系统。2,本人在项目里面负责后端部分,使用IDEA开发工具,Git协同开发
3,实现了登录校验,发布,删除,评论等功能。

IT技能:熟悉Python、Java,有扎实的数据结构算法基础,熟悉Linux操作,熟悉JavaScript页面开发;
职位相关技能:了解Hadoop,了解redis,了解机器学习、深度学习。
CET6:520 有良好的英语阅读能力

准备

  • 说一下Django框架
  • 说一下进程监控系统

生产服务依靠很多关键性进程的运行来维持。比如rabbit_mq消费者,数据分析的脚本,网站响应速度,数据库健康状况等等。这些进程分布在不同机器上,而且数量巨大。为了把这些进程监控起来,就开发了一个简单的监控系统。通过前端界面进行配置服务相关信息,所有进程的状态都可以通过前端进行查看。一旦有异常会根据邮件分组进行发送,如果配置了异常自动恢复功能,会自动恢复服务。

底层原理:ssh,ping,connect,urlopen,rabbit_mq消息队列

不足:虽然功能简单,但是能稳定运行。其中也有很多不足的地方,如果机器数量特别大,那么这个监控系统可能管理起来就会很麻烦。

优化:可以借鉴开源框架的C/S模式,客户端上报机器信息,服务端进行汇总监控。

  • python文件数据分析

对5G一些模块生成的文件,进行分析统计一些高频函数。

rabbitMQ 和 kafaka

  • nginx

    • [x] Nginx 相关负载均衡算法

    • [x] 原理

    • [x] Nginx如何做到高并发下的高效处理?

      上文已经提及Nginx的worker进程个数与CPU绑定、worker进程内部包含一个线程高效回环处理请求,这的确有助于效率,但这是不够的。

      作为专业的程序员,我们可以开一下脑洞:BIO/NIO/AIO、异步/同步、阻塞/非阻塞...

      要同时处理那么多的请求,要知道,有的请求需要发生IO,可能需要很长时间,如果等着它,就会拖慢worker的处理速度。

      Nginx采用了Linux的epoll模型,epoll模型基于事件驱动机制,它可以监控多个事件是否准备完毕,如果OK,那么放入epoll队列中,这个过程是异步的。worker只需要从epoll队列循环处理

Java

  • [ ] 读写锁https://www.cnblogs.com/DarrenChan/p/8619476.html
  • [ ] hashtable、hashmap、concurrenthashmap
  • [ ] wait 和 sleep 的区别
  • [ ] 接口和抽象类的区别
  • [ ] 集合类 arraylist linkedlist 区别 扩容
  • [ ] 何时会STW,所有垃圾回收器都会有STW吗
  • [ ] String str = new String(“abc”)的操作有几个对象产生
  • [ ] public protected private区别
  • [ ] final和finally区别?final可以用在方法参数上吗?
  • [ ] RuntimeException和非RuntimeException?各举几个例子?比方说文件读写的时候会有什么异常?
  • [ ] 怎么实现序列化?除了Java原生序列化方法,序列化还有什么格式?
  • [ ] Java IO(序列化、BIO、NIO、AIO)

  • spring boot基础

    • 什么Spring的原理,
    • Ioc和
    • AOP,
    • 事务,
    • 多个bean的关系,
    • SpringMVC的流程

redis

  • [x] Redis 实现分布式锁的原理说一下
  • [x] Redis 实现缓存是存储什么数据,过期时间是多少
  • [x] 除了 Redis 实现分布式锁,还有什么办法:ZK
  • [x] Redis 在项目中怎么使用,使用什么特性
  • [x] 分布式锁的实现除了 Redis 还有什么?
  • [x] 缓存与硬盘的优点缺点比较,为什么需要缓存
  • [x] Redis 缓存存放什么数据/使用什么数据格式存储
  • [x] redis 持久化
  • [x] redis缓存一致性
  • hadoop
    • [ ] mapreduce
      • [ ] shuffle
    • [ ] 数据倾斜
    • [ ] maptask和reducetask的数量怎么控制
    • [ ] resourcemanager,nodemanager,applicationmanager和MRAppMaster等等
    • [ ] hdfs
      • [ ] namenode 和 datanode 怎么数据交换
      • [ ] 数据如何存储到datanode上的,具体存到哪里
      • [ ] datanode坏了 如何恢复(有备份),每个datanode有几个副本,可以更改吗
      • [ ]
    • [ ] yarn
    • [ ] HDFS数据如何保证不会丢失?
    • [ ] MR详细过程(请注意详细,从RPC开始说)
    • [ ] YARN容错机制
  • zookeeper
    • [ ] ZK 实现分布式锁的原理了解吗?不了解,但了解如何实现服务注册与发现
    • [ ] zk 如何保证高可用
    • [ ] zk 高可用的实现原理是什么
  • 流处理框架

  • 设计模式
    • 单例模式
  • 哈希一致算法
  • Hive

    • 分区和分桶

算法

  • 二叉树中序遍历 非递归

  • 链表逆序(O(1))

  • 冒泡排序

  • 最长递增子序列

  • 动态规划 https://www.cnblogs.com/DarrenChan/p/8734203.html

  • 最长公共子串

  • Top K问题 https://www.cnblogs.com/DarrenChan/p/8796749.html

  • 微信扫码登录设计原理 https://www.jianshu.com/p/047acc4190cb

  • 01背包

  • 最长公共子串

  • 二叉树序列化与反序列化

  • 二叉树前序遍历中序遍历构造还原

  • LRU算法实现

  • 单链表奇数位递增,偶数位递减进行排序

  • 矩阵中的二分查找(一个二维矩阵,从左到右是升序,从上到下是降序,找一个数是否存在于矩阵中(类似于二叉查找树))

  • 数组内部重复,求重复部分(1,2,3,1,2,3 求 1,2,3)

  • 二叉树是否存在和位N的路径

  • 求二叉树最长路径

  • 通过内存计数器实现限流器

  • 名人问题:

    • 链接:https://www.nowcoder.com/discuss/115824
      所有人都认识TA,但是TA不认识任何其他人
      a [i] [j] = 1, i 认识 j
      a [i] [j] = 0, i 不认识 j
      a [i] [i] 置空
      给定n*n的二维数组,有多少个名人?具体都是谁?
  • 删除链表中所有重复元素

  • 输入一个字符串String str,求重复次数最多的字符的第一个索引值
    例如
    输入:"aabcbcbc"
    输出:2(b和c都出现了3次,但b在c前面)

场景题:

  • 游戏保证100人在线不卡:长连接,消息队列静态资源分配
  • 小米抢购怎么做
  • 抢红包随机算法,保证公平性
  • 微博高并发应对措施
  • 爬虫多个电商数据,如何存放,如何找到同一商品最便宜的url
  • 一个五升桶,一个三升桶,怎么倒出四升水,水可以无限量使用
  • 滴滴派发订单功能设计?
  • 有声小说音频自动匹配字幕情景题,有大量的音频文件,非人力能够做到,语音识别匹配生成字幕文件,字幕文件中语音和字幕的时间需一致,如何设计?
  • 英雄联盟H5小游戏排名,实时动态更新,如何实现?
  • 杭州G20形象工程需要擦窗子,估计杭州擦窗子要多少费用?

数据库:

  • 索引:

    • 平衡树,b树 和 b+树 https://www.cnblogs.com/aspwebchh/p/6652855.html

    • 聚集索引(根据主键生成平衡树,然后进行查找),一般的查找步骤是,根据字段查找对应的id,然后根据id再查到具体的信息。 建立索引的目的就是加快id查找,根据多字段建立索引也可以省略根据id查找具体信息的目的。 比如:我要查name 小王 的 score成绩,根据这两个字段建立索引:<这种方式叫覆盖索引>

    • create index name_and_score on student(name, score);
      select score from student where name='小王';
  • b树 和 b+树的区别

  • 数据库事务隔离级别

  • mysql 和 hbase对比

  • mysql数据库默认存储引擎,有什么优点

others:

  • epoll

https://www.nowcoder.com/discuss/271862?type=2

数据库基础

? 关系型和非关系型数据库的区别(各自优点)

? 常用SQL语句(DDL,DML,DCL,TCL)

? 数据库中join的类型与区别(inner join, outer join, cross join, natural join, self join),注意适用场景和sql语句的编写

? 数据库的索引类型

? 聚集索引和非聚集索引的区别(叶节点存储内容)

? 唯一性索引和主码索引的区别

? 索引的优缺点,什么时候使用索引,什么时候不能使用索引(重点)

? 索引的底层实现(B+树,为何不采用红黑树,B树)

? B树和B+树具体实现

? 索引最左前缀问题

? Mysql的优化(高频,索引优化,性能优化)

? 数据库引擎介绍,Innodb和Myisam的特点与区别

? 数据库中事务的ACID(四大特性都要能够举例说明,理解透彻,比如原子性和一致性的关联,隔离性不好会出现的问题)

? 数据库隔离性设置不同会出现的问题(脏读、不可重复读、丢失修改、幻读)

? 数据库的隔离级别,Mysql和Oracle的隔离级别分别是什么

? 数据库连接池的作用

? Mysql的表空间方式,各自特点

? 分布式事务

? 数据库的范式

? 数据的锁的种类,加锁的方式

? 视图的作用与使用方法(如何删除等)

? 分库分表,主从复制,读写分离。(我不会,也没碰到过)

? 项目中哪里用到了数据库,怎么用的

? Memcache和Redis了解

?

大数据和分布式

? Hadoop框架下,各个组件的构成及作用

? BASE原则,CAP原则

? 一致性算法Raft的过程

? TIDB原理

? HBase的存储原理

? HDFS运行原理

? Hive的了解

? Spark的了解

? 介绍熟悉的设计模式(单例,简单工厂,观察者模式等等)

? 写单例模式(饿汉模式和懒汉模式),线程安全版本

? MVC设计模式

相关推荐