今天本来想分享关于技术类的文章,由于工作的事,一直拖到现在。还在测试中,在十一国庆节前要发布的。所以最近一直在忙。想今天该写点什么东西呢,思来想去,既然技术类的分享不了,那就分享面试经历吧。

趁着今年下半年时间段休假之余,去面试了几家公司,当然我也只是去看看外面的市场行情。说到这里,我就多嘴一提。每个人对公司和岗位的要求不同。有的人想找薪资高的,有的人想找离家近的,有的人想找双休。。。。等,总有会有些取舍吧!我说说我的自己的要求吧,最好是大厂,其次是上市公司,或者公司规模比较大,行业内有知名度。为什么这么排序呢?在国内只要你进去大厂,出来后找工作很容易了,也不用担心35岁的问题,前提是自己要保持学习和更新知识体系;其二是上市公司,主要是稳定,一般在国内的上市公司相比创业公司相对要资源多、财力雄厚等;其三是公司规模,这样的公司一般员工数量级别大,能养得起这么多的员工,公司也不会差点哪里去。最最最重要的一点,是保持学习,保持更新知识体系。大公司大厂在今年疫情中相比其他的公司优势逐渐体现,这才是重点!当然每个人的追求不一样,各有各的选择。话不多说下面开始分享我的面试经历。

先介绍我自己的背景,我就是一个大专毕业,武汉某三流大专,学计算机的,但是在学校学的也就是传统的ASP.NET,其他的暂未涉及到。很高兴接到腾讯的面试邀请。

腾讯一面————岗位——csig事业群golang后端(腾讯教育部门)

一面就两个问题,让我直接铩羽而归。第一个问题是如何评估并发量,带宽, 以及PV与并发,带宽的计算规则。说实话这个问题,我还真不会,但是当我前几天突然翻开我的笔记本,第二页就写着如何评估带宽,里面什么都有,看到那一刻我的心都死了,这还是去年年底写的,写了就丢到一边了,从未翻开来看。看来,以后的笔记,博客还得时常温习下,不然我还真的是,,,,,

第二个问题,是mysql的binlog有几种格式,分别解释下。我在想,现在难道不问索引了吗?直接问最深层次的问题。正常情况下,这都是属于DBA的范畴了。要是问我一个索引我还能给你讲个一二三四五六七八,你问binlog我无能为力啊。不过放心,我会补回来的。

上面的第一个问题,下面我就开始给思路和答案,这里不考虑集群和分布式

以30w的PV为例,来计算需要买多少带宽合适?
  对于这个问题,相信若从来没有想过这个问题,你很可能一下子一脸懵逼,怎么测算?
  其实冷静下来,就会发现,不过就是一道小学数学题罢了。
不就是将30万PV的访问量,换算成带宽嘛,将问题拆分如下:
  1. 一天30万的页面访问(PV),转换为每秒访问量(QPS): 30万/(24 × 60 × 60)秒 = 3.47个请求每秒
  2. 知道了一秒大概是3.47个请求,将请求化整,就是4个请求每秒.
  3. 再来看看我们整个网站平均一个页面有多大,怎么看?Chrome等浏览器打开调试窗口(如:按F12) ,访问自己的网站,看一下最右下角的访问统计,你就知道自己当前访问的这个页面有多少资源,这一次访问发起了多少个衍生连接,以及这一次压缩传输的数据大小,已经资源到客户端后,解压到大小,我们这里主要关心压缩传输大小,通过对整个网站的网页做访问,记录这些值,并求出平均页面大小,接着就可以继续下面的计算了。
  
4. 知道了一秒大概有4个并发请求,而平均一个页面假如是0.4M,那么4个并发请求需要占用的带宽不就是 4×0.4M=1.6MB,再换算成比特,就是1.6MByte × 8bit= 12.8Mbps 这就是你的网站大概需要多少带宽。
  5. 引用道友的公式如下:
    网站带宽= PV / 统计时间(换算到S)*平均页面大小(单位KB)* 8

上面的第二个问题,现在不用我说,相信大家都开始去谷歌答案或者百度答案去了吧。当然现在既然提到了,我还是会把答案摘抄出来的,毕竟再要大家去百度或者谷歌,太吊人胃口了吧!

一.MySQL Binlog格式介绍
mysql binlog日志有三种格式,分别为Statement,MiXED,以及ROW!
查看binlog的格式的脚本:

二、binlog 的不同模式有什么区别呢?
1.Statement:每一条会修改数据的sql都会记录在binlog中。
优点:不需要记录每一行的变化,减少了binlog日志量,节约了IO,提高性能。(相比row能节约多少性能与日志量,这个取决于应用的SQL情况,正常同一条记录修改或者插入row格式所产生的日志量还小于Statement产生的日志量,但是考虑到如果带条件的update操作,以及整表删除,alter表等操作,ROW格式会产生大量日志,因此在考虑是否使用ROW格式日志时应该根据应用的实际情况,其所产生的日志量会增加多少,以及带来的IO性能问题。)
缺点:由于记录的只是执行语句,为了这些语句能在slave上正确运行,因此还必须记录每条语句在执行的时候的一些相关信息,以保证所有语句能在slave得到和在master端执行时候相同的结果。另外mysql 的复制,像一些特定函数功能,slave可与master上要保持一致会有很多相关问题(如sleep()函数, last_insert_id(),以及user-defined functions(udf)会出现问题).
2.Row:不记录sql语句上下文相关信息,仅保存哪条记录被修改。
优点: binlog中可以不记录执行的sql语句的上下文相关的信息,仅需要记录那一条记录被修改成什么了。所以rowlevel的日志内容会非常清楚的记录下每一行数据修改的细节。而且不会出现某些特定情况下的存储过程,或function,以及trigger的调用和触发无法被正确复制的问题
缺点:所有的执行的语句当记录到日志中的时候,都将以每行记录的修改来记录,这样可能会产生大量的日志内容,比如一条update语句,修改多条记录,则binlog中每一条修改都会有记录,这样造成binlog日志量会很大,特别是当执行alter table之类的语句的时候,由于表结构修改,每条记录都发生改变,那么该表每一条记录都会记录到日志中。
3.Mixedlevel: 是以上两种level的混合使用,一般的语句修改使用statment格式保存binlog,如一些函数,statement无法完成主从复制的操作,则采用row格式保存binlog,MySQL会根据执行的每一条具体的sql语句来区分对待记录的日志形式,也就是在Statement和Row之间选择一种.新版本的MySQL中队row level模式也被做了优化,并不是所有的修改都会以row level来记录,像遇到表结构变更的时候就会以statement模式来记录。至于update或者delete等修改数据的语句,还是会记录所有行的变更。

三.Binlog基本配置与格式设定
1.基本配制
Mysql BInlog日志格式可以通过mysql的my.cnf文件的属性binlog_format指定。如以下:
binlog_format = MIXED //binlog日志格式
log_bin =目录/mysql-bin.log //binlog日志名
expire_logs_days = 7 //binlog过期清理时间
max_binlog_size 100m //binlog每个日志文件大小

2.Binlog日志格式选择
Mysql默认是使用Statement日志格式,推荐使用MIXED.
由于一些特殊使用,可以考虑使用ROWED,如自己通过binlog日志来同步数据的修改,这样会节省很多相关操作。对于binlog数据处理会变得非常轻松,相对mixed,解析也会很轻松(当然前提是增加的日志量所带来的IO开销在容忍的范围内即可)。
3.mysqlbinlog格式选择
mysql对于日志格式的选定原则:如果是采用 INSERT,UPDATE,DELETE 等直接操作表的情况,则日志格式根据 binlog_format 的设定而记录,如果是采用 GRANT,REVOKE,SET PASSWORD 等管理语句来做的话,那么无论如何 都采用 SBR 模式记录
4.Mixed日志说明:
在slave日志同步过程中,对于使用now这样的时间函数,MIXED日志格式,会在日志中产生对应的unix_timestamp()*1000的时间字符串,slave在完成同步时,取用的是sqlEvent发生的时间来保证数据的准确性。另外对于一些功能性函数slave能完成相应的数据同步,而对于上面指定的一些类似于UDF函数,导致Slave无法知晓的情况,则会采用ROW格式存储这些Binlog,以保证产生的Binlog可以供Slave完成数据同步。

在这里,我分享下,为什么写技术分享的原因,写文章可以锻炼人的文笔,也可以加深对知识体系的理解,还有想以此形成自律。每天抽几个小时做技术分享。当你们看到就是文章的时候,其实背后我会去找素材,找代码,有些东西只说没什么卵用,要用代码来实践并证实观点。所以有时候准备一个技术分享,还是很消耗精力的。在此给广大程序员一个建议,如果要继续吃程序员这碗饭,坚持学习和写博客是非常有效果和有意义的。