分享 Teahour.fm 25 期:和又拍云 (UPYun) 的邵海杨聊运维

lgn21st · 2013年07月22日 · 最后由 sasuke 回复于 2013年12月16日 · 6954 次阅读

地址:http://teahour.fm/2013/07/22/interview-with-shaohaiyang-about-upyun-devops.html

本期由 @lgn21st 主持,邀请到UPYun的运维总监@geminis 邵海杨一起聊聊运维,云存储,云加速,以及互联网运维人员的职业规划,发展方面的话题...

关于邵海杨:

来自杭州 Linux 用户组。又拍云运维总监,网名“海洋之心”,资深系统运维/架构师,业余撰稿人,致力于开源软件及前沿科技的研究和探索。精通系统及网络管理,定制嵌入式系统,安全防御及 CDN 加速,互联网高性能网络及架构设计、NoSQL 先行者、分布式文件系统 Ceph、虚拟化及 OpenStack 云平台的研究等新技术,喜交流,活跃于社区,积极投身于开源活动的组织和传播,真诚待人,授人以渔,共同进步。

学到了很多,经验很受用,感谢分享。

这一期好像没有什么反响?大家听下来觉的如何?给我一些反馈好吗?

昨天刷的时候没有,今早刚看到,还没来得及听,先下载晚上听

还在听...

这期声音都还不错,再次提建议,dingding 录的时候,声音太小

程序员多少得懂点运维哟.... :D 推荐!!

本来我也应该参与这次录制的,结果身体有点不适,所以错过了哦... 辛苦 @lgn21st 同学了!!!

upyun 给我的印象很好,有一次我遇到了一个小问题,客服人员直接就帮我接通了技术人员。感觉很人性化,很贴心。

#6 楼 @poshboytl 木有关系,要保重身体。

已经听完!感觉很不错!尤其是听到多看每天上午 10 点都有限免!这个太激动!

刚听完,很赞,听下来觉的邵海杨好接地气,踏实谦虚好学,乐于分享,每期 teahour 都能让我收获很多,谢谢@lgn21st

赞,理念交流重于技术讨论,很多理念很受用

很好,学了不少东西,尤其是员工写 wiki,还有 usb 制作的服务器群 但是偶尔的会有听不清的情况,比如多看,听 podcast 怎么听都像都看,搜了半天没搜到,囧,要是能有注明就好了。

我更喜欢运维出身的程序员,从底层上来的程序员,基础扎实,思维灵活,知识面广。用 wiki 做知识管理是个好方法,但是让团队坚持不容易。

歪个楼。 这是 BUG 吗?Windows 下的 Firefox 22.0, 只能看到第 20 期,无法滚动。

#2 楼 @lgn21st 对 upyun 有个问题,如果我网站流量本来就很大,如果有人恶意 DDOS,那我为这些巨大的流量付费岂不会很惨。

#15 楼 @Peter 这个是一个老话题了,DDOS 本就是拼资源,拼流量的事情。如果遇到 DDOS 攻击,并且你能够把攻击转移到云存储或者 CDN 上去的话,让他们帮助你挡掉 DDOS 攻击,并且还能保证你可以服务普通用户的话,你应该为这些帮你抵挡攻击的人付钱,如果你不愿意付钱的话,你损失的可能会更多。

#14 楼 @liliang13 哈哈,的确有这个 bug,显示器小了就这样…… 一般用手机听 podcast。

#14 楼 @liliang13 我们有计划重新设计 http://teahour.fm 的首页,添加一些必要的功能,比如可以让用户反馈信息等。只不过大家近期都有点忙。

#16 楼 @lgn21st 你说的的确在理,但当一个网站不是那么盈利的时候,有站长是宁愿网站打不开,也不愿为云存储或者 CDN 付大额流量费的,因为自己服务器是不限流量的。

那些变动大,不好管理,也是速度瓶颈的资源交给云存储或者 CDN 在一般情况下是有好处,费用在一般情况下也可以接受,但有这么一次 DDOS, 要是还持续几天没有觉察的话,真可能是一笔意外的开支。

所以网站要盈利是关键。有盈利就可以用高级的产品解放程序员和系统维护工程师。

#17 楼 @siyang1982 是啊,我突然意识到了。 = =

@lgn21st 很精彩的访谈。不过有个时间问题要确定一下。邵说 99 年开始用 riak 用 erlang,99 年用 erlang 还是可能的,但用 riak 就不太现实了,毕竟 riak 也就是 09 年以后才出来的东西。是不是口误了?而且之前也有一个类似的,说 93 年淘宝开始 php 写出来,也应该是 03 年吧。

非常好。

能问问有啥专门说运维的播客吗?

本期的节目非常精彩,这种有思想分享的内容比起普通的技术大会好多了。整理了笔记:

其实学到的有 3 点:

要闲下来才有精力学东西提高,中间件,个人是公司的核心对个人来说问题很大

05 linux 熟悉 运维还是以 linux 为主

苦逼?运维 24 小时待命?是系统工程 运维的苦逼之处:不参与决策,但是要为结果负责, 苦:和机器,机房,网络打交道,解决方法:外包 逼:别人出问题自己要负责,解决方法:提高能力,转变角色,负责协调

upyun: 业务:云存储,云加速 不自己造轮子,用和改别人的轮子 归一化管理

人数:3 人,2 个技术支持 google 一个人 1 万台 模型足够简单: 组件标准化:2 个模型 流程化:执行操作批量推送 自动化:rethink,puppet

上架:一个月上架一次 5 台,架构成熟 嵌入式思想做运维: 05-10,威盛,x86 芯片+linux 做车载,700K kernel,12M 系统 DOM 盘 5 年 IT 经理 53 客服 精简光盘,瘦身到 500M Upyun,500 台机器,小系统,优盘 cdn 资源,3/5,安装系统,软件,部署,烧优盘,就可以发布了

树莓派,小型硬件做有趣的东西。嵌入式自己玩玩可以,业务的话还是不冒风险为主。 这个方案遇到的问题:没有。优盘质保 5 年,IO 转移掉读写,节点集群,发货后有备用优盘

嵌入式:系统小,方便放到优盘 安全:第三方软件引入风险,去掉 GCC 基础机器,推送软件

运维精髓:高度一致,要专一 人难控制,机器方便控制,多人团队不确定性被放大 自动化运维:流程化,标准化,文档清晰 cdn,存储自动化,技术支持都可以做

挑战? 运维不是一步到位,有 10 年的沉淀,学习,摸索和总结,需要付出努力

建议:如何才能做到那么轻松

技术领域: 一定要让自己闲下来: 自动化,3 剑客编程:bash,sed,awk 好处:节省时间和精力 后端系统:12 个硬盘,挂载,格式化,识别,盘符,序列号 节省时间后,关注新技术:nginx,才能学习

要跳出去:不能只懂系统级别的时期,要懂 3p:perl,python,php,打通前后端

运维是底层人员,负责系统,数据库管理

业务模型->程序(开发人员),运维把握系统 各个行:其实殊途同归, 优秀的软件工程师,比如监控数据,软件开发人员就做掉 运维,开发互补关系

upyun devops 实践? 还是开发归开发,运维归运维 devops 架构中的一部分 架构师:要懂业务,成本核算,CEO

upyun 讨论方案:运维总监,技术总监,CEO(成本) 全球架构师大会?有 45 十岁非常厉害的架构师 但是其实架构师是头衔:可以是一个团队,自己修炼,另外寻找伙伴 开发运维齐了,但是对业务的把控能力差?找合适的人

运维工程师如何发展:挑战:

  • 修炼自己的运维能力
  • 学习新技术
  • 面临 devops 的挑战
  • 面临来自于云的挑战: 熟悉云部署和使用,云端运维 博:了解云,专:对特殊领域有了解,可以加入到云团队

多看书,要能够传播好的理念,和开发沟通,和老板要资源 运维是沉淀出来的:坑只有在特殊状况出现 多做笔记,wiki,需要输出经验的时候很方便 学习和思考结合:信息!=知识!=智慧

保证人员异动不影响公司运作,运维的本质很重要 与其把握铁饭碗,不如做好事情,让铁饭碗来找自己 不要成为公司的单点

个人把握核心为什么不好? 因为会成为公司发展瓶颈,以及会成为单点故障 可以带团队:需要建立公司信息库 做事先做人

团队合作 个人修行决定周围人的层次,想找人也能够找到 脚踏实地,结交朋友

如何提高能力 戒骄戒躁,每天进步一点点就够了,最好的方法:人与人之间的交流是最重要的

问题: 运维的思想和严谨如何在追女生中实现? 现在的谈笑风生需要努力:每天都在很苦的学习: 图书馆看书,写文章 05-07:思想转变:技术很牛了,500 强很少推广?技术支持的岗位 老大同意了:技术支持,反而工资加了很多,精通系统,谈判,文案,省会跑遍了,写方案 首先一直在努力,一直在思考人生路,遇到机会能够把握,找老大聊天定夺

07 运维:自己做运维,10 年,老大聊天:已经成为公司的天花板,姿态放低 让手底下的人写文档,周报 3,5,8 年一个坎,低端研究给小弟,自己做高端研究

upyun 云服务运维经验分享 如何做系统监控?监控宝:监控短信做自动化处理 嵌入点:flicr 的追随者,小而精,专注:静态资源的存储和发布 现在:服务趋势 公司发展好的时候,最好合作,寻找合作伙伴 销售:口碑营销 学佛

全网加速 稳定性:解决单点故障: 性能单点故障(性能好,cache 用到极致), 架构单点故障(分布式)

程序简单,运维复杂?框架解决问题,中间件 遇到问题:好的程序员,运维难找, 快速验证业务,找初级程序员,一不小心做大:还债,业务跑着不方便重构

做项目要有中间件概念:留好钩子中间件,比如 restful openstack 研究了 1 年多了 运维可以接触到优秀的软件 好的程序员接触好的软件吸收 openstack:应对云设计,每个组件对外都是端口 可以用 nginx 等做水平扩展,中间件非常厉害

中间件的运用:rabbitmq erlang 分布式存储:非常简单 左拉?英语特别好,技术有敏锐直觉 闲下来才有时间和精力学新的东西

分享: 稻盛和夫:活法 坚持的影响力

还有就是首页有问题,我不能点击到上面的项目:

话说我发了长的东西应该可以把我折叠掉。。 #25 楼 @bhuztez 稍微修改了一下不至于错误太多太寒碜。。。 看了他的博客,果然是以前经常说的车轱辘话。这么高质量的分享只有可能是思考很久,说过很多遍的长期总结。

#23 楼 @linjunhalida 哇,你的总结真赞!

昨天我们几个主播齐聚沈阳,大家商量了一下,等 Teahour.FM 一周年的时候,我们四个人重新做到一起,录制一期节目,聊聊我们录制过程中哪些有趣的故事。其实每期如何准备,如何录制,以及事后剪辑都是不为人所知的。

想加入又拍云做运维,可惜刚毕业,水平还不够

本周往返上海时,火车很抖,不方便看书。手边也没有什么有趣的内容,于是就勉强听了一期 Teahour。

之所以勉强,是因为 25 期的话题是运维。本以为又是一个屌丝的负能量吐槽,听了 5 分钟就发现内容好的出人意料。

25 期 Teahour:和又拍云的邵海杨聊运维

Reputation

很多程序员喜欢自己的 style,写自己才能看的懂的代码,牢牢的控制着一些项目,做到「无可取代」。

很多 SA 牢牢的控制着各种 Root 权限,获取一种无可替代的安全感。

你是不是也在通过这种方式证明自己在公司的存在感?

邵海杨则是另一类人,乐于分享,将自己的知识转化为 wiki 文档,沉淀在任职的公司,像一份无形的资产传承下去。

他总是在不断学习,期待更大的舞台。一旦有好的机会向他招手,他离开后,前一家公司会十分感谢他积累的知识,以及他培养的团队。

我真心觉得这家伙很会做人。

管理

带团队的第一年,他凡事大包大揽,事必躬亲。自己很累,没时间学习新知识,团队成长速度也很慢。

他变成了团队的天花板,没有人可以超越他,但他又是公司的瓶颈。

他后来的做法:自己学习最新技术,指一个大方向。让下属深入研究,再将知识以文档的形式沉淀下来。通过这种管理方式,他有更多的时间与家人相处,研究热门技术,工作轻松了很多。

我在这方面也有相同的感悟:信任,按时检查,激励是一种更好的管理方式,他们会持续不断创造惊喜。

让自己闲下来

作为一个运维,他写脚本将简单、机械、重复的工作自动化,设法让自己闲下来,把时间花在更高端的事情上:学习新技术,转化为生产力。

备注:这和四象限论不谋而合,将时间花在重要但是不紧急的事情上。

功不唐捐

功利所致,很多人都期盼通过短时间的突击学习来换取巨大的成功。

可邵海洋现在的「闲庭信步」是 10 年积累的结果。所以他一再强调,每天都要坚持进步一点点。

这让我想起了胡适先生一句话「功不唐捐」。

与同行沟通

他在学习的过程中若遇到 tough 问题,都会及时找同行。闭门造车耗时耗力,不如牛人的一句点拨。

这点我也深有体会。

总结

学习是个很大的话题,再扯 1 万字也写不完。邵海杨这些点引起了我的共鸣。

写下来,自勉。

以上是自己的日记,让大家贱笑了。

#29 楼 @xiaoronglv 你的总结写的真好,举一反三,于我心有戚戚焉 ~ 赞一记!

坐地铁用手机看微博要么没网,要么无聊,每天上下班听 teahour podcast。很不错。

#23 楼 @linjunhalida 干货太多了!

#29 楼 @xiaoronglv 总结的角度又不一样。

谢谢分享!

#24 楼 @linjunhalida 有没有时间和兴趣帮助修复一下 CSS 的问题,大功一件! https://github.com/pragmaticly/teahour.fm

#24 楼 @linjunhalida 哦,已经被修复了,谢谢这位网友。

3 个人管 4 百多台机子,太厉害了

#7 楼 @happypeter 专业的事交给专业的团队做,这就是精良高效的优势,甚至有些客户有十几 T 的图片,直接快递硬盘过来,我们都可以安排数据对拷,当然这也是对我们人品充分的信任,呵呵,感谢大家的厚爱!

@geminis 对现在大公司做的事未来就应该是小公司链去完成,as they say.

#21 楼 @swachian 哈哈,口误口误,正确是 2009 年,谁想到网友听得这么认真呀,这是超级感动。现在我们还做了 ceph 的研究,但还是不太稳定,最终还是决定用 riak1.4 的版本准备重构,这样过渡就更加平滑了

#39 楼 @geminis xtreemfs 还有 glusterFS 怎么样?

#19 楼 @Peter 能够理解 peter 的苦衷。又拍云的本意是愿意帮助企业防御这些不良行为,解燃眉之急,但我们同时也会清退一些不良企业,为了我们自身的良性发展,也要考虑到其它客户的安危。忠义难全,也希望能够体谅我们的发展。从技术的角度来说,可以参考我这个文章http://www.infoq.com/cn/articles/anti-ddos-cdn-1,你可以自建一些防御节点,利用第三方的监控宝和 dnspod,做又拍云和自建节点的切换,这样会更加平衡

#26 楼 @linjunhalida 信息多 不等于 长知识,长知识 不等于 生智慧。 这就要求我们一定要学思结合,学而不思则罔,思而不学则怠; 只有沉淀,才能举一反三;

#29 楼 @xiaoronglv 这位同学的总结真的非常不错,都说进我的心坎里了。 我一直坚持做事先做人,人品好,才能交到真心朋友,也要接地气,因为这个世界不是一个人的,就算是程序员“改变世界的人”,也要学会互相尊重,互相理解;

跟大家说个小故事,大家都知道做网线要用专业工具,但是家里装修布网线,肯定不会买专业工具,我又忘记向公司借了,跟我经常聊天的电工师傅知道我忘记借工具了,二话不说,就用尖嘴钳把水晶头夹好了,太神奇了。。。这件事情对我感触很大,其实每个人都有我们值得学习的技能,有时候我们太高高在上了,有时候我们以为自己跑得很快,所以,一定要把自己的姿态放低,一定要学会与人同行,三人行,必有我师嘛

@geminis 海洋之星本尊出现啦,各种现身说法,赞一记!@geminis 大哥经常来我们这里坐坐,传授一下你追到漂亮老婆的心得,帮一下这群可怜的码农吧。

#41 楼 @geminis 有料,谢谢!

#44 楼 @lgn21st 这个问题有点意思,我听我老婆说,当我非常忘我地学习计算机的时候,虽然有时候会不理她,但她觉得这样的男孩子很有奋斗精神;当我在黑屏上飞快的敲着命令,可以远程控制几百台机器的时候,她觉得很酷;当我有了老婆,孩子后,我不再自我,独自奋斗,而是学会合理的安排时间和分配工作,做到张驰有道,留给家庭更多的时间,但这一点不影响我思考深入的问题;

太棒了,好多要跟前辈学习,受益匪浅!

需要 登录 后方可回复, 如果你还没有账号请 注册新账号