地址:http://teahour.fm/2013/07/22/interview-with-shaohaiyang-about-upyun-devops.html
本期由 @lgn21st 主持,邀请到UPYun的运维总监@geminis 邵海杨一起聊聊运维,云存储,云加速,以及互联网运维人员的职业规划,发展方面的话题...
关于邵海杨:
来自杭州 Linux 用户组。又拍云运维总监,网名“海洋之心”,资深系统运维/架构师,业余撰稿人,致力于开源软件及前沿科技的研究和探索。精通系统及网络管理,定制嵌入式系统,安全防御及 CDN 加速,互联网高性能网络及架构设计、NoSQL 先行者、分布式文件系统 Ceph、虚拟化及 OpenStack 云平台的研究等新技术,喜交流,活跃于社区,积极投身于开源活动的组织和传播,真诚待人,授人以渔,共同进步。
程序员多少得懂点运维哟.... :D 推荐!!
本来我也应该参与这次录制的,结果身体有点不适,所以错过了哦... 辛苦 @lgn21st 同学了!!!
很好,学了不少东西,尤其是员工写 wiki,还有 usb 制作的服务器群 但是偶尔的会有听不清的情况,比如多看,听 podcast 怎么听都像都看,搜了半天没搜到,囧,要是能有注明就好了。
#14 楼 @liliang13 我们有计划重新设计 http://teahour.fm 的首页,添加一些必要的功能,比如可以让用户反馈信息等。只不过大家近期都有点忙。
@lgn21st 很精彩的访谈。不过有个时间问题要确定一下。邵说 99 年开始用 riak 用 erlang,99 年用 erlang 还是可能的,但用 riak 就不太现实了,毕竟 riak 也就是 09 年以后才出来的东西。是不是口误了?而且之前也有一个类似的,说 93 年淘宝开始 php 写出来,也应该是 03 年吧。
本期的节目非常精彩,这种有思想分享的内容比起普通的技术大会好多了。整理了笔记:
其实学到的有 3 点:
要闲下来才有精力学东西提高,中间件,个人是公司的核心对个人来说问题很大
05 linux 熟悉 运维还是以 linux 为主
苦逼?运维 24 小时待命?是系统工程 运维的苦逼之处:不参与决策,但是要为结果负责, 苦:和机器,机房,网络打交道,解决方法:外包 逼:别人出问题自己要负责,解决方法:提高能力,转变角色,负责协调
upyun: 业务:云存储,云加速 不自己造轮子,用和改别人的轮子 归一化管理
人数:3 人,2 个技术支持 google 一个人 1 万台 模型足够简单: 组件标准化:2 个模型 流程化:执行操作批量推送 自动化:rethink,puppet
上架:一个月上架一次 5 台,架构成熟 嵌入式思想做运维: 05-10,威盛,x86 芯片+linux 做车载,700K kernel,12M 系统 DOM 盘 5 年 IT 经理 53 客服 精简光盘,瘦身到 500M Upyun,500 台机器,小系统,优盘 cdn 资源,3/5,安装系统,软件,部署,烧优盘,就可以发布了
树莓派,小型硬件做有趣的东西。嵌入式自己玩玩可以,业务的话还是不冒风险为主。 这个方案遇到的问题:没有。优盘质保 5 年,IO 转移掉读写,节点集群,发货后有备用优盘
嵌入式:系统小,方便放到优盘 安全:第三方软件引入风险,去掉 GCC 基础机器,推送软件
运维精髓:高度一致,要专一 人难控制,机器方便控制,多人团队不确定性被放大 自动化运维:流程化,标准化,文档清晰 cdn,存储自动化,技术支持都可以做
挑战? 运维不是一步到位,有 10 年的沉淀,学习,摸索和总结,需要付出努力
建议:如何才能做到那么轻松
技术领域: 一定要让自己闲下来: 自动化,3 剑客编程:bash,sed,awk 好处:节省时间和精力 后端系统:12 个硬盘,挂载,格式化,识别,盘符,序列号 节省时间后,关注新技术:nginx,才能学习
要跳出去:不能只懂系统级别的时期,要懂 3p:perl,python,php,打通前后端
运维是底层人员,负责系统,数据库管理
业务模型->程序(开发人员),运维把握系统 各个行:其实殊途同归, 优秀的软件工程师,比如监控数据,软件开发人员就做掉 运维,开发互补关系
upyun devops 实践? 还是开发归开发,运维归运维 devops 架构中的一部分 架构师:要懂业务,成本核算,CEO
upyun 讨论方案:运维总监,技术总监,CEO(成本) 全球架构师大会?有 45 十岁非常厉害的架构师 但是其实架构师是头衔:可以是一个团队,自己修炼,另外寻找伙伴 开发运维齐了,但是对业务的把控能力差?找合适的人
运维工程师如何发展:挑战:
多看书,要能够传播好的理念,和开发沟通,和老板要资源 运维是沉淀出来的:坑只有在特殊状况出现 多做笔记,wiki,需要输出经验的时候很方便 学习和思考结合:信息!=知识!=智慧
保证人员异动不影响公司运作,运维的本质很重要 与其把握铁饭碗,不如做好事情,让铁饭碗来找自己 不要成为公司的单点
个人把握核心为什么不好? 因为会成为公司发展瓶颈,以及会成为单点故障 可以带团队:需要建立公司信息库 做事先做人
团队合作 个人修行决定周围人的层次,想找人也能够找到 脚踏实地,结交朋友
如何提高能力 戒骄戒躁,每天进步一点点就够了,最好的方法:人与人之间的交流是最重要的
问题: 运维的思想和严谨如何在追女生中实现? 现在的谈笑风生需要努力:每天都在很苦的学习: 图书馆看书,写文章 05-07:思想转变:技术很牛了,500 强很少推广?技术支持的岗位 老大同意了:技术支持,反而工资加了很多,精通系统,谈判,文案,省会跑遍了,写方案 首先一直在努力,一直在思考人生路,遇到机会能够把握,找老大聊天定夺
07 运维:自己做运维,10 年,老大聊天:已经成为公司的天花板,姿态放低 让手底下的人写文档,周报 3,5,8 年一个坎,低端研究给小弟,自己做高端研究
upyun 云服务运维经验分享 如何做系统监控?监控宝:监控短信做自动化处理 嵌入点:flicr 的追随者,小而精,专注:静态资源的存储和发布 现在:服务趋势 公司发展好的时候,最好合作,寻找合作伙伴 销售:口碑营销 学佛
全网加速 稳定性:解决单点故障: 性能单点故障(性能好,cache 用到极致), 架构单点故障(分布式)
程序简单,运维复杂?框架解决问题,中间件 遇到问题:好的程序员,运维难找, 快速验证业务,找初级程序员,一不小心做大:还债,业务跑着不方便重构
做项目要有中间件概念:留好钩子中间件,比如 restful openstack 研究了 1 年多了 运维可以接触到优秀的软件 好的程序员接触好的软件吸收 openstack:应对云设计,每个组件对外都是端口 可以用 nginx 等做水平扩展,中间件非常厉害
中间件的运用:rabbitmq erlang 分布式存储:非常简单 左拉?英语特别好,技术有敏锐直觉 闲下来才有时间和精力学新的东西
分享: 稻盛和夫:活法 坚持的影响力
#23 楼 @linjunhalida 哇,你的总结真赞!
昨天我们几个主播齐聚沈阳,大家商量了一下,等 Teahour.FM 一周年的时候,我们四个人重新做到一起,录制一期节目,聊聊我们录制过程中哪些有趣的故事。其实每期如何准备,如何录制,以及事后剪辑都是不为人所知的。
本周往返上海时,火车很抖,不方便看书。手边也没有什么有趣的内容,于是就勉强听了一期 Teahour。
之所以勉强,是因为 25 期的话题是运维。本以为又是一个屌丝的负能量吐槽,听了 5 分钟就发现内容好的出人意料。
很多程序员喜欢自己的 style,写自己才能看的懂的代码,牢牢的控制着一些项目,做到「无可取代」。
很多 SA 牢牢的控制着各种 Root 权限,获取一种无可替代的安全感。
你是不是也在通过这种方式证明自己在公司的存在感?
邵海杨则是另一类人,乐于分享,将自己的知识转化为 wiki 文档,沉淀在任职的公司,像一份无形的资产传承下去。
他总是在不断学习,期待更大的舞台。一旦有好的机会向他招手,他离开后,前一家公司会十分感谢他积累的知识,以及他培养的团队。
我真心觉得这家伙很会做人。
带团队的第一年,他凡事大包大揽,事必躬亲。自己很累,没时间学习新知识,团队成长速度也很慢。
他变成了团队的天花板,没有人可以超越他,但他又是公司的瓶颈。
他后来的做法:自己学习最新技术,指一个大方向。让下属深入研究,再将知识以文档的形式沉淀下来。通过这种管理方式,他有更多的时间与家人相处,研究热门技术,工作轻松了很多。
我在这方面也有相同的感悟:信任,按时检查,激励是一种更好的管理方式,他们会持续不断创造惊喜。
作为一个运维,他写脚本将简单、机械、重复的工作自动化,设法让自己闲下来,把时间花在更高端的事情上:学习新技术,转化为生产力。
备注:这和四象限论不谋而合,将时间花在重要但是不紧急的事情上。
功利所致,很多人都期盼通过短时间的突击学习来换取巨大的成功。
可邵海洋现在的「闲庭信步」是 10 年积累的结果。所以他一再强调,每天都要坚持进步一点点。
这让我想起了胡适先生一句话「功不唐捐」。
他在学习的过程中若遇到 tough 问题,都会及时找同行。闭门造车耗时耗力,不如牛人的一句点拨。
这点我也深有体会。
学习是个很大的话题,再扯 1 万字也写不完。邵海杨这些点引起了我的共鸣。
写下来,自勉。
#24 楼 @linjunhalida 有没有时间和兴趣帮助修复一下 CSS 的问题,大功一件! https://github.com/pragmaticly/teahour.fm
#7 楼 @happypeter 专业的事交给专业的团队做,这就是精良高效的优势,甚至有些客户有十几 T 的图片,直接快递硬盘过来,我们都可以安排数据对拷,当然这也是对我们人品充分的信任,呵呵,感谢大家的厚爱!
#19 楼 @Peter 能够理解 peter 的苦衷。又拍云的本意是愿意帮助企业防御这些不良行为,解燃眉之急,但我们同时也会清退一些不良企业,为了我们自身的良性发展,也要考虑到其它客户的安危。忠义难全,也希望能够体谅我们的发展。从技术的角度来说,可以参考我这个文章http://www.infoq.com/cn/articles/anti-ddos-cdn-1,你可以自建一些防御节点,利用第三方的监控宝和 dnspod,做又拍云和自建节点的切换,这样会更加平衡
#26 楼 @linjunhalida 信息多 不等于 长知识,长知识 不等于 生智慧。 这就要求我们一定要学思结合,学而不思则罔,思而不学则怠; 只有沉淀,才能举一反三;
#29 楼 @xiaoronglv 这位同学的总结真的非常不错,都说进我的心坎里了。 我一直坚持做事先做人,人品好,才能交到真心朋友,也要接地气,因为这个世界不是一个人的,就算是程序员“改变世界的人”,也要学会互相尊重,互相理解;
跟大家说个小故事,大家都知道做网线要用专业工具,但是家里装修布网线,肯定不会买专业工具,我又忘记向公司借了,跟我经常聊天的电工师傅知道我忘记借工具了,二话不说,就用尖嘴钳把水晶头夹好了,太神奇了。。。这件事情对我感触很大,其实每个人都有我们值得学习的技能,有时候我们太高高在上了,有时候我们以为自己跑得很快,所以,一定要把自己的姿态放低,一定要学会与人同行,三人行,必有我师嘛