云时代,运维不仅要会写代码,也需要运维安全审计
什么是运维?在企业里,运维应当归属于技术部门,与研发、测试、系统管理同为互联网产品技术支撑的4大部门。
一个互联网产品的生成一般经历的过程是:产品经理、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。
运维是一个非常广泛的定义,在不同的公司不同的阶段有着不同的职责与定位。在初创公司,运维工程师的工作可能需要从申请域名开始,购买/租用服务器,上架,调整网络设备的设置,部署操作系统和运行环境,部署代码,设计和部署监控,防止漏洞和攻击等等。

01运维面临新趋势
这是最好的时代,也是最坏的时代,运维逐渐照着更专业的方向发展,对运维人员的职业要求也越来越高。
除去早期大企业内部的少量IT运维人员,中国运维行业的兴起应该是随着互联网行业上个世纪90年代的发展而来,如今传统企业数字化转型加快,IT 系统越发复杂,运维挑战更大,需要实现更高程度的自动化。
再加上云计算的诞生以及大规模普及,企业运维的主要对象则从硬件(服务器等),转向了面向服务API的运维,包括主机运维和应用运维,提倡自动化的部署流水线和持续交付的 DevOps 愈发受到关注。

02我们为什么需要运维安全审计?
2011年4月,韩国四大银行之一的农协银行出现持续3天以上的网络瘫痪。事故起因于第三方代运维人员对银行核心系统下达了一条rm.dd命令;
2014年1月,中国境内发生DNS解析服务故障,导致百度等多家网站长达几个小时无法访问,据分析,疑是GreatFirewall管理员的误操作导致;
2015年5月,携程网瘫痪近12小时,粗略估算直接损失数百万美元,股价跌11%。携程官方声明此次事件是由于员工错误操作,删除了生产服务器上的执行代码导致。
……
一系列运维安全事件给我们敲响了警钟,高权限操作风险的不透明、违规操作和误操作是来自内部用户的威胁,一旦将企业数据交给第三方代理运维,操作风险更是不可控,无法实现有效的监管。
运维安全审计是针对运维的信息安全、操作规范等进行的审计,是为了保障网络和数据不受来自内部合法用户的不合规操作带来的系统损坏和数据泄露。
运维安全审计运用各种技术手段实时收集和监控网络环境中每一个组成部分的系统状态、安全事件、网络活动,以便集中报警、记录、分析、处理。
03运维安全审计系统——堡垒机
堡垒机,一个在特定的网络环境下,为了保障网络和数据不受来自外部和内部用户的入侵和破坏,而运用各种技术手段监控和记录运维人员对网络内的服务器、网络设备、安全设备、数据库等设备的技术。
用一句话来说,堡垒机就是用来后控制哪些人可以登录哪些资产(事先防范和事中控制),以及录像记录登录资产后做了什么事情(事溯源)。
