一个数据中心能效治理的感人案例 - 范文中心

一个数据中心能效治理的感人案例

08/22

一个数据中心能效治理的感人案例 (2011-11-08)

标签:数据中心能耗能效治理IT 治理案例 分类:数据中心

2005年,太平洋国家实验室(Pacific Northwest National Laboratory,简称PHHL )的数据中心已经到了最危急的时刻。

意外停电几乎每周就发生一次,每次都害得数据中心停电几小时。那时组织不断地买机架服务器,结果数量越来越多。因为计算资源数量暴增,机架服务器在那时比较便宜——按数据中心服务经理Ralph Wescott的话说是这样。结果到了2005年,机房的容量已经达到临界点了。

Wescott 说:“组织买了服务器,就直接丢给我安装,但是机房已经没有空间了,电力和冷却的容量也不够用。如果再装一台服务器,恐怕机房得瘫痪。” Wescott 和PNNL 开始着手进行一项计划:在不打破预算的前提下,好好翻新一下数据中心。以后三年的每个季度,数据中心小组会花上一个周末,把机房关掉,淘汰掉一批旧的服务器,扔掉地板下交缠的网线,然后换成更高效更强大的服务器,这些服务器都是用天花板上更加简洁的布线方式连接。这样的新配置释放了地板下的空间,以便进行更高效的制冷。

结果怎样?PNNL 以前在500个服务器上运行500个应用,现在150个服务器就能带起800个应用。

分析公司IDC 的程序主管Joseph Pucciarelli说,在经济紧张的士气,对付这样的IT 计划需要勒紧钱包。“这种情况很常见,公司只会给你刚刚够用的资金,他们只想着问题能差不多解决就行。”

在这次PNNL 从危机中脱险的事件中,我们学到了五点:

1、积极计划,不要消极应对。Wescott 首先需要解决的问题是纠正数据中心小组的习惯,因为他们总是在各个小问题发生了之后才一个个做出反应,而不是观察系统的问题,然后做计划,构建一个耐用的设备系统。除了500个服务器,他们的数据中心还有33000条线缆来给这些服务器通电、连网,或者连接安全系统。

他说:“由我们决定数据中心的形态和容量该是怎么样。”

小组推断出,当前的轨道结构导致了3000个应用程序分别运行在各自服务器上,这种情况持续了十年。如今该数据中心81%的应用都虚拟化了(还有17%的服务器虚拟化),Wescott 计划向90%的应用程序虚拟化迈进。

Joseph Pucciarelli认为,公司若想增加容量,应当关注三个地方:减少物理服务器的数量;在虚拟系统运行应用来减少电力要求;使用更高效的制冷系统并改善配电。

“这是一个典型的三部曲,这样就能升级数据中心。”

Pucciarelli 见过很多公司把大约50个服务器换成2到3个更大容量的系统,并且使用虚拟化来运行应用。

2、通过测量能耗来管理。Wescott 建议管理者们需要想办法监控数据中心的状态,但是通常他们没有正确的工具。在作出计划改变之前,PNNL 没有测量数据中心能效的方法,等到停电了之后,才发现这些能源问题。

“如果电源中的安培数太多了,那我只能靠触摸来感觉断路开关,如果热的话就有问题。所以还是得有监控工具。”

现在PNNL 在每四个机柜的低、中、高处放上传感器,来创建一个3D 的机房热量图。这样Wescott 就能根据数据改变制冷方针,提升总体温度,对需要制冷的地方供冷。

“这下就能省下很多钱了,我的空调也会减少耗损。”Wescott说道,他还补充说,现在制冷方面能效估计比以前提升40%。

3、一小步一小步地进行。Wescott 认为,首要的问题是从根本上重新配置数据中心,同时又不打断正常运行。公司的经理建议小步进行,减少停电的可能,但是同时又把问题抛给了手下。

“我给了管理层两种提议,”他说:“一种是我们把关掉数据中心,整顿七天,然后从头开始;另一种就是每个季度的某个周末,我们都停电整修一次。” 最后他们选了第二种提议,他们小组打算先替换一排服务器。在第一个周末三天的时间内,一个30人的团队花了14个小时,把数据中心里面的一排服务器机架都替换完了,并测试了新的配置。Wescott 发现数据中心的可靠性和稳定性马上提升了。

如果管理层不同意这样做,放弃了计划暂停这样的正确方法,恐怕就会带来突发的故障事件。Wescott 打比方说:“你不能在船航行的时候修理底部,但如果不修的话船就要沉。”

所以答案显而易见。

4、为了长远利益,做好暂时损失的准备。管理层不能因为一时的花费而放弃长远的利益。

Wescott 的小组为了减少制冷系统的能源要求,于是估计了waterside economizer (利用水和外面的温度来冷却服务器的机架的仪器)。他们发现使用环绕制冷系统在长久上看要更加省电,而waterside economizer的制冷花费要比预算多10%。Wescott 只好和供应商沟通,把花费减少到预算以内。

5、找到你不知道的地方。在翻新数据中心的过程中,管理员需要知道哪些地方能源没有消耗或者很少。其中常见的问题是数据中心里存在“流氓服务器”和“幽灵服务器”。

所谓幽灵服务器,就是配置好了但是一直没使用的服务器。他们仍然吃能源,却不为数据中心工作。而流氓服务器则是一些人私下放在自己办公室里的服务器,绕开了数据中心人员的约束。

Wescott 说,这样的服务器会浪费能源预算。

“本来得在晚上关掉的空调,却被流氓服务器利用而彻夜开着。”

经过整顿,数据中心的能效有了较大进步。自从Wescott 开始翻新设备之后,在数据中心只发生过一次意外断电,那是因为天气极热,冷却系统故障。Wescott 知道,他的任务还将继续。

如何在IT 灾难恢复规划中预防“人为事故”

2011-11-10 作者:Harvey Betan 译者:张瀚文 来源:

TechTarget 中国 我要评论 分享到: 博客引用 投稿 打印 英文 大 |

中 | 小导读:当提起容灾话题时,人们一般都会联想到物理设备的损坏,这类事件通常由天气相关的原因,或其它各类事件所引起。我想要提到还有一些人为因素所引起的业务中断。

关键词:容灾 人为因素

正在加载数据...

【TechTarget 中国原创】通过本篇您将了解到:什么是人为引起的灾难?这类事故所引起的原因是什么?其如何对IT 灾难恢复规划产生影响?以及如何进行避免?

当提起容灾话题时,人们一般都会联想到物理设备的损坏,这类事件通常由天气相关的原因,或其它各类事件所引起。不过我想要提到还有一些人为因素所引起的业务中断。

在本篇中,“人为引起”的事故并不指恐怖袭击事件,这类事件中的事故是人为有意引起的;我所关注的是那些在运营、连接、数据传输或存储过程中出现的问题。这其中的一部分可以通过安装预防式的软件产品加以避免。

以下是最常见的人为事故:

员工问题

可以考虑在办公环境中部署“安全桌面”策略来控制办公电脑可以使用哪些设备、访问哪些网站。强制程度可以根据你所希望达到的开放或限制程度,不过需要记住一旦打开了这扇大门,这意味着就可能有不受欢迎的软件进入你的环境。同时需要考虑每次同步个人设备,比如黑莓手机或iPod 时,你所下载到设备上的软件业可以连接到你的电脑上。有些应用程序并不像你所想的那样没有恶意。你的员工是否被允许在办公室使用

Facebook 或访问个人邮件?这可能会是恶意软件的一个潜在的藏身之所。

还有一个风险是无法预估的,恶意软件可能内置在非恶意软件之中。这意味着任何通过USB 端口连接你电脑环境的存储设备都可能成为潜在的威胁。你如何预防这一问题?你必须限制USB 端口访问。一些企业甚至限制CD 使用,不过这取决于你的企业环境。

无线网络和安全性

密码可以提升无线网络的安全性,不过确保其不会轻易地被入侵者所破解。一些企业具有多个无线环境,允许来访者连接互联网而不是公司内部网络。同时,小心使用在有些环境中可用的公用Wi-Fi 连接。坐在你身边的用户可能正在努力攻击你连接在无线上的电脑。一些电脑专家甚至还可以传输数据到你的笔记本上,并通过此连接到你的网络上。

电力

确保不间断电源(UPS )设备可以足以支撑你所要求的电耗。许多企业在升级其数据中心时往往会忽视其UPS 设备是否可以支持新的变化。专业的电力工程师可以判定对UPS 的规格要求,以及你可以从UPS 处获取的服务时间。也可以通过安装UPS 监控设备提醒用户可能出现的问题。

如果你有发电机,确保至少每年测试一次,同时确保发电机可以提供足够的电力来运行整个数据中心。同时保证发电机可以在故障发生时自动启动,除非你在现场配有人员进行手动启动。

网络问题

我们再看下网络。你的企业是否采用网络语音电话业务(VoIP )作为电话系统?假设你采用了这种技术,那你就要知道语音通讯和所有的数据流共享同一网络。当你的网络出现中断时,你的通讯亦受到影响。近期我访问了一家企业,其在客户支持中心中采用VoIP 技术。原因有两点,降低成本,以及在人员离席时来电的重定向。问题是其经历了高达6个小时的网络中断,丢失了所有通讯。VoIP 还有一个问题是所有设备都需要电力,因此除非你在每个坐席上都配置一个UPS 或将其连接到发电设备上,否则断电就意味着通讯中断。为降低这种中断的可能,请确保电力问题可以得到解决并实时监控网络。记住网络对于语音和数据通讯都是至关重要的。

一些潜在的关键网络问题可以通过很简单的方式解决,比如看下局域网中心室内和地板下、隐蔽处电缆的情况。如果那看上去就像是一碗面条,技术人员如何跟踪连接来进行检查?一个整洁,标记有标签的电缆配置可以避免长期的中断情况。

你还要考虑到数据中心周边的情况。我曾看到过有数据中心正位于一家自助餐厅后面,餐厅中准备热食。自助餐厅中或食物加热处可能引起的火灾,以及火灾引起后的消防措施都会对边上的数据中心构成损坏。

除非你可以建立一个完全无人干预的环境,你都必须想到人为的可能引起的灾害。这并不是要建立完全无故障的系统,只为避免经常听到的“人为故障”。


相关内容

  • 一带一路在生态环境建议上的成果和意义
    一带一路在生态环境建议上的成果和意义 中国于2013年正式提出"一带一路"战略构想之后,沿线国家不断掀起合作热潮.在经济合作一马当先的前提下,其他方面合作的重要性也逐渐凸显.维护"一带一路"沿线国家和 ...
  • 关于"定位"
    关于"定位" <中外洗衣>杂志"高层视点"文稿 一直想写一篇关于洗涤企业定位的文章,因为在我看来,这是中国洗涤企业最容易忽略的,也是最没有解决好的问题,但由于担心写不好反而会误导别人,就搁 ...
  • 50分你不要?教师资格考试中[写作题]真题思路案例分析解读(附范文)
    读而思 duersi 2016下半年教师资格备考脚步不断逼近,同学们是否一个一个题型攻破?今天小编带同学们先来攻破这个分值高,我们从小学就接触的题目<写作题>.让同学们了解教师资格中批卷分值标准与等级划分,提供2个真题做案例分析 ...
  • 河南省蓝天工程行动计划
    河南省人民政府关于印发河南省蓝天工程行动计划 的通知 2014-05-22 各省辖市.省直管县(市)人民政府,省人民政府各部门: 现将<河南省蓝天工程行动计划>印发给你们,请认真贯彻执行. 河南省人民政府 2014年3月23日 ...
  • 实习案例分析
    案例分析 学院:商学院 学号:1100580232 姓名:张竹英 案例一: 罗氏照明公司2015年3月从某空调设备制造厂购置能效等级I级的屋顶式空调机组一套(该套设备为节能节水专用设备,属于财税[2008]115号文件规定的优惠目录范围), ...
  • 热泵热水机能效限定值及能效等级的正式颁布
    无规矩不成方圆,对于一个行业而言,行业标准是至关重要的,它不仅能使行业朝着制度化.规范化的发展,也是行业成长壮大的印记和标记.如果将新兴的空气能热水器行业比如一棵真正茁壮成长的大树,那热泵行业标准就是树干里的年轮,记载大树的生长历程,也是大 ...
  • 低碳城市理论和实践的发展_现状与走向
    <甘肃行政学院学报>2010年第3期学术专题:生态经济与低碳发展 低碳城市理论和实践的发展.现状与走向 李向阳黄芳李瑞晴 (南京陆军指挥学院政工理论教研室,南京210045) [摘 要]建设低碳城市是实现城市可持续发展的必由之路 ...
  • 节能减排的现实意义
    ■■■■■置■回■■盈匪筮 理,促进节能服务产业化发展. 节能减排的现实意义 口许朝阳 节能减排指的是减少能源浪费和降 制约循环经济发展的技术瓶颈. 加强组织领导.健全考核机制.要 五要夯实基础,强化节能减排管 理.各单位要出台<节能 ...
  • 安徽农村改革与发展
    实践教学案例建设项目文本 案例名称: 红手印的思考--安徽农村改革与发展 课程名称: 毛泽东思想和中国特色社会主义理论体系概论 项目负责人: 叶 高 填表日期: 2012年8月18日 学校(盖章): 滁 州 学 院 安徽省高等学校思想政治理 ...
  • 标准仓单质押贷款风险与防范.kdh
    时代人物・ 经济研究 Times Figure・Economical Research 标准仓单质押贷款风险与防范 [摘要]随着我国期货业的成熟与发展,商业银行与期货行业大力合作,开展标准仓单质押贷款业务,既解决了现货企业短期流动资金融资难 ...