我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:双彩网 > 阵列控制部件 >

石家庄桥西区服务器磁盘阵列数据恢复上门清理

归档日期:06-15       文本归类:阵列控制部件      文章编辑:爱尚语录

  还是使用fsck、checkdisk等其他文件系统的相关修复工具时,一定要慎重。在修复前一定要先备份元数据、重要用户数据等信息,再继续。服务器数据恢复案例;IBMV7000数据恢复成功。IBMV7000存储是一款定位中端的存储设备,很多企业选择该服务器作为存储,最近北亚数据恢复中心接到一例V7000服务器数据恢复案例,下面将对本次数据恢复的过程和数据恢复方法进行归纳总结,希望对各位管理员在服务器的运维工作有所帮助。但oracle无法启动,客户在原盘上重装了 oracle系统,并导入了以前备份的 dmp文件,但数据差得太多。服务器硬件故障处理实际案例

  (因厂家机型不同,在实际问题中如果遇到相似现象,也需要具体问题具体分析,请不要盲目套用)硬件故障是指服务器硬件出现异常而导致的各类错误,由于服务器构成比较复杂,因此在检查的时候必须认线、规范管理和实施。很多企业级数据灾难往往来自于人为,因为任何一个系统,在涉及维护的时候,都必须工作在无保护状态,任何一个不小心都可能导致无法回溯的后果。制定严格的维护实施方案、备份计划、预警机制是非常重要的保障。3、数据取舍。太老的数据就删了吧,再对数据精简整理,再做详细的管理计划。要知道,娶妻越多,头顶发绿的机会就越大。【物理服务器与逻辑存储介绍】 客户使用一台IBM 3850服务器,4块300GB SAS磁盘做的RAID5磁盘阵列。

  有一台XXX型号服务器,配有256M内存,使用一个PIIIXEON500带2M高速缓存的处理器。4块18GB的硬盘做成RAID5磁盘阵列,其阵列卡是NetRaid;另一台是2006年购买的HP ProLian 文明用语370服务器,4块146GB的硬盘做成RAID 5磁盘阵列,其阵列卡是Smart Array 642并带有热备份硬盘(Hot Spare)。两者操作系统都为Window 2000,数据库是Server 2000。HP LH6000的故障如下: 一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。原始应有约700MB,而 users 表空间的数据文件也有部分被覆盖,但仅4MB。提取出找到了数据,下一步对严重损坏的数据库进行修复。

  开机后没有任何显示,但系统日志上提示了一条CPU电压为0伏的信息,系统指示灯三灯不停在闪烁(指示灯三灯闪烁是服务器的另一种报警方式,我会在文后说明)。这种错误一般是处理器电压调节模块(VRM)出错或CPU出错或CPU与CPU板块接触不良,但也可能是CPU板块出错,这时情况就比较复杂了,必须经过认真慎重的思考。磁盘文件快照与第四层的卷快照原理相似,Hyper-V对其称为差异磁盘,表述直接明了。快照文件丢失或损坏后,也可能与腾讯本次数据灾难表现相同。八、 第9层:虚拟机文件系统。分配给用户的虚拟机,其硬盘就是前文提到的虚拟磁盘文件,但进入虚拟机后,就等同于物理硬盘。这些硬盘也被正常操作方法分区、格式化、安装系统、安装应用等。不论Windows的NTFS、Linux的Ext4等。重要的system和 users表空间数据文件都有不同程度的破坏,其中system表空间的数据文件仅剩中后部的10MB。

  因为CPU板块在整个服务器中,占有举足轻重的地位,如果它出错服务器是会报致命错误的,并且在系统日志中会提示致命错误,但报CPU电压报错的情况也有5%左右。我们立刻把CPU调换在另一CPU插槽中,开机后依然是刚才的那种故障。所以在初步判断中,可以排除是CPU板块坏。这时取出CPU仔细擦拭金手指,以及CPU板块中与CPU接触的地方后,开机依然无显示。相对处理器坏的情况来说处理器电压模块(VRM)出现故障的情况比较大。于是立即在另一台同型号服务器中取下一个处理器电压模块,安装在此服务器中。开机后,服务器依然没有任何显示,系统日志上依然提示CPU电压为0伏的信息,系统指示灯三灯依然不停在闪烁。这时的情况就比较明显了。于是立即从另一台同类型服务器中取下一个CPU安装后,开机正常。3.查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。笔者所在单位另一台运行ERP系统的服务器(HP ProLiant 文明用语370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare)。服务器租用和服务器托管有什么区别?哪个更合算?服务器租用售后好的商家-秉文网络

  有一台XXX型号服务器不显示,发现开机时系统日志没有任何信息,且系统指示灯不亮。初步判断是电源方面出现了错误。经过仔细检查,发现服务器的电源是正常的,因此最大的可能就是服务器的电源管理板出现故障。更换电源管理板后,开机显示正常。但这时,新的问题来了:自检时,用CTRL+M不能检测到硬盘。还有可能的错误是buffer dirty,当缓冲数据掉电清空,或有意无意损坏后,会导致数据出现本例的表现错误。但这个原因可以很容易推到控制器BUG上面,腾讯没提及这个原因,或者是他们没找到病根,或者的确和这个无关。还有最可能的错误是RAID中超过冗余数量的磁盘损坏。比如RAID5只支持一块盘损坏,但现实中出现了:情形1:同时2块或以上硬盘损坏。首先分析RAID层: 重建RAID会带来最为严重的破坏,但分析发现重建的RAID的块大小、盘序都和原来一样。

  硬盘在别的服务器上是正常的,因此立即清除此服务器的CMOS,但依然不正常。立刻上网找到此服务器的最新BIOS,升级BIOS后也不能解决问题。又检查硬盘笼子和服务器里的数据线及电源线后依然出错。这时,一般情况会怀疑是服务器的I/O板(输入输出板块)有问题。但就在这个时候,工程师发现在I/O板上有一个非XXX型号服务器标配的旧式网卡,立即去除此网卡后服务器就一切正常。笔者所在单位另一台运行ERP系统的服务器(HP ProLiant 文明用语370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代。整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中,应用程序和数据库没有发生影响。某些元器件老化问题、开机不显示、花屏、显卡BGA损坏、开机不认硬盘、南桥电路、南桥BGA。

  硬件故障并不单单指硬件有问题,它也指硬件之间不兼容。因为服务器的正常运作需要各部件之间的大力协调。建议大家在采购各元件时,都采用同一品牌原装的,并且要采用能发挥服务器性能的元件(上例中的旧式网卡即使正常也会严重影响服务器性能),这样才不会发生莫明其妙的故障。二、 第2层:RAID。RAID自身有冗余算法,可实现在部分介质(硬盘)损坏后,由其他成员及算法控制来接管损坏硬盘的数据服务,保证上层业务不中断,不出故障。但RAID也并非完全可靠。一种错误是软RAID中的写漏洞(write hole),如果是软RAID,这无法避免,可能导致腾讯本次事故。但软RAID是玩具产品,自然腾讯是不会用这种方案的。服务器电源维修故障系列精修各品牌服务器冗余及非冗余电源,工厂资料及原厂配件,擅长IBM服务器电源维修。

  用户需要把他的XXX型号服务器升级到双网卡,我建议他购买原装网卡,但当他看到XXX型号服务器的网卡是采用的INTEL82559芯片后,断然决定不使用原装网卡而采用另一品牌也采用INTEL82559的网卡。过了几天,他打电话给我说,他的新网卡不能使用网络冗余及数据校验,并怀疑服务器有问题。工程师带了一个INTEL82559网卡到用户那里,仔细检查了服务器的环境完全正常后,把INTEL82559网卡安装到机器上后一切正常。这个例子更加说明了,要发挥服务器的最大性能及功能,必须使用原品牌原装的配件。非原品牌非原装的配件,不能支持服务器的某些功能,严重的会影响到服务器的正常使用。但并未碰触到坏道区,这时表现一切完好,一旦重建,就会导致RAID崩溃。一般而言,工程师的修复方法就是强制上线,让带病的硬盘强行工作,也可能不懂的工程师随便上线了旧掉线的硬盘,这时,就会表现为大多数数据可访问,但部分数据(尤其较新)出现损坏,与腾讯公开的表现相似。三、 第3层:虚拟卷层。虚拟卷往往用在大的云存储中心,简单地举例来说,如果由1000个硬盘构成的一个存储系统。总有人认为做站群对服务器的速度要求不是很高,所以想当然的以为服务器只要价格便宜就是自己的首选。

  要避免硬件故障发生频率,服务器管理人员必须注意服务器的使用环境完全正常。比较重要的服务器必须在恒温、恒湿的环境;电压也要符合,不仅要采用UPS,还必须接地线伏。在开、关服务器上必须符合正常的流程。工作人员必须严格执行操作流程。

  一台XXX型号服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,

  将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?3.查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。笔者所在单位另一台运行ERP系统的服务器(HP ProLiant 文明用语370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare)。随着网络资源服务市场的成熟,现在发展起来的共有三种基本的网站系统方式:虚拟主机,整机租用以及服务器托管。

  服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除CMOS跳线一会儿,然后恢复原位,开机正常(提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOSSETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。从服务器官网下载H330_H730驱动、下载win系统驱动注入工具,使用u盘制作pe启动盘,把下载好的win系统驱动注入工具和H330_H730驱动放入u盘,将目标服务器通电开机,进入pe,通过win系统srs驱动注入工具,注入H330_H730驱动,具体操作过程如下:1、打开工具win系统srs驱动注入,选择第三项 清除驱动。服务器数据迁移/服务器/北亚数据恢复中心。稳压电源维修、变频电源维修、开关电源维修、高压电源维修、控制电源维修、驱动电源维修、焊接电源维修。

  这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行。但感觉索引文件太重要了,尤其是加密后,如果没有索引文件将无法解开数据,还得注意多备份索引文件。5、备份速度在不加密时很快,但加密后速度很慢(北亚数据恢复中心张宇曾经测试,500M的网站数据,本地加密备份,花了1小时)。6、支持FTP备份与还原,可做在线、还原时无法选择部分还原,只能全部还原或增量还原。如果备份包数据太多,可能是很麻烦的事情。但oracle无法启动,客户在原盘上重装了 oracle系统,并导入了以前备份的 dmp文件,但数据差得太多。

  一台XXX型号服务器使用8708E的raid卡在读取某个文件或运行某个软件时经常出错,或者要经过很长时间才能成功,其间硬盘不断读盘并发出刺耳的杂音,这种现象意味着硬盘上载有数据的某些扇区已坏。1、插入网线、通过驱动人生或驱动精灵可安装其他驱动。3、最后进入设备管理器查看验证驱动是否安装成功,并重启。若驱动安装不成功,重启会导致蓝屏,系统无法启动,此后,只能重新镜像目标盘,pe注入驱动,进入操作系统,安装驱动。注:pe层面注入驱动是临时性的,进入操作系统后需要第一时间安装驱动,不要重启设备。服务器磁盘阵列数据恢复-磁盘阵列两块硬盘离线数据恢复成功案例。服务器电源维修故障系列精修各品牌服务器冗余及非冗余电源,工厂资料及原厂配件,擅长IBM服务器电源维修。

  一旦硬盘有比较刺耳的杂音可以尝试使用HD软件来测试硬盘时候有坏道,进入ctrl+H配置界面进行查看,阵列是否降级

  服务器软件故障是在服务器故障中占有比例最高的部份,约占70%,解决的过程必须更加深思熟虑。导致服务器出现软件故障的原因有很多,最常见的是服务器BIOS版本太低、服务器的管理软件或服务器的驱动程序有BUG、应用程序有冲突及人为造成的软件故障。服务器状态介绍:需要进行数据恢复的服务器故障表现为vdisk丢失,操作系统中的数据库无法正常使用。管理员重建MDisk,原来的raid10重建为raid6,然后又再次重建为riad10,这一系列的操作导致服务器对应的存储池中的VDisk丢失,从而影响上层Solaris操作系统中的Oracle数据库无法正常使用。客户需要恢复原服务器操作系统中的两套数据库。重要的system和 users表空间数据文件都有不同程度的破坏,其中system表空间的数据文件仅剩中后部的10MB。

本文链接:http://twilightranch.com/zhenliekongzhibujian/80.html