Категории публикаций
Подписка на рассылку по Email
новости (подписчиков: 2)
комментарии (подписчиков: 2)

Отменить подписку
Популярные публикации
Интересный опрос
Откуда вы узнали о моем сайте?

Gogole
Yandex
Youtube
Twitter
Из форума
От друга
Другое
Поблагодарить автора
donate
1B4ZZ2PXUd9E7AqEB82AqFnkpk2bt5hQG7

Как отремонтировать компьютер или ноутбук если он хаотично зависает

Размещено в категории: Железо

Иногда бывает что старенький или же новокупленный ПК или ноутбук начинает поводить себя странно - хаотично зависать или же выключаться. Поделюсь знаниями и соображениями, которые помогут локализовать проблему хаотичного зависания (halt) компьютера или ноутбука. Простые и эффективные советы помогут самому устранить неполадку или же определить причину такого поведения для дальнейшего ремонта в сервисном центре.

Заготовка для данной статьи уже давно залежалась у меня в TODOLIST'е, начиналось все с того что мною был куплен маленький симпатичный БУ лептоп, который как выяснилось спустя несколько дней после покупки, имел очень странный дефект.

Суть проблемы заключалась в том что компьютер хаотично намертво подвисал (черный экран) и даже иногда отключался в случае если процессор не был загружен больше чем на 30%. Получилось так что при запущенных 3D играх или запаковке/распаковке больших архивов нет никаких зависаний, а одиночного запуска браузера или видеоплеера достаточно чтобы ПК рандомно завис по истечению 1-30 минут. Иногда простого простоя CPU без нагрузки хватало для того чтобы ноутбук застопорился намертво.

Было принято решение попробовать разобраться в чем причина. В данной статье будет рассмотрен общий процесс вычисления поломок компьютеров и ноутбуков исходя из моего опыта и знаний, а также из проб вычислить причину этой странной аномалии с лептопом.

Будут рассмотрены программные инструменты как для операционных систем Windows, так и для GNU Debian Linux, Ubuntu.

Я не несу никакой ответственности за использование вами предоставленной ниже информации, все действия выполняйте на свой страх и риск. Будьте внимательны и аккуратны, думаю что у вас все получится!

  1. Таблица S.M.A.R.T жесткого диска
  2. Поиск сбойных блоков на диске
  3. Система внутренней диагностики от производителя
  4. Профилактическая подготовка
  5. Очистка позолоченных контактов плат и модулей памяти
  6. Микросхема BIOS
  7. Батарейка CMOS
  8. Стресс-тест оперативной памяти
  9. Блок питания и аккумуляторная батарея
  10. Тест стабильности системы
  11. Драйвера устройств
  12. Системные журналы
  13. Контроллер жесткого диска
  14. Обновление прошивок BIOS, SSD
  15. Настройки BIOS
  16. Отключение периферии и устройств
  17. Поиск информации о проблеме
  18. Заключение

Таблица S.M.A.R.T жесткого диска

Первым делом, в случае рандомных подвисаний и сильного торможения ПК, прежде чем вскрывать корпус компьютера, можно посмотреть что творится с жестким диском и в каком состоянии его механика и электроника. Не важно у вас БУ-шный или новый ПК - с жестким диском могло случиться что угодно при хранении и транспортировке. Вскрывать накопитель мы не будем - это нам не понадобится.

Для проверки жизнеспособности у каждого накопителя (шпиндельного или SSD) есть статистическая таблица самодиагностики - SMART (Self-Monitoring Analysis and Reporting Technology), в которой сохраняются и отображаются разнообразные полезные данные в процессе всего рабочего цикла накопителя. Данная таблица хранится в энергонезависимой памяти контроллера накопителя, так что где бы он не побывал - вся история его жизни будет у нас как на ладони.

Какими программами можно посмотреть SMART? - таких программ масса, наиболее доступны под Windows - AIDA64 (платная, пробный период 30 дней, www.aida64.com), SPECCY (freeware, piriform.com).

К примеру, скачав и установив Speccy идем в раздел "Storage" - "Hard Drives" и выбираем наш накопитель, клацаем на раскрывающемся разделе "S.M.A.R.T" и смотрим колонку с реальными значениями "Real value".

Под Linux есть прекрасный пакет утилит smartmontools, в котором содержится утилита smartctl для диагностики и чтения таблички SMART. Для установки и запуска smartctl в Linux используем команды:

sudo apt-get install smartmontools
sudo smartctl -a /dev/sda

Где sda - псевдоним устройства накопителя для проверки (sda - 1й накопитель, sdb -2й и т.п.).

Утилита smartctl входит в большинство LIVE-CD на основе Linux, так что загрузившись с диска или флешь-накопителя вы сможете проверить жесткий диск на компьютере где установлен Windows или же на котором пока что не установлена никакая ОС.

На какие параметры прежде всего стоит обращать внимание в таблице SMART:

ID Название атрибута Описание
5 Reallocated Sectors Count Число, которое отображает количество операций переназначения секторов. Если это число больше 0 - значит на диске начали образовываться сбойные сектора и стоит задуматься о переносе данных в безопасное место, с последующей заменой диска. Некоторые диски даже со 10-100 сбойными секторами могут еще проработать несколько лет, но это не гарантирует что завтра, во время очередной важной работы, вы не потеряете свои данные.
10 Spin Retry Count Количество попыток раскрутки шпинделя диска после каждой первой неудачной попытки запуска. Данный параметр касается только шпиндельных дисков и не относится к твердотельным SSD. Если число большое и растет, то это свидетельствует о износе механики и/или двигателя, который вращает магнитные диски.
184 End-to-End error Атрибут является частью технологии HP SMART IV, он говорит что в процессе обмена данными через кеш-память произошла ошибка четности. Достаточно серьезная ошибка, желательно поскорее выполнить замену накопителя.
188 Command Timeout Количество превышений времени ожидания при выполнении команд. Если значение отлично от 0 то это может свидетельствовать о плохом контакте в разъемах, окислении контактов и прочих неполадках. Прочистить контакты шлейфа данных (лучше заменить) и накопителя, также стоит посмотреть в сторону проблем с источником питания.
195 Hardware ECC Recovered Количество ошибок, которые были откорректированы аппаратной частью диска. Параметр специфичный для каждого производителя дисков, но тем не менее если наблюдается увеличение этого параметра то стоит поискать причины таких ошибок. Одной из причин может быть разгон частоты системной шины - интерфейс SATA очень чувствителен к подобным вещам.
196 Reallocation Event Count Суммарное количество (успешные + не успешные) попыток переносов секторов в зарезервированную область. Большое количество таких ошибок, так же как и атрибут Reallocated Sectors Count, говорит о начале процесса разрушения поверхности диска.
197 Current Pending Sector Count Количество нестабильных секторов, которые ждут решения контроллера для переноса из них данных в резервную область. Такие сектора еще не есть плохими, но это уже является предупредительным знаком того что на диске начинаются разрушительные процессы.
198

Uncorrectable Sector Count,

Offline Uncorrectable

Атрибут отображает количество секторов из которых не удалось выполнить перенос данных в безопасную область. Желательно незамедлительно сделать резервную копию имеющихся на диске данных и заменить носитель. Также будьте готовы к тому что уже некоторые данные могут быть частично повреждены.
231 Temperature Отображает температуру жесткого диска. Нормальный температурный диапазон - до 35-40 градусов Цельсия. Значение выше 45 градусов Цельсия означает что диск может перегреваться, металл из которых сделаны пластины и механика расширяется, что в свою очередь может быть причиной ошибок и медленной работы диска, а также признаком повреждения электроники.

В зависимости от типа накопителя и производителя технология SMART предоставляет еще много других интересных атрибутов для мониторинга.

 

Поиск сбойных блоков на диске

Данные с таблици SMART достаточно достоверно помогут сореинтировться в состоянии аппаратной части вашего жесткого диска, но тем не менее не помешает произвести тест поверхности накопителя на начилие сбойных секторов (BAD Blocks), которые еще не были обнаружены и маркированы как подозрительные или сбойные.

Для данной цели лучше всего воспользваться загрузочным диском, на котором есть свободные утилиты наподобии HDAT2, DRevitalize,  MHDD, Victoria и другие.

Также, загрузившись из-под любого дистрибутива Linux можно провести простой тест на сбойные блоки при помощи следующей команды:

sudo badblocks -sv /dev/sda

где /dev/sda - путь к файлу-устройству тестируемого накопителя (в Линукс sda - первый накопитель, sdb - второй и т.д).

 

Система внутренней диагностики от производителя

У некоторых производителей ноутбуков, серверов и рабочих станций есть встроенная система диагностики оборудования, которая подгружается при помощи нажатия горячей клавиши во время загрузки компьютера еще на этапе инициализации устройств в BIOS.

Как правило такую систему диагностики можно встретить в вычислительной продукции таких компаний как DELL и Hewlett-Packard (HP), а также у других серьезных компаний-производителей компьютерного оборудования.

К примеру чтобы войти в меню диагностики на ноутбуке от DELL, в большинстве случаев на этапе инициализации устройств и само-теста BIOS нужно нажать клавишу F12, на экране вы сможете видеть подсказку по горячим клавишам и что они делают на английском языке.

Dell Self Diagnostics, F12

Рис .1. Система самодиагностики ноутбука Dell.

Войдя в меню диагностики и запустив общий тест оборудования будут проверены разные доступные комплектующие:

  • процессор;
  • память;
  • жесткий диск;
  • датчики температуры;
  • датчики напряжений;
  • куллера;
  • матрица дисплея;
  • видеопамять;
  • коммуникационные порты;
  • и другие железячки.

Длительность процесса самодиагностики - как правило 15-30 минут, по завершению может быть задан вопрос для продолжения более длительной и тщательной диагностики, для которой понадобится примерно 1 час времени.

 

Профилактическая подготовка

Чтобы двигаться дальше в поисках проблемы, нужно выполнить профилактическую подготовку и очистку внутренностей компьютера. Со стационарным компьютером проще, а вот разобрать и почистить ноутбук не так легко, возможно что придется обратиться к специалисту.

Влажность воздуха в помещении, где работает компьютер, или же в процессе транспортировки, могла быть завышена, в помещении может быть много пыли, также как и для человека для компьютера далеко не на пользу идет табачный и сигаретный дым. В зависимости от того где находится компьютер, в воздухе могут присутствовать и другие примеси веществ, которые могут повлиять на электронику и контакты в разъемах компьютера.

Перед тем как разобрать корпус компьютера и начать работу с компонентами, очень важно снять с себя одежду и вещи которые легко электризуются. После этого нужно снять со своего тела остаток статического заряда, который мог накопиться и способен повредить электронные компоненты к которым мы будем притрагиваться.

Для снятия остатка статического электричества со своего тела нужно коснуться заземленного проводника, на крайний случай подойдет оголенный участок батареи отопления или же какой-то массивный предмет из металла, какая-то большая металлоконструкция.

В компьютере нужно отключить все разъемы и извлечь все платы из PCI/PCIe слотов. В случае с ноутбуком, мы можем самостоятельно открутить нижнюю крышку, продуть внутренности от пыли и очистить контакты планок памяти, Wi-Fi адаптера, жесткого диска, то есть то к чему позволяет нам добраться открученная нижняя панель. Данное вмешательство, как правило, не нарушает гарантии на ноутбук.

Вполне возможно что беглый осмотр внутренностей компьютера позволит найти возможную причину поломки:

  • дутые электролитические конденсаторы;
  • подгоревшие ножки в штекерах и гнездах разъемов;
  • оплавившиеся проводники;
  • остатки жидкости на платах и места где виднеется окисление контактов;
  • застрявшие в куллере и/или на платах посторонние, когда-то живые обитатели;
  • опилки металла, скрепки от степлера, кусочки проводников;
  • загнутые и соединенные между собою контакты в портах на материнской плате;
  • и т.п.

Так что не ленитесь и внимательно все осмотрите при хорошом освещении.

Поврежденные конденсаторы на материнской плате

Рис. 2. Поврежденные конденсаторы на материнской плате компьютера.

После разборки корпуса, насколько это возможно, желательно продуть все отверстия охлаждения, куллеры, порты и разъемы при помощи пылесоса. Если нет пылесоса - не беда, используйте собственные способности, главное выполнять данную процедуру на улице, поскольку пыли может быть не мало.

 

Очистка позолоченных контактов плат и модулей памяти

Уже не раз сталкивался с неработоспособностью компьютера, его плат в PCI-слотах из-за налета на позолоченных контактах. Плотный слой пыли на платах и компонентах также может повлиять на работу отдельной электроники и на ПК в целом.

Очень важный момент - єто профилактическая очистка позолоченных контактов на планках памяти, платах PCI/PCIe, модулях Wi-FI и т.п.

Для очистки нам понадобится резинка для стирания карандаша, желательно использовать более грубую ее часть. Достаточно два-три раза пройтись вдоль всех контактов на планках памяти и платах-модулях с каждой стороны и потом стереть оставшийся мусор при помощи сухой ватки, но не в коем случае не стирайте мусор пальцами!

очистка позолоченных контактов плат и модулей памяти

Рис. 3. Как очистить позолоченные контакты на платах и модулях памяти.

Из собственного опыта неоднократно случалось что простое протирание контактов решало проблему неработоспособности PCI ТВ-тюнеров, сетевых карт, планок памяти и других модулей.

 

Микросхема BIOS

Если на материнской плате присутствует панелька с микросхемой BIOS то нужно ее аккуратно извлечь, протереть контакты таким же способом как мы это делали выше, и потом поместить ее обратно на свое место. Не исключен вариант что микросхема немного вылезла из панельки или контакты окислились и это является причиной подвисаний и сбоев в работе ПК. В ноутбуках, как правило, микросхемы BIOS впаяны в плату, здесь подобная операция не понадобится.

Микросхемы BIOS в панельках и впаянная в плату, извлечение

Рис. 4. Микросхемы BIOS: A, B - в панельках, C - впаянная в плату, D - извлечение из панельки.

Перед извлечением микросхемы желательно извлечь батарейку, которая питает энергонезависимую память CMOS (смотри рисунок 4,А и 5). Примите к сведению что после извлечения батарейки и микросхемы настройки в BIOS будут потеряны, данные системных часов сброшены, позже необходимо будет все наново перенастроить.

 

Батарейка CMOS

Раз уж мы добрались внутрь нашей вычислительной машинки то не помешает проверить батарейку, которая необходима для поддержания в рабочем состоянии энергонезависимой памяти CMOS и системных часов. Для данной задачи нам пригодится тестер-мультиметр или же простой вольтметр постоянного напряжения.

В настольных компьютерах батарейка CMOS располагается на материнской плате возле микросхемы BIOS или же в небольшом отдалении от нее. В ноутбуках батарейка может быть приклеена к шасси и подключена к основной плате при помощи разъема.

Батарейки CMOS

Рис. 5. Батарейки CMOS: A - в гнезде на материнской плате PC, B - подключенная через разъем в ноутбуке, C - впаянная в плату.

Напряжение батарейки CMOS должно быть в пределах 2,9-3,2В, в противном случае желательно заменить батарейку на новую. Севшая батарейка вполне может быть причиной перезагрузок, синих экранов смерти от дяди Билли, зависаний и других аномалий.

Помнится как купил нерабочий БУ компьютер, который вообще не включался (проблема заключалась в полностью севшей батарейке) позже продав этот ПК можно сказать что одна батарейка на 3Вольта заработала мне примерно 100$.

 

Стресс-тест оперативной памяти

Следующим пунктом, если проблема еще не найдена, а также в целях профилактики, желательно произвести проверку исправности модулей оперативной памяти (RAM, ОЗУ). Вполне возможно что вы уже проверили исправность памяти используя систему диагностики от производителя, но тем не менее не помешает проверить память при помощи еще одного мощного инструмента - утилиты memtest86.

Зачем тестировать оперативную память несколькими программами? - у каждой программы свой алгоритм работы. Одна может параллельно тестироваться весь кеш процессора и оперативную память в несколько проходов и используя разные техники проверки четности, с максимальной нагрузкой на "железо". А другая программа может просто провести быстрый тест на читаемость и запись, что в свою очередь может оказаться недостаточным для того чтобы судить исправны все ячейки памяти или нет.

Где найти программу memtest86? - на официальном сайте (www.memtest86.com) есть бесплатная и платные версии, к тому же эту утилиту можно встретить в меню загрузки во многих дистрибутивах и сборках Windows/Linux: AVG Resque CD, Ultimate Boot CD Linux (Parted Magic), Hiren's Boot CD и в других.

Если у вас в качестве ОС установлена Debian GNU Linux или Ubuntu с загрузчиком GRUB, то для появления в загрузчике пункта с memtest86 в большинстве случаев будет достаточно установить программу из репозитория используя команду:

sudo apt-get install memtest86+

После запуска программа memtest86 сразу же приступит к работе, прогресс выполнения всех циклов тестирования "Test, Test#2" мы можем наблюдать в самом верху "Pass %". Если все тесты завершаться успешно и без ошибок то будет выведено сообщение "Pass complete, no errors" и тестирование продолжится дальше, для его прекращения нужно нажать клавишу Esc.

Если в процессе теста появятся ошибки то мы сможем наблюдать картину, подобную тому рисунку что предоставлен ниже:

memtest86 ram failures

Рис. 6. Программа memtest86 обнаружила сбойные ячейки в тестируемом обьеме оперативной памяти.

В случае обнаружения ошибок нужно повторить тест для каждой из планок памяти в компьютере или ноутбуке по отдельности, это позволит вычислить планки памяти с дефектами.

Не стоит исключать тот вариант что проблема кроется в самом слоте под память - попробуйте протестировать по одной планке в каждом из слотов, это займет дополнительное время но зато вы точно будете знать что данный вариант исключен или же подтвержден.

Конечно же memtest86 не единственная программа в своем роде, существуют и другие программы с подобным функционалом. Дефектная память вполне может быть причиной подвисаний компьютера, синих экранов в Windows и паники ядра (Kernel Panic) в Linux.

 

Блок питания и аккумуляторная батарея

В случае, если даже предыдущие шаги помогли обнаружить причину неработоспособности компьютера, не помешает проверить источники питания - блок питания (БП), состояние батареи в ноутбуке. От качества питания зависит очень многое:

  • температурные режимы работы оборудования;
  • долговечность жесткого диска;
  • стабильность системы при нагрузках;
  • сохранность ваших данных и ресурсов.

Если у вас стационарный ПК то желательно разобрать его блок питания и осмотреть нет ли на его платах дутых электролитических конденсаторов и других дефектов, работает ли куллер, а также прочистить его внутренности от пыли.

Если внешних дефектов не обнаружено то желательно проверить напряжения, которые выдает блок питания на разъемах. Уровни напряжений можно посмотреть в BIOS, а также при помощи программ AIDA64, SPECCY (раздел Motherboard - Voltage) для Windows. Под Linux можно использовать пакет lm-sensors, для установки и запуска нужно выполнить команды (установка, поиск датчиков, запуск):

sudo apt-get install lm-sensors
sudo sensors-detect
sudo sensors

Все программы берут данные из внутренних сенсоров и по некоторым причинам могут отображать результаты не совсем точно, поэтому лучше проверить наличие нужных напряжений вручную - железным методом. Сделать это можно при помощи мультиметра или вольтметра постоянного напряжения.

Ниже приведен рисунок с распиновкой основных разъемов питания в стационарном компьютере, а также величины напряжений и назначение для каждого из пинов.

Разъемы питания в компьютере, распиновка и напряжения

Рис. 7. Разъемы питания в компьютере - распиновка и напряжения на каждом из пинов.

Выставляем мультиметр или вольтметр на измерение постоянного напряжения, включаем компьютер и пройдемся по наиболее важным пинам с напряжениями +5В, +3,3В, +12В, -12В (один щуп тестера на GND, COM а второй - на проверяемый пин) , все показания записываем на листе бумаги.

Теперь запускаем для нагрузки какую-либо современную 3D-игрушку или 3D-бенчмарк чтобы нагрузить видеокарту, процессор, память и немножко жесткий диск, после измеряем снова выписываем все напряжения на листочек для сопоставления с предыдущими результатами.

Если по одной из линий или сразу по нескольким наблюдается отклонение +-5% то это сигнал о том что с блоком питания что-то не в порядке или же он не может выдерживать нагрузку всего железа, которое к нему подключено.

Что делать в данном случае? - одолжить на время другой рабочий и более мощный блок питания, протестировать работу ПК вместе с ним. Дальше уже примете решение нужно ли нести ваш БП в ремонт или же покупать новый и более мощный.

В случае с ноутбуком мы имеем внешний блок питания-адаптер, а также встроенную Li-Ion батарею. Возиться с проверкой напряжения на штекере такого адаптера нет смысла, потому что напряжение с него в ноутбуке дополнительно фильтруется и стабилизируется контроллером питания и заряда. Ваша операционная система точно укажет что питание от сети есть или же его нет.

К тому же у некоторых производителей ноутбуков, например у Dell, в комплекте может идти адаптер, у которого на отключенном от ноутбука штекере не будет вообще напряжения, оно появится только тогда когда штекер будет вставлен в ноутбук и контроллер питания даст команду адаптеру на подачу напряжения.

Также ноутбуки от Dell могут предупреждать о проблемах с адаптером питания еще при старте системы. Например вы подключили к  ноутбуку адаптер на 60Ватт вместо полагаемого 90Ватт - в момент инициализации BIOS у вас может появиться предупреждение.

Осталось проверить батарею питания. Сначала для теста нужно полностью извлечите ее и проверить работу ноутбука с одним лишь адаптером питания - если проблема с зависаниями и т.п. исчезла то возможно что проблема кроется в плохой батареи или ее контроллере.

Для проверки состояния батареи под Windows можно использовать программу AIDA64 (раздел Computer - Power). Также можно  сгенерировать отчет по питанию при помощи утилитки powercfg, для этого нужно нажать Пуск, в строке поиска ввести "cmd", на найденном пункте клацнуть правой клавишей мышки и выбрать пункт "Запуск от имени администратора" (Run as administrator) для запуска командной строчки с правами Администратора.

Теперь выполним команды:

cd c:
powercfg energy

В результате, в корне диска С будет сгенерирован файл "energy-report.htm", в котором будет содержаться отчет о питании. Открываем єтот файл любым браузером и ищем значения параметров:

  • "Расчетная емкость" - начальная емкость аккумуляторной батареи, установленная производителем.
  • "Последняя полная зарядка" - реальная полученная емкость после последней зарядки.

Как рассчитать процент износа аккумуляторной батареи? - для этого используем формулу:

% износа = ("Расчетная емкость" - "Последняя полная зарядка") / "Расчетная емкость" * 100.

Для получения параметров состояния батареи под Linux можно использовать утилиту upower.

upower -e

Команда выведет список устройств где мы сможем найти путь с названием имеющейся батареи, например: "/org/freedesktop/UPower/devices/battery_BAT0". Теперь запустим утилиту upower и передадим ей полный путь, который мы узнали из предыдущей команды:

upower -i /org/freedesktop/UPower/devices/battery_BAT0

Команда выведет полную информацию об установленной аккумуляторной батареи, здесь нам наиболее интересны параметры:

  • "energy-full-design" - емкость аккумуляторной батареи, установленная производителем;
  • "energy-full" - полученная емкость после последней зарядки;
  • "capacity" - текущая емкость батареи;
  • "time to empty" - время работы на текущем заряде от батареи.

Если емкость батареи сильно снизилась в процессе работы то необходимо принять меры по ее замене. А если вам пришел новый ноутбук с изношенной батареей - то это уже или ошибка/лукавство со стороны продавца или же гарантийный случай с заводским дефектом.

 

Тест стабильности системы

Для того чтобы проверить насколько стабильно будут себя поводить комплектующие компьютера необходимо провести тест под нагрузкой - стресс-тест системы.

Под Windows для этой цели хорошо подойдет стресс-тест который находится в программном пакете AIDA64 - он достаточно безопасен для системы и наглядно показывает состояние компонентов в процессе тестирования.

Для запуска стресс-теста в AIDA64 клацаем иконку в меню с подсказкой "System Stability Test", откроется окно где нам нужно выбрать что мы будем тестировать. Здесь мы можем установить галочки и протестировать все компоненты вместе (процессор CPU, подпроцессор FPU, графический процессор GPU, память MEMORY), а можем по отдельности.

Для начала хватит установки галочек CPU, FPU, Cache, System memory, а потом можно еще раз запустить тест добавив к нагрузке графическое ядро GPU. Нажимаем "Start" и наблюдаем за графиками состояния температур отдельных комплектующих, в других вкладках можно также увидеть графики для частоты вращения куллеров, уровней напряжений и суммарную статистику.

Желательно оставить тест запущенным минут так на 20 и более, по истечению времени жмем кнопку "Stop" и приступаем к анализу результатов.

AIDA64 стресс-тест, все отлично

Рис. 8. AIDA64 стресс-тест запущен, температурные режимы в норме.

Из рисунка выше видно что температуры не превышают допустимых пределов и не "скачут", процессор загружен равномерно и без пропускания тактов (CPU Thtottling).

AIDA64 стресс-тест, перегрев микропроцессора

Рис. 9. AIDA64 стресс-тест почти сразу после запуска оповестил о перегреве микропроцессора.

Из приведенного выше рисунка (рис. 9) видно что температурные режимы компонентов, после запуска нагрузочного теста, начали "прыгать", к тому же на графике загрузки микропроцессора видны проседания - єто работает технология CPU Throttling, которая начинает пропускать такты микропроцессора и тем самым снижая производительность - предотвращая критический перегрев микропроцессора.

Причиной такого перегрева может быть: плохая термо-паста, отвалившийся или плохо закрепленный радиатор куллера, остановившийся куллер на процессоре и т.п.

Под Linux пока что не встречал такого комплексного инструмента с графическим интерфейсом, но зато есть все необходимые инструменты по отдельности и они свободны, установим некоторые из них для нашего теста:

sudo apt-get install htop stress mesa-utils lm-sensors
sudo sensors-detect

Запускаем каждую из команд в отдельном окне терминала для удобства наблюдений:

htop
watch -n 1 sensors
vblank_mode=0 glxgears -info
stress --cpu 8 --io 4 --vm 2 --vm-bytes 128M --hdd 2 --timeout 20m

При помощи "htop" мы мониторим загрузку памяти и процессора, в терминале с "sensors" мы наблюдаем за температурой компонентов, при помощи "glxgears" - выполняем небольшую нагрузку GPU (разворачиваем окно с шестеренками во весь экран), а "stress" нагружает все ядра процессора (параметры --cpu 8 --io 4), нагружает оперативную память 2x128Мб (--vm 2 --vm-bytes 128M) и жесткий диск (--hdd 2) на протяжении 20 минут (--timeout 20m).

Вы можете изменить параметры так, как вам необходимо, например для загрузки памяти использовать 8 работников по 256Мб (2048Мб, 2Гб).

Ниже привожу пример экрана с таким комплексным тестом:

Комплексный стресс-тест железа под Linux

Рис. 10. Пример размещения окон для комплексного теста стабильности системы, используя набор свободных утилит в Linux.

Понятно что "glxgears" лишь немного поверхностно загрузит графический процессор, для более полной нагрузки GPU можно использовать свободный набор тестов GPU Test (www.geeks3d.com/gputest/).

Подведем итоги данного этапа. В случае обнаружения больших разбросов в значениях температуры и напряжений в процессе стресс-тестов стоит обратить внимание на тестируемые компоненты и провести для каждого компонента тест по отдельности. Это поможет определить причину нестабильности системы для принятия дальнейших мер.

 

Драйвера устройств

Плохой или старый драйвер одного из устройств вполне может стать причиной перезагрузки или зависания компьютера, а также вызвать синие экраны в Windows, панику ядра в Linux.

По данным из синего экрана (строчка 0хххххх) можно определить что именно вызвало сбой системы, для этого достаточно задать в Гугл-поиск строчку которая содержит код из синего экрана и добавить через пробел слова "синий экран" - получим множество результатов где сможем найти ответ на свой вопрос.

Не лишним будет загрузиться в безопасном режиме для вашей операционной системы, а также попробовать по очереди удалить/запретить драйвера для всех возможных устройств, наблюдая при этом за работой системы. В случае если вы определили устройство, драйвер которого сбоит, желательно удалить драйвер и установить самую свежедоступную его версию, скачанную из официального сайта (не из варезника).

В случае паники ядра в Linux мы сможем сразу наблюдать отчет о том что вызвало проблему, после перезагрузки эти данные можно найти в журналах системы. Возможно что решить проблему с драйвером в Linux получится просто обновив установленные пакеты и ядро, а возможно что здесь поможет установка более свежего дистрибутива.

Также можно попробовать установить и протестировать систему под разными операционными системами. Например ПК зависает под Windows 7 - устанавливаем на временный переносной USB-накопитель ОС Linux, настраиваем все железо, устанавливаем поддержку видеокарты и тестируем систему, нагружаем разными способами. Если проблем нет - производим свежую установку Windows и продолжаем поиски проблем уже под ней.

 

Системные журналы

Может показаться странным, но многие железячники не используют системные журналы, а есть некоторые "специалисты", которые вообще не подозревают что существует такой инструмент. В системном журнале можно найти множество полезной информации, которая поможет вам разобраться что именно вызывает сбой: драйвер устройства, служба, программа и т.п. )

Под Windows 7 журнал событий можно найти вот так: ПУСК - Панель управления - Администрирование - Просмотр событий.

В Linux большинство залогированных событий для служб и программ можно найти в папке /var/log, также есть очень информативные инструменты - это команда "dmesg" и "journalctl".

В моем случае, во время подвисании ноутбука в журнале событий для Windows и Linux не было никаких записей, то есть зависание было как-бы равносильно полному перебою питания в ноутбуке. Данный факт может означать проблему с системой управления питанием, ACPI, системой питания видеокарты или же где-то неподалеку пролетало НЛО...?! )

 

Контроллер жесткого диска

Может быть что проблема заключается в микросхеме контроллера SATA, которая впаяна в материнскую плату вашего компьютера. Как проверить такой контроллер? - это достаточно сложно сделать без специального оборудования, но все же можно провести некоторые тесты самостоятельно.

Как вариант - попробовать проверить контроллер методом исключения, использовать внешний USB-накопитель (жесткий диск), на который устанавливаем операционную систему, но перед тем в BIOS отключаем встроенный контроллер накопителей, который может быть проблемным местом.

Тестируем систему, если все ОК - тогда пробуем включить контроллер обратно и подключить к нему новый жесткий диск, а также желательно попробовать установить под ним разные операционные системы (WinXP, Win7, Linux).

 

Обновление прошивок BIOS, SSD

Если у вас стационарный компьютер, то стоит узнать точную модель материнской платы и попробовать найти для нее более свежую версию прошивки BIOS.

В случае с ноутбуком достаточно знать модель этого ноутбука и его производителя, по этим данным можно без проблем найти официальный сайт производителя и уже там поискать в разделе Поддержка/Драйвера (Support/Drivers) самую свежую версию BIOS.

Как узнать вашу текущую версию прошивки BIOS в Windows? - здесь вам также поможет уже выше упомянутая программа AIDA64 (раздел Motherboard - BIOS).

Как узнать версию BIOS под Linux? - можно использовать утилитку dmidecode, для этого нужно выполнить от имени суперпользователя (root) комплексную команду:

dmidecode -s bios-version && dmidecode -s bios-release-date

На экран будет выведена версия текущей прошивки BIOS (bios firmware version), а также дата ее релиза.

Производители современных материнских плат и ноутбуков позволяют скачивать самораспаковывающийся файл обновления BIOS, который предназначен для запуска под Windows (.exe).

Если у вас установлена ОС отличная от Windows то можно загрузиться с Windows Live-CD или же временно установить на один из разделов жесткого диска ( или на внешний накопитель) чистый Windows без драйверов, а уже из под него выполнить обновление BIOS.

Современные твердотельные SSD диски также имеют встроенную прошивку, которая может быть загружена и обновлена до актуальной, наиболее хорошо оталженной версии с сайта производителя.

Для этого нужно найти и скачать установочный файл с прошивкой под вашу модель SSD-накопителя с официального сайта производителя! Для запуска и выполнения обновления прошивки, возможно что также понадобится установленная (пусть даже временно) ОС Windows.

Старый биос в комплекте с новой ОС Windows вполне может быть причиной сбоев, а также не следует забывать о старой прошивке SSD - из-за них не редко можно получить синий экран смерти Windows и другие глюки.

 

Настройки BIOS

В случае возникновения проблем с железом компьютера желательно сделать полный сброс настроек BIOS в значения по умолчанию (default) - пункт "Load Optimal Defaults" и в таком состоянии произвести тестирование системы и ее компонентов.

Внимание! Перед сбросом настроек BIOS желательно не полениться и записать себе на лист бумаги или же сфотографировать на телефон все экраны с настройками BIOS. Позже это поможет в сравнении и восстановлении прежних настроек.

Позже можно еще попробовать поочередно и при этом тестируя, отключить специальные настройки, которые связаны с разгоном процессора и повышением его частоты, разгоном частоты системной шины и видеокарты:

  • TurboBoost;
  • CPU Overclocking;
  • GPU Overclocking;
  • и другие.

 

Отключение периферии и устройств

Если ничего из вышеприведенного не помогло и проблема все еще дает о себе знать - стоит исключить из системы все возможные устройства. Это могут быть:

  • Сетевые и Wi-Fi адаптеры
  • Звуковые и мультимедиа (ТВ) платы
  • Дополнительные жесткие диски и накопители
  • Все подключенные по шине USB устройства
  • и т.п.

Желательно оставить самый минимум, к примеру для стационарника это:

  • материнская плата;
  • микропроцессор;
  • планка памяти;
  • одна из видеокарт (желательно интегрированная, если есть);
  • жесткий диск (желательно абсолютно новый или заведомо рабочий);
  • блок питания;
  • клавиатура + мышь.

Для ноутбука можно оставить одну из планок памяти, извлечь по возможности Wi-Fi модуль, Bluetooth, CDMA-карту, если есть две видеокарты то оставить включенной только интегрированную.

Здесь мы исключаем все варианты сбоя в подключенном железе и сосредоточиваемся на тестах текущего, минимально необходимого для работы аппаратного обеспечения.

Также посте тестов можно отключить и жесткий диск, а загрузку ОС выполнить используя флешку или диск с Linux в режиме Live (загрузка и работа без установки прямо с диска).

 

Поиск информации о проблеме

Итак, вы выполнили все тесты и эксперименты по определению причины неработоспособности ПК или ноутбука, проверили все варианты до которых только смогли додуматься, но это не принесло необходимого результата. Что же делать дальше?

Каждый день огромное количество людей в интернете делятся своими знаниями, способами решения задач и проблем. С каждым днем меняются технологии, появляются новые обсуждения и статьи на форумах, блогах, сайтах вопросов-ответов и т.п.

Однозначно стоит поискать информацию о вашей проблеме в интернете, причем для поисков желательно придумать и использовать как запросы на отечественном языке, так и на английском. Здесь главное сформулировать правильный поисковый запрос, например в моем случае с хаотическими зависаниями ноутбука используем запросы:

  • "випадкові зависання ноутбука";
  • "хаотичные зависания компьютера";
  • "случайные подвисания ноутбука";
  • "notebook randomly freezes";
  • "notebook crash at random times";
  • "laptop shutting down randomly";
  • "notebook freezes under low load";
  • и т.п.

Если вы не знаете как сформулировать свой запрос на английском языке то воспользуйтесь сервисом онлайн-переводов от Гугла (translate.google.com) или же другим переводчиком онлайн/оффлайн.

Вполне может быть что кто-то уже сталкивался с подобной проблемой и он не только описал свой опыт но и получил рекомендации по решению проблемы от других участников интернет-сообщества.

 

Заключение

Пройдя по всем выше описанным пунктам, в большинстве случаев вы определите причину неработоспособности своего компьютера или ноутбука. Если же вам это не удалось, то скорее всего что причина проблемы кроется где-то внутри электроники и здесь нужно специальное оборудование и знания для проведения тестов и ремонта.

В таком случае лучше не медлить и отнести свой нерабочий компьютер в сертифицированный сервисный центр, дополнительно предоставив специалистам информацию о своих произведенных тестах и экспериментах по вычислению проблемы - это сократит время ремонта и вполне возможно что и ваши деньги.

После всех тестов и догадок я так и не смог самостоятельно вылечить дефектный лептоп (проблема оказалась в материнской плате), но тем не менее было получено много полезного опыта, которым я постарался поделиться с вами в этой статье.

 (5/5) голосов: 1   просмотров: 508




Добавить комментарий captcha