Ремонт: Ноутбуков, Компьютеров
https://vlab.su/

need some help for ati cards with memory errors for making script
https://vlab.su/viewtopic.php?f=48&t=100822
Страница 3 из 55

ilie321 [ 17 авг 2020, 20:16 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

mazahaka011 писал(а):
Приветствую. Попробовал запустить скрипт на r9 390 8гб (одна полоса на экране)
Показало ошибки во всех чипах памяти :/
Это помер контроллер памяти или ошибка скрипта?

I think you didn't choose the good address for your card. Run lspci comand and search your card and address.

azatar0890 [ 18 авг 2020, 20:15 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Доброго вечера уважаемые коллеги, есть ли какие то наработка с картами RADEON 5Х00 серии? Запустил тут лежачую MSI 5700, нету изо, но по всем признакам плата заводится, есть генерация в VRM есть обмен данными с флешкой биваса, питальники все поднимаются, камень разогревается, полазил по обвязки памяти вроде тоже ничего не нашел, попытался прогнать скриптом, но после подгрузки линукса начинается что-то вроде автотеста который клинит на 400+ пункте, приложу фотки, бегут они быстро но вообщем некоторые строки видно

mazahaka011 [ 19 авг 2020, 07:39 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

azatar0890 писал(а):
Доброго вечера уважаемые коллеги, есть ли какие то наработка с картами RADEON 5Х00 серии? Запустил тут лежачую MSI 5700, нету изо, но по всем признакам плата заводится, есть генерация в VRM есть обмен данными с флешкой биваса, питальники все поднимаются, камень разогревается, полазил по обвязки памяти вроде тоже ничего не нашел, попытался прогнать скриптом, но после подгрузки линукса начинается что-то вроде автотеста который клинит на 400+ пункте, приложу фотки, бегут они быстро но вообщем некоторые строки видно

Это еще до скрипта не дошло. это образ линукса запуститься не может.

ilie321 писал(а):
I think you didn't choose the good address for your card. Run lspci comand and search your card and address.


Адрес выбираю правильно. Попробовал так же HD7950, картина аналогичная
Можно ли запускать скрипт из под ubuntu с графическим интерфейсом?
Изображение
Изображение

ilie321 [ 19 авг 2020, 09:34 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

show picture with address from lspci command

allas [ 19 авг 2020, 23:44 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Can you test the newer cards like the RX 5700 ??

suhar777777 [ 20 авг 2020, 01:48 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Два режима AUTO MODE и MANUAL MODE, соответственно автоматический и ручной. В автоматическом режим аргументы не нужно вводить. В нем постоянным остается только размер тестируемой памяти, а остальные аргументы автоматически меняются. В ручном режиме все аргументы в ручную прописываются. Пока все еще тестирую)))

ilie321 [ 20 авг 2020, 08:59 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

allas писал(а):
Can you test the newer cards like the RX 5700 ??


Hello. I don't have any card to check. Can you put here the output of script for this card?

Crimfell [ 20 авг 2020, 11:41 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

suhar777777 писал(а):
Пока все еще тестирую)))

А можно ссылку на бета версию в личку? Спасибо.

Oger [ 20 авг 2020, 14:36 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Crimfell писал(а):
А можно ссылку на бета версию в личку? Спасибо.

А чего в личку? Чем больше людей тестирует и находит баги, тем лучше.

TheMArcos [ 20 авг 2020, 15:29 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

I also wait for the link, I have some Radeon R7 and R9, HD's and Rx that could be running the tests.

Levsha110mb [ 21 авг 2020, 09:56 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Ждем с нетерпением. Уже лежат парочку RX470 с подозрением на память.

Elsid79 [ 24 авг 2020, 00:09 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Есть несколько карт серии RX 470-580 4-8 гб с проблемной памятью, могу тестить софт. разработчикам софта огромный рєспект

Mafiya67 [ 25 авг 2020, 03:39 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Товарищи доброго времени суток! В чем может быть причина, если скрипт dmgg ошибок не находит, но при нагрузке 3дмарк происходит выпад изо в одноцветный экран. Проблема решается снижением частоты памяти. Напряжения в норме. Видеокарта рх470 4 гб. Буду благодарен за советы

ilie321 [ 25 авг 2020, 09:15 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Mafiya67 писал(а):
Товарищи доброго времени суток! В чем может быть причина, если скрипт dmgg ошибок не находит, но при нагрузке 3дмарк происходит выпад изо в одноцветный экран. Проблема решается снижением частоты памяти. Напряжения в норме. Видеокарта рх470 4 гб. Буду благодарен за советы


Hello script does not load memory like a game. Problem can be an bios update also voltage on memory can drop on big load or a chip has problems when is warm or full load in my opinion

vitok70 [ 25 авг 2020, 12:00 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Mafiya67 писал(а):
при нагрузке 3дмарк происходит выпад изо в одноцветный экран. Проблема решается снижением частоты памяти. Напряжения в норме.

Если карта с майнинга и обычно нужен патч после установки драйвера то установить заводской на неё как советовал автор темы. А если она с заводским то частенько на таких деградирует GPU, контроллер памяти к примеру в нём и нужна его замена или же как вы уже делали работать с пониженными частотами на ней.

Mafiya67 [ 25 авг 2020, 12:48 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

vitok70 писал(а):
Если карта с майнинга и обычно нужен патч после установки драйвера то установить заводской на неё как советовал автор темы. А если она с заводским то частенько на таких деградирует GPU, контроллер памяти к примеру в нём и нужна его замена или же как вы уже делали работать с пониженными частотами на ней.

Спасибо за ответ! Да с майнинга, Биос ординальных поставил, вот и задался вопросом есть ли смысл заменить память в круг. Но видимо уже нет в этом необходимости)
---------- Добавлено спустя 4 часа 24 минуты 26 секунд: ----------
И хотел ещё уточнить по скрипту. При определении с какого адреса начинается видеопамять на некоторых моделях видеокарт получается два адреса (во вложении на фото с0000000 и d0000000). И такое наблюдается только иногда. При этом если проводит тест начиная с первого адреса -с ошибок нет, если со второго -d все банки с ошибками))

Gas_man [ 25 авг 2020, 22:37 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Автор @ilie321 вопрос наверное к ВАМ.
Я столкнулся с такой проблемой что у меня ДОЛЖНЫМ образом теструются карты которые подключены к монитору.
Хочу сказать что карты которые тестирую через подключенный монитор ко встроенной в проц\материнку графике - тестируются с результатом ОШИБКИ по ВСЕМ БАНКАМ памяти.
Пытался материнки менять, пытался карты менять местами.
Вариант теста № 1: Карта заведомо исправна по банкам памяти. Тестирую со вставленным в нее монитором. Результат теста - ошибок по банкам памяти - НЕТ
Вариант теста № 2: Тестируемая карта в слоте PCI-E x 16 в материнке, вывод изображения на монитор через "встройку". Результат теста - ошибка по всем банкам памяти, хотя карта до этого не показывала ошибки.
Вариант теста № 3: Отключаю "встроку". Приалекаю вторую карту АМД. Одна в слоте PCI- E x 16, вторая через рейзер в слоте PCI - E X 1. Монитор вставлен в карту которая в X 16 - изображение есть. Карта по адресу e0000000 - тестируется без ошибок, карта которая в рейзере и в слоте PCI-E x 1 по адресу c0000000 - Теструется с ошибками по всем банкам памяти. Хотя у этой карты ошибок ранее не наблюдалось.
Пробую вариант теста № 4 - монитор подцепляю к карте которая в райзере и слоте PCI-E x 1 - монитор не стартует, не инициализируется.
ПОДСКАЖИТЕ ЧТО Я НЕ ТАК ДЕЛАЮ.
Ниже немного видео:
https://radikal.ru/video/3ijjO8u7tPU

https://radikal.ru/video/rb8ADvgeSPe

Conqueror [ 25 авг 2020, 22:42 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

vitok70 писал(а):
частенько на таких деградирует GPU, контроллер памяти к примеру в нём

Всем доброго времени суток!
А не может быть, что какая-то из банок памяти в режиме пониженной частоты работает, а номинальную (7-8 ГГц в зависимости от модели) уже не держит?
---------- Добавлено спустя 2 минуты 52 секунды: ----------
Gas_man писал(а):
Теструется с ошибками по всем банкам памяти. Хотя у этой карты ошибок ранее не наблюдалось.

А с полноценно работающими картами пробовали на этой же конфигурации (мат.плате + режиме загрузки) тестировать? На них что говорит? Тоже ошибки?

Gas_man [ 25 авг 2020, 23:12 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Conqueror писал(а):
А с полноценно работающими картами пробовали на этой же конфигурации (мат.плате + режиме загрузки) тестировать? На них что говорит? Тоже ошибки?


А это и есть тест полноценной исправной карты.

Mafiya67 [ 25 авг 2020, 23:16 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
Я столкнулся с такой проблемой что у меня ДОЛЖНЫМ образом теструются карты которые подключены к монитору.


У меня была такая ерунда, если адрес памяти не правильно определить. По всем банкам ошибки

galkinvv [ 26 авг 2020, 04:18 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
ПОДСКАЖИТЕ ЧТО Я НЕ ТАК ДЕЛАЮ.

К сожалению, тут не ошибка с вашей стороны, а ненадёжность самого метода.

Все существующие тулзы для поиска битой памяти - что эти скрипты, что mats - ожидают что для карты будет выполнена её процедура первичной инициализации, которая включит доступ к памяти.
Инициализация делается или на этапе BIOS/UEFI, или линуксом при ините драйвера.
И если этого по каой-то причине не произогло - то везде будут ошибки.

А ещё бывает, что везде ошибки, если наоборот инициализация прошла слишком далеко и драйвер уже успешно "захватил" устройство и настроил его. На НЕисправных картах это происходит редко, только если доля ошибок памяти крайне мала. Т.к. елси ошибок много - то драйвер до конца не проинициализируется.

Некоторые теоретические подробности я расписывал тут: viewtopic.php?t=89664&p=714673#p714673
Там про nvidia, но сути это не меняет

Там очень длинно, поэтому напишу и чуть более сжатую версию:
  • универсального способа мне неизвестно и упоминаний его нигде видел. Встречаются карты на которых любая попытка инициализации из опробованных вешает систему намертво (при загрузке или при старте драйвера). Может там дохлый gpu, но доказательства этому нет.
  • можно вставлять единственной основной картой и использовать авторежим или удалённый доступ через ssh/putty
  • можно вставлять второй картой в материнку с поддержкой uefi, которая на старте пытается инициализировать все карты, а не одну (некоторые материнки так точно делают, но как это сказывается на тесте - не уверен)
  • Стоит использовать такую загрузочную систему linux, которая содержит актуальный драйвер amdgpu с поддержкой тестируемых карт и автоматической его активацией. (Критерием того что на эту тему всё правильно можно считать то что при загрузке с единственной рабочей картой - происходит инициализации фреймбуфера - т.е. переключение в родное разрешение монитора с уменьшением размера букв. Критерий работает только если сразу после BIOS до инита драйверов линуксом разрешение неродное. Если uefi сразу родное поставил, то критерий надо икать другой).

Вцелом информация для поиска вариантов... Точного решенеия мне неизвестно

Conqueror [ 26 авг 2020, 08:09 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

galkinvv писал(а):
Вцелом информация для поиска вариантов... Точного решенеия мне неизвестно

Теперь ещё вариант: например, есть карта - даёт картинку, устанавливается драйвер - но при запуске любого ресурсоёмкого приложения, которое переключает карту в полноценный 3D turbo режим - крашится. Меняешь частоту памяти в риватюнере (афтербёрнере) на более низкую - работает стабильно.
Такая карта минимум одна 1066 была - и естественно, МАТС на неё говорил PASS - ибо в 2D режиме память вся работала исправно.
Решение - полностью заменили весь комплект банок на заведомо исправный.

Я правильно понимаю, что ваш скрипт для АМД (обсуждаемый здесь) - также не запускает карту в 3D turbo режим, и тестирование происходит на минимальных (2D) частотах?

ilie321 [ 26 авг 2020, 08:33 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
Автор @ilie321 вопрос наверное к ВАМ

Hello if card it is good the linux driver it is loaded completely and you obtain false results from script
Also most of the time you get 2 range of addresses for card. In one range you don't have access and it is giving all chip faulty

Mafiya67 [ 26 авг 2020, 09:03 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Уважаемый @galkinvv, подскажите, дальнейшее совершенствование скрипта с Вашей стороны будет?) или текущая версия итог? Я в программировании совсем никак, не будет к примеру возможности автоматизации процесса без поиска адресов памяти, как к примеру в матсе организовано?)

Gas_man [ 26 авг 2020, 09:17 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Mafiya67 писал(а):
к примеру возможности автоматизации процесса без поиска адресов памяти, как к примеру в матсе организовано?)


Вы скорее всего тему полностью не читали, а стоило бы - viewtopic.php?p=795183#p795183
---------- Добавлено спустя 5 минут 58 секунд: ----------
ilie321 писал(а):
Также большую часть времени вы получаете 2 диапазона адресов для карты. В одном диапазоне у вас нет доступа, и он дает неисправность всей микросхемы


У меня возникли трудности в понимании того что перевел переводчик.

Вы подскажите что мне делать?

Я тестировал ЭТИ карты в разных вариациях на двух система/двух материнках - обе системы на базе INTEL.

Есть товарищ, который тестирует на базе AMD. И на его системе нет встраиваемой графики. Он тестирует карты через 2ую исправную, которая дает изображение

vitok70 [ 26 авг 2020, 09:53 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Conqueror писал(а):
А не может быть, что какая-то из банок памяти в режиме пониженной частоты работает, а номинальную (7-8 ГГц в зависимости от модели) уже не держит?

Может. В сущности скрипт и матс находят ошибки памяти на точно неисправных банках или отвалах а вот если с дровами под нагрузкой тут сложнее определить что конкретно является источником этого и тут только сработает старый метод подмены на исправные элементы при этом решая с чего начать можно учитывать свою или других статистику по ремонту с таким на конкретных моделях к примеру на AMD RX серии после майнинга часто полудохлые процы попадаются и глючат в нагрузке. А если как у вас срабатывает понижение частоты памяти можно и с неё начать если есть такая на подмену а это главный фактор в таком ремонте.

Mafiya67 [ 26 авг 2020, 10:28 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

А возможно @Gas_man Вы столкнулись с ситуацией которую описывал я чуть выше?
Изображение
На RX определяет два адреса памяти, отмеченные желтым. Если проводить проверку по первому адресу то ошибок нет, по второму все банки в ошибках. Карта заведомо исправная. Еще заметил одну особенность, но не критично, если тестировать карту и выводить с нее изображение, то весь экран на время проверки становится в цветных точках

suhar777777 [ 26 авг 2020, 11:11 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Добавил Navi.

Gas_man [ 26 авг 2020, 12:23 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Mafiya67 писал(а):
На RX определяет два адреса памяти, отмеченные желтым. Если проводить проверку по первому адресу то ошибок нет, по второму все банки в ошибках. Карта заведомо исправная. Еще заметил одну особенность, но не критично, если тестировать карту и выводить с нее изображение, то весь экран на время проверки становится в цветных точках


То что выделено желтым - ЭТО понятно. Я всегда беру в работу адрес со строкой где числится =256М . Другой адрес даже не рассматриваю.
Это я усек когда скрипт был первой версии "Direct-mem-test.py"

У меня немного другая ситуация:
В систему вставляю 2 карты одна в слоте на материнке, вторая в рейзере.
Скрипт обе видеокарты видит. Появляется 2 раздела "VGA compatible controller" с разными адресами в которой прописаны цифры "=256М"
По одному адресу адекватно (видеокарта с подключенным монитором) тестируется - показывает без ошибок.
По второму адресу (без подключенного монитора) - ошибка по всем банкам.
Замечено еще такое, что перевтыкая монитор в видеокарту с рейзером - монитор не инициализируется. Настройка в биосе материской платы - загрузка графики только с PCE

Mafiya67 [ 26 авг 2020, 12:45 ]
Заголовок сообщения:  Re: need some help for ati cards with memory errors for making script

Gas_man писал(а):
По одному адресу адекватно (видеокарта с подключенным монитором) тестируется - показывает без ошибок.


А у Вас при этом изображение во время теста в цветную кашу не превращается?
Изображение (пример фото из интернета, но суть такая же)
По завершению теста текст отображается нормально)

Страница 3 из 55 Часовой пояс: UTC + 4 часа
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
http://www.phpbb.com/