MER-1 "Spirit"

Автор ratman, 04.01.2004 06:47:35

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

Marmot

ЦитироватьА мой принцип совпадает с Билл'овским: "If you can't make it good, make it look good" (c)

P.S.: Люди Билли не любили, и за это Билли били :)
Вот, вот, Билли развратил народ своим подходом к прозводства софта.
Никто и не задумывается о том как делать правильно, главное быстро и в красивой обёртке.
А потом приходится логи пересылать по всей Солнечной системе :-)

Игорь Суслов

ЦитироватьВот, вот, Билли развратил народ своим подходом к прозводства софта.

"Разработка программы заканчивается, когда заказчиком уплачены деньги" (с) :)
Спасибо не говорю, - уплачено...

А все-таки, каково происхождение дырочек на камне (фота вывешена мной ранее). Манипулятор таких насверлить не мог,
абразивная щетка на нем имеет диаметр 4.5 см и чистит на глубину до 5 мм. Тут немного выше сказали, что это пузырьки из расплава. Что скажут эксперты?

X

http://spaceflightnow.com/mars/mera/040126spirit.html

Я не могу понять, правильно ли я поняла информацию о некоторой установке, происхождение которой NASA еще точно не знает. Она якобы вывела из строя весь Spirit.

Это что хакеры? Или внутренныя проблема.

Motor

Цитироватьhttp://spaceflightnow.com/mars/mera/040126spirit.html

Я не могу понять, правильно ли я поняла информацию о некоторой установке, происхождение которой NASA еще точно не знает. Она якобы вывела из строя весь Spirit.

Это что хакеры? Или внутренныя проблема.

Насколько я могу понять, в статье говорится о том, что основная версия проблемы - переполнение внутренней энергонезависимой памяти - FLASH-memory (в которой данные не пропадают при отключении питания). Эта память используется ровером для хранения данных экспериментов и фотографий до момента их передачи на Одиссей или Землю. В этой памяти хранились данные еще со времен перелета, и после нескольких дней работы на Марсе эта память просто сильно заполнилась (я так понимаю, что количество файлов в ней стало очень большим). В какой-то момент работы с "рукой" и подготовки "абразивного инструмента" произошло "падение" софта (роверовская бортовая ЭВМ ресетнулась). Из за чего произошел самый первый ресет пока не очень понятно, но потом, при старте ЭВМ по идее должна была проинициализировать флэш, однако из-за большого количества файлов, ей это делать не удавалось и ЭВМ опять ресеталась. На мысль о том, что что-то плохо с флэшом команду натолкнули данные о том, что роверовское локальное время установилось в 2053-й год (эти данные были получены при очередной "бредовой" посылке данных на Землю). После этого было ясно, что проблемы с конфигурационными параметрами, которые, как они надеялись, были связаны с проблемыми флэша. Архитектор софта предложил отключить инициализацию флэша при старте (типа все равно хуже-то не будет, но вдруг поможет). Это и помогло. Теперь они ищут способ "почистить" флэш от ненужных файлов. Предположительно будут стирать данные, полученные во время перелета, как не очень уже актуальные. После этого они надеются флэш-таки проинициализировать и стартануть в нормальный режим. После этого останется понять, все ли нормально с "рукой" и абразивным инструментом, а также с high-gain антенной, которые, возможно, вызвали самый первый ресет.

В статье по линку об этом не пишется, но по-моему, вчера писали, что отдельная плата управления "рукой", возможно передала бортовой ЭВМ какие-то направильные (неожиданные) данные о своем состоянии, положении и так далее, из-за чего, возможно и произошел самый первый ресет. То есть проблем как бы две. Первая - починить флэш (прибить на нем ненужные файлы и сократить, таким образом, их количество). Вторая проблема - понять, все ли в порядке с остальными инструментами ровера.

Если я что-то упустил или придумал, прошу меня поправить. Про установку или хакеров в статье вроде ничего не говорится...

X

Про хакеров это я у нас видела. Правда. какой-то идиотский сайт. Со ссылкой на своих специалистов в Лондоне.

Motor

ЦитироватьПро хакеров это я у нас видела. Правда. какой-то идиотский сайт. Со ссылкой на своих специалистов в Лондоне.

Ха-ха. :) Где ровер, и где хакеры. :))

Аля

В качестве гостя была я. Вот ссылка на русский источник.
http://www.dekanat.ru/260104.htm

 И еще старая инфа:
20-летний житель Калифорнии Джейсон Дикман признал себя виновным в незаконном проникновении в компьютерную сеть лаборатории реактивных двигателей НАСА в 1998 году.

X

Там они прикольно объясняли, как выяснилось что ровер отвечает на команды, они его загоняли в SAFE mode  и beep пропадал, и снова  пробуждали - так несколько раз. По тону статью я понял, что причина флеш - они не совсем уверены, что причина талько в нем..

Дальше описано,как они нашли причину, что это флеш, грубо говоря начали перезапускать OC ровера, и последовательно отключать куски софта, и при отключении инициалиазции флеша - у них ровер перестал виснуть (соответсвенно перезапускаться, так как  если программа зависала внешняя схема генерила сброс через определенный промежуток времени).

Они загружают сейчас тест памяти и будут тестировать весь флеш на сбои, а это еще тот геморрой, он 10 раз может протестироваться ОК, а в работе  опять сбоить. Да и с часиками пока непонятно, причем тут флеш и часовые установки, RTC часики сами по себе, а флеш - сам по себе. Сбой часов  возможно произошел от большого кол-ва перезапусков. Второе - тоже непонятно, по файловой системе, не ужели там не было ограничение на кол-во записываеиых файлов или объем, в любой файловой системе это есть. Такое , мне кажется может произойти. когда при большом кол-ве записей они затерли служебные сектора во флеше (но по любому у них должна быть защита), те все что было во флеше, быстрее всего потерялось.

Со среды собираются по частям оживлять ровер, те инициализировать следующие программные модули отвечающие за работу остальных узлов и быстрее всего , программеры сейчас лихорадочно перекапывают исходники всей файловой системы, ну как положено программеры будут гнать на электронщиков, те на программеров и сообща в курилке - на руководство :) Через какое то время найдут неполадки в питании, но так как паяльника под рукой на Марсе нет, урежут исследовательскую часть и со страхом будут ожидать подобных глюков на сестре оппортунити..

frost_ii

Тех. характеристики RAM 128 Mb, CPU PowerPC 20MHz, OS VXWorks

X

И еще поправочка,  у них был вариант оключать флеш в обход софта, вот они им м воспользовались, после чего работа возобновилась.

Motor

ЦитироватьВ качестве гостя была я. Вот ссылка на русский источник.
http://www.dekanat.ru/260104.htm

 И еще старая инфа:
20-летний житель Калифорнии Джейсон Дикман признал себя виновным в незаконном проникновении в компьютерную сеть лаборатории реактивных двигателей НАСА в 1998 году.

Аля, в том "источнике", который Вы привели, в роли одного аналитика выступает некто Ц.И.Олковски. А в роли второго Плер Ке. (Ке Плер).
Вы ничего не замечаете странного?... Спорю, у них скоро появится интервью с каким-нить неофициальным хозяином НАСА с фамилией Кифио. И рассказ о проектах автоматических зондов к полету свежеоткрытой планеты Куриймер. :)

Интересно, кто же у них ведет эту "ленту"?... Большой шутникъ этот человечище...

Motor

ЦитироватьВторое - тоже непонятно, по файловой системе, не ужели там не было ограничение на кол-во записываеиых файлов или объем, в любой файловой системе это есть. Такое , мне кажется может произойти. когда при большом кол-ве записей они затерли служебные сектора во флеше (но по любому у них должна быть защита), те все что было во флеше, быстрее всего потерялось.

Еще возможен вариант, что при монтировании файловой системы этот самый "монтер" подвисал на достаточно большой промежуток времени из-за большого количества файлов. И из-за этого срабатывал watch-dog таймер, про который Вы упомянули. Ну это как бы например.

Вообще, гадать можно долго. Мы же не знаем, что у них там софт делает. По бинарникам бы еще разобрали, а вот по выпускам новостей мне лично реинжиниринг делать слабО. :)

X

Понятно, что по завляением менеджеров (той симпатчиной тете с моделью ровера в руке :)) сложно понять что там на самом деле твориться, но с такими проблемами эмбеддеры сталкиваются на регулярно и на земле, поэтому подходы одинаковые. Например, у нас народ уже рассказывает, что софт к нему писали и отлаживали   в среде  MULTI (от GHS).  Но мне интересн сам каркас построения системы - те софтовая часть на базе RAD6000 и независимый канал от софта, по которому можно по блокам отключать и хотя бы в первом приближении контролировать работу ровера.

sas

73 или сколько то там мегабайт тех. инфы скачали с марса?
Это AI дезертировал!

Гришель Максим


Аля

Это точно не взлом. Я проконсультировалась с одним, вроде профессиональным, хакером.
А женщина -- точно прикольная. Я рада, что такие занимаются космосом.

Marmot

Судя по невнятным мычаниям "прикольной женщины"на последнем брифинге и её глубоко защитной позиции в вопросах об проблемах с софтом, мне кажется они там нашли банальное переполнение буфера в коде который работает с флэшем.
Именно поэтом они говорят о проблемах в RAM при работе с флэшем :-)
Если это действительно так, то тогда и причина первого ресета может стать понятной, т.к., похоже, используется VxWorks без memory protection  :twisted:

X

ЦитироватьСудя по невнятным мычаниям "прикольной женщины"на последнем брифинге и её глубоко защитной позиции в вопросах об проблемах с софтом, мне кажется они там нашли банальное переполнение буфера в коде который работает с флэшем.
Именно поэтом они говорят о проблемах в RAM при работе с флэшем :-)
Если это действительно так, то тогда и причина первого ресета может стать понятной, т.к., похоже, используется VxWorks без memory protection  :twisted:

А мне гораздо больше импонирует версия с нештаным сигналом от руки, который "свел с ума" кампик.

X

ЦитироватьА мне гораздо больше импонирует версия с нештаным сигналом от руки, который "свел с ума" кампик.

Дружеское рукопожатие?