Подключение к шеллу и выполнение произвольного кода на синтезаторе Yamaha PSR-E433

Время создания: 24.03.2025 18:39

Автор: Анна Антоненко aka Portasynthinca3, перевод Сергей Степанов aka Xintrea

Текстовые метки: yamaha, psr, e433, синтезатор, клавиши, реверсинжиниринг, взлом, JTAG, MIDI, прошивка, шелл, shell, консоль, команды, подключение, USB

Раздел: Музыка - Пианино - Yamaha

Запись: xintrea/mytetra_syncro/master/base/1742830764lxzmbaj9mj/text.html на raw.githubusercontent.com

Ниже сделан перевод статьи, которая размещена на сайте автора psi3.ru.

Это статья о том, как был получен доступ к внутреннему шеллу синтезатора Yamaha PSR E-433. Данный шелл позволяет передавать произвольные данные, размещать их в памяти, а с помощью плясок со стеком можно даже запускать произвольный код прямо внутри синтезатора. Имея такой доступ, автор смог проиграть на алфавитно-цифровой части дисплея мультфильм Bad Apple.

Все, что написано в данной статье - это максимально круто. Исследование произведено на таком уровне, какого нигде больше в интернете найти невозможно. Особенно радует, что человек, судя по домену, русскоговорящий. Перевод делался в тот момент, когда я еще не знал, что автор - девушка. Поэтому повествование ведется от мужского лица. Да и кто вообще мог предположить, что прекрасный пол на такое способен? Живите теперь с этой информацией и ломайте себе мозг: автор - девушка, но пишет как мальчик.

Начинаем!

* * *

Первый в мире шелл-код через MIDI

Я получил удаленное выполнение кода через MIDI-сообщения, чтобы обмануть свой синтезатор и заставить его играть мультфильм Bad Apple на своем ЖК-дисплее. Это запись в блоге о разработке предельно сложного проекта в области обратного инжиниринга.

Введение

У меня уже очень давно есть синтезатор Yamaha PSR-E433, и пару лет назад я решил его вскрыть — отчасти потому, что он нуждался в чистке, а отчасти потому, что мне было очень любопытно узнать о его внутренностях. Открутив несколько винтов и откопав основную плату (с надписью «DMLCD»), я был весьма удивлен, обнаружив два флэш-чипа, один чип ОЗУ и крупный чип с надписью «YAMAHA SWL01U», который, как я предположил, должен был быть мозгом всей системы. Используя этот номер детали, я не смог найти никакой информации о чипе в Интернете, кроме статьи , в которой утверждалось, что он основан на ядре ЦП «SuperH». Такую архитектуру и набор инструкций (ISA) я впервые увидел как раз в этой статье. Поэтому, закончив чистку, я просто собрал синтезатор обратно. Но затем я постоянно стал задумываться о том, что же на самом деле скрывается под капотом у этого таинственного чипа.

DMLCD-плата в естественной среде обитания

Перенесемся на несколько месяцев назад, когда я снова разобрал этот бедный синтезатор – на этот раз чисто из любопытства. То, что вызвало любопытство - это руководство по обслуживанию похожего синтезатора (E443, у меня E433), которое я нашел в сети. В котором, среди прочего, была распиновка этого основного чипа. В руководстве были перечислены описания контактов, настолько заманчивые («TESTN – Тестовый режим», «PROTN – Определяет, является ли продукт прототипом»), что я просто должен был взглянуть на то, что происходит у него внутри. Также было два двунаправленных интерфейса UART, и, взглянув на схему, я увидел, что один из двух передающих контактов никуда не подключен, что предполагает, что чип, возможно, передает какой-то лог через этот контакт. О, и на плате также были аккуратно размечены контрольные точки JTAG – по сути, 5-контактный интерфейс для различных задач тестирования производственной линейки этих CPU-контроллеров и их отладки.

Итак, какие у меня были варианты на тот момент? Я мог:

Поэкспериментировать с контактами TESTN и PROTN и посмотреть, как поведет себя синтезатор;
Подпаяться к контакту UART Tx и посмотреть, что выдает чип;
Подключиться к интерфейсу JTAG и считать идентификационный код чипа;
Отпаять одну из двух микросхем флэш-памяти и скинуть прошивку для последующего изучения.

Давайте начнем с первого подхода. Оба контакта выбора режима загрузки заканчиваются на N. Это говорит о том, что данные контакты активны на низком уровне, то есть сигнал считается активным, когда напряжение близко к нулю, в отличие от шины питания, которая в данном случае составляет 3,3 вольта. Схема гласит, что оба этих контакта подтянуты до 3,3 вольта с помощью резистора, поэтому мы можем просто замкнуть контакты на землю, чтобы активировать их. Именно это я и сделал; к сожалению, оказалось, что активация контакта TESTN просто не дала синтезатору загрузиться, а активация контакта PROTN вообще не изменила поведение синтезатора. Ну, по крайней мере, я его не испортил!

Далее, давайте попробуем взглянуть на интерфейс UART. Тот пин, о котором я говорил, никуда не вел, даже не был контрольной точкой, что означает, что мне пришлось подпаяться напрямую к 0,3-миллиметровому штырьку чипа. И в этот раз успеха не было, так как чип ничего не вывел ни в одной из 4 комбинаций сигналов TESTN и PROTN.

Теперь настала очередь JTAG. Несмотря на то, что следующий вариант (выпаивание флэш-чипа) был довольно пугающим, поскольку он означал, что мне придется построить флэш-дампер (у меня его не было), возиться с JTAG было еще страшнее по другой причине. Дело в том, что JTAG — это довольно абстрактный интерфейс, на основе которого поставщики могут построить все, что захотят. Чтобы общаться с устройством через JTAG, вам нужно иметь подробное описание схемы, которая строится на нем, которое обычно поставляется в виде файла BSDL . По сути, есть только одна команда, которую поддерживает почти каждое устройство, и это чтение IDCODE — 32-битного числа, которое действует как идентификатор типа устройства, с которым вы общаетесь. Давайте подключим J-Link к нашей плате и попробуем прочитать этот идентификационный код с помощью OpenOCD .

$ cat openocd.cfg

# Uh-oh, a continuity error!

# I've switched to an FT232R-based dongle

# instead of J-Link since I took the picture above.

adapter driver ft232r

transport select jtag

adapter speed 5000

$ openocd

Open On-Chip Debugger 0.12.0

Licensed under GNU GPL v2

For bug reports, read

http://openocd.org/doc/doxygen/bugs.html

Info : only one transport option; autoselect 'jtag'

Warn : Transport "jtag" was already selected

adapter speed: 5000 kHz

Info : Listening on port 6666 for tcl connections

Info : Listening on port 4444 for telnet connections

Info : clock speed 3000 kHz

Warn : There are no enabled taps. AUTO PROBING MIGHT NOT WORK!!

Info : JTAG tap: auto0.tap tap/device found: 0x3f0f0f0f (mfg: 0x787 (<unknown>), part: 0xf0f0, ver: 0x3)

Warn : AUTO auto0.tap - use "jtag newtap auto0 tap -irlen 4 -expected-id 0x3f0f0f0f"

Warn : gdb services need one or more targets defined

Ну, это уже кое-что. IDCODE отображается как 0x3f0f0f0f, что подозрительно красиво. Настолько подозрительно, что я трижды проверил свою проводку, но нет, похоже, это настоящий IDCODE устройства, которое после быстрого поиска в Google показалось, что оно принадлежит либо микроконтроллеру STMicroelectonics STR7xxx, либо Atmel SAM7xxx, оба из которых были основаны на ядре ЦП ARM7. Моим единственным вариантом было предположить, что я имею дело с настоящим ядром ARM7TDMI, таким же как и то, на котором основаны эти микроконтроллеры. С другой стороны, неправильное обращение к устройству через JTAG рискует привести к катастрофическим повреждениям, поскольку некоторые реализации интерфейса предоставляют очень низкоуровневый доступ к оборудованию, даже ниже, чем машинный код, который выполняют ядра ЦП. Есть небольшая вероятность выпустить волшебный дым, когда вы неправильно инструктируете устройство на таком низком уровне, если обстоятельства обернутся против вас. В любом случае, я это сделал; Я сообщил OpenOCD, что имею дело с ядром ARM7TDMI, и он с радостью подчинился.

$ cat openocd.cfg

adapter driver ft232r

transport select jtag

adapter speed 5000

jtag newtap swl01u cpu -irlen 4 -expected-id 0x3f0f0f0f

target create swl01u.cpu arm7tdmi -chain-position swl01u.cpu

$ openocd

Open On-Chip Debugger 0.12.0

Licensed under GNU GPL v2

For bug reports, read

http://openocd.org/doc/doxygen/bugs.html

Info : only one transport option; autoselect 'jtag'

Warn : Transport "jtag" was already selected

swl01u.cpu

Info : Listening on port 6666 for tcl connections

Info : Listening on port 4444 for telnet connections

Info : clock speed 3000 kHz

Info : JTAG tap: swl01u.cpu tap/device found: 0x3f0f0f0f (mfg: 0x787 (<unknown>), part: 0xf0f0, ver: 0x3)

Info : Embedded ICE version 1

Info : swl01u.cpu: hardware has 2 breakpoint/watchpoint units

Info : starting gdb server for swl01u.cpu on 3333

Info : Listening on port 3333 for gdb connections

По крайней мере, в этот момент магический дым, на котором работает вся электроника, все еще находился внутри чипа. Я нервно подключился к OpenOCD через GDB и попытался приостановить и возобновить выполнение программы. Я был очень удивлен и взволнован, увидев, как ток, о котором сообщал мой лабораторный блок питания, предсказуемо реагировал на мои команды. Вся печатная плата потребляла около 115 мА при работе, и около 98 мА при паузе, что было очень хорошим признаком того, что я общался с ядром ARM7TDMI! В тот момент у меня не было другого способа проверить, действительно ли останавливается процессор или нет.

Снятие прошивки

Итак, похоже, что мне даже не придется отпаивать флэш-чип, чтобы сдампить прошивку! И я уже знаю, на каком ISA основан чип, так что мне не придется копаться в образе прошивки, чтобы это выяснить! Заглянув в документацию для ARM7TDMI, можно увидеть, что вектор сброса находится по адресу 0, так что давайте посмотрим, какие данные находятся по этому адресу.

(gdb) x/2xw 0 # eXamine 2 heX Words at location 0

0x0: 0xe59ff018 0xe59ff018

(gdb) x/2i 0 # eXamine 2 Instructions at location 0

0x0: ldr pc, [pc, #24] @ 0x20

0x4: ldr pc, [pc, #24] @ 0x24

Запрос GDB на чтение двух инструкций по адресу 0

Да, ладно! Это прыжок, как я и ожидал (безусловный переход сделан путем изменения регистра PC - он же programm counter). Следующая инструкция — это какой-то другой вектор, и это тоже прыжок. Выглядит примерно так.

Прим. переводчика: программный счетчик (регистр PC) в момент выполнения инструкции, в архитектуре ARM, всегда указывает на адрес текущей команды + 8 байт. Да, вот такая странная особенность, связанная с конвеерной обработкой команд. Это поведение сохраняется и в ARM-режиме (32-х битные инструкции) и в Thumb-режиме (16-битные инструкции). Команда ldr pc, [pc, #24], расположенная начиная с нуливого адреса, будет загружать в регистр PC значение, лежащее по адресу 0 + 8 + 24 = 32 (дес.), что равнозначно адресу 0x20. Следующая, точно такая же команда, будет считывать значение с адреса 0x24, так как в формуле первый ноль (текущий адрес команды) заменяется на 4. До адреса 0x20 может разместиться только 8 команд длинной в 4 байта. Таким образом, эта таблица переходов содержит не более 8 векторов переходов.

Да, мы определенно на правильном пути! Я знаю размер флэш-чипа (16 Мбайт), так что давайте просто выгрузим 16 Мбайт данных, начиная с адреса 0, в файл, загрузим его в Cutter и посмотрим, какие секреты он содержит.

Я очень неопытен в области обратного проектирования, но одно я знаю точно: текстовые строки — это кладезь легко извлекаемой информации о программном обеспечении. Вот почему первое, что я делаю, начиная проект по RE (реверс-инжинирингу) — просматриваю раздел «Строки» в инструменте RE. Этот проект не стал исключением, и я был очень рад увидеть такие строки, как:

“This code can only run on a Thumb compatible processor” - Этот код может работать только на процессоре, совместимом с Thumb
“Illegal address (e.g. wildly outside array bounds)” - Недопустимый адрес (например, сильно выходящий за пределы массива)
“Abnormal termination (e.g. abort() function)” - Ненормальное завершение (например, функция abort()

и самое главное:

“SWL01U Internal” - Внутреннее состояние SWL01U

Секция строк в Cutter

Что мне не понравилось, так это то, как несколько строк, которые были в полученном образе памяти, повторялись каждые 64 КБ. Так, например, строка «SWL01U Internal» содержалась по адресам 0x0000bfd0, 0x0001bfd0, 0x0002bfd0 и так далее. И это повторение (вероятно, вызванное примитивной конструкцией декодера адреса внутри чипа), и сама эта строка намекали на то, что я взял дамп какой-то памяти внутри самого чипа, а не одного из внешних флэш-чипов, как я изначально представлял. Я пришел к выводу, что этот чип SWL01U содержит 64 КБ ПЗУ.

Инструкция в векторе сброса была переходом на адрес 0x02000000, который, как я думал, на самом деле мог быть внешним флэш-чипом на этот раз. Я снова сделал 16-мегабайтный дамп, начиная с этого адреса, и был рад, что на этот раз не нашел никаких повторений. Кроме того, я заметил большое количество строк, которые я мог распознать только с помощью синтезатора, например, «GrandPno», «Tr1 will be OverWritten!» и «BogiWogi».

Итак, что мы знаем на данный момент? Мы знаем, что сам чип содержит 64-килобайтное ПЗУ, которое сразу же передает управление внешнему 16-мегабайтному флэш-чипу при запуске. ПЗУ находится по адресу 0x00000000, а флэш начинается с 0x02000000. У нас есть дампы обеих памятей, и теперь мы можем начать реверс прошивки этого синтезатора, чтобы, как мы надеемся, получить больше информации о его основном чипе.

Разбор прошивки

После того, как я около часа смотрел на образ флэша в Cutter, мне стало совершенно очевидно, что этот инструмент обратного инижиниринга просто не справляется со своей задачей, и что мне нужно заменить его на что-то более мощное. Я рад сообщить, что Ghidra оправдала все мои ожидания.

Теперь нам нужно немного пофилософствовать. В моих глазах RE похожа на игру в сапера. Вы начинаете с пустого поля, не зная состояния ни одной из ячеек, то есть не зная, содержит ли каждая отдельная ячейка мину или нет. Когда вы обнаруживаете состояние ячейки, у вас есть контекст, чтобы вывести состояние соседних ячеек. В игре «Сапер» у вас нет определенного направления, в котором вы двигаетесь. Вы никогда не говорите: «В этой игре в сапер я хочу идти вверх, несмотря ни на что», вы просто позволяете числам подталкивать вас в направлении, в котором легче всего идти в данный момент. Я утверждаю, что это также верно для RE. Как только вы узнаете, что делает функция или переменная, вы внезапно немного больше понимаете о функциях и переменных, которые зависят от тех, чье значение вы только что вывели. Может быть полезно не ставить какую-либо конкретную цель в проекте RE, а вместо этого позволить сложной сети переплетенных функций и переменных направлять вас к пониманию системы в целом.

Итак, с чего начать? Прямо сейчас у нас есть две точки входа, с которых мы можем начать разбирать прошивку: вектор сброса и текстовые строки. Я попробовал обе, просто проводя ночь за ночью, изучая каждую следующую функцию на основе новых идей, полученных при изучении предыдущей. Этот процесс не очень захватывающий для наблюдения со стороны, поэтому я не чувствую необходимости возвращаться и описывать свои шаги здесь. Это просто цепочка простых логических выводов, которые распространяются по кодовой базе. Как те маленькие флажки, расставляющиеся по полю в игре «Сапер».

В прошивке есть одна подсистема, о которой, как мне кажется, стоит упомянуть, поскольку она играет важную роль во всей этой истории с «Bad Apple»: Shell. Пока я копался в разделе «Defined Strings» Ghidra, я заметил кластер из нескольких строк, которые выглядели так, будто это был какой-то список команд для какой-то оболочки:

Строки «help», «?», «info», «ver» в адресах, которые находятся близко друг к другу

В RE центральное место занимают так называемые «xrefs» (перекрестные ссылки). Когда вы смотрите на символ (функцию или глобальную переменную), xrefs сообщают вам, какие другие символы используют (ссылаются) на символ, на который вы смотрите. На снимке экрана выше большинство наших строк имеют одну xref. Давайте проследим за каждой из них и посмотрим, куда они нас приведут:

Последовательность ссылок

Здесь мы видим последовательность пар ссылок, где первый элемент в паре всегда является именем команды, а второй элемент — указателем на некоторую функцию. Только первый элемент в этой последовательности ссылается напрямую, что наводит меня на мысль, что это обычный массив в языке Си из Си-структур, состоящих из двух членов. Давайте дадим название этому массиву, чтобы, когда мы встретим эту переменную, используемую где-то в будущем, мы бы сразу поняли, что это такое.

Давайте теперь посмотрим на код. Обычные программы (например, файлы .exe или ELF) состоят из разделов с четкими обозначениями того, какие данные они содержат. Например, раздел .text содержит исполняемый код, а раздел .rodata содержит данные только для чтения, которые требуются коду. К сожалению, встроенные системы обычно не используют эти файлы, а вместо этого сбрасывают код и данные в одну большую кучу. Это также означает, что нет абсолютно никакой надежды на восстановление имен и местоположений переменных и функций (именуемых обычно символами). Без метаданных символов поток инструкций — это просто поток байт. К счастью для нас, Ghidra была запрограммирована, по крайней мере, распознавать границы большинства функций, что она, как правило, делает очень хорошо.

Так как я впервые имел дело с ARM-ассемблером, функция декомпилятора C в Ghidra оказалась для меня очень полезной. К сожалению, из-за полного отсутствия отладочных символов, ее вывод все еще довольно сложен для обработки. Взгляните на эту функцию, которая ссылается на массив, который мы рассматривали ранее. Не вчитывайтесь в нее, просто просмотрите:

void FUN_02022008(char *param_1)

{

int *piVar1;

char cVar2;

int iVar3;

char *pcVar4;

undefined4 *puVar5;

if (DAT_060078c6 == '\0') {

iVar3 = FUN_020214e0(param_1,(char *)0x20bdf3c);

if (iVar3 == 0) {

FUN_02021f9c();

DAT_060078c6 = '\x01';

}

else if (DAT_060078c6 == '\x01') {

iVar3 = FUN_020214e0(param_1,"#0000");

if (iVar3 == 0) {

FUN_02021fb4();

DAT_060078c6 = '\x02';

}

else {

FUN_020213f8((byte *)0x2022098);

DAT_060078c6 = '\0';

}

else {

puVar5 = (undefined4 *)0x20bdf48;

do {

pcVar4 = (char *) FUN_02021528(param_1,*puVar5);

if (pcVar4 != (char *)0x0) {

cVar2 = *pcVar4;

while (cVar2 == ' ') {

pcVar4 = pcVar4 + 1;

cVar2 = *pcVar4;

}

jump_to_1(pcVar4,puVar5[1]);

return;

}

piVar1 = puVar5 + 2;

puVar5 = puVar5 + 2;

} while (*piVar1 != 0);

FUN_02021fe8();

}

return;

}

Необработанный вывод декомпилятора C

Как я уже сказал, поскольку Ghidra не имеет абсолютно никакой информации о типах или символах, полученный код на C — это не то, что вы обычно пишете в своих исходниках. Функции и глобальные переменные не имеют осмысленных имен и вместо этого ссылаются на них по их адресам. Локальные переменные также не имеют осмысленных имен, и они ограничены всей функцией, а не каким-либо конкретным блоком. Иногда Ghidra думает, что что-то является локальной переменной, когда на самом деле это лучше представить как временный результат выражения. Это абсолютно не вина инструмента: вся эта информация, которая делает код простым для понимания, стирается при его компиляции, и структурная информация о символах удаляется.

Понимание подобного "тяжело обработанного кода" — вот что так сложно в RE, и это одна из тех вещей, которым можно научиться, долго с работая с подобными объектами. С этого момента, ради ясности, я буду представлять вам очищенный код на языке Си только после того, как разберусь в нем. В любом случае, мы явно имеем дело с неким конечным автоматом. Обратите внимание на общую структуру этой функции:

void function() {

if(global_var == 0) {

if(/* условие */)

global_var = 1;

} else if(global_var == 1) {

if(/* условие */)

global_var = 2;

else

global_var = 0;

} else {

if(/* условие */)

global_var = 0; // performed by a subordinate function

else

action();

}

Есть два состояния, в которых функция делает очень мало, и одно состояние, в котором функция делает много. Судя по строкам, на которые ссылаются первые два состояния (это строки «login» и «Passwd Error»), эта функция реализует некий интерфейс входа и позволяет нам выполнять команду только если мы вошли в систему. Функция всегда вызывается только одной другой функцией, поэтому давайте проверим ее:

void FUN_020220f0(void) {

while(global_var_1 != global_var_2) {

char ch = global_var_3[global_var_1];

global_var_1 = global_var_1 + 1 & 0xff;

yet_unknown_function(ch); // изменение global_var_4

if(ch == '\r') {

function_from_before(global_var_4);

global_var_5 = 0;

}

Эта функция пробегает по какому-то буферу и вызывает другую функцию для каждого символа, который она извлекает из буфера, и вызывает только функцию, которую мы рассматривали в предыдущем абзаце, для каждого символа '\r' (возврат каретки). Более того, буфер, похоже, является кольцевым размером 256 байт. Давайте назовем некоторые переменные и функции на базе того, (как я думаю), что они делают, основываясь на этих новых идеях:

void shell_process_input(void) {

while(shell_input_buf_r != shell_input_buf_w) {

char ch = shell_input_buf[shell_input_buf_r];

shell_input_buf_r = shell_input_buf_r + 1 & 0xff;

shell_feed_char(ch); // манипуляции с shell_command_buffer

if(ch == '\r') {

shell_run_command(shell_command_buffer);

shell_edit_position = 0;

}

Функция «shell_process_input»

Давайте еще раз назовем некоторые переменные и вернемся к нашей функции «shell_run_command», на этот раз с еще большим количеством обозначений (я пропустил большинство скучных и простых символов):

void shell_run_command(char* command_input) {

if (shell_login_state == 0) {

if (shell_compare_command(command_input, "login") == 0) {

shell_ask_passwd(); // prints "passwd? "

shell_login_state = 1;

}

} else if (shell_login_state == 1) {

if (shell_compare_command(command_input, "#0000") == 0) {

shell_login_ok(); // prints "login OK"

shell_login_state = 2;

} else {

shell_print("Passwd Error\r");

shell_login_state = 0;

}

} else {

// actually run the command

}

Функция “shell_run_command”

Если мы углубимся в функцию shell_print, то увидим множество пока неизвестных передач данных в глобальные переменные. На эти глобальные переменные ссылаются другие части кода (как во флэш-памяти, так и во внутреннем ПЗУ), которые записывают данные в загадочные адреса, расположенные по адресу 0xfxxxxxxx, который, как я предполагаю, является областью памяти, используемой для связи с различными периферийными устройствами внутри чипа.

Итак, что мы знаем об этом шелле?

Он не будет реагировать на наши команды, пока мы не скажем «логин» и не введем пароль «#0000»;
Он имеет довольно ограниченный набор команд и потенциально неинтересен;
Мы до сих пор не знаем, как получить доступ к этой оболочке.

Давайте перечислим потенциальных кандидатов на различные интерфейсы, поверх которых может работать эта оболочка:

UART. Существует два документированных интерфейса UART. Согласно схеме, оба приемных контакта и один из двух передающих контактов используются как GPIO, а другой передающий контакт ничего не делает (помните предыдущий раздел?).
USB. На этом синтезаторе есть два USB-интерфейса: один — интерфейс устройства, реализованный самим чипом SWL01U, а другой — интерфейс хоста для подключения флеш-накопителей и т. п., реализованный внешним чипом контроллера хоста. Если оболочка работает поверх одного из них, то это, вероятно, интерфейс устройства, а не хоста. Однако, если мы подключим синтезатор к ПК и запустим «lsusb», чтобы сбросить его USB-дескриптор, мы увидим, что у него нет ничего, кроме MIDI , интерфейса, широко используемого в музыкальной индустрии для передачи различных музыкальных сообщений, таких как события «note on» и «note off». Никаких последовательных портов или чего-то подобного.
JTAG. В документации к ARM7TDMI говорится, что его реализация JTAG включает в себя то, что ARM называет DCC , что позволяет программе, работающей на чипе, и внешней отладочной плате обмениваться пользовательскими данными. Он двунаправленный и, таким образом, может быть очень хорошо использован для оболочки. Доступ к DCC осуществляется через специальные инструкции передачи данных сопроцессора (MCR и MRC) в 32-битных словах.

Если это UART, то он определенно недоступен на нашем варианте платы, но тем не менее код не должен сильно изменять данные, которые он хочет отправить, поскольку UART работает на уровне байтов. Если это USB, то он должен работать поверх MIDI и, таким образом, должен манипулировать данными таким образом, чтобы их можно было отправить по MIDI тем или иным способом. Если это JTAG, то он должен работать поверх DCC и должен использовать специальные инструкции, которые обращаются к DCC. Давайте подробнее рассмотрим, как именно наша функция shell_print "искажает" данные:

void shell_print(char* data) {

// Копирование 8-байтного заголовка пакета

memcpy(global_var_1, global_var_2, 8);

global_var_1[24] = 0xf7;

// process data in 8-byte blocks first

for(size_t i = strlen(data); i >= 8; i -= 8) {

char ch = *(data++);

for(int j = 0; j < 8; j++) {

global_var_1[8 + (j * 2)] = ch >> 4;

global_var_1[8 + (j * 2) + 1] = ch & 0xf;

}

pass_on_to_next_stage_of_printing(global_var_1, 25);

}

// process the tail

size_t tail_size = 8;

for(int i = 0; *data; i++) {

char ch = *(data++);

global_var_1[8 + (i * 2)] = ch >> 4;

global_var_1[8 + (i * 2) + 1] = ch & 0xf;

tail_size += 2;

}

global_var_1[tail_size] = 0xf7;

tail_size++;

pass_on_to_next_stage_of_printing(global_var_1, tail_size);

}

Обзор функции «shell_print»

Кажется, она разбивает каждый байт данных на два 4-битных полубайта и оборачивает каждый из них в свой собственный байт. Каждый блок данных, который она передает на следующий этап в этом конвейере передачи данных, начинается с тех же 8 байт данных, за которыми следует полезная нагрузка, и наконец заканчивается байтом 0xf7. Давайте используем GDB, чтобы посмотреть, что это за постоянные 8 байтов (т. е. какой постоянный заголовок пакета хранится в global_var_2):

(gdb) x/8xb 0x06000000 # eXamine 8 heX Bytes at location 0x06000000

0x6000000: 0xf0 0x43 0x73 0x01 0x52 0x19 0x00 0x00

GDB читает 8 байт в "global_var_2"

В целом пакет оболочки, содержащий строку «>», выглядит следующим образом:

F0 43 73 01 52 19 00 00 03 0E 02 00 F7

└──────────┬──────────┘ └─┬─┘ └─┬─┘ ├┘

│ │ │ │

│ │ │ ╰── fixed footer

│ │ ╰────── the character “ ”

│ ╰──────────── the character “>”

╰─────────────────────────── fixed header

Пакет оболочки, соответствующий строке « >»

Вот некоторый контекст для тех из вас, кто не знает, как работает MIDI. MIDI — это действительно простой протокол, который появился в 80-х годах и по сей день позволяет различным цифровым музыкальным инструментам взаимодействовать, отправляя и получая сообщения, такие как «Пожалуйста, сыграйте ноту C#4 с громкостью 40 из 127», или «Пожалуйста, установите уровень реверберации на 14 из 127», или «Это тик. Предположим, что период времени между текущим и последним тиком соответствует 1/24 четвертной ноты». В MIDI есть несколько различных типов сообщений, но их было недостаточно, чтобы описать все аспекты генерации звука, поэтому они ввели специальное сообщение, называемое системным эксклюзивным сообщением, или просто SysEx. Как гласит спецификация, «Этот тип сообщения позволяет производителям создавать собственные сообщения».

Сообщение SysEx, определенное спецификацией MIDI

Итак... это было MIDI, верно? Каждое сообщение SysEx начинается с байта 0xf0 (как и наши пакеты оболочки), за которым следуют 1 или 3 байта идентификатора производителя, затем полезная нагрузка, наконец, заканчивающаяся байтом 0xf7 (опять же, как и наши пакеты). Полезная нагрузка SysEx может содержать только байты, в которых MSB равен 0, потому что MIDI использует MSB для различения байтов команды и данных: 1 означает, что это команда, а 0 означает, что это данные, связанные с последней командой — именно поэтому «shell_print» разрезает байты на 4-битные полубайты. Давайте посмотрим на первый байт данных, который отправляет синтезатор (0x43), и посмотрим, какому производителю он соответствует.

Ассоциация производителей MIDI заявляет, что идентификатор 0x43 присвоен Yamaha

Так что да, эти сумасшедшие сделали оболочку, которая работает поверх MIDI SysEx сообщений поверх USB. Очень круто. Давайте приготовим скрипт Python, который будет работать как слой перевода между терминалом и этим извращенным протоколом оболочки синтезатора и попробуем поговорить с ним.

# Наш ввод помечен красным, а ответ синтезатора - синим

passwd? #0000

> help

logout

help

info

ver

stack

perf-on

perf-off

perf-disp

d xxxxx

d/s xxxxx

m ADDRESS DATA

m/b ADDRESS DATA

m/w ADDRESS DATA

m/l ADDRESS DATA

> info

DevelopName PSR-E433

DevelopNumber #3341

Main DevelopNumber #3341

Make data & time MAY 16 2012 19:00:57

J/E Select English

Наш первый разговор с MIDI-оболочкой синтезатора

Это необычайно круто! Я не ожидал, что это сработает, так как есть вероятность, что формат входящих сообщений отличается от формата исходящих. К счастью, это оказалось не так. Хотя должен сказать, что доступные команды довольно скучны. Помимо стандартной справки и информации о версии, самые интересные команды, которые у нас есть, — это произвольные команды чтения/записи памяти. Так что, если мы действительно хотим, мы можем теперь просто заглянуть и потыкать память синтезатора через MIDI. И для этого нам не нужен JTAG!

Шеллкод

Теперь, что мы можем сделать с произвольными командами чтения/записи памяти? Мы могли бы внедрить исполняемый код в оперативную память, но мы никогда не смогли бы выполнить его. Верно? Неверно! Если мы перезапишем стек вызовов программы, мы можем обмануть синтезатор и заставить его выполнить код, как только закончится обработка команды (видимо, автор имел в виду конец обработки функции). Это бинарная эксплуатация 101, за исключением того, что нам не нужно находить какие-либо уязвимости переполнения буфера, ибо команды изменения памяти есть прямо в шелле!

Давайте в начале поговорим о скорости передачи данных. Наша 32-битная команда записи в память имеет вид «m/l AAAAAAAA DDDDDDDD\r» (суффикс l, видимо обозначает long вместо более привычного dword), где A и D — адрес и данные соответственно, выраженные в шестнадцатеричном формате. Каждый байт команды преобразуется в два байта, содержащих 4-битные полубайты исходного байта. Он также расширяется 9 дополнительными байтами сообщения SysEx. Затем каждые 3 байта оборачиваются в 4-байтовый пакет USB-MIDI. В общей сложности, если мы хотим записать 4 байта в память, нам нужно отправить синтезатору 72 байта, что в 18 раз больше полезной нагрузки. Но это еще не все! Синтезатор прочитает нам команду обратно, причем каждый отдельный символ будет аккуратно упакован в свою собственную передачу SysEx, и завершит ее приглашением «>». В общей сложности мы и синтезатор обмениваемся 396 байтами, что почти в 100 раз больше 4-байтовой полезной нагрузки! Эта низкая эффективность передачи данных определенно проявляется и станет проблемой, если мы когда-нибудь захотим отправить большие объемы данных.

Я нашел область ОЗУ, которая, похоже, ничем не используется и, таким образом, может быть безопасной для помещения туда произвольных данных. Давайте напишем небольшой фрагмент ассемблера, который любезно попросит прошивку вывести «HeloWrld» на 8-символьную текстовую часть ЖК-дисплея:

# Сообщите ассемблеру, по какому адресу будет размещаться эта программа.

# В данном случае это не обязательно, но рекмендуется всегда указывать:

.org 0x06002900

# Функция "write_str" находится в прошивке.

# Мы хотим вежливо попросить ее что-то напечатать.

# Сначала загружается адрес этой функции в регистр:

ldr r1, write_str

# Затем загружается адрес строки в другой регистр:

adr r0, str

# Помните, что мы прервали нормальный процесс выполнения,

# перезаписав стек? Но еще нам нужно каким-то образом перейти

# к тому коду, который изначально планировался выполниться

# прошивкой, как только мы закончим исполнять свою "вставку".

# Давайте заставим вызываемую нами функцию сделать это за нас!

# Большинство функций (и write_str не является исключением)

# ожидают вызова с помощью команды "bl" (Branch and Link),

# которая помещает обратный адрес в специальный регистр,

# называемый регистром ссылки (lr).

# Если мы сами вначале зададим lr и просто перейдем к функции,

# она вернется на заданный нами адрес.

ldr lr, return

# Вызов функции write_str:

bx r1

# Data definitions

write_str: .word 0x2086ed5

return: .word 0x02021a7b

str: .asciz "HeloWrld"

# Padding so that the size of our program is even

.byte 0

Наша первая программа Hello World

Значения write_str и return получены из исследования прошивки.

Давайте напишем скрипт на Python, который берет наш собранный фрагмент, преобразует его в команды записи в память и отправляет их через MIDI на синтезатор, после чего выполняет еще одну запись в область стека, чтобы обмануть прошивку и заставить ее запустить этот фрагмент.

ЖК-дисплей с надписью «HeloWrld»

Мне потребовалось несколько попыток, чтобы сделать это правильно, но, в конце-концов это работает! Хорошая часть данного хака в том, что он не зависит от каких-либо специальных интерфейсов, таких как JTAG или UART. Если бы мы захотели, мы могли бы записать эти сообщения в MIDI-файл и воспроизвести его на синтезаторе, как любой другой MIDI-файл. Эй, это дает мне идею...

Дамы и господа, представляю вам: первый в мире MIDI-шеллкод!

Токката и фуга ре минор с изюминкой

Вот файл MIDI на случай, если вы захотите сделать то же самое с Yamaha PSR-E433, работающим под управлением прошивки версии 1.02.

ВНИМАНИЕ! НЕ воспроизводите этот файл MIDI на ЛЮБОМ другом устройстве Yamaha или на PSR-E433, работающем под управлением другой версии прошивки, так как он будет вести себя непредсказуемо! Вас предупредили.

Bad Apple

Отображение графики оказалось намного, намного, намного сложнее, чем отображение текста. Сначала давайте посмотрим на техническое описание нашего контроллера ЖК-дисплея (ML9040A), чтобы решить, возможно ли это вообще с аппаратной точки зрения. Оказывается, не совсем — он может обрабатывать только текстовые символы на точечной матрице. Наш ЖК-дисплей определенно имеет рабочую область с точечной матрицей, и у него также есть часть для нотной записи, 7-сегментная часть посередине, еще одна 7-сегментная часть справа, и часть аккордовой записи под ней, и, наконец, область с фортепианной клавиатуры в самом низу экрана.

ЖК-дисплей Yamaha PSR-E433 со всеми включенными сегментами

Как, интересно, прошивка подсвечивает все эти сегменты, если контроллер формально поддерживает только текст? Давайте рассмотрим структурную схему нашего контроллера дисплея.

Внутренняя структурная схема ML9040A

Здесь видно три важных вещи:

ОЗУ данных дисплея (DDRAM) заполняется хостом (в данном случае SWL01U) для изменения текста, отображаемого на дисплее. Хост никогда не записывает изображение, которое он хочет, чтобы контроллер отобразил; вместо этого он отправляет его в виде простого старого ASCII (с некоторыми дополнительными символами), а контроллер отвечает за перевод ASCII в изображение, которое может быть отображено на точечной матрице.
ПЗУ генерации символов (CGROM) — это то, что фактически выполняет перевод кода ASCII в изображение символа. ПЗУ — это простая таблица поиска. Она выдает графический шаблон, который должен отображаться в определенной строке для формирования внешнего вида символа.
Оперативная память генерации символов (CGRAM) позволяет хосту определять до 8 пользовательских символов, которые можно вызывать с помощью кодов символов от 0 до 7 или от 8 до 15.

CGRAM — это то, с помощью чего синтезатор отображает нетекстовые данные, и то, что мы можем использовать для отображения пользовательской графики на точечной матрице ЖК-панели. Давайте используем фрагмент ассемблера из предыдущего примера, чтобы отобразить 8 пользовательских символов в области точечной матрицы.

ЖК-дисплей, отображающий 8 пользовательских символов

Нет, это не мусор. Когда я нажимаю клавишу на фортепианной клавиатуре, в области точечной матрицы загораются две точки, которые соответствуют ноте в области нотации и номеру клавиши в области клавиатуры. Когда я отпускаю клавишу, эти сегменты гаснут. Это подтверждает, что прошивка манипулирует CGRAM, чтобы отображать свои данные в области точечной матрицы.

В череде бесчисленных бессонных ночей копания в прошивке, я обнаружил функцию, которая отправляет произвольные данные на контроллер LCD. Давайте напишем еще один фрагмент ассемблерного кода, который использует эту функцию для загрузки некоторых пользовательских данных в CGRAM.

# ----- 8< -----

# Мы собираемся вызывать эту функцию несколько раз

ldr r4, lcd_write

# Режим 0x40 означает "Set CGRAM write address to 0"

mov r0, #0x40

mov lr, pc

bx r4

# Отправка проверочного "шахматного" паттерна (64 bytes)

mov r5, #0

ldr r0, checker_pattern

fill_loop:

# Отправка данных

push {r0}

mov lr, pc

bx r4

pop {r0}

# Инвертирование паттерна для следующей линии

eor r0, r0, #0xff

# Обработка цикла

add r5, r5, #1

cmp r5, #64

bne fill_loop

# ----- 8< -----

# Функция расположена в прошивке

lcd_write: .word 0x02020ac9

# Значение 0x4000 сообщает функции, что мы отправляем данные, а не команду

checker_pattern: .word 0x4055

Загрузка данных в CGRAM

Когда я запускаю этот фрагмент, я определенно вижу, что данные, которые я хочу отобразить (в данном случае, клетчатый узор), на самом деле отображаются в области точечной матрицы. Однако они быстро заменяются тем, что синтезатор хочет отобразить в пользовательской области. Мы определенно не можем воспроизвести видео с этим; нам нужно найти способ отключить часть прошивки, отвечающую за обновление CGRAM. Один из способов сделать это — найти функцию, отвечающую за это (что я уже сделал), и просто заменить ее немедленным возвратом, заставив ее ничего не делать. Проблема в том, что для этого мне нужно перезаписать флэш-чип синтезатора, чего я не хочу делать из-за страха его испортить. Я специально намеревался сделать каждый свой эксперимент мгновенно обратимым с помощью выключения питания, что означает, что я позволяю себе только манипулировать оперативной памятью.

Я помню, как заметил, что эта прошивка запускает что-то вроде примитивной RTOS (ОС реального времени), некоторые части которой содержатся в (перезаписываемом?) ПЗУ чипа SWL01U. Во флэш-памяти есть набор постоянных глобальных переменных, которые определяют функции обратного вызова для задач, а также их стеки и другие атрибуты, значение которых я не мог понять. Итак, если бы мы могли а) выяснить, какая из этих 64 задач отвечает за постоянное обновление CGRAM, и б) найти способ перезаписать соответствующую запись в таблице задач так, чтобы она указывала на функцию-пустышку, мы могли бы эффективно отключить эту часть прошивки.

Ключ к этой головоломке заключается в том, что ПЗУ и флэш-память связаны очень слабо. При запуске, прошивка во флэш-памяти сообщает ПЗУ где находится ее таблица задач, и ПЗУ запоминает эту информацию в глобальной переменной, расположенной во встроенной SRAM. Если мы сделаем копию этой таблицы задач в ОЗУ, а затем сообщим ПЗУ, что таблица задач перемещена в новое место, мы можем заставить его использовать эту новую таблицу, которую мы можем изменить мгновенно обратимым образом. Так я и сделал! Я выяснил, какая задача отвечает за обновление дисплея, и заменил ее обратный вызов на обратный вызов задачи бездействия по умолчанию, фактически предотвращая постоянное обновление CGRAM контроллера дисплея прошивкой.

Первая итерация вывода кадров мультфильма имела некоторые артефакты, но самая большая проблема была в том, что частота кадров получилась очень низкая. Причина этого в чрезвычайно низкой эффективности передачи данных, о которой я говорил. Даже если мы загрузим исполняемый фрагмент один раз и заменим его раздел данных только тогда, когда мы хотим отобразить новый кадр, это все равно будет 6732 байта переданных данных на 70 байт полезной нагрузки (64 байта данных CGRAM плюс перезапись 32-битного адреса возврата). И оказывается, что эти передачи действительно медленные, что в нашем случае и приводит к низкой частоте кадров.

Два самых больших фактора, способствующих этой низкой эффективности полезной нагрузки: а) тот факт, что эти данные должны быть упакованы в команду, и б) то, что синтезатор считывает команду обратно символ за символом в этих огромных пакетах. Если бы мы могли снова манипулировать таблицей задач, чтобы назначить наш собственный обратный вызов для задачи оболочки, мы могли бы захватить необработанные данные и выбрать не отвечать ничем, что устранило бы обе эти проблемы. Это, вместе с другой оптимизацией упаковки, снижает общий размер передачи на кадр с 6732 байт до 92 байт — уменьшение в 73 раза! Артефакты все еще есть, но теперь мы можем воспроизводить видео с приемлемой частотой кадров.

Что вызывает эти артефакты? Синтезатор использует одни и те же 8 линий GPIO как для общения с дисплеем, так и для сканирования кнопок панели и для управлением светодиодами. Одна из задач отвечает за переплетение доступа к ЖК-дисплею со сканированием панели, и иногда, когда мы передаем наши данные на ЖК-дисплей, не зная об этой задаче, она решает прервать нас и выполнить сканирование панели, что портит линии данных, которые дисплей в данный момент активно слушает, что и вызывает эти артефакты. Чтобы избежать этого, мы могли бы прекратить общение с дисплеем напрямую и вместо этого вежливо попросить эту задачу мультиплексирования отправить нужные нам данные, как только она закончит сканирование панели.

По итогу, алгоритм отображения видео на ЖК-дисплее этого синтезатора по MIDI-протоколу следующий:

Войти в оболочку;
Записать исполняемый код в оперативную память, используя команды записи в память, предоставляемые оболочкой;
Выполнить исполняемый код из ОЗУ, перезаписав адрес возврата в стеке;
Сделать копию таблиц задач в оперативной памяти;
Закрепить эти новые таблицы так, чтобы они были направлены друг на друга;
Сообщить ПЗУ использовать наши новые таблицы задач;
Заменить обратный вызов задачи отображения на обратный вызов бездействия по умолчанию;
Заменить обратный вызов задачи оболочки на наш собственный обратный вызов;
В этом обратном вызове распаковываются данные, поступающие по MIDI, и передаются в задачу мультиплексирования дисплея/панели;
Передавать видеокадры нашего мультфильма в синтезатор по MIDI.

Этот проект еще не совсем завершен. У меня очень ограниченное понимание региона MMIO для SWL-чипа (Memory Mapped I/O) и абсолютно никакого понимания его самой интересной части - DSP, которая отделена от основного ядра ARM. Оставайтесь на связи, я попробую разобраться с этими вещами.

Ссылки

Этот проект на GitHub
Спецификация MIDI
Таблица распределения идентификаторов MIDI SysEx
Спецификация USB-MIDI
Техническое справочное руководство ARM7TDMI
Архитектура синтезаторов Yamaha начального уровня

Так же в этом разделе:

MyTetra Share v.0.67