Смотрим RM008. Это на STM32F10x. Ядро Cortex-M3.
Спойлер

Читаем оттуда же.
ICode bus This bus connects the Instruction bus of the Cortex®-M3 core to the Flash memory instruction interface. Prefetching is performed on this bus.
Т.е. у таких МК шина Icode не имеет доступ к SRAM.
Обращаем внимание, что чтение флеша происходит через буфер FLITF, который читает сразу 2х64 бит, т.е. четыре 32 битных слова. Это должно ускорять процесс чтения.
Цитата из книги Trevor Martin_The Insiders Guide to the STM32 ARM Based Microcontroller
Несмотря на то, что программный код может загружаться и исполняться изSRAM, команды в таком случае будут извлекаться с использованием системной шины, что приводит к дополнительным задержкам. И вероятнее всего код будет исполняться медленнее изSRAM, чем из встроеннойFlash памяти, расположенной в области для программного кода.
Это он про Cortex-M3.
Кроме того, мне где-то еще попадалась информация, что код из ОЗУ выполняется медленнее. Не помню где блин.
------------------------------------------------------------------------------------------------
Вы привели в пример STM32f407. Я с ним не работал. Это уже Cortex-M4.
Гляжу RM009.
Цитату Вашу дублировать не буду. Смотрим сразу картинку.
Спойлер

Действительно получается I-bus тут "достает" до ОЗУ.
НО!!! Шина ICode и Dcode подключены ко флеш через некий акселератор. Если ничего не напутал, то вот цитата про него
To release the processor full performance, the accelerator implements an instruction
prefetch queue and branch cache which increases program execution speed from the 128-bit Flash memory. Based on CoreMark benchmark, the performance achieved thanks to the ART accelerator is equivalent to 0 wait state program execution from Flash memory at a
CPU frequency up to 180 MHz.
Т.е. ноль времени простоя при чтении флеша. Куда еще быстрее?
------------------------------------------------------------------------------------------------
На данный момент моих знаний, делаю вывод. Выполнение кода в ОЗУ не будет быстрее, но может быть медленее. Конечно это нельзя говорить за все контроллеры.
------------------------------------------------------------
Сегодня может попробую сделать тестовый код и поробовать его на STM32F103 (другого у меня нет). Если сделаю, то результат выложу само собой.
Если есть желание, то можете и Вы попробовать на своем МК.