Если ТАК переписать - не ускорят.

NOP'ы только для выделения блока, который надо выдирать. По-хорошему его еще надо оптимизировать по полной программе, но не думаю, что ТС будет этим заниматься. Только тогда был бы прирост в скорости.
З.Ы. зачем переписывать весь код? Проще уж сразу на ассемблере писать.
