schneller, wie wenn du eine fixed-point-multiplikation in c schreiben würdest. natürlich kann der compiler viel optimieren, aber manchmal ist man von hand einfach schneller... du könntest die ersten beiden operationen auch in assembler schreiben. und lass' das mit mov r1, eax... return r1 weg.