[IA64] fix fls()
authorDavid Mosberger-Tang <davidm@hpl.hp.com>
Thu, 21 Apr 2005 18:07:59 +0000 (11:07 -0700)
committerTony Luck <tony.luck@intel.com>
Thu, 21 Apr 2005 18:07:59 +0000 (11:07 -0700)
commit821376bf15e692941f9235f13a14987009fd0b10
tree2179380ee3eb38fb393719e6ce32b15e934c4a44
parentd8470b7c13e11c18cf14a7e3180f0b00e715e4f0
[IA64] fix fls()

The ia64-version of fls() never worked as intended (the bitnumbering
was off by 1 and fls(0) was undefined).  This patch fixes the problem
by using a popcnt-based fls(), which on McKinley-derived cores is
slightly faster than both ia64_fls() and generic_fls().  The resulting
code, however, is bigger (7-8 bundles instead of about 3 bundles).
Also switch ia64_popcnt() to __builtin_popcountl() for GCC v3.4 or
newer since the compiler can predicate that and schedule it better.

Thanks to Simon Derr and Matt Mackall for tracking down this bug.

Signed-off-by: David Mosberger-Tang <davidm@hpl.hp.com>
Signed-off-by: Tony Luck <tony.luck@intel.com>
include/asm-ia64/bitops.h
include/asm-ia64/gcc_intrin.h