Optimize SwissMap for ARM by 3-8% for all operations

https://pastebin.com/CmnzwUFN The key idea is to avoid using 16 byte NEON and use 8 byte NEON which has lower latency for BitMask::Match. Even though 16 byte NEON achieves higher throughput, in SwissMap it's very important to catch these Matches with low latency as probing on average happens at most once. I also introduced NonIterableMask as ARM has really great cbnz instructions and additional AND on scalar mask had 1 extra latency cycle PiperOrigin-RevId: 453216147 Change-Id: I842c50d323954f8383ae156491232ced55aacb78
author: Abseil Team <absl-team@google.com> 2022-06-06 09:28:31 -0700
committer: Copybara-Service <copybara-worker@google.com> 2022-06-06 09:29:27 -0700
commit: 6481443560a92d0a3a55a31807de0cd712cd4f88 (patch)
tree: b13d0a400f72cc4d0acc3a35f2ff73b2499a127f /absl/container/internal/raw_hash_set_benchmark.cc
parent: 48419595d31609762985a6b08be504ebe6d593e7 (diff)
1 files changed, 7 insertions, 7 deletions
diff --git a/absl/container/internal/raw_hash_set_benchmark.cc b/absl/container/internal/raw_hash_set_benchmark.cc
index 146ef433..47dc9048 100644
--- a/absl/container/internal/raw_hash_set_benchmark.cc
+++ b/absl/container/internal/raw_hash_set_benchmark.cc
@@ -336,27 +336,27 @@ void BM_Group_Match(benchmark::State& state) {
 }
 BENCHMARK(BM_Group_Match);
 
-void BM_Group_MatchEmpty(benchmark::State& state) {
+void BM_Group_MaskEmpty(benchmark::State& state) {
   std::array<ctrl_t, Group::kWidth> group;
   Iota(group.begin(), group.end(), -4);
   Group g{group.data()};
   for (auto _ : state) {
     ::benchmark::DoNotOptimize(g);
-    ::benchmark::DoNotOptimize(g.MatchEmpty());
+    ::benchmark::DoNotOptimize(g.MaskEmpty());
   }
 }
-BENCHMARK(BM_Group_MatchEmpty);
+BENCHMARK(BM_Group_MaskEmpty);
 
-void BM_Group_MatchEmptyOrDeleted(benchmark::State& state) {
+void BM_Group_MaskEmptyOrDeleted(benchmark::State& state) {
   std::array<ctrl_t, Group::kWidth> group;
   Iota(group.begin(), group.end(), -4);
   Group g{group.data()};
   for (auto _ : state) {
     ::benchmark::DoNotOptimize(g);
-    ::benchmark::DoNotOptimize(g.MatchEmptyOrDeleted());
+    ::benchmark::DoNotOptimize(g.MaskEmptyOrDeleted());
   }
 }
-BENCHMARK(BM_Group_MatchEmptyOrDeleted);
+BENCHMARK(BM_Group_MaskEmptyOrDeleted);
 
 void BM_Group_CountLeadingEmptyOrDeleted(benchmark::State& state) {
   std::array<ctrl_t, Group::kWidth> group;
@@ -375,7 +375,7 @@ void BM_Group_MatchFirstEmptyOrDeleted(benchmark::State& state) {
   Group g{group.data()};
   for (auto _ : state) {
     ::benchmark::DoNotOptimize(g);
-    ::benchmark::DoNotOptimize(*g.MatchEmptyOrDeleted());
+    ::benchmark::DoNotOptimize(g.MaskEmptyOrDeleted().LowestBitSet());
   }
 }
 BENCHMARK(BM_Group_MatchFirstEmptyOrDeleted);
author	Abseil Team <absl-team@google.com>	2022-06-06 09:28:31 -0700
committer	Copybara-Service <copybara-worker@google.com>	2022-06-06 09:29:27 -0700
commit	6481443560a92d0a3a55a31807de0cd712cd4f88 (patch)
tree	b13d0a400f72cc4d0acc3a35f2ff73b2499a127f /absl/container/internal/raw_hash_set_benchmark.cc
parent	48419595d31609762985a6b08be504ebe6d593e7 (diff)