Pull the latest updates from trunk

author: Benoit Steiner <benoit.steiner.goog@gmail.com> 2016-10-05 14:54:36 -0700
committer: Benoit Steiner <benoit.steiner.goog@gmail.com> 2016-10-05 14:54:36 -0700
commit: ae1385c7e46fd35f4e1a89fd0fda5ec828a85c41 (patch)
tree: 484427e28e9f8a58f1fa408bf6472af5543d8db5 /unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h
parent: 73b00129451f53a3a701397617c765ec2eb87851 (diff)
parent: ceee1c008b6d618a48846283e1f18ba1b4cc171a (diff)
1 files changed, 1 insertions, 6 deletions
diff --git a/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h b/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h
index 9b99af641..f01d77c0a 100644
--- a/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h
+++ b/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h
@@ -234,16 +234,11 @@ struct EigenMetaKernelEval<Evaluator, Index, true> {
 template <typename Evaluator, typename Index>
 __global__ void
 __launch_bounds__(1024)
-EigenMetaKernel(Evaluator memcopied_eval, Index size) {
+EigenMetaKernel(Evaluator eval, Index size) {
 
   const Index first_index = blockIdx.x * blockDim.x + threadIdx.x;
   const Index step_size = blockDim.x * gridDim.x;
 
-  // Cuda memcopies the kernel arguments. That's fine for POD, but for more
-  // complex types such as evaluators we should really conform to the C++
-  // standard and call a proper copy constructor.
-  Evaluator eval(memcopied_eval);
-
   const bool vectorizable = Evaluator::PacketAccess & Evaluator::IsAligned;
   EigenMetaKernelEval<Evaluator, Index, vectorizable>::run(eval, first_index, size, step_size);
 }
author	Benoit Steiner <benoit.steiner.goog@gmail.com>	2016-10-05 14:54:36 -0700
committer	Benoit Steiner <benoit.steiner.goog@gmail.com>	2016-10-05 14:54:36 -0700
commit	ae1385c7e46fd35f4e1a89fd0fda5ec828a85c41 (patch)
tree	484427e28e9f8a58f1fa408bf6472af5543d8db5 /unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h
parent	73b00129451f53a3a701397617c765ec2eb87851 (diff)
parent	ceee1c008b6d618a48846283e1f18ba1b4cc171a (diff)