unsupported/test/cxx11_tensor_builtins_sycl.cpp


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83

// This file is part of Eigen, a lightweight C++ template library
// for linear algebra.
//
// Copyright (C) 2016
// Mehdi Goli    Codeplay Software Ltd.
// Ralph Potter  Codeplay Software Ltd.
// Luke Iwanski  Codeplay Software Ltd.
// Contact: <eigen@codeplay.com>
//
// This Source Code Form is subject to the terms of the Mozilla
// Public License v. 2.0. If a copy of the MPL was not distributed
// with this file, You can obtain one at http://mozilla.org/MPL/2.0/.

#define EIGEN_TEST_NO_LONGDOUBLE
#define EIGEN_TEST_NO_COMPLEX
#define EIGEN_TEST_FUNC cxx11_tensor_builtins_sycl
#define EIGEN_DEFAULT_DENSE_INDEX_TYPE int
#define EIGEN_USE_SYCL

#include "main.h"
#include <unsupported/Eigen/CXX11/Tensor>

using Eigen::array;
using Eigen::SyclDevice;
using Eigen::Tensor;
using Eigen::TensorMap;

namespace std
{
  template<typename T> T rsqrt(T x) { return 1/std::sqrt(x); }
  template<typename T> T square(T x) { return x*x; }
  template<typename T> T cube(T x) { return x*x*x; }
  template<typename T> T inverse(T x) { return 1/x; }
}

#define TEST_UNARY_BUILTINS_FOR_SCALAR(FUNC, SCALAR)                                            \
{                                                                                               \
  Tensor<SCALAR, 3> in1(tensorRange);                                                           \
  Tensor<SCALAR, 3> out1(tensorRange);                                                          \
  in1 = in1.random();                                                                           \
  SCALAR* gpu_data1  = static_cast<SCALAR*>(sycl_device.allocate(in1.size()*sizeof(SCALAR)));   \
  TensorMap<Tensor<SCALAR, 3>> gpu1(gpu_data1, tensorRange);                                    \
  sycl_device.memcpyHostToDevice(gpu_data1, in1.data(),(in1.size())*sizeof(SCALAR));            \
  gpu1.device(sycl_device) = gpu1.FUNC();                                                       \
  sycl_device.memcpyDeviceToHost(out1.data(), gpu_data1,(out1.size())*sizeof(SCALAR));          \
  for (int i = 0; i < in1.size(); ++i) {                                                        \
    VERIFY_IS_APPROX(out1(i), std::FUNC(in1(i)));                                               \
  }                                                                                             \
  sycl_device.deallocate(gpu_data1);                                                            \
} 

#define TEST_UNARY_BUILTINS(SCALAR)               \
TEST_UNARY_BUILTINS_FOR_SCALAR(abs, SCALAR)       \
TEST_UNARY_BUILTINS_FOR_SCALAR(sqrt, SCALAR)      \
TEST_UNARY_BUILTINS_FOR_SCALAR(rsqrt, SCALAR)     \
TEST_UNARY_BUILTINS_FOR_SCALAR(square, SCALAR)    \
TEST_UNARY_BUILTINS_FOR_SCALAR(cube, SCALAR)      \
TEST_UNARY_BUILTINS_FOR_SCALAR(inverse, SCALAR)   \
TEST_UNARY_BUILTINS_FOR_SCALAR(tanh, SCALAR)      \
TEST_UNARY_BUILTINS_FOR_SCALAR(exp, SCALAR)       \
TEST_UNARY_BUILTINS_FOR_SCALAR(log, SCALAR)       \
TEST_UNARY_BUILTINS_FOR_SCALAR(abs, SCALAR)       \
TEST_UNARY_BUILTINS_FOR_SCALAR(ceil, SCALAR)      \
TEST_UNARY_BUILTINS_FOR_SCALAR(floor, SCALAR)     \
TEST_UNARY_BUILTINS_FOR_SCALAR(round, SCALAR)     \
TEST_UNARY_BUILTINS_FOR_SCALAR(log1p, SCALAR)

static void test_builtin_unary_sycl(const Eigen::SyclDevice &sycl_device){
  int sizeDim1 = 100;
  int sizeDim2 = 100;
  int sizeDim3 = 100;
  array<int, 3> tensorRange = {{sizeDim1, sizeDim2, sizeDim3}};

  TEST_UNARY_BUILTINS(float)
  TEST_UNARY_BUILTINS(double)
}


void test_cxx11_tensor_builtins_sycl() {
  cl::sycl::gpu_selector s;
  Eigen::SyclDevice sycl_device(s);
  CALL_SUBTEST(test_builtin_unary_sycl(sycl_device));
}