template_blas_spmv.h
Go to the documentation of this file.00001
00002
00003
00004
00005
00006
00007
00008
00009
00010
00011
00012
00013
00014
00015
00016
00017
00018
00019
00020
00021
00022
00023
00024
00025
00026
00027
00028
00029
00030
00031
00032
00033
00034
00035 #ifndef TEMPLATE_BLAS_SPMV_HEADER
00036 #define TEMPLATE_BLAS_SPMV_HEADER
00037
00038
00039 template<class Treal>
00040 int template_blas_spmv(const char *uplo, const integer *n, const Treal *alpha,
00041 Treal *ap, const Treal *x, const integer *incx, const Treal *beta,
00042 Treal *y, const integer *incy)
00043 {
00044
00045 integer i__1, i__2;
00046
00047 integer info;
00048 Treal temp1, temp2;
00049 integer i__, j, k;
00050 integer kk, ix, iy, jx, jy, kx, ky;
00051
00052
00053
00054
00055
00056
00057
00058
00059
00060
00061
00062
00063
00064
00065
00066
00067
00068
00069
00070
00071
00072
00073
00074
00075
00076
00077
00078
00079
00080
00081
00082
00083
00084
00085
00086
00087
00088
00089
00090
00091
00092
00093
00094
00095
00096
00097
00098
00099
00100
00101
00102
00103
00104
00105
00106
00107
00108
00109
00110
00111
00112
00113
00114
00115
00116
00117
00118 --y;
00119 --x;
00120 --ap;
00121
00122 info = 0;
00123 if (! template_blas_lsame(uplo, "U") && ! template_blas_lsame(uplo, "L")) {
00124 info = 1;
00125 } else if (*n < 0) {
00126 info = 2;
00127 } else if (*incx == 0) {
00128 info = 6;
00129 } else if (*incy == 0) {
00130 info = 9;
00131 }
00132 if (info != 0) {
00133 template_blas_erbla("SPMV ", &info);
00134 return 0;
00135 }
00136
00137 if (*n == 0 || ( *alpha == 0. && *beta == 1. ) ) {
00138 return 0;
00139 }
00140
00141 if (*incx > 0) {
00142 kx = 1;
00143 } else {
00144 kx = 1 - (*n - 1) * *incx;
00145 }
00146 if (*incy > 0) {
00147 ky = 1;
00148 } else {
00149 ky = 1 - (*n - 1) * *incy;
00150 }
00151
00152
00153
00154 if (*beta != 1.) {
00155 if (*incy == 1) {
00156 if (*beta == 0.) {
00157 i__1 = *n;
00158 for (i__ = 1; i__ <= i__1; ++i__) {
00159 y[i__] = 0.;
00160
00161 }
00162 } else {
00163 i__1 = *n;
00164 for (i__ = 1; i__ <= i__1; ++i__) {
00165 y[i__] = *beta * y[i__];
00166
00167 }
00168 }
00169 } else {
00170 iy = ky;
00171 if (*beta == 0.) {
00172 i__1 = *n;
00173 for (i__ = 1; i__ <= i__1; ++i__) {
00174 y[iy] = 0.;
00175 iy += *incy;
00176
00177 }
00178 } else {
00179 i__1 = *n;
00180 for (i__ = 1; i__ <= i__1; ++i__) {
00181 y[iy] = *beta * y[iy];
00182 iy += *incy;
00183
00184 }
00185 }
00186 }
00187 }
00188 if (*alpha == 0.) {
00189 return 0;
00190 }
00191 kk = 1;
00192 if (template_blas_lsame(uplo, "U")) {
00193
00194 if (*incx == 1 && *incy == 1) {
00195 i__1 = *n;
00196 for (j = 1; j <= i__1; ++j) {
00197 temp1 = *alpha * x[j];
00198 temp2 = 0.;
00199 k = kk;
00200 i__2 = j - 1;
00201 for (i__ = 1; i__ <= i__2; ++i__) {
00202 y[i__] += temp1 * ap[k];
00203 temp2 += ap[k] * x[i__];
00204 ++k;
00205
00206 }
00207 y[j] = y[j] + temp1 * ap[kk + j - 1] + *alpha * temp2;
00208 kk += j;
00209
00210 }
00211 } else {
00212 jx = kx;
00213 jy = ky;
00214 i__1 = *n;
00215 for (j = 1; j <= i__1; ++j) {
00216 temp1 = *alpha * x[jx];
00217 temp2 = 0.;
00218 ix = kx;
00219 iy = ky;
00220 i__2 = kk + j - 2;
00221 for (k = kk; k <= i__2; ++k) {
00222 y[iy] += temp1 * ap[k];
00223 temp2 += ap[k] * x[ix];
00224 ix += *incx;
00225 iy += *incy;
00226
00227 }
00228 y[jy] = y[jy] + temp1 * ap[kk + j - 1] + *alpha * temp2;
00229 jx += *incx;
00230 jy += *incy;
00231 kk += j;
00232
00233 }
00234 }
00235 } else {
00236
00237 if (*incx == 1 && *incy == 1) {
00238 i__1 = *n;
00239 for (j = 1; j <= i__1; ++j) {
00240 temp1 = *alpha * x[j];
00241 temp2 = 0.;
00242 y[j] += temp1 * ap[kk];
00243 k = kk + 1;
00244 i__2 = *n;
00245 for (i__ = j + 1; i__ <= i__2; ++i__) {
00246 y[i__] += temp1 * ap[k];
00247 temp2 += ap[k] * x[i__];
00248 ++k;
00249
00250 }
00251 y[j] += *alpha * temp2;
00252 kk += *n - j + 1;
00253
00254 }
00255 } else {
00256 jx = kx;
00257 jy = ky;
00258 i__1 = *n;
00259 for (j = 1; j <= i__1; ++j) {
00260 temp1 = *alpha * x[jx];
00261 temp2 = 0.;
00262 y[jy] += temp1 * ap[kk];
00263 ix = jx;
00264 iy = jy;
00265 i__2 = kk + *n - j;
00266 for (k = kk + 1; k <= i__2; ++k) {
00267 ix += *incx;
00268 iy += *incy;
00269 y[iy] += temp1 * ap[k];
00270 temp2 += ap[k] * x[ix];
00271
00272 }
00273 y[jy] += *alpha * temp2;
00274 jx += *incx;
00275 jy += *incy;
00276 kk += *n - j + 1;
00277
00278 }
00279 }
00280 }
00281 return 0;
00282
00283 }
00284
00285 #endif