25 #error "Never use <avx512vlintrin.h> directly; include <immintrin.h> instead."
28 #ifndef __AVX512VLINTRIN_H
29 #define __AVX512VLINTRIN_H
31 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512vl")))
32 #define __DEFAULT_FN_ATTRS_BOTH __attribute__((__always_inline__, __nodebug__, __target__("avx512vl, avx512bw")))
37 _mm_cmpeq_epi32_mask(__m128i __a, __m128i
__b) {
38 return (
__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
43 _mm_mask_cmpeq_epi32_mask(
__mmask8 __u, __m128i __a, __m128i
__b) {
44 return (
__mmask8)__builtin_ia32_pcmpeqd128_mask((__v4si)__a, (__v4si)__b,
49 _mm_cmpeq_epu32_mask(__m128i __a, __m128i __b) {
50 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
55 _mm_mask_cmpeq_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
56 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 0,
61 _mm256_cmpeq_epi32_mask(__m256i __a, __m256i __b) {
62 return (
__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
67 _mm256_mask_cmpeq_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
68 return (
__mmask8)__builtin_ia32_pcmpeqd256_mask((__v8si)__a, (__v8si)__b,
73 _mm256_cmpeq_epu32_mask(__m256i __a, __m256i __b) {
74 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
79 _mm256_mask_cmpeq_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
80 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 0,
85 _mm_cmpeq_epi64_mask(__m128i __a, __m128i __b) {
86 return (
__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
91 _mm_mask_cmpeq_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
92 return (
__mmask8)__builtin_ia32_pcmpeqq128_mask((__v2di)__a, (__v2di)__b,
97 _mm_cmpeq_epu64_mask(__m128i __a, __m128i __b) {
98 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
103 _mm_mask_cmpeq_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
104 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 0,
109 _mm256_cmpeq_epi64_mask(__m256i __a, __m256i __b) {
110 return (
__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
115 _mm256_mask_cmpeq_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
116 return (
__mmask8)__builtin_ia32_pcmpeqq256_mask((__v4di)__a, (__v4di)__b,
121 _mm256_cmpeq_epu64_mask(__m256i __a, __m256i __b) {
122 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
127 _mm256_mask_cmpeq_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
128 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 0,
134 _mm_cmpge_epi32_mask(__m128i __a, __m128i __b) {
135 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
140 _mm_mask_cmpge_epi32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
141 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 5,
146 _mm_cmpge_epu32_mask(__m128i __a, __m128i __b) {
147 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
152 _mm_mask_cmpge_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
153 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 5,
158 _mm256_cmpge_epi32_mask(__m256i __a, __m256i __b) {
159 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
164 _mm256_mask_cmpge_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
165 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 5,
170 _mm256_cmpge_epu32_mask(__m256i __a, __m256i __b) {
171 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
176 _mm256_mask_cmpge_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
177 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 5,
182 _mm_cmpge_epi64_mask(__m128i __a, __m128i __b) {
183 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
188 _mm_mask_cmpge_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
189 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 5,
194 _mm_cmpge_epu64_mask(__m128i __a, __m128i __b) {
195 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
200 _mm_mask_cmpge_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
201 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 5,
206 _mm256_cmpge_epi64_mask(__m256i __a, __m256i __b) {
207 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
212 _mm256_mask_cmpge_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
213 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 5,
218 _mm256_cmpge_epu64_mask(__m256i __a, __m256i __b) {
219 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
224 _mm256_mask_cmpge_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
225 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 5,
230 _mm_cmpgt_epi32_mask(__m128i __a, __m128i __b) {
231 return (
__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
236 _mm_mask_cmpgt_epi32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
237 return (
__mmask8)__builtin_ia32_pcmpgtd128_mask((__v4si)__a, (__v4si)__b,
242 _mm_cmpgt_epu32_mask(__m128i __a, __m128i __b) {
243 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
248 _mm_mask_cmpgt_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
249 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 6,
254 _mm256_cmpgt_epi32_mask(__m256i __a, __m256i __b) {
255 return (
__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
260 _mm256_mask_cmpgt_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
261 return (
__mmask8)__builtin_ia32_pcmpgtd256_mask((__v8si)__a, (__v8si)__b,
266 _mm256_cmpgt_epu32_mask(__m256i __a, __m256i __b) {
267 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
272 _mm256_mask_cmpgt_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
273 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 6,
278 _mm_cmpgt_epi64_mask(__m128i __a, __m128i __b) {
279 return (
__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
284 _mm_mask_cmpgt_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
285 return (
__mmask8)__builtin_ia32_pcmpgtq128_mask((__v2di)__a, (__v2di)__b,
290 _mm_cmpgt_epu64_mask(__m128i __a, __m128i __b) {
291 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
296 _mm_mask_cmpgt_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
297 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 6,
302 _mm256_cmpgt_epi64_mask(__m256i __a, __m256i __b) {
303 return (
__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
308 _mm256_mask_cmpgt_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
309 return (
__mmask8)__builtin_ia32_pcmpgtq256_mask((__v4di)__a, (__v4di)__b,
314 _mm256_cmpgt_epu64_mask(__m256i __a, __m256i __b) {
315 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
320 _mm256_mask_cmpgt_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
321 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 6,
326 _mm_cmple_epi32_mask(__m128i __a, __m128i __b) {
327 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
332 _mm_mask_cmple_epi32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
333 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 2,
338 _mm_cmple_epu32_mask(__m128i __a, __m128i __b) {
339 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
344 _mm_mask_cmple_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
345 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 2,
350 _mm256_cmple_epi32_mask(__m256i __a, __m256i __b) {
351 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
356 _mm256_mask_cmple_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
357 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 2,
362 _mm256_cmple_epu32_mask(__m256i __a, __m256i __b) {
363 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
368 _mm256_mask_cmple_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
369 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 2,
374 _mm_cmple_epi64_mask(__m128i __a, __m128i __b) {
375 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
380 _mm_mask_cmple_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
381 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 2,
386 _mm_cmple_epu64_mask(__m128i __a, __m128i __b) {
387 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
392 _mm_mask_cmple_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
393 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 2,
398 _mm256_cmple_epi64_mask(__m256i __a, __m256i __b) {
399 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
404 _mm256_mask_cmple_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
405 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 2,
410 _mm256_cmple_epu64_mask(__m256i __a, __m256i __b) {
411 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
416 _mm256_mask_cmple_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
417 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 2,
422 _mm_cmplt_epi32_mask(__m128i __a, __m128i __b) {
423 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
428 _mm_mask_cmplt_epi32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
429 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 1,
434 _mm_cmplt_epu32_mask(__m128i __a, __m128i __b) {
435 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
440 _mm_mask_cmplt_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
441 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 1,
446 _mm256_cmplt_epi32_mask(__m256i __a, __m256i __b) {
447 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
452 _mm256_mask_cmplt_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
453 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 1,
458 _mm256_cmplt_epu32_mask(__m256i __a, __m256i __b) {
459 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
464 _mm256_mask_cmplt_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
465 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 1,
470 _mm_cmplt_epi64_mask(__m128i __a, __m128i __b) {
471 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
476 _mm_mask_cmplt_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
477 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 1,
482 _mm_cmplt_epu64_mask(__m128i __a, __m128i __b) {
483 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
488 _mm_mask_cmplt_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
489 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 1,
494 _mm256_cmplt_epi64_mask(__m256i __a, __m256i __b) {
495 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
500 _mm256_mask_cmplt_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
501 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 1,
506 _mm256_cmplt_epu64_mask(__m256i __a, __m256i __b) {
507 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
512 _mm256_mask_cmplt_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
513 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 1,
518 _mm_cmpneq_epi32_mask(__m128i __a, __m128i __b) {
519 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
524 _mm_mask_cmpneq_epi32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
525 return (
__mmask8)__builtin_ia32_cmpd128_mask((__v4si)__a, (__v4si)__b, 4,
530 _mm_cmpneq_epu32_mask(__m128i __a, __m128i __b) {
531 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
536 _mm_mask_cmpneq_epu32_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
537 return (
__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)__a, (__v4si)__b, 4,
542 _mm256_cmpneq_epi32_mask(__m256i __a, __m256i __b) {
543 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
548 _mm256_mask_cmpneq_epi32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
549 return (
__mmask8)__builtin_ia32_cmpd256_mask((__v8si)__a, (__v8si)__b, 4,
554 _mm256_cmpneq_epu32_mask(__m256i __a, __m256i __b) {
555 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
560 _mm256_mask_cmpneq_epu32_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
561 return (
__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)__a, (__v8si)__b, 4,
566 _mm_cmpneq_epi64_mask(__m128i __a, __m128i __b) {
567 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
572 _mm_mask_cmpneq_epi64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
573 return (
__mmask8)__builtin_ia32_cmpq128_mask((__v2di)__a, (__v2di)__b, 4,
578 _mm_cmpneq_epu64_mask(__m128i __a, __m128i __b) {
579 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
584 _mm_mask_cmpneq_epu64_mask(
__mmask8 __u, __m128i __a, __m128i __b) {
585 return (
__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)__a, (__v2di)__b, 4,
590 _mm256_cmpneq_epi64_mask(__m256i __a, __m256i __b) {
591 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
596 _mm256_mask_cmpneq_epi64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
597 return (
__mmask8)__builtin_ia32_cmpq256_mask((__v4di)__a, (__v4di)__b, 4,
602 _mm256_cmpneq_epu64_mask(__m256i __a, __m256i __b) {
603 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
608 _mm256_mask_cmpneq_epu64_mask(
__mmask8 __u, __m256i __a, __m256i __b) {
609 return (
__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)__a, (__v4di)__b, 4,
614 _mm256_mask_add_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
617 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
624 _mm256_maskz_add_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
626 return (__m256i) __builtin_ia32_paddd256_mask ((__v8si) __A,
629 _mm256_setzero_si256 (),
634 _mm256_mask_add_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
637 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
644 _mm256_maskz_add_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
646 return (__m256i) __builtin_ia32_paddq256_mask ((__v4di) __A,
649 _mm256_setzero_si256 (),
654 _mm256_mask_sub_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
657 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
664 _mm256_maskz_sub_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
666 return (__m256i) __builtin_ia32_psubd256_mask ((__v8si) __A,
669 _mm256_setzero_si256 (),
674 _mm256_mask_sub_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
677 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
684 _mm256_maskz_sub_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
686 return (__m256i) __builtin_ia32_psubq256_mask ((__v4di) __A,
689 _mm256_setzero_si256 (),
694 _mm_mask_add_epi32 (__m128i __W,
__mmask8 __U, __m128i __A,
697 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
704 _mm_maskz_add_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
706 return (__m128i) __builtin_ia32_paddd128_mask ((__v4si) __A,
709 _mm_setzero_si128 (),
714 _mm_mask_add_epi64 (__m128i __W,
__mmask8 __U, __m128i __A,
717 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
724 _mm_maskz_add_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
726 return (__m128i) __builtin_ia32_paddq128_mask ((__v2di) __A,
729 _mm_setzero_si128 (),
734 _mm_mask_sub_epi32 (__m128i __W,
__mmask8 __U, __m128i __A,
737 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
744 _mm_maskz_sub_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
746 return (__m128i) __builtin_ia32_psubd128_mask ((__v4si) __A,
749 _mm_setzero_si128 (),
754 _mm_mask_sub_epi64 (__m128i __W,
__mmask8 __U, __m128i __A,
757 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
764 _mm_maskz_sub_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
766 return (__m128i) __builtin_ia32_psubq128_mask ((__v2di) __A,
769 _mm_setzero_si128 (),
774 _mm256_mask_mul_epi32 (__m256i __W,
__mmask8 __M, __m256i __X,
777 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
783 _mm256_maskz_mul_epi32 (
__mmask8 __M, __m256i __X, __m256i __Y)
785 return (__m256i) __builtin_ia32_pmuldq256_mask ((__v8si) __X,
788 _mm256_setzero_si256 (),
793 _mm_mask_mul_epi32 (__m128i __W,
__mmask8 __M, __m128i __X,
796 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
802 _mm_maskz_mul_epi32 (
__mmask8 __M, __m128i __X, __m128i __Y)
804 return (__m128i) __builtin_ia32_pmuldq128_mask ((__v4si) __X,
807 _mm_setzero_si128 (),
812 _mm256_mask_mul_epu32 (__m256i __W,
__mmask8 __M, __m256i __X,
815 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
821 _mm256_maskz_mul_epu32 (
__mmask8 __M, __m256i __X, __m256i __Y)
823 return (__m256i) __builtin_ia32_pmuludq256_mask ((__v8si) __X,
826 _mm256_setzero_si256 (),
831 _mm_mask_mul_epu32 (__m128i __W,
__mmask8 __M, __m128i __X,
834 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
840 _mm_maskz_mul_epu32 (
__mmask8 __M, __m128i __X, __m128i __Y)
842 return (__m128i) __builtin_ia32_pmuludq128_mask ((__v4si) __X,
845 _mm_setzero_si128 (),
850 _mm256_maskz_mullo_epi32 (
__mmask8 __M, __m256i __A, __m256i __B)
852 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
855 _mm256_setzero_si256 (),
860 _mm256_mask_mullo_epi32 (__m256i __W,
__mmask8 __M, __m256i __A,
863 return (__m256i) __builtin_ia32_pmulld256_mask ((__v8si) __A,
869 _mm_maskz_mullo_epi32 (
__mmask8 __M, __m128i __A, __m128i __B)
871 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
874 _mm_setzero_si128 (),
879 _mm_mask_mullo_epi32 (__m128i __W,
__mmask16 __M, __m128i __A,
882 return (__m128i) __builtin_ia32_pmulld128_mask ((__v4si) __A,
888 _mm256_mask_and_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
891 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
898 _mm256_maskz_and_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
900 return (__m256i) __builtin_ia32_pandd256_mask ((__v8si) __A,
903 _mm256_setzero_si256 (),
908 _mm_mask_and_epi32 (__m128i __W,
__mmask8 __U, __m128i __A, __m128i __B)
910 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
917 _mm_maskz_and_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
919 return (__m128i) __builtin_ia32_pandd128_mask ((__v4si) __A,
922 _mm_setzero_si128 (),
927 _mm256_mask_andnot_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
930 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
937 _mm256_maskz_andnot_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
939 return (__m256i) __builtin_ia32_pandnd256_mask ((__v8si) __A,
942 _mm256_setzero_si256 (),
947 _mm_mask_andnot_epi32 (__m128i __W,
__mmask8 __U, __m128i __A,
950 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
957 _mm_maskz_andnot_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
959 return (__m128i) __builtin_ia32_pandnd128_mask ((__v4si) __A,
962 _mm_setzero_si128 (),
967 _mm256_mask_or_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
970 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
977 _mm256_maskz_or_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
979 return (__m256i) __builtin_ia32_pord256_mask ((__v8si) __A,
982 _mm256_setzero_si256 (),
987 _mm_mask_or_epi32 (__m128i __W,
__mmask8 __U, __m128i __A, __m128i __B)
989 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
996 _mm_maskz_or_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
998 return (__m128i) __builtin_ia32_pord128_mask ((__v4si) __A,
1001 _mm_setzero_si128 (),
1006 _mm256_mask_xor_epi32 (__m256i __W,
__mmask8 __U, __m256i __A,
1009 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1016 _mm256_maskz_xor_epi32 (
__mmask8 __U, __m256i __A, __m256i __B)
1018 return (__m256i) __builtin_ia32_pxord256_mask ((__v8si) __A,
1021 _mm256_setzero_si256 (),
1026 _mm_mask_xor_epi32 (__m128i __W,
__mmask8 __U, __m128i __A,
1029 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1036 _mm_maskz_xor_epi32 (
__mmask8 __U, __m128i __A, __m128i __B)
1038 return (__m128i) __builtin_ia32_pxord128_mask ((__v4si) __A,
1041 _mm_setzero_si128 (),
1046 _mm256_mask_and_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
1049 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1055 _mm256_maskz_and_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
1057 return (__m256i) __builtin_ia32_pandq256_mask ((__v4di) __A,
1060 _mm256_setzero_pd (),
1065 _mm_mask_and_epi64 (__m128i __W,
__mmask8 __U, __m128i __A,
1068 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1074 _mm_maskz_and_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
1076 return (__m128i) __builtin_ia32_pandq128_mask ((__v2di) __A,
1084 _mm256_mask_andnot_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
1087 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1093 _mm256_maskz_andnot_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
1095 return (__m256i) __builtin_ia32_pandnq256_mask ((__v4di) __A,
1098 _mm256_setzero_pd (),
1103 _mm_mask_andnot_epi64 (__m128i __W,
__mmask8 __U, __m128i __A,
1106 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1112 _mm_maskz_andnot_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
1114 return (__m128i) __builtin_ia32_pandnq128_mask ((__v2di) __A,
1122 _mm256_mask_or_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
1125 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1132 _mm256_maskz_or_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
1134 return (__m256i) __builtin_ia32_porq256_mask ((__v4di) __A,
1137 _mm256_setzero_si256 (),
1142 _mm_mask_or_epi64 (__m128i __W,
__mmask8 __U, __m128i __A, __m128i __B)
1144 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1151 _mm_maskz_or_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
1153 return (__m128i) __builtin_ia32_porq128_mask ((__v2di) __A,
1156 _mm_setzero_si128 (),
1161 _mm256_mask_xor_epi64 (__m256i __W,
__mmask8 __U, __m256i __A,
1164 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1171 _mm256_maskz_xor_epi64 (
__mmask8 __U, __m256i __A, __m256i __B)
1173 return (__m256i) __builtin_ia32_pxorq256_mask ((__v4di) __A,
1176 _mm256_setzero_si256 (),
1181 _mm_mask_xor_epi64 (__m128i __W,
__mmask8 __U, __m128i __A,
1184 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1191 _mm_maskz_xor_epi64 (
__mmask8 __U, __m128i __A, __m128i __B)
1193 return (__m128i) __builtin_ia32_pxorq128_mask ((__v2di) __A,
1196 _mm_setzero_si128 (),
1200 #define _mm_cmp_epi32_mask(a, b, p) __extension__ ({ \
1201 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1202 (__v4si)(__m128i)(b), \
1203 (p), (__mmask8)-1); })
1205 #define _mm_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1206 (__mmask8)__builtin_ia32_cmpd128_mask((__v4si)(__m128i)(a), \
1207 (__v4si)(__m128i)(b), \
1208 (p), (__mmask8)(m)); })
1210 #define _mm_cmp_epu32_mask(a, b, p) __extension__ ({ \
1211 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1212 (__v4si)(__m128i)(b), \
1213 (p), (__mmask8)-1); })
1215 #define _mm_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1216 (__mmask8)__builtin_ia32_ucmpd128_mask((__v4si)(__m128i)(a), \
1217 (__v4si)(__m128i)(b), \
1218 (p), (__mmask8)(m)); })
1220 #define _mm256_cmp_epi32_mask(a, b, p) __extension__ ({ \
1221 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1222 (__v8si)(__m256i)(b), \
1223 (p), (__mmask8)-1); })
1225 #define _mm256_mask_cmp_epi32_mask(m, a, b, p) __extension__ ({ \
1226 (__mmask8)__builtin_ia32_cmpd256_mask((__v8si)(__m256i)(a), \
1227 (__v8si)(__m256i)(b), \
1228 (p), (__mmask8)(m)); })
1230 #define _mm256_cmp_epu32_mask(a, b, p) __extension__ ({ \
1231 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1232 (__v8si)(__m256i)(b), \
1233 (p), (__mmask8)-1); })
1235 #define _mm256_mask_cmp_epu32_mask(m, a, b, p) __extension__ ({ \
1236 (__mmask8)__builtin_ia32_ucmpd256_mask((__v8si)(__m256i)(a), \
1237 (__v8si)(__m256i)(b), \
1238 (p), (__mmask8)(m)); })
1240 #define _mm_cmp_epi64_mask(a, b, p) __extension__ ({ \
1241 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1242 (__v2di)(__m128i)(b), \
1243 (p), (__mmask8)-1); })
1245 #define _mm_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1246 (__mmask8)__builtin_ia32_cmpq128_mask((__v2di)(__m128i)(a), \
1247 (__v2di)(__m128i)(b), \
1248 (p), (__mmask8)(m)); })
1250 #define _mm_cmp_epu64_mask(a, b, p) __extension__ ({ \
1251 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1252 (__v2di)(__m128i)(b), \
1253 (p), (__mmask8)-1); })
1255 #define _mm_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1256 (__mmask8)__builtin_ia32_ucmpq128_mask((__v2di)(__m128i)(a), \
1257 (__v2di)(__m128i)(b), \
1258 (p), (__mmask8)(m)); })
1260 #define _mm256_cmp_epi64_mask(a, b, p) __extension__ ({ \
1261 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1262 (__v4di)(__m256i)(b), \
1263 (p), (__mmask8)-1); })
1265 #define _mm256_mask_cmp_epi64_mask(m, a, b, p) __extension__ ({ \
1266 (__mmask8)__builtin_ia32_cmpq256_mask((__v4di)(__m256i)(a), \
1267 (__v4di)(__m256i)(b), \
1268 (p), (__mmask8)(m)); })
1270 #define _mm256_cmp_epu64_mask(a, b, p) __extension__ ({ \
1271 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1272 (__v4di)(__m256i)(b), \
1273 (p), (__mmask8)-1); })
1275 #define _mm256_mask_cmp_epu64_mask(m, a, b, p) __extension__ ({ \
1276 (__mmask8)__builtin_ia32_ucmpq256_mask((__v4di)(__m256i)(a), \
1277 (__v4di)(__m256i)(b), \
1278 (p), (__mmask8)(m)); })
1280 #define _mm256_cmp_ps_mask(a, b, p) __extension__ ({ \
1281 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1282 (__v8sf)(__m256)(b), \
1283 (p), (__mmask8)-1); })
1285 #define _mm256_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1286 (__mmask8)__builtin_ia32_cmpps256_mask((__v8sf)(__m256)(a), \
1287 (__v8sf)(__m256)(b), \
1288 (p), (__mmask8)(m)); })
1290 #define _mm256_cmp_pd_mask(a, b, p) __extension__ ({ \
1291 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1292 (__v4df)(__m256)(b), \
1293 (p), (__mmask8)-1); })
1295 #define _mm256_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1296 (__mmask8)__builtin_ia32_cmppd256_mask((__v4df)(__m256)(a), \
1297 (__v4df)(__m256)(b), \
1298 (p), (__mmask8)(m)); })
1300 #define _mm128_cmp_ps_mask(a, b, p) __extension__ ({ \
1301 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1302 (__v4sf)(__m128)(b), \
1303 (p), (__mmask8)-1); })
1305 #define _mm128_mask_cmp_ps_mask(m, a, b, p) __extension__ ({ \
1306 (__mmask8)__builtin_ia32_cmpps128_mask((__v4sf)(__m128)(a), \
1307 (__v4sf)(__m128)(b), \
1308 (p), (__mmask8)(m)); })
1310 #define _mm128_cmp_pd_mask(a, b, p) __extension__ ({ \
1311 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1312 (__v2df)(__m128)(b), \
1313 (p), (__mmask8)-1); })
1315 #define _mm128_mask_cmp_pd_mask(m, a, b, p) __extension__ ({ \
1316 (__mmask8)__builtin_ia32_cmppd128_mask((__v2df)(__m128)(a), \
1317 (__v2df)(__m128)(b), \
1318 (p), (__mmask8)(m)); })
1321 _mm_mask_fmadd_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1323 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1330 _mm_mask3_fmadd_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1332 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 ((__v2df) __A,
1339 _mm_maskz_fmadd_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1341 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1348 _mm_mask_fmsub_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1350 return (__m128d) __builtin_ia32_vfmaddpd128_mask ((__v2df) __A,
1357 _mm_maskz_fmsub_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1359 return (__m128d) __builtin_ia32_vfmaddpd128_maskz ((__v2df) __A,
1366 _mm_mask3_fnmadd_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1368 return (__m128d) __builtin_ia32_vfmaddpd128_mask3 (-(__v2df) __A,
1375 _mm_maskz_fnmadd_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1377 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1384 _mm_maskz_fnmsub_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1386 return (__m128d) __builtin_ia32_vfmaddpd128_maskz (-(__v2df) __A,
1393 _mm256_mask_fmadd_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1395 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1402 _mm256_mask3_fmadd_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1404 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 ((__v4df) __A,
1411 _mm256_maskz_fmadd_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1413 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1420 _mm256_mask_fmsub_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1422 return (__m256d) __builtin_ia32_vfmaddpd256_mask ((__v4df) __A,
1429 _mm256_maskz_fmsub_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1431 return (__m256d) __builtin_ia32_vfmaddpd256_maskz ((__v4df) __A,
1438 _mm256_mask3_fnmadd_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1440 return (__m256d) __builtin_ia32_vfmaddpd256_mask3 (-(__v4df) __A,
1447 _mm256_maskz_fnmadd_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1449 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1456 _mm256_maskz_fnmsub_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1458 return (__m256d) __builtin_ia32_vfmaddpd256_maskz (-(__v4df) __A,
1465 _mm_mask_fmadd_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1467 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1474 _mm_mask3_fmadd_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1476 return (__m128) __builtin_ia32_vfmaddps128_mask3 ((__v4sf) __A,
1483 _mm_maskz_fmadd_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1485 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1492 _mm_mask_fmsub_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1494 return (__m128) __builtin_ia32_vfmaddps128_mask ((__v4sf) __A,
1501 _mm_maskz_fmsub_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1503 return (__m128) __builtin_ia32_vfmaddps128_maskz ((__v4sf) __A,
1510 _mm_mask3_fnmadd_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1512 return (__m128) __builtin_ia32_vfmaddps128_mask3 (-(__v4sf) __A,
1519 _mm_maskz_fnmadd_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1521 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1528 _mm_maskz_fnmsub_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1530 return (__m128) __builtin_ia32_vfmaddps128_maskz (-(__v4sf) __A,
1537 _mm256_mask_fmadd_ps(__m256 __A,
__mmask8 __U, __m256 __B, __m256 __C)
1539 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1546 _mm256_mask3_fmadd_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1548 return (__m256) __builtin_ia32_vfmaddps256_mask3 ((__v8sf) __A,
1555 _mm256_maskz_fmadd_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1557 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1564 _mm256_mask_fmsub_ps(__m256 __A,
__mmask8 __U, __m256 __B, __m256 __C)
1566 return (__m256) __builtin_ia32_vfmaddps256_mask ((__v8sf) __A,
1573 _mm256_maskz_fmsub_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1575 return (__m256) __builtin_ia32_vfmaddps256_maskz ((__v8sf) __A,
1582 _mm256_mask3_fnmadd_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1584 return (__m256) __builtin_ia32_vfmaddps256_mask3 (-(__v8sf) __A,
1591 _mm256_maskz_fnmadd_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1593 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1600 _mm256_maskz_fnmsub_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1602 return (__m256) __builtin_ia32_vfmaddps256_maskz (-(__v8sf) __A,
1609 _mm_mask_fmaddsub_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1611 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1618 _mm_mask3_fmaddsub_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1620 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask3 ((__v2df) __A,
1628 _mm_maskz_fmaddsub_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1630 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1638 _mm_mask_fmsubadd_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1640 return (__m128d) __builtin_ia32_vfmaddsubpd128_mask ((__v2df) __A,
1647 _mm_maskz_fmsubadd_pd(
__mmask8 __U, __m128d __A, __m128d __B, __m128d __C)
1649 return (__m128d) __builtin_ia32_vfmaddsubpd128_maskz ((__v2df) __A,
1657 _mm256_mask_fmaddsub_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1659 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1666 _mm256_mask3_fmaddsub_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1668 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask3 ((__v4df) __A,
1676 _mm256_maskz_fmaddsub_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1678 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1686 _mm256_mask_fmsubadd_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1688 return (__m256d) __builtin_ia32_vfmaddsubpd256_mask ((__v4df) __A,
1695 _mm256_maskz_fmsubadd_pd(
__mmask8 __U, __m256d __A, __m256d __B, __m256d __C)
1697 return (__m256d) __builtin_ia32_vfmaddsubpd256_maskz ((__v4df) __A,
1705 _mm_mask_fmaddsub_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1707 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1714 _mm_mask3_fmaddsub_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1716 return (__m128) __builtin_ia32_vfmaddsubps128_mask3 ((__v4sf) __A,
1723 _mm_maskz_fmaddsub_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1725 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1732 _mm_mask_fmsubadd_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1734 return (__m128) __builtin_ia32_vfmaddsubps128_mask ((__v4sf) __A,
1741 _mm_maskz_fmsubadd_ps(
__mmask8 __U, __m128 __A, __m128 __B, __m128 __C)
1743 return (__m128) __builtin_ia32_vfmaddsubps128_maskz ((__v4sf) __A,
1750 _mm256_mask_fmaddsub_ps(__m256 __A,
__mmask8 __U, __m256 __B,
1753 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1760 _mm256_mask3_fmaddsub_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1762 return (__m256) __builtin_ia32_vfmaddsubps256_mask3 ((__v8sf) __A,
1769 _mm256_maskz_fmaddsub_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1771 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1778 _mm256_mask_fmsubadd_ps(__m256 __A,
__mmask8 __U, __m256 __B, __m256 __C)
1780 return (__m256) __builtin_ia32_vfmaddsubps256_mask ((__v8sf) __A,
1787 _mm256_maskz_fmsubadd_ps(
__mmask8 __U, __m256 __A, __m256 __B, __m256 __C)
1789 return (__m256) __builtin_ia32_vfmaddsubps256_maskz ((__v8sf) __A,
1796 _mm_mask3_fmsub_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1798 return (__m128d) __builtin_ia32_vfmsubpd128_mask3 ((__v2df) __A,
1805 _mm256_mask3_fmsub_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1807 return (__m256d) __builtin_ia32_vfmsubpd256_mask3 ((__v4df) __A,
1814 _mm_mask3_fmsub_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1816 return (__m128) __builtin_ia32_vfmsubps128_mask3 ((__v4sf) __A,
1823 _mm256_mask3_fmsub_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1825 return (__m256) __builtin_ia32_vfmsubps256_mask3 ((__v8sf) __A,
1832 _mm_mask3_fmsubadd_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1834 return (__m128d) __builtin_ia32_vfmsubaddpd128_mask3 ((__v2df) __A,
1842 _mm256_mask3_fmsubadd_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1844 return (__m256d) __builtin_ia32_vfmsubaddpd256_mask3 ((__v4df) __A,
1852 _mm_mask3_fmsubadd_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1854 return (__m128) __builtin_ia32_vfmsubaddps128_mask3 ((__v4sf) __A,
1861 _mm256_mask3_fmsubadd_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1863 return (__m256) __builtin_ia32_vfmsubaddps256_mask3 ((__v8sf) __A,
1870 _mm_mask_fnmadd_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1872 return (__m128d) __builtin_ia32_vfnmaddpd128_mask ((__v2df) __A,
1879 _mm256_mask_fnmadd_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1881 return (__m256d) __builtin_ia32_vfnmaddpd256_mask ((__v4df) __A,
1888 _mm_mask_fnmadd_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1890 return (__m128) __builtin_ia32_vfnmaddps128_mask ((__v4sf) __A,
1897 _mm256_mask_fnmadd_ps(__m256 __A,
__mmask8 __U, __m256 __B, __m256 __C)
1899 return (__m256) __builtin_ia32_vfnmaddps256_mask ((__v8sf) __A,
1906 _mm_mask_fnmsub_pd(__m128d __A,
__mmask8 __U, __m128d __B, __m128d __C)
1908 return (__m128d) __builtin_ia32_vfnmsubpd128_mask ((__v2df) __A,
1915 _mm_mask3_fnmsub_pd(__m128d __A, __m128d __B, __m128d __C,
__mmask8 __U)
1917 return (__m128d) __builtin_ia32_vfnmsubpd128_mask3 ((__v2df) __A,
1924 _mm256_mask_fnmsub_pd(__m256d __A,
__mmask8 __U, __m256d __B, __m256d __C)
1926 return (__m256d) __builtin_ia32_vfnmsubpd256_mask ((__v4df) __A,
1933 _mm256_mask3_fnmsub_pd(__m256d __A, __m256d __B, __m256d __C,
__mmask8 __U)
1935 return (__m256d) __builtin_ia32_vfnmsubpd256_mask3 ((__v4df) __A,
1942 _mm_mask_fnmsub_ps(__m128 __A,
__mmask8 __U, __m128 __B, __m128 __C)
1944 return (__m128) __builtin_ia32_vfnmsubps128_mask ((__v4sf) __A,
1951 _mm_mask3_fnmsub_ps(__m128 __A, __m128 __B, __m128 __C,
__mmask8 __U)
1953 return (__m128) __builtin_ia32_vfnmsubps128_mask3 ((__v4sf) __A,
1960 _mm256_mask_fnmsub_ps(__m256 __A,
__mmask8 __U, __m256 __B, __m256 __C)
1962 return (__m256) __builtin_ia32_vfnmsubps256_mask ((__v8sf) __A,
1969 _mm256_mask3_fnmsub_ps(__m256 __A, __m256 __B, __m256 __C,
__mmask8 __U)
1971 return (__m256) __builtin_ia32_vfnmsubps256_mask3 ((__v8sf) __A,
1978 _mm_mask_add_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
1979 return (__m128d) __builtin_ia32_addpd128_mask ((__v2df) __A,
1986 _mm_maskz_add_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
1987 return (__m128d) __builtin_ia32_addpd128_mask ((__v2df) __A,
1995 _mm256_mask_add_pd (__m256d __W,
__mmask8 __U, __m256d __A, __m256d __B) {
1996 return (__m256d) __builtin_ia32_addpd256_mask ((__v4df) __A,
2003 _mm256_maskz_add_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
2004 return (__m256d) __builtin_ia32_addpd256_mask ((__v4df) __A,
2007 _mm256_setzero_pd (),
2012 _mm_mask_add_ps (__m128 __W,
__mmask16 __U, __m128 __A, __m128 __B) {
2013 return (__m128) __builtin_ia32_addps128_mask ((__v4sf) __A,
2020 _mm_maskz_add_ps (
__mmask16 __U, __m128 __A, __m128 __B) {
2021 return (__m128) __builtin_ia32_addps128_mask ((__v4sf) __A,
2029 _mm256_mask_add_ps (__m256 __W,
__mmask16 __U, __m256 __A, __m256 __B) {
2030 return (__m256) __builtin_ia32_addps256_mask ((__v8sf) __A,
2037 _mm256_maskz_add_ps (
__mmask16 __U, __m256 __A, __m256 __B) {
2038 return (__m256) __builtin_ia32_addps256_mask ((__v8sf) __A,
2041 _mm256_setzero_ps (),
2046 _mm_mask_blend_epi32 (
__mmask8 __U, __m128i __A, __m128i __W) {
2047 return (__m128i) __builtin_ia32_blendmd_128_mask ((__v4si) __A,
2053 _mm256_mask_blend_epi32 (
__mmask8 __U, __m256i __A, __m256i __W) {
2054 return (__m256i) __builtin_ia32_blendmd_256_mask ((__v8si) __A,
2060 _mm_mask_blend_pd (
__mmask8 __U, __m128d __A, __m128d __W) {
2061 return (__m128d) __builtin_ia32_blendmpd_128_mask ((__v2df) __A,
2067 _mm256_mask_blend_pd (
__mmask8 __U, __m256d __A, __m256d __W) {
2068 return (__m256d) __builtin_ia32_blendmpd_256_mask ((__v4df) __A,
2074 _mm_mask_blend_ps (
__mmask8 __U, __m128 __A, __m128 __W) {
2075 return (__m128) __builtin_ia32_blendmps_128_mask ((__v4sf) __A,
2081 _mm256_mask_blend_ps (
__mmask8 __U, __m256 __A, __m256 __W) {
2082 return (__m256) __builtin_ia32_blendmps_256_mask ((__v8sf) __A,
2088 _mm_mask_blend_epi64 (
__mmask8 __U, __m128i __A, __m128i __W) {
2089 return (__m128i) __builtin_ia32_blendmq_128_mask ((__v2di) __A,
2095 _mm256_mask_blend_epi64 (
__mmask8 __U, __m256i __A, __m256i __W) {
2096 return (__m256i) __builtin_ia32_blendmq_256_mask ((__v4di) __A,
2102 _mm_mask_compress_pd (__m128d __W,
__mmask8 __U, __m128d __A) {
2103 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
2109 _mm_maskz_compress_pd (
__mmask8 __U, __m128d __A) {
2110 return (__m128d) __builtin_ia32_compressdf128_mask ((__v2df) __A,
2117 _mm256_mask_compress_pd (__m256d __W,
__mmask8 __U, __m256d __A) {
2118 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
2124 _mm256_maskz_compress_pd (
__mmask8 __U, __m256d __A) {
2125 return (__m256d) __builtin_ia32_compressdf256_mask ((__v4df) __A,
2127 _mm256_setzero_pd (),
2132 _mm_mask_compress_epi64 (__m128i __W,
__mmask8 __U, __m128i __A) {
2133 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
2139 _mm_maskz_compress_epi64 (
__mmask8 __U, __m128i __A) {
2140 return (__m128i) __builtin_ia32_compressdi128_mask ((__v2di) __A,
2142 _mm_setzero_si128 (),
2147 _mm256_mask_compress_epi64 (__m256i __W,
__mmask8 __U, __m256i __A) {
2148 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
2154 _mm256_maskz_compress_epi64 (
__mmask8 __U, __m256i __A) {
2155 return (__m256i) __builtin_ia32_compressdi256_mask ((__v4di) __A,
2157 _mm256_setzero_si256 (),
2162 _mm_mask_compress_ps (__m128 __W,
__mmask8 __U, __m128 __A) {
2163 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
2169 _mm_maskz_compress_ps (
__mmask8 __U, __m128 __A) {
2170 return (__m128) __builtin_ia32_compresssf128_mask ((__v4sf) __A,
2177 _mm256_mask_compress_ps (__m256 __W,
__mmask8 __U, __m256 __A) {
2178 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
2184 _mm256_maskz_compress_ps (
__mmask8 __U, __m256 __A) {
2185 return (__m256) __builtin_ia32_compresssf256_mask ((__v8sf) __A,
2187 _mm256_setzero_ps (),
2192 _mm_mask_compress_epi32 (__m128i __W,
__mmask8 __U, __m128i __A) {
2193 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
2199 _mm_maskz_compress_epi32 (
__mmask8 __U, __m128i __A) {
2200 return (__m128i) __builtin_ia32_compresssi128_mask ((__v4si) __A,
2202 _mm_setzero_si128 (),
2207 _mm256_mask_compress_epi32 (__m256i __W,
__mmask8 __U, __m256i __A) {
2208 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
2214 _mm256_maskz_compress_epi32 (
__mmask8 __U, __m256i __A) {
2215 return (__m256i) __builtin_ia32_compresssi256_mask ((__v8si) __A,
2217 _mm256_setzero_si256 (),
2222 _mm_mask_compressstoreu_pd (
void *__P,
__mmask8 __U, __m128d __A) {
2223 __builtin_ia32_compressstoredf128_mask ((__v2df *) __P,
2229 _mm256_mask_compressstoreu_pd (
void *__P,
__mmask8 __U, __m256d __A) {
2230 __builtin_ia32_compressstoredf256_mask ((__v4df *) __P,
2236 _mm_mask_compressstoreu_epi64 (
void *__P,
__mmask8 __U, __m128i __A) {
2237 __builtin_ia32_compressstoredi128_mask ((__v2di *) __P,
2243 _mm256_mask_compressstoreu_epi64 (
void *__P,
__mmask8 __U, __m256i __A) {
2244 __builtin_ia32_compressstoredi256_mask ((__v4di *) __P,
2250 _mm_mask_compressstoreu_ps (
void *__P,
__mmask8 __U, __m128 __A) {
2251 __builtin_ia32_compressstoresf128_mask ((__v4sf *) __P,
2257 _mm256_mask_compressstoreu_ps (
void *__P,
__mmask8 __U, __m256 __A) {
2258 __builtin_ia32_compressstoresf256_mask ((__v8sf *) __P,
2264 _mm_mask_compressstoreu_epi32 (
void *__P,
__mmask8 __U, __m128i __A) {
2265 __builtin_ia32_compressstoresi128_mask ((__v4si *) __P,
2271 _mm256_mask_compressstoreu_epi32 (
void *__P,
__mmask8 __U, __m256i __A) {
2272 __builtin_ia32_compressstoresi256_mask ((__v8si *) __P,
2278 _mm_mask_cvtepi32_pd (__m128d __W,
__mmask8 __U, __m128i __A) {
2279 return (__m128d) __builtin_ia32_cvtdq2pd128_mask ((__v4si) __A,
2285 _mm_maskz_cvtepi32_pd (
__mmask8 __U, __m128i __A) {
2286 return (__m128d) __builtin_ia32_cvtdq2pd128_mask ((__v4si) __A,
2293 _mm256_mask_cvtepi32_pd (__m256d __W,
__mmask8 __U, __m128i __A) {
2294 return (__m256d) __builtin_ia32_cvtdq2pd256_mask ((__v4si) __A,
2300 _mm256_maskz_cvtepi32_pd (
__mmask8 __U, __m128i __A) {
2301 return (__m256d) __builtin_ia32_cvtdq2pd256_mask ((__v4si) __A,
2303 _mm256_setzero_pd (),
2308 _mm_mask_cvtepi32_ps (__m128 __W,
__mmask8 __U, __m128i __A) {
2309 return (__m128) __builtin_ia32_cvtdq2ps128_mask ((__v4si) __A,
2315 _mm_maskz_cvtepi32_ps (
__mmask16 __U, __m128i __A) {
2316 return (__m128) __builtin_ia32_cvtdq2ps128_mask ((__v4si) __A,
2323 _mm256_mask_cvtepi32_ps (__m256 __W,
__mmask8 __U, __m256i __A) {
2324 return (__m256) __builtin_ia32_cvtdq2ps256_mask ((__v8si) __A,
2330 _mm256_maskz_cvtepi32_ps (
__mmask16 __U, __m256i __A) {
2331 return (__m256) __builtin_ia32_cvtdq2ps256_mask ((__v8si) __A,
2333 _mm256_setzero_ps (),
2338 _mm_mask_cvtpd_epi32 (__m128i __W,
__mmask8 __U, __m128d __A) {
2339 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
2345 _mm_maskz_cvtpd_epi32 (
__mmask8 __U, __m128d __A) {
2346 return (__m128i) __builtin_ia32_cvtpd2dq128_mask ((__v2df) __A,
2348 _mm_setzero_si128 (),
2353 _mm256_mask_cvtpd_epi32 (__m128i __W,
__mmask8 __U, __m256d __A) {
2354 return (__m128i) __builtin_ia32_cvtpd2dq256_mask ((__v4df) __A,
2360 _mm256_maskz_cvtpd_epi32 (
__mmask8 __U, __m256d __A) {
2361 return (__m128i) __builtin_ia32_cvtpd2dq256_mask ((__v4df) __A,
2363 _mm_setzero_si128 (),
2368 _mm_mask_cvtpd_ps (__m128 __W,
__mmask8 __U, __m128d __A) {
2369 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
2375 _mm_maskz_cvtpd_ps (
__mmask8 __U, __m128d __A) {
2376 return (__m128) __builtin_ia32_cvtpd2ps_mask ((__v2df) __A,
2383 _mm256_mask_cvtpd_ps (__m128 __W,
__mmask8 __U, __m256d __A) {
2384 return (__m128) __builtin_ia32_cvtpd2ps256_mask ((__v4df) __A,
2390 _mm256_maskz_cvtpd_ps (
__mmask8 __U, __m256d __A) {
2391 return (__m128) __builtin_ia32_cvtpd2ps256_mask ((__v4df) __A,
2398 _mm_cvtpd_epu32 (__m128d __A) {
2399 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2401 _mm_setzero_si128 (),
2406 _mm_mask_cvtpd_epu32 (__m128i __W,
__mmask8 __U, __m128d __A) {
2407 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2413 _mm_maskz_cvtpd_epu32 (
__mmask8 __U, __m128d __A) {
2414 return (__m128i) __builtin_ia32_cvtpd2udq128_mask ((__v2df) __A,
2416 _mm_setzero_si128 (),
2421 _mm256_cvtpd_epu32 (__m256d __A) {
2422 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2424 _mm_setzero_si128 (),
2429 _mm256_mask_cvtpd_epu32 (__m128i __W,
__mmask8 __U, __m256d __A) {
2430 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2436 _mm256_maskz_cvtpd_epu32 (
__mmask8 __U, __m256d __A) {
2437 return (__m128i) __builtin_ia32_cvtpd2udq256_mask ((__v4df) __A,
2439 _mm_setzero_si128 (),
2444 _mm_mask_cvtps_epi32 (__m128i __W,
__mmask8 __U, __m128 __A) {
2445 return (__m128i) __builtin_ia32_cvtps2dq128_mask ((__v4sf) __A,
2451 _mm_maskz_cvtps_epi32 (
__mmask8 __U, __m128 __A) {
2452 return (__m128i) __builtin_ia32_cvtps2dq128_mask ((__v4sf) __A,
2454 _mm_setzero_si128 (),
2459 _mm256_mask_cvtps_epi32 (__m256i __W,
__mmask8 __U, __m256 __A) {
2460 return (__m256i) __builtin_ia32_cvtps2dq256_mask ((__v8sf) __A,
2466 _mm256_maskz_cvtps_epi32 (
__mmask8 __U, __m256 __A) {
2467 return (__m256i) __builtin_ia32_cvtps2dq256_mask ((__v8sf) __A,
2469 _mm256_setzero_si256 (),
2474 _mm_mask_cvtps_pd (__m128d __W,
__mmask8 __U, __m128 __A) {
2475 return (__m128d) __builtin_ia32_cvtps2pd128_mask ((__v4sf) __A,
2481 _mm_maskz_cvtps_pd (
__mmask8 __U, __m128 __A) {
2482 return (__m128d) __builtin_ia32_cvtps2pd128_mask ((__v4sf) __A,
2489 _mm256_mask_cvtps_pd (__m256d __W,
__mmask8 __U, __m128 __A) {
2490 return (__m256d) __builtin_ia32_cvtps2pd256_mask ((__v4sf) __A,
2496 _mm256_maskz_cvtps_pd (
__mmask8 __U, __m128 __A) {
2497 return (__m256d) __builtin_ia32_cvtps2pd256_mask ((__v4sf) __A,
2499 _mm256_setzero_pd (),
2504 _mm_cvtps_epu32 (__m128 __A) {
2505 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2507 _mm_setzero_si128 (),
2512 _mm_mask_cvtps_epu32 (__m128i __W,
__mmask8 __U, __m128 __A) {
2513 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2519 _mm_maskz_cvtps_epu32 (
__mmask8 __U, __m128 __A) {
2520 return (__m128i) __builtin_ia32_cvtps2udq128_mask ((__v4sf) __A,
2522 _mm_setzero_si128 (),
2527 _mm256_cvtps_epu32 (__m256 __A) {
2528 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2530 _mm256_setzero_si256 (),
2535 _mm256_mask_cvtps_epu32 (__m256i __W,
__mmask8 __U, __m256 __A) {
2536 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2542 _mm256_maskz_cvtps_epu32 (
__mmask8 __U, __m256 __A) {
2543 return (__m256i) __builtin_ia32_cvtps2udq256_mask ((__v8sf) __A,
2545 _mm256_setzero_si256 (),
2550 _mm_mask_cvttpd_epi32 (__m128i __W,
__mmask8 __U, __m128d __A) {
2551 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2557 _mm_maskz_cvttpd_epi32 (
__mmask8 __U, __m128d __A) {
2558 return (__m128i) __builtin_ia32_cvttpd2dq128_mask ((__v2df) __A,
2560 _mm_setzero_si128 (),
2565 _mm256_mask_cvttpd_epi32 (__m128i __W,
__mmask8 __U, __m256d __A) {
2566 return (__m128i) __builtin_ia32_cvttpd2dq256_mask ((__v4df) __A,
2572 _mm256_maskz_cvttpd_epi32 (
__mmask8 __U, __m256d __A) {
2573 return (__m128i) __builtin_ia32_cvttpd2dq256_mask ((__v4df) __A,
2575 _mm_setzero_si128 (),
2580 _mm_cvttpd_epu32 (__m128d __A) {
2581 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2583 _mm_setzero_si128 (),
2588 _mm_mask_cvttpd_epu32 (__m128i __W,
__mmask8 __U, __m128d __A) {
2589 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2595 _mm_maskz_cvttpd_epu32 (
__mmask8 __U, __m128d __A) {
2596 return (__m128i) __builtin_ia32_cvttpd2udq128_mask ((__v2df) __A,
2598 _mm_setzero_si128 (),
2603 _mm256_cvttpd_epu32 (__m256d __A) {
2604 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2606 _mm_setzero_si128 (),
2611 _mm256_mask_cvttpd_epu32 (__m128i __W,
__mmask8 __U, __m256d __A) {
2612 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2618 _mm256_maskz_cvttpd_epu32 (
__mmask8 __U, __m256d __A) {
2619 return (__m128i) __builtin_ia32_cvttpd2udq256_mask ((__v4df) __A,
2621 _mm_setzero_si128 (),
2626 _mm_mask_cvttps_epi32 (__m128i __W,
__mmask8 __U, __m128 __A) {
2627 return (__m128i) __builtin_ia32_cvttps2dq128_mask ((__v4sf) __A,
2633 _mm_maskz_cvttps_epi32 (
__mmask8 __U, __m128 __A) {
2634 return (__m128i) __builtin_ia32_cvttps2dq128_mask ((__v4sf) __A,
2636 _mm_setzero_si128 (),
2641 _mm256_mask_cvttps_epi32 (__m256i __W,
__mmask8 __U, __m256 __A) {
2642 return (__m256i) __builtin_ia32_cvttps2dq256_mask ((__v8sf) __A,
2648 _mm256_maskz_cvttps_epi32 (
__mmask8 __U, __m256 __A) {
2649 return (__m256i) __builtin_ia32_cvttps2dq256_mask ((__v8sf) __A,
2651 _mm256_setzero_si256 (),
2656 _mm_cvttps_epu32 (__m128 __A) {
2657 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2659 _mm_setzero_si128 (),
2664 _mm_mask_cvttps_epu32 (__m128i __W,
__mmask8 __U, __m128 __A) {
2665 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2671 _mm_maskz_cvttps_epu32 (
__mmask8 __U, __m128 __A) {
2672 return (__m128i) __builtin_ia32_cvttps2udq128_mask ((__v4sf) __A,
2674 _mm_setzero_si128 (),
2679 _mm256_cvttps_epu32 (__m256 __A) {
2680 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2682 _mm256_setzero_si256 (),
2687 _mm256_mask_cvttps_epu32 (__m256i __W,
__mmask8 __U, __m256 __A) {
2688 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2694 _mm256_maskz_cvttps_epu32 (
__mmask8 __U, __m256 __A) {
2695 return (__m256i) __builtin_ia32_cvttps2udq256_mask ((__v8sf) __A,
2697 _mm256_setzero_si256 (),
2702 _mm_cvtepu32_pd (__m128i __A) {
2703 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2710 _mm_mask_cvtepu32_pd (__m128d __W,
__mmask8 __U, __m128i __A) {
2711 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2717 _mm_maskz_cvtepu32_pd (
__mmask8 __U, __m128i __A) {
2718 return (__m128d) __builtin_ia32_cvtudq2pd128_mask ((__v4si) __A,
2725 _mm256_cvtepu32_pd (__m128i __A) {
2726 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2728 _mm256_setzero_pd (),
2733 _mm256_mask_cvtepu32_pd (__m256d __W,
__mmask8 __U, __m128i __A) {
2734 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2740 _mm256_maskz_cvtepu32_pd (
__mmask8 __U, __m128i __A) {
2741 return (__m256d) __builtin_ia32_cvtudq2pd256_mask ((__v4si) __A,
2743 _mm256_setzero_pd (),
2748 _mm_cvtepu32_ps (__m128i __A) {
2749 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2756 _mm_mask_cvtepu32_ps (__m128 __W,
__mmask8 __U, __m128i __A) {
2757 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2763 _mm_maskz_cvtepu32_ps (
__mmask8 __U, __m128i __A) {
2764 return (__m128) __builtin_ia32_cvtudq2ps128_mask ((__v4si) __A,
2771 _mm256_cvtepu32_ps (__m256i __A) {
2772 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2774 _mm256_setzero_ps (),
2779 _mm256_mask_cvtepu32_ps (__m256 __W,
__mmask8 __U, __m256i __A) {
2780 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2786 _mm256_maskz_cvtepu32_ps (
__mmask8 __U, __m256i __A) {
2787 return (__m256) __builtin_ia32_cvtudq2ps256_mask ((__v8si) __A,
2789 _mm256_setzero_ps (),
2794 _mm_mask_div_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
2795 return (__m128d) __builtin_ia32_divpd_mask ((__v2df) __A,
2802 _mm_maskz_div_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
2803 return (__m128d) __builtin_ia32_divpd_mask ((__v2df) __A,
2811 _mm256_mask_div_pd (__m256d __W,
__mmask8 __U, __m256d __A,
2813 return (__m256d) __builtin_ia32_divpd256_mask ((__v4df) __A,
2820 _mm256_maskz_div_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
2821 return (__m256d) __builtin_ia32_divpd256_mask ((__v4df) __A,
2824 _mm256_setzero_pd (),
2829 _mm_mask_div_ps (__m128 __W,
__mmask8 __U, __m128 __A, __m128 __B) {
2830 return (__m128) __builtin_ia32_divps_mask ((__v4sf) __A,
2837 _mm_maskz_div_ps (
__mmask8 __U, __m128 __A, __m128 __B) {
2838 return (__m128) __builtin_ia32_divps_mask ((__v4sf) __A,
2846 _mm256_mask_div_ps (__m256 __W,
__mmask8 __U, __m256 __A, __m256 __B) {
2847 return (__m256) __builtin_ia32_divps256_mask ((__v8sf) __A,
2854 _mm256_maskz_div_ps (
__mmask8 __U, __m256 __A, __m256 __B) {
2855 return (__m256) __builtin_ia32_divps256_mask ((__v8sf) __A,
2858 _mm256_setzero_ps (),
2863 _mm_mask_expand_pd (__m128d __W,
__mmask8 __U, __m128d __A) {
2864 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2870 _mm_maskz_expand_pd (
__mmask8 __U, __m128d __A) {
2871 return (__m128d) __builtin_ia32_expanddf128_mask ((__v2df) __A,
2878 _mm256_mask_expand_pd (__m256d __W,
__mmask8 __U, __m256d __A) {
2879 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2885 _mm256_maskz_expand_pd (
__mmask8 __U, __m256d __A) {
2886 return (__m256d) __builtin_ia32_expanddf256_mask ((__v4df) __A,
2888 _mm256_setzero_pd (),
2893 _mm_mask_expand_epi64 (__m128i __W,
__mmask8 __U, __m128i __A) {
2894 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2900 _mm_maskz_expand_epi64 (
__mmask8 __U, __m128i __A) {
2901 return (__m128i) __builtin_ia32_expanddi128_mask ((__v2di) __A,
2903 _mm_setzero_si128 (),
2908 _mm256_mask_expand_epi64 (__m256i __W,
__mmask8 __U, __m256i __A) {
2909 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2915 _mm256_maskz_expand_epi64 (
__mmask8 __U, __m256i __A) {
2916 return (__m256i) __builtin_ia32_expanddi256_mask ((__v4di) __A,
2918 _mm256_setzero_si256 (),
2923 _mm_mask_expandloadu_pd (__m128d __W,
__mmask8 __U,
void const *__P) {
2924 return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
2931 _mm_maskz_expandloadu_pd (
__mmask8 __U,
void const *__P) {
2932 return (__m128d) __builtin_ia32_expandloaddf128_mask ((__v2df *) __P,
2940 _mm256_mask_expandloadu_pd (__m256d __W,
__mmask8 __U,
void const *__P) {
2941 return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
2948 _mm256_maskz_expandloadu_pd (
__mmask8 __U,
void const *__P) {
2949 return (__m256d) __builtin_ia32_expandloaddf256_mask ((__v4df *) __P,
2951 _mm256_setzero_pd (),
2957 _mm_mask_expandloadu_epi64 (__m128i __W,
__mmask8 __U,
void const *__P) {
2958 return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
2965 _mm_maskz_expandloadu_epi64 (
__mmask8 __U,
void const *__P) {
2966 return (__m128i) __builtin_ia32_expandloaddi128_mask ((__v2di *) __P,
2968 _mm_setzero_si128 (),
2974 _mm256_mask_expandloadu_epi64 (__m256i __W,
__mmask8 __U,
2976 return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
2983 _mm256_maskz_expandloadu_epi64 (
__mmask8 __U,
void const *__P) {
2984 return (__m256i) __builtin_ia32_expandloaddi256_mask ((__v4di *) __P,
2986 _mm256_setzero_si256 (),
2992 _mm_mask_expandloadu_ps (__m128 __W,
__mmask8 __U,
void const *__P) {
2993 return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
2999 _mm_maskz_expandloadu_ps (
__mmask8 __U,
void const *__P) {
3000 return (__m128) __builtin_ia32_expandloadsf128_mask ((__v4sf *) __P,
3008 _mm256_mask_expandloadu_ps (__m256 __W,
__mmask8 __U,
void const *__P) {
3009 return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
3015 _mm256_maskz_expandloadu_ps (
__mmask8 __U,
void const *__P) {
3016 return (__m256) __builtin_ia32_expandloadsf256_mask ((__v8sf *) __P,
3018 _mm256_setzero_ps (),
3024 _mm_mask_expandloadu_epi32 (__m128i __W,
__mmask8 __U,
void const *__P) {
3025 return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
3032 _mm_maskz_expandloadu_epi32 (
__mmask8 __U,
void const *__P) {
3033 return (__m128i) __builtin_ia32_expandloadsi128_mask ((__v4si *) __P,
3035 _mm_setzero_si128 (),
3040 _mm256_mask_expandloadu_epi32 (__m256i __W,
__mmask8 __U,
3042 return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
3049 _mm256_maskz_expandloadu_epi32 (
__mmask8 __U,
void const *__P) {
3050 return (__m256i) __builtin_ia32_expandloadsi256_mask ((__v8si *) __P,
3052 _mm256_setzero_si256 (),
3058 _mm_mask_expand_ps (__m128 __W,
__mmask8 __U, __m128 __A) {
3059 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
3065 _mm_maskz_expand_ps (
__mmask8 __U, __m128 __A) {
3066 return (__m128) __builtin_ia32_expandsf128_mask ((__v4sf) __A,
3073 _mm256_mask_expand_ps (__m256 __W,
__mmask8 __U, __m256 __A) {
3074 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
3080 _mm256_maskz_expand_ps (
__mmask8 __U, __m256 __A) {
3081 return (__m256) __builtin_ia32_expandsf256_mask ((__v8sf) __A,
3083 _mm256_setzero_ps (),
3088 _mm_mask_expand_epi32 (__m128i __W,
__mmask8 __U, __m128i __A) {
3089 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
3095 _mm_maskz_expand_epi32 (
__mmask8 __U, __m128i __A) {
3096 return (__m128i) __builtin_ia32_expandsi128_mask ((__v4si) __A,
3098 _mm_setzero_si128 (),
3103 _mm256_mask_expand_epi32 (__m256i __W,
__mmask8 __U, __m256i __A) {
3104 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
3110 _mm256_maskz_expand_epi32 (
__mmask8 __U, __m256i __A) {
3111 return (__m256i) __builtin_ia32_expandsi256_mask ((__v8si) __A,
3113 _mm256_setzero_si256 (),
3118 _mm_getexp_pd (__m128d __A) {
3119 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3126 _mm_mask_getexp_pd (__m128d __W,
__mmask8 __U, __m128d __A) {
3127 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3133 _mm_maskz_getexp_pd (
__mmask8 __U, __m128d __A) {
3134 return (__m128d) __builtin_ia32_getexppd128_mask ((__v2df) __A,
3141 _mm256_getexp_pd (__m256d __A) {
3142 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3144 _mm256_setzero_pd (),
3149 _mm256_mask_getexp_pd (__m256d __W,
__mmask8 __U, __m256d __A) {
3150 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3156 _mm256_maskz_getexp_pd (
__mmask8 __U, __m256d __A) {
3157 return (__m256d) __builtin_ia32_getexppd256_mask ((__v4df) __A,
3159 _mm256_setzero_pd (),
3164 _mm_getexp_ps (__m128 __A) {
3165 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3172 _mm_mask_getexp_ps (__m128 __W,
__mmask8 __U, __m128 __A) {
3173 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3179 _mm_maskz_getexp_ps (
__mmask8 __U, __m128 __A) {
3180 return (__m128) __builtin_ia32_getexpps128_mask ((__v4sf) __A,
3187 _mm256_getexp_ps (__m256 __A) {
3188 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3190 _mm256_setzero_ps (),
3195 _mm256_mask_getexp_ps (__m256 __W,
__mmask8 __U, __m256 __A) {
3196 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3202 _mm256_maskz_getexp_ps (
__mmask8 __U, __m256 __A) {
3203 return (__m256) __builtin_ia32_getexpps256_mask ((__v8sf) __A,
3205 _mm256_setzero_ps (),
3210 _mm_mask_max_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
3211 return (__m128d) __builtin_ia32_maxpd_mask ((__v2df) __A,
3218 _mm_maskz_max_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
3219 return (__m128d) __builtin_ia32_maxpd_mask ((__v2df) __A,
3227 _mm256_mask_max_pd (__m256d __W,
__mmask8 __U, __m256d __A,
3229 return (__m256d) __builtin_ia32_maxpd256_mask ((__v4df) __A,
3236 _mm256_maskz_max_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
3237 return (__m256d) __builtin_ia32_maxpd256_mask ((__v4df) __A,
3240 _mm256_setzero_pd (),
3245 _mm_mask_max_ps (__m128 __W,
__mmask8 __U, __m128 __A, __m128 __B) {
3246 return (__m128) __builtin_ia32_maxps_mask ((__v4sf) __A,
3253 _mm_maskz_max_ps (
__mmask8 __U, __m128 __A, __m128 __B) {
3254 return (__m128) __builtin_ia32_maxps_mask ((__v4sf) __A,
3262 _mm256_mask_max_ps (__m256 __W,
__mmask8 __U, __m256 __A, __m256 __B) {
3263 return (__m256) __builtin_ia32_maxps256_mask ((__v8sf) __A,
3270 _mm256_maskz_max_ps (
__mmask8 __U, __m256 __A, __m256 __B) {
3271 return (__m256) __builtin_ia32_maxps256_mask ((__v8sf) __A,
3274 _mm256_setzero_ps (),
3279 _mm_mask_min_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
3280 return (__m128d) __builtin_ia32_minpd_mask ((__v2df) __A,
3287 _mm_maskz_min_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
3288 return (__m128d) __builtin_ia32_minpd_mask ((__v2df) __A,
3296 _mm256_mask_min_pd (__m256d __W,
__mmask8 __U, __m256d __A,
3298 return (__m256d) __builtin_ia32_minpd256_mask ((__v4df) __A,
3305 _mm256_maskz_min_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
3306 return (__m256d) __builtin_ia32_minpd256_mask ((__v4df) __A,
3309 _mm256_setzero_pd (),
3314 _mm_mask_min_ps (__m128 __W,
__mmask8 __U, __m128 __A, __m128 __B) {
3315 return (__m128) __builtin_ia32_minps_mask ((__v4sf) __A,
3322 _mm_maskz_min_ps (
__mmask8 __U, __m128 __A, __m128 __B) {
3323 return (__m128) __builtin_ia32_minps_mask ((__v4sf) __A,
3331 _mm256_mask_min_ps (__m256 __W,
__mmask8 __U, __m256 __A, __m256 __B) {
3332 return (__m256) __builtin_ia32_minps256_mask ((__v8sf) __A,
3339 _mm256_maskz_min_ps (
__mmask8 __U, __m256 __A, __m256 __B) {
3340 return (__m256) __builtin_ia32_minps256_mask ((__v8sf) __A,
3343 _mm256_setzero_ps (),
3348 _mm_mask_mul_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
3349 return (__m128d) __builtin_ia32_mulpd_mask ((__v2df) __A,
3356 _mm_maskz_mul_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
3357 return (__m128d) __builtin_ia32_mulpd_mask ((__v2df) __A,
3365 _mm256_mask_mul_pd (__m256d __W,
__mmask8 __U, __m256d __A,
3367 return (__m256d) __builtin_ia32_mulpd256_mask ((__v4df) __A,
3374 _mm256_maskz_mul_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
3375 return (__m256d) __builtin_ia32_mulpd256_mask ((__v4df) __A,
3378 _mm256_setzero_pd (),
3383 _mm_mask_mul_ps (__m128 __W,
__mmask8 __U, __m128 __A, __m128 __B) {
3384 return (__m128) __builtin_ia32_mulps_mask ((__v4sf) __A,
3391 _mm_maskz_mul_ps (
__mmask8 __U, __m128 __A, __m128 __B) {
3392 return (__m128) __builtin_ia32_mulps_mask ((__v4sf) __A,
3400 _mm256_mask_mul_ps (__m256 __W,
__mmask8 __U, __m256 __A, __m256 __B) {
3401 return (__m256) __builtin_ia32_mulps256_mask ((__v8sf) __A,
3408 _mm256_maskz_mul_ps (
__mmask8 __U, __m256 __A, __m256 __B) {
3409 return (__m256) __builtin_ia32_mulps256_mask ((__v8sf) __A,
3412 _mm256_setzero_ps (),
3417 _mm_mask_abs_epi32 (__m128i __W,
__mmask8 __U, __m128i __A) {
3418 return (__m128i) __builtin_ia32_pabsd128_mask ((__v4si) __A,
3424 _mm_maskz_abs_epi32 (
__mmask8 __U, __m128i __A) {
3425 return (__m128i) __builtin_ia32_pabsd128_mask ((__v4si) __A,
3427 _mm_setzero_si128 (),
3432 _mm256_mask_abs_epi32 (__m256i __W,
__mmask8 __U, __m256i __A) {
3433 return (__m256i) __builtin_ia32_pabsd256_mask ((__v8si) __A,
3439 _mm256_maskz_abs_epi32 (
__mmask8 __U, __m256i __A) {
3440 return (__m256i) __builtin_ia32_pabsd256_mask ((__v8si) __A,
3442 _mm256_setzero_si256 (),
3447 _mm_abs_epi64 (__m128i __A) {
3448 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3450 _mm_setzero_si128 (),
3455 _mm_mask_abs_epi64 (__m128i __W,
__mmask8 __U, __m128i __A) {
3456 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3462 _mm_maskz_abs_epi64 (
__mmask8 __U, __m128i __A) {
3463 return (__m128i) __builtin_ia32_pabsq128_mask ((__v2di) __A,
3465 _mm_setzero_si128 (),
3470 _mm256_abs_epi64 (__m256i __A) {
3471 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3473 _mm256_setzero_si256 (),
3478 _mm256_mask_abs_epi64 (__m256i __W,
__mmask8 __U, __m256i __A) {
3479 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3485 _mm256_maskz_abs_epi64 (
__mmask8 __U, __m256i __A) {
3486 return (__m256i) __builtin_ia32_pabsq256_mask ((__v4di) __A,
3488 _mm256_setzero_si256 (),
3493 _mm_maskz_max_epi32 (
__mmask8 __M, __m128i __A, __m128i __B) {
3494 return (__m128i) __builtin_ia32_pmaxsd128_mask ((__v4si) __A,
3497 _mm_setzero_si128 (),
3502 _mm_mask_max_epi32 (__m128i __W,
__mmask8 __M, __m128i __A,
3504 return (__m128i) __builtin_ia32_pmaxsd128_mask ((__v4si) __A,
3510 _mm256_maskz_max_epi32 (
__mmask8 __M, __m256i __A, __m256i __B) {
3511 return (__m256i) __builtin_ia32_pmaxsd256_mask ((__v8si) __A,
3514 _mm256_setzero_si256 (),
3519 _mm256_mask_max_epi32 (__m256i __W,
__mmask8 __M, __m256i __A,
3521 return (__m256i) __builtin_ia32_pmaxsd256_mask ((__v8si) __A,
3527 _mm_maskz_max_epi64 (
__mmask8 __M, __m128i __A, __m128i __B) {
3528 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3531 _mm_setzero_si128 (),
3536 _mm_mask_max_epi64 (__m128i __W,
__mmask8 __M, __m128i __A,
3538 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3544 _mm_max_epi64 (__m128i __A, __m128i __B) {
3545 return (__m128i) __builtin_ia32_pmaxsq128_mask ((__v2di) __A,
3548 _mm_setzero_si128 (),
3553 _mm256_maskz_max_epi64 (
__mmask8 __M, __m256i __A, __m256i __B) {
3554 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3557 _mm256_setzero_si256 (),
3562 _mm256_mask_max_epi64 (__m256i __W,
__mmask8 __M, __m256i __A,
3564 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3570 _mm256_max_epi64 (__m256i __A, __m256i __B) {
3571 return (__m256i) __builtin_ia32_pmaxsq256_mask ((__v4di) __A,
3574 _mm256_setzero_si256 (),
3579 _mm_maskz_max_epu32 (
__mmask8 __M, __m128i __A, __m128i __B) {
3580 return (__m128i) __builtin_ia32_pmaxud128_mask ((__v4si) __A,
3583 _mm_setzero_si128 (),
3588 _mm_mask_max_epu32 (__m128i __W,
__mmask8 __M, __m128i __A,
3590 return (__m128i) __builtin_ia32_pmaxud128_mask ((__v4si) __A,
3596 _mm256_maskz_max_epu32 (
__mmask8 __M, __m256i __A, __m256i __B) {
3597 return (__m256i) __builtin_ia32_pmaxud256_mask ((__v8si) __A,
3600 _mm256_setzero_si256 (),
3605 _mm256_mask_max_epu32 (__m256i __W,
__mmask8 __M, __m256i __A,
3607 return (__m256i) __builtin_ia32_pmaxud256_mask ((__v8si) __A,
3613 _mm_maskz_max_epu64 (
__mmask8 __M, __m128i __A, __m128i __B) {
3614 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3617 _mm_setzero_si128 (),
3622 _mm_max_epu64 (__m128i __A, __m128i __B) {
3623 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3626 _mm_setzero_si128 (),
3631 _mm_mask_max_epu64 (__m128i __W,
__mmask8 __M, __m128i __A,
3633 return (__m128i) __builtin_ia32_pmaxuq128_mask ((__v2di) __A,
3639 _mm256_maskz_max_epu64 (
__mmask8 __M, __m256i __A, __m256i __B) {
3640 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3643 _mm256_setzero_si256 (),
3648 _mm256_max_epu64 (__m256i __A, __m256i __B) {
3649 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3652 _mm256_setzero_si256 (),
3657 _mm256_mask_max_epu64 (__m256i __W,
__mmask8 __M, __m256i __A,
3659 return (__m256i) __builtin_ia32_pmaxuq256_mask ((__v4di) __A,
3665 _mm_maskz_min_epi32 (
__mmask8 __M, __m128i __A, __m128i __B) {
3666 return (__m128i) __builtin_ia32_pminsd128_mask ((__v4si) __A,
3669 _mm_setzero_si128 (),
3674 _mm_mask_min_epi32 (__m128i __W,
__mmask8 __M, __m128i __A,
3676 return (__m128i) __builtin_ia32_pminsd128_mask ((__v4si) __A,
3682 _mm256_maskz_min_epi32 (
__mmask8 __M, __m256i __A, __m256i __B) {
3683 return (__m256i) __builtin_ia32_pminsd256_mask ((__v8si) __A,
3686 _mm256_setzero_si256 (),
3691 _mm256_mask_min_epi32 (__m256i __W,
__mmask8 __M, __m256i __A,
3693 return (__m256i) __builtin_ia32_pminsd256_mask ((__v8si) __A,
3699 _mm_min_epi64 (__m128i __A, __m128i __B) {
3700 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3703 _mm_setzero_si128 (),
3708 _mm_mask_min_epi64 (__m128i __W,
__mmask8 __M, __m128i __A,
3710 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3716 _mm_maskz_min_epi64 (
__mmask8 __M, __m128i __A, __m128i __B) {
3717 return (__m128i) __builtin_ia32_pminsq128_mask ((__v2di) __A,
3720 _mm_setzero_si128 (),
3725 _mm256_min_epi64 (__m256i __A, __m256i __B) {
3726 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3729 _mm256_setzero_si256 (),
3734 _mm256_mask_min_epi64 (__m256i __W,
__mmask8 __M, __m256i __A,
3736 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3742 _mm256_maskz_min_epi64 (
__mmask8 __M, __m256i __A, __m256i __B) {
3743 return (__m256i) __builtin_ia32_pminsq256_mask ((__v4di) __A,
3746 _mm256_setzero_si256 (),
3751 _mm_maskz_min_epu32 (
__mmask8 __M, __m128i __A, __m128i __B) {
3752 return (__m128i) __builtin_ia32_pminud128_mask ((__v4si) __A,
3755 _mm_setzero_si128 (),
3760 _mm_mask_min_epu32 (__m128i __W,
__mmask8 __M, __m128i __A,
3762 return (__m128i) __builtin_ia32_pminud128_mask ((__v4si) __A,
3768 _mm256_maskz_min_epu32 (
__mmask8 __M, __m256i __A, __m256i __B) {
3769 return (__m256i) __builtin_ia32_pminud256_mask ((__v8si) __A,
3772 _mm256_setzero_si256 (),
3777 _mm256_mask_min_epu32 (__m256i __W,
__mmask8 __M, __m256i __A,
3779 return (__m256i) __builtin_ia32_pminud256_mask ((__v8si) __A,
3785 _mm_min_epu64 (__m128i __A, __m128i __B) {
3786 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3789 _mm_setzero_si128 (),
3794 _mm_mask_min_epu64 (__m128i __W,
__mmask8 __M, __m128i __A,
3796 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3802 _mm_maskz_min_epu64 (
__mmask8 __M, __m128i __A, __m128i __B) {
3803 return (__m128i) __builtin_ia32_pminuq128_mask ((__v2di) __A,
3806 _mm_setzero_si128 (),
3811 _mm256_min_epu64 (__m256i __A, __m256i __B) {
3812 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3815 _mm256_setzero_si256 (),
3820 _mm256_mask_min_epu64 (__m256i __W,
__mmask8 __M, __m256i __A,
3822 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3828 _mm256_maskz_min_epu64 (
__mmask8 __M, __m256i __A, __m256i __B) {
3829 return (__m256i) __builtin_ia32_pminuq256_mask ((__v4di) __A,
3832 _mm256_setzero_si256 (),
3836 #define _mm_roundscale_pd(__A, __imm) __extension__ ({ \
3837 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, \
3838 __imm, (__v2df) _mm_setzero_pd (), (__mmask8) -1); })
3841 #define _mm_mask_roundscale_pd(__W, __U, __A, __imm) __extension__ ({ \
3842 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, __imm, \
3843 (__v2df) __W, (__mmask8) __U); })
3846 #define _mm_maskz_roundscale_pd(__U, __A, __imm) __extension__ ({ \
3847 (__m128d) __builtin_ia32_rndscalepd_128_mask ((__v2df) __A, __imm, \
3848 (__v2df) _mm_setzero_pd (), (__mmask8) __U); })
3851 #define _mm256_roundscale_pd(__A, __imm) __extension__ ({ \
3852 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3853 (__v4df) _mm256_setzero_pd (), (__mmask8) -1); })
3856 #define _mm256_mask_roundscale_pd(__W, __U, __A, __imm) __extension__ ({ \
3857 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3858 (__v4df) __W, (__mmask8) __U); })
3861 #define _mm256_maskz_roundscale_pd(__U, __A, __imm) __extension__ ({ \
3862 (__m256d) __builtin_ia32_rndscalepd_256_mask ((__v4df) __A, __imm, \
3863 (__v4df) _mm256_setzero_pd(), (__mmask8) __U); })
3865 #define _mm_roundscale_ps(__A, __imm) __extension__ ({ \
3866 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3867 (__v4sf) _mm_setzero_ps(), (__mmask8) -1); })
3870 #define _mm_mask_roundscale_ps(__W, __U, __A, __imm) __extension__ ({ \
3871 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3872 (__v4sf) __W, (__mmask8) __U); })
3875 #define _mm_maskz_roundscale_ps(__U, __A, __imm) __extension__ ({ \
3876 (__m128) __builtin_ia32_rndscaleps_128_mask ((__v4sf) __A, __imm, \
3877 (__v4sf) _mm_setzero_ps(), (__mmask8) __U); })
3879 #define _mm256_roundscale_ps(__A, __imm) __extension__ ({ \
3880 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A,__imm, \
3881 (__v8sf) _mm256_setzero_ps(), (__mmask8) -1); })
3883 #define _mm256_mask_roundscale_ps(__W, __U, __A,__imm) __extension__ ({ \
3884 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A, __imm, \
3885 (__v8sf) __W, (__mmask8) __U); })
3888 #define _mm256_maskz_roundscale_ps(__U, __A, __imm) __extension__ ({ \
3889 (__m256) __builtin_ia32_rndscaleps_256_mask ((__v8sf) __A, __imm, \
3890 (__v8sf) _mm256_setzero_ps(), (__mmask8) __U); })
3893 _mm_scalef_pd (__m128d __A, __m128d __B) {
3894 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3902 _mm_mask_scalef_pd (__m128d __W,
__mmask8 __U, __m128d __A,
3904 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3911 _mm_maskz_scalef_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
3912 return (__m128d) __builtin_ia32_scalefpd128_mask ((__v2df) __A,
3920 _mm256_scalef_pd (__m256d __A, __m256d __B) {
3921 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3924 _mm256_setzero_pd (),
3929 _mm256_mask_scalef_pd (__m256d __W,
__mmask8 __U, __m256d __A,
3931 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3938 _mm256_maskz_scalef_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
3939 return (__m256d) __builtin_ia32_scalefpd256_mask ((__v4df) __A,
3942 _mm256_setzero_pd (),
3947 _mm_scalef_ps (__m128 __A, __m128 __B) {
3948 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3956 _mm_mask_scalef_ps (__m128 __W,
__mmask8 __U, __m128 __A, __m128 __B) {
3957 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3964 _mm_maskz_scalef_ps (
__mmask8 __U, __m128 __A, __m128 __B) {
3965 return (__m128) __builtin_ia32_scalefps128_mask ((__v4sf) __A,
3973 _mm256_scalef_ps (__m256 __A, __m256 __B) {
3974 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3977 _mm256_setzero_ps (),
3982 _mm256_mask_scalef_ps (__m256 __W,
__mmask8 __U, __m256 __A,
3984 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3991 _mm256_maskz_scalef_ps (
__mmask8 __U, __m256 __A, __m256 __B) {
3992 return (__m256) __builtin_ia32_scalefps256_mask ((__v8sf) __A,
3995 _mm256_setzero_ps (),
3999 #define _mm_i64scatter_pd(__addr,__index, __v1, __scale) __extension__ ({ \
4000 __builtin_ia32_scatterdiv2df(__addr, (__mmask8) 0xFF, (__v2di) __index, \
4001 (__v2df) __v1, __scale); })
4003 #define _mm_mask_i64scatter_pd(__addr, __mask, __index, __v1, \
4004 __scale) __extension__ ({ \
4005 __builtin_ia32_scatterdiv2df (__addr, __mask, (__v2di) __index, \
4006 (__v2df) __v1, __scale); })
4009 #define _mm_i64scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4010 __builtin_ia32_scatterdiv2di (__addr, (__mmask8) 0xFF, \
4011 (__v2di) __index, (__v2di) __v1, __scale); })
4013 #define _mm_mask_i64scatter_epi64(__addr, __mask, __index, __v1,\
4014 __scale) __extension__ ({ \
4015 __builtin_ia32_scatterdiv2di (__addr, __mask, (__v2di) __index,\
4016 (__v2di) __v1, __scale); })
4018 #define _mm256_i64scatter_pd(__addr, __index, __v1, __scale) __extension__ ({ \
4019 __builtin_ia32_scatterdiv4df (__addr, (__mmask8) 0xFF,\
4020 (__v4di) __index, (__v4df) __v1, __scale); })
4022 #define _mm256_mask_i64scatter_pd(__addr, __mask, __index, __v1,\
4023 __scale) __extension__ ({ \
4024 __builtin_ia32_scatterdiv4df (__addr, __mask, (__v4di) __index,\
4025 (__v4df) __v1, __scale); })
4027 #define _mm256_i64scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4028 __builtin_ia32_scatterdiv4di (__addr, (__mmask8) 0xFF, (__v4di) __index,\
4029 (__v4di) __v1, __scale); })
4031 #define _mm256_mask_i64scatter_epi64(__addr, __mask, __index, __v1,\
4032 __scale) __extension__ ({ \
4033 __builtin_ia32_scatterdiv4di (__addr, __mask, (__v4di) __index,\
4034 (__v4di) __v1, __scale); })
4036 #define _mm_i64scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4037 __builtin_ia32_scatterdiv4sf (__addr, (__mmask8) 0xFF,\
4038 (__v2di) __index, (__v4sf) __v1, __scale); })
4040 #define _mm_mask_i64scatter_ps(__addr, __mask, __index, __v1, \
4041 __scale) __extension__ ({ \
4042 __builtin_ia32_scatterdiv4sf (__addr, __mask, (__v2di) __index,\
4043 (__v4sf) __v1, __scale); })
4045 #define _mm_i64scatter_epi32(__addr, __index, __v1, \
4046 __scale) __extension__ ({ \
4047 __builtin_ia32_scatterdiv4si (__addr, (__mmask8) 0xFF,\
4048 (__v2di) __index, (__v4si) __v1, __scale); })
4050 #define _mm_mask_i64scatter_epi32(__addr, __mask, __index, __v1,\
4051 __scale) __extension__ ({ \
4052 __builtin_ia32_scatterdiv4si (__addr, __mask, (__v2di) __index,\
4053 (__v4si) __v1, __scale); })
4055 #define _mm256_i64scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4056 __builtin_ia32_scatterdiv8sf (__addr, (__mmask8) 0xFF, (__v4di) __index, \
4057 (__v4sf) __v1, __scale); })
4059 #define _mm256_mask_i64scatter_ps(__addr, __mask, __index, __v1, \
4060 __scale) __extension__ ({ \
4061 __builtin_ia32_scatterdiv8sf (__addr, __mask, (__v4di) __index, \
4062 (__v4sf) __v1, __scale); })
4064 #define _mm256_i64scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4065 __builtin_ia32_scatterdiv8si (__addr, (__mmask8) 0xFF, \
4066 (__v4di) __index, (__v4si) __v1, __scale); })
4068 #define _mm256_mask_i64scatter_epi32(__addr, __mask, __index, __v1, \
4069 __scale) __extension__ ({ \
4070 __builtin_ia32_scatterdiv8si(__addr, __mask, (__v4di) __index, \
4071 (__v4si) __v1, __scale); })
4073 #define _mm_i32scatter_pd(__addr, __index, __v1, \
4074 __scale) __extension__ ({ \
4075 __builtin_ia32_scattersiv2df (__addr, (__mmask8) 0xFF, \
4076 (__v4si) __index, (__v2df) __v1, __scale); })
4078 #define _mm_mask_i32scatter_pd(__addr, __mask, __index, __v1, \
4079 __scale) __extension__ ({ \
4080 __builtin_ia32_scattersiv2df (__addr, __mask, (__v4si) __index,\
4081 (__v2df) __v1, __scale); })
4083 #define _mm_i32scatter_epi64(__addr, __index, __v1, __scale) __extension__ ({ \
4084 __builtin_ia32_scattersiv2di (__addr, (__mmask8) 0xFF, \
4085 (__v4si) __index, (__v2di) __v1, __scale); })
4087 #define _mm_mask_i32scatter_epi64(__addr, __mask, __index, __v1, \
4088 __scale) __extension__ ({ \
4089 __builtin_ia32_scattersiv2di (__addr, __mask, (__v4si) __index, \
4090 (__v2di) __v1, __scale); })
4092 #define _mm256_i32scatter_pd(__addr, __index, __v1, __scale) __extension__ ({ \
4093 __builtin_ia32_scattersiv4df (__addr, (__mmask8) 0xFF, \
4094 (__v4si) __index, (__v4df) __v1, __scale); })
4096 #define _mm256_mask_i32scatter_pd(__addr, __mask, __index, __v1, \
4097 __scale) __extension__ ({ \
4098 __builtin_ia32_scattersiv4df (__addr, __mask, (__v4si) __index, \
4099 (__v4df) __v1, __scale); })
4101 #define _mm256_i32scatter_epi64(__addr, __index, __v1, \
4102 __scale) __extension__ ({ \
4103 __builtin_ia32_scattersiv4di (__addr, (__mmask8) 0xFF, \
4104 (__v4si) __index, (__v4di) __v1, __scale); })
4106 #define _mm256_mask_i32scatter_epi64(__addr, __mask, __index, __v1, \
4107 __scale) __extension__ ({ \
4108 __builtin_ia32_scattersiv4di (__addr, __mask, (__v4si) __index, \
4109 (__v4di) __v1, __scale); })
4111 #define _mm_i32scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4112 __builtin_ia32_scattersiv4sf (__addr, (__mmask8) 0xFF, \
4113 (__v4si) __index, (__v4sf) __v1, __scale); })
4115 #define _mm_mask_i32scatter_ps(__addr, __mask, __index, __v1, \
4116 __scale) __extension__ ({ \
4117 __builtin_ia32_scattersiv4sf (__addr, __mask, (__v4si) __index, \
4118 (__v4sf) __v1, __scale); })
4120 #define _mm_i32scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4121 __builtin_ia32_scattersiv4si (__addr, (__mmask8) 0xFF, \
4122 (__v4si) __index, (__v4si) __v1, __scale); })
4124 #define _mm_mask_i32scatter_epi32(__addr, __mask, __index, __v1, \
4125 __scale) __extension__ ({ \
4126 __builtin_ia32_scattersiv4si (__addr, __mask, (__v4si) __index,\
4127 (__v4si) __v1, __scale); })
4129 #define _mm256_i32scatter_ps(__addr, __index, __v1, __scale) __extension__ ({ \
4130 __builtin_ia32_scattersiv8sf (__addr, (__mmask8) 0xFF, \
4131 (__v8si) __index, (__v8sf) __v1, __scale); })
4133 #define _mm256_mask_i32scatter_ps(__addr, __mask, __index, __v1, \
4134 __scale) __extension__ ({ \
4135 __builtin_ia32_scattersiv8sf (__addr, __mask, (__v8si) __index,\
4136 (__v8sf) __v1, __scale); })
4138 #define _mm256_i32scatter_epi32(__addr, __index, __v1, __scale) __extension__ ({ \
4139 __builtin_ia32_scattersiv8si (__addr, (__mmask8) 0xFF, \
4140 (__v8si) __index, (__v8si) __v1, __scale); })
4142 #define _mm256_mask_i32scatter_epi32(__addr, __mask, __index, __v1, \
4143 __scale) __extension__ ({ \
4144 __builtin_ia32_scattersiv8si (__addr, __mask, (__v8si) __index, \
4145 (__v8si) __v1, __scale); })
4148 _mm_mask_sqrt_pd (__m128d __W,
__mmask8 __U, __m128d __A) {
4149 return (__m128d) __builtin_ia32_sqrtpd128_mask ((__v2df) __A,
4155 _mm_maskz_sqrt_pd (
__mmask8 __U, __m128d __A) {
4156 return (__m128d) __builtin_ia32_sqrtpd128_mask ((__v2df) __A,
4163 _mm256_mask_sqrt_pd (__m256d __W,
__mmask8 __U, __m256d __A) {
4164 return (__m256d) __builtin_ia32_sqrtpd256_mask ((__v4df) __A,
4170 _mm256_maskz_sqrt_pd (
__mmask8 __U, __m256d __A) {
4171 return (__m256d) __builtin_ia32_sqrtpd256_mask ((__v4df) __A,
4173 _mm256_setzero_pd (),
4178 _mm_mask_sqrt_ps (__m128 __W,
__mmask8 __U, __m128 __A) {
4179 return (__m128) __builtin_ia32_sqrtps128_mask ((__v4sf) __A,
4185 _mm_maskz_sqrt_ps (
__mmask8 __U, __m128 __A) {
4186 return (__m128) __builtin_ia32_sqrtps128_mask ((__v4sf) __A,
4193 _mm256_mask_sqrt_ps (__m256 __W,
__mmask8 __U, __m256 __A) {
4194 return (__m256) __builtin_ia32_sqrtps256_mask ((__v8sf) __A,
4200 _mm256_maskz_sqrt_ps (
__mmask8 __U, __m256 __A) {
4201 return (__m256) __builtin_ia32_sqrtps256_mask ((__v8sf) __A,
4203 _mm256_setzero_ps (),
4208 _mm_mask_sub_pd (__m128d __W,
__mmask8 __U, __m128d __A, __m128d __B) {
4209 return (__m128d) __builtin_ia32_subpd128_mask ((__v2df) __A,
4216 _mm_maskz_sub_pd (
__mmask8 __U, __m128d __A, __m128d __B) {
4217 return (__m128d) __builtin_ia32_subpd128_mask ((__v2df) __A,
4225 _mm256_mask_sub_pd (__m256d __W,
__mmask8 __U, __m256d __A,
4227 return (__m256d) __builtin_ia32_subpd256_mask ((__v4df) __A,
4234 _mm256_maskz_sub_pd (
__mmask8 __U, __m256d __A, __m256d __B) {
4235 return (__m256d) __builtin_ia32_subpd256_mask ((__v4df) __A,
4238 _mm256_setzero_pd (),
4243 _mm_mask_sub_ps (__m128 __W,
__mmask16 __U, __m128 __A, __m128 __B) {
4244 return (__m128) __builtin_ia32_subps128_mask ((__v4sf) __A,
4251 _mm_maskz_sub_ps (
__mmask16 __U, __m128 __A, __m128 __B) {
4252 return (__m128) __builtin_ia32_subps128_mask ((__v4sf) __A,
4260 _mm256_mask_sub_ps (__m256 __W,
__mmask16 __U, __m256 __A, __m256 __B) {
4261 return (__m256) __builtin_ia32_subps256_mask ((__v8sf) __A,
4268 _mm256_maskz_sub_ps (
__mmask16 __U, __m256 __A, __m256 __B) {
4269 return (__m256) __builtin_ia32_subps256_mask ((__v8sf) __A,
4272 _mm256_setzero_ps (),
4277 _mm_mask2_permutex2var_epi32 (__m128i __A, __m128i __I,
__mmask8 __U,
4279 return (__m128i) __builtin_ia32_vpermi2vard128_mask ((__v4si) __A,
4287 _mm256_mask2_permutex2var_epi32 (__m256i __A, __m256i __I,
4289 return (__m256i) __builtin_ia32_vpermi2vard256_mask ((__v8si) __A,
4297 _mm_mask2_permutex2var_pd (__m128d __A, __m128i __I,
__mmask8 __U,
4299 return (__m128d) __builtin_ia32_vpermi2varpd128_mask ((__v2df) __A,
4308 _mm256_mask2_permutex2var_pd (__m256d __A, __m256i __I,
__mmask8 __U,
4310 return (__m256d) __builtin_ia32_vpermi2varpd256_mask ((__v4df) __A,
4319 _mm_mask2_permutex2var_ps (__m128 __A, __m128i __I,
__mmask8 __U,
4321 return (__m128) __builtin_ia32_vpermi2varps128_mask ((__v4sf) __A,
4329 _mm256_mask2_permutex2var_ps (__m256 __A, __m256i __I,
__mmask8 __U,
4331 return (__m256) __builtin_ia32_vpermi2varps256_mask ((__v8sf) __A,
4339 _mm_mask2_permutex2var_epi64 (__m128i __A, __m128i __I,
__mmask8 __U,
4341 return (__m128i) __builtin_ia32_vpermi2varq128_mask ((__v2di) __A,
4349 _mm256_mask2_permutex2var_epi64 (__m256i __A, __m256i __I,
4351 return (__m256i) __builtin_ia32_vpermi2varq256_mask ((__v4di) __A,
4359 _mm_permutex2var_epi32 (__m128i __A, __m128i __I, __m128i __B) {
4360 return (__m128i) __builtin_ia32_vpermt2vard128_mask ((__v4si) __I
4368 _mm_mask_permutex2var_epi32 (__m128i __A,
__mmask8 __U, __m128i __I,
4370 return (__m128i) __builtin_ia32_vpermt2vard128_mask ((__v4si) __I
4378 _mm_maskz_permutex2var_epi32 (
__mmask8 __U, __m128i __A, __m128i __I,
4380 return (__m128i) __builtin_ia32_vpermt2vard128_maskz ((__v4si) __I
4389 _mm256_permutex2var_epi32 (__m256i __A, __m256i __I, __m256i __B) {
4390 return (__m256i) __builtin_ia32_vpermt2vard256_mask ((__v8si) __I
4398 _mm256_mask_permutex2var_epi32 (__m256i __A,
__mmask8 __U, __m256i __I,
4400 return (__m256i) __builtin_ia32_vpermt2vard256_mask ((__v8si) __I
4408 _mm256_maskz_permutex2var_epi32 (
__mmask8 __U, __m256i __A,
4409 __m256i __I, __m256i __B) {
4410 return (__m256i) __builtin_ia32_vpermt2vard256_maskz ((__v8si) __I
4419 _mm_permutex2var_pd (__m128d __A, __m128i __I, __m128d __B) {
4420 return (__m128d) __builtin_ia32_vpermt2varpd128_mask ((__v2di) __I
4429 _mm_mask_permutex2var_pd (__m128d __A,
__mmask8 __U, __m128i __I,
4431 return (__m128d) __builtin_ia32_vpermt2varpd128_mask ((__v2di) __I
4440 _mm_maskz_permutex2var_pd (
__mmask8 __U, __m128d __A, __m128i __I,
4442 return (__m128d) __builtin_ia32_vpermt2varpd128_maskz ((__v2di) __I
4451 _mm256_permutex2var_pd (__m256d __A, __m256i __I, __m256d __B) {
4452 return (__m256d) __builtin_ia32_vpermt2varpd256_mask ((__v4di) __I
4461 _mm256_mask_permutex2var_pd (__m256d __A,
__mmask8 __U, __m256i __I,
4463 return (__m256d) __builtin_ia32_vpermt2varpd256_mask ((__v4di) __I
4472 _mm256_maskz_permutex2var_pd (
__mmask8 __U, __m256d __A, __m256i __I,
4474 return (__m256d) __builtin_ia32_vpermt2varpd256_maskz ((__v4di) __I
4483 _mm_permutex2var_ps (__m128 __A, __m128i __I, __m128 __B) {
4484 return (__m128) __builtin_ia32_vpermt2varps128_mask ((__v4si) __I
4492 _mm_mask_permutex2var_ps (__m128 __A,
__mmask8 __U, __m128i __I,
4494 return (__m128) __builtin_ia32_vpermt2varps128_mask ((__v4si) __I
4502 _mm_maskz_permutex2var_ps (
__mmask8 __U, __m128 __A, __m128i __I,
4504 return (__m128) __builtin_ia32_vpermt2varps128_maskz ((__v4si) __I
4513 _mm256_permutex2var_ps (__m256 __A, __m256i __I, __m256 __B) {
4514 return (__m256) __builtin_ia32_vpermt2varps256_mask ((__v8si) __I
4522 _mm256_mask_permutex2var_ps (__m256 __A,
__mmask8 __U, __m256i __I,
4524 return (__m256) __builtin_ia32_vpermt2varps256_mask ((__v8si) __I
4532 _mm256_maskz_permutex2var_ps (
__mmask8 __U, __m256 __A, __m256i __I,
4534 return (__m256) __builtin_ia32_vpermt2varps256_maskz ((__v8si) __I
4543 _mm_permutex2var_epi64 (__m128i __A, __m128i __I, __m128i __B) {
4544 return (__m128i) __builtin_ia32_vpermt2varq128_mask ((__v2di) __I
4552 _mm_mask_permutex2var_epi64 (__m128i __A,
__mmask8 __U, __m128i __I,
4554 return (__m128i) __builtin_ia32_vpermt2varq128_mask ((__v2di) __I
4562 _mm_maskz_permutex2var_epi64 (
__mmask8 __U, __m128i __A, __m128i __I,
4564 return (__m128i) __builtin_ia32_vpermt2varq128_maskz ((__v2di) __I
4574 _mm256_permutex2var_epi64 (__m256i __A, __m256i __I, __m256i __B) {
4575 return (__m256i) __builtin_ia32_vpermt2varq256_mask ((__v4di) __I
4583 _mm256_mask_permutex2var_epi64 (__m256i __A,
__mmask8 __U, __m256i __I,
4585 return (__m256i) __builtin_ia32_vpermt2varq256_mask ((__v4di) __I
4593 _mm256_maskz_permutex2var_epi64 (
__mmask8 __U, __m256i __A,
4594 __m256i __I, __m256i __B) {
4595 return (__m256i) __builtin_ia32_vpermt2varq256_maskz ((__v4di) __I
4603 #undef __DEFAULT_FN_ATTRS
4604 #undef __DEFAULT_FN_ATTRS_BOTH
unsigned char __mmask8
Definition: avx512fintrin.h:39
#define __DEFAULT_FN_ATTRS_BOTH
Definition: avx512vlintrin.h:32
static vector float vector float __b
Definition: altivec.h:419
#define __DEFAULT_FN_ATTRS
Definition: avx512vlintrin.h:31
unsigned short __mmask16
Definition: avx512fintrin.h:40