не оптимизированный вариант – один поток данных на итерацию
Чтобы сократить время выполнения цикла, необходимо увеличить количество потоков, переписав наш код так:
for(i=0; i<XXL, I += 4)
{
sum += a[i];
sum += a[i+1];
sum += a[i+2];
sum += a[i+3];
}
for (i -= 4; i<XXL; i++)
sum += a[i];