Better OpenCL Performance on Qualcomm Adreno GPU